꺾은선 그래프

최종 수정 2026.03.25

![Line chart showing the population of the town of [Pushkin, Saint Petersburg from 1800 to 2010, measured at various intervals]]

꺾은선 그래프 또는 선형 차트곡선 차트[^1]라고도 하며, 'markers'라 불리는 일련의 데이터 포인트를 직선 세그먼트로 연결하여 정보를 표시하는 차트의 한 유형이다.[^2] 이는 많은 분야에서 흔히 사용되는 기본적인 차트 유형이다. 산점도와 유사하지만, 측정 포인트가 순서대로 정렬되어 있고(일반적으로 x축 값 기준) 직선 세그먼트로 연결된다는 점이 다르다. 꺾은선 그래프는 일정한 시간 간격에 따른 데이터의 추세, 즉 시계열을 시각화하는 데 자주 사용되며, 따라서 선은 시간순으로 그려지는 경우가 많다. 이러한 경우 런 차트라고 불린다.

역사

가장 초기에 알려진 꺾은선 그래프 중 일부는 일반적으로 Francis Hauksbee, Nicolaus Samuel Cruquius, Johann Heinrich Lambert, 그리고 스코틀랜드의 공학자 William Playfair의 공로로 인정된다.[^3] 꺾은선 그래프는 x축의 변수로 시간을 표시하는 경우가 많다. Playfair는 이런 방식으로 데이터를 시각화한 최초의 인물 중 한 명이었다. 1786년, 그는 영국 해군이 10년간 지출한 비용을 그래프로 나타냈다. 독자들이 이러한 형태의 추상적 시각화에 익숙하지 않았기 때문에, 그는 시간에 따른 변화를 어떻게 해석해야 하는지 상세한 설명을 차트에 덧붙였다. 꺾은선 그래프 외에도 Playfair는 막대 그래프와 원형 그래프를 발명하고 대중화하였다.[^4]

예시

실험 과학에서, 실험을 통해 수집된 데이터는 그래프로 시각화되는 경우가 많다. 예를 들어, 특정 시점에서 물체의 속도에 관한 데이터를 수집한 경우, 다음과 같은 데이터 표로 시각화할 수 있다:

속도 대 시간 그래프

{| class="wikitable" ! 경과 시간 (s) ! 속도 (m s−1) |- | 0 | 0 |- | 1 | 3 |- | 2 | 7 |- | 3 | 12 |- | 4 | 18 |- | 5 | 30 |- | 6 | 45.6 |}

이러한 표 형태의 데이터 표현은 정확한 값을 표시하는 데는 훌륭한 방법이지만, 값들의 패턴을 발견하고 이해하는 것을 방해할 수 있다. 또한 표 형태의 표시는 종종 객관적이고 중립적인 데이터의 수집 또는 저장으로 잘못 간주되며(이런 의미에서 데이터 그 자체로 잘못 여겨지기도 한다), 실제로는 데이터의 다양한 가능한 시각화 방법 중 하나에 불과하다.

표의 데이터가 설명하는 과정을 이해하는 데는 속도 대 시간의 그래프 또는 꺾은선 그래프를 작성하는 것이 도움이 된다. 이러한 시각화는 오른쪽 그림에 나타나 있다. 이 시각화를 통해 보는 사람은 전체 과정을 한눈에 빠르게 이해할 수 있다.

그러나 이 시각화는 오해를 불러일으킬 수 있는데, 특히 속도 v(종속 변수)를 시간 t의 함수로 나타내는 수학 함수 v(t)를 보여주는 것으로 표현될 경우 그러하다. 이것은 속도가 오직 시간에만 의존하는 변수라는 오해를 불러일으킬 수 있다. 그러나 이는 진공 상태에서 일정한 힘만 작용하는 물체의 경우에만 해당된다.

최적 적합선

![최적 적합선 차트 ([단순 선형 회귀 )]]

![[William Addison Dwiggins 의 패러디 꺾은선 그래프 (1919).]] 차트에는 산점도 데이터의 최적 적합 추세를 나타내는 수학 함수가 겹쳐서 표시되는 경우가 많다. 이 레이어를 최적 적합 레이어라고 하며, 이 레이어가 포함된 그래프를 흔히 꺾은선 그래프라고 부른다.

인접한 데이터 점들을 연결하는 선분 집합으로 구성된 "최적 적합" 레이어를 만드는 것은 간단하지만, 이러한 "최적 적합"은 일반적으로 다음과 같은 이유로 기저 산점도 데이터의 추세를 이상적으로 표현한 것이라고 보기 어렵다:

  1. 최적 적합선 기울기의 불연속점이 측정값의 위치와 정확히 일치할 가능성은 매우 낮다.
  2. 데이터의 실험 오차가 무시할 수 있을 정도로 작으면서 곡선이 각 데이터 점을 정확히 통과할 가능성은 매우 낮다.

어느 경우든, 최적 적합 레이어는 데이터의 추세를 드러낼 수 있다. 또한, 기울기나 곡선 아래 면적과 같은 측정을 시각적으로 수행할 수 있어 데이터 표에서 더 많은 결론이나 결과를 도출할 수 있다.

진정한 최적 적합 레이어는 데이터 값의 오차에 적절한 가중치를 부여하는 적합한 오차 최소화 기법을 사용하여 매개변수가 결정되는 연속 수학 함수를 나타내야 한다. 이러한 곡선 적합 기능은 그래프 소프트웨어나 스프레드시트에서 흔히 찾을 수 있다. 최적 적합 곡선은 단순한 선형 방정식부터 더 복잡한 이차, 다항, 지수 및 주기 곡선까지 다양할 수 있다.[^5]

같이 보기

  • 곡선 적합
  • 데이터 및 정보 시각화
  • 정보 그래픽 소프트웨어 목록
  • 런 차트
  • 차트 정크

참고 문헌

[^1]: Spear, Mary Eleanor. 통계 차트 작성. McGraw-Hill

[^2]: Burton G. Andreas (1965). ''실험 심리학''. p.186

[^3]: [[Michael Friendly]] (2008). [http://www.math.yorku.ca/SCS/Gallery/milestone/milestone.pdf "주제별 지도 제작, 통계 그래픽 및 데이터 시각화 역사의 이정표"]. pp 13–14.

[^4]: Fry, Hannah. 그래프가 삶과 죽음의 문제가 될 때. (2021-06-14)

[^5]: Elert, Glenn. 곡선 적합. (2023)