양대수 그래프

최종 수정 2026.03.25

A log–log plot of y = x (blue), y = x<sup>2</sup> (green), and y = x<sup>3</sup> (red).Note the logarithmic scale markings on each of the axes, and that the log x and log y axes (where the logarithms are 0) are where x and y themselves are 1.

Comparison of linear, concave, and convex functions when plotted using a linear scale (left) or a log scale (right).

과학과 공학에서 양대수 그래프 또는 양대수 도표는 수평축과 수직축 모두에 로그 눈금을 사용하는 수치 데이터의 2차원 그래프이다. 거듭제곱 함수 – y=ax^k 형태의 관계식 –는 양대수 그래프에서 직선으로 나타나며, 지수는 기울기에, 계수는 절편에 대응한다. 따라서 이러한 그래프는 이와 같은 관계를 파악하고 매개변수를 추정하는 데 매우 유용하다. 로그의 밑으로는 어떤 값이든 사용할 수 있으나, 가장 일반적으로는 밑이 10인 상용로그가 사용된다.

단항식과의 관계

단항식 방정식 y=ax^k,이 주어졌을 때, 방정식의 양변에 (임의의 밑의) 로그를 취하면 다음을 얻는다: \log y = k \log x + \log a.

X = \log x 및 Y = \log y로 놓으면, 이는 양대수 그래프를 사용하는 것에 해당하며, 다음 방정식을 얻는다: Y = mX + b

여기서 m = k는 직선의 기울기(경사)이고, b = log a는 (log y)축 위의 절편, 즉 log x = 0인 지점을 의미한다. 따라서 로그를 역으로 풀면, ax = 1에 대응하는 y 값이다.[^2]

방정식

양-로그 그래프에서 직선의 방정식은 다음과 같다: \log_{10}F(x) = m \log_{10}x + b, F(x) = x^m\cdot10^b, 여기서 m은 기울기이고 b는 로그 그래프에서의 절편이다.

양-로그 그래프의 기울기

비율을 이용한 양-로그 그래프의 기울기 구하기

그래프의 기울기를 구하기 위해 x축 위에서 두 점, 예를 들어 x1과 x2를 선택한다. 아래 방정식을 이용하면: \log[F (x_1)] = m \log (x_1) + b, 그리고 \log[F (x_2)] = m \log(x_2) + b. 기울기 m은 차이를 취하여 구할 수 있다: m = \frac { \log (F_2) - \log (F_1)} { \log(x_2) - \log(x_1) } = \frac {\log (F_2/F_1)}{\log(x_2/x_1)}, 여기서 F1은 F(x1)의 약칭이고 F2는 F(x2)의 약칭이다. 오른쪽 그림은 이 공식을 보여준다. 그림의 예시에서 기울기가 음수임을 주목하라. 이 공식 역시 음의 기울기를 제공하는데, 이는 로그의 다음 성질로부터 알 수 있다: \log(x_1/x_2) = -\log(x_2/x_1).

양-로그 그래프로부터 함수 구하기

위의 절차를 역으로 적용하여 (이미 알려져 있다고 가정한) 양-로그 그래프를 이용해 함수 F(x)의 형태를 구한다. 함수 F를 구하기 위해, 위 그래프의 직선 위에서 어떤 고정점 (x0, F0)을 선택하는데, 여기서 F0는 F(x0)의 약칭이며, 또한 같은 그래프 위에서 다른 임의의 점 (x1, F1)을 선택한다. 그러면 위의 기울기 공식으로부터: m = \frac {\log (F_1 / F_0)}{\log(x_1 / x_0)} 이를 정리하면 \log(F_1 / F_0) = m \log(x_1 / x_0) = \log[(x_1 / x_0)^m ]. 10log10(F1) = F1임을 주목하라. 따라서 로그를 역변환하면 다음을 얻는다: \frac{F_1}{F_0} = \left(\frac{x_1}{x_0}\right)^m 또는 F_1 = \frac{F_0}{x_0^m} , x^m, 이는 다음을 의미한다: F(x) = \mathrm{constant}\cdot x^m. 즉, F는 양-로그 그래프에서 직선의 기울기를 지수로 하는 x의 거듭제곱에 비례한다. 구체적으로, 점 (x0, F0)과 (x1, F1)을 포함하는 양-로그 그래프 위의 직선은 다음 함수를 갖는다: F(x) = {F_0}\left(\frac{x}{x_0} \right)^\frac {\log (F_1/F_0)}{\log(x_1/x_0)}, 물론 역도 성립한다: 다음 형태의 모든 함수 F(x) = \mathrm{constant} \cdot x^m 는 양-로그 그래프에서 직선으로 표현되며, 그 직선의 기울기는 m이다.

양-로그 그래프의 직선 구간 아래 넓이 구하기

양-로그 그래프에서 연속적인 직선 구간 아래의 넓이를 계산하거나 (거의 직선인 구간의 넓이를 추정하기 위해) 앞서 정의한 함수를 사용한다: F(x) = \mathrm{constant}\cdot x^m. 이를 적분한다. 정적분(두 개의 정해진 끝점)에서만 작동하므로, 그래프 아래의 넓이 A는 다음 형태를 갖는다: A(x) = \int_{x_0}^{x_1} F(x) , dx = \left.\frac{\mathrm{constant}}{m+1} \cdot x^{m+1}\right|_{x_0}^{x_1}

원래 방정식을 재정리하고 고정점 값을 대입하면 다음을 얻는다: \mathrm{constant} = \frac{F_0}{x_0^m}

이를 적분식에 다시 대입하면, x0에서 x1까지의 A에 대해 다음을 얻는다:

\begin{align} A &= \frac{F_0/x_0^m}{m+1}\cdot (x_1^{m+1}-x_0^{m+1}) \[1.2ex] \log A &= \log \left[\frac{F_0 / x_0^m}{m+1} \cdot (x_1^{m+1}-x_0^{m+1})\right] \ &= \log \frac{F_0}{m+1} - \log \frac{1}{x_0^m} + \log (x_1^{m+1}-x_0^{m+1}) \ &= \log \frac{F_0}{m+1} + \log \left(\frac{x_1^{m+1} - x_0^{m+1}}{x_0^m}\right) \ &= \log \frac{F_0}{m+1} + \log \left(\frac{x_1^m}{x_0^m}\cdot x_1 - \frac{x_0^{m+1}}{x_0^m}\right) \end{align}

따라서, A = \frac{F_0}{m+1} \cdot \left[x_1 \cdot \left(\frac {x_1}{x_0}\right)^m - x_0\right]

m = −1인 경우, 적분은 다음과 같다: \begin{align} A_{(m=-1)} &= \int_{x_0}^{x_1} F(x) , dx = \int_{x_0}^{x_1} \frac {\mathrm{constant}}{x} , dx = \frac{F_0}{x_0^{-1}} \int_{x_0}^{x_1} \frac {dx}{x} = F_0 \cdot x_0 \cdot {\ln x }\Big|{x_0}^{x_1} \ A{(m=-1)} &= F_0 \cdot x_0 \cdot \ln \frac{x_1}{x_0} \end{align}

로그-로그 선형 회귀 모델

로그-로그 플롯은 (대략적으로) 로그 정규 또는 로그-로지스틱 오차를 가진 로그-로그 선형 회귀 모델을 시각화하는 데 자주 사용된다. 이러한 모델에서는 종속 변수와 독립 변수를 로그 변환한 후 단순 선형 회귀 모델을 적합시킬 수 있으며, 오차는 등분산성을 갖게 된다. 이 모델은 독립 변수가 증가함에 따라 오차도 함께 증가하는(즉, 이분산성 오차) 지수적 성장 또는 감쇠를 나타내는 데이터를 다룰 때 유용하다.

위에서 설명한 바와 같이, 로그-로그 선형 모델에서 변수 간의 관계는 거듭제곱 법칙으로 표현된다. 독립 변수의 단위 변화마다 종속 변수에 일정한 비율의 변화가 발생한다. 모델은 다음과 같이 표현된다:

y = a \cdot x^b \cdot e^\epsilon

양변에 로그를 취하면 다음과 같다:

\log(y) = \log(a) + b \cdot \log(x) + \epsilon

이것은 x와 y의 로그에 대한 선형 방정식으로, \log(a)가 절편이고 b가 기울기이다. 여기서 \epsilon \sim \textrm{Normal}(\mu, \sigma^2)이고, e^\epsilon \sim \textrm{Log-Normal}(\mu, \sigma^2)이다.

Figure 1: Visualizing Loglog Normal Data

그림 1은 이것이 어떻게 보이는지를 보여준다. 10,000개의 시뮬레이션된 점을 사용하여 생성된 두 개의 플롯을 제시한다. '로그 정규 잡음을 가진 오목 곡선'이라는 제목의 왼쪽 플롯은 독립 변수(x)에 대한 관측 데이터(y)의 산점도를 보여준다. 빨간 선은 '중앙값 선'을 나타내고, 파란 선은 '평균 선'이다. 이 플롯은 오목 곡선으로 표현되는 변수 간의 거듭제곱 법칙 관계를 가진 데이터셋을 보여준다.

그림 1의 오른쪽 플롯인 '정규 잡음을 가진 로그-로그 선형 직선'에서 보이는 것처럼 두 변수를 모두 로그 변환하면 관계가 선형이 된다. 이 플롯도 독립 변수에 대한 관측 데이터의 산점도를 보여주지만, 두 축 모두 로그 스케일로 되어 있다. 여기서 평균선과 중앙값선은 동일한 (빨간) 선이다. 이 변환을 통해 단순 선형 회귀 모델을 적합시킬 수 있으며(이후 원래 스케일로 역변환할 수 있다 - 중앙값 선으로서).

Figure 2: Sliding Window Error Metrics Loglog Normal Data

그림 1에서 왼쪽 플롯에서 오른쪽 플롯으로의 변환은 데이터 내 잡음 분포에 대한 로그 변환의 효과도 보여준다. 왼쪽 플롯에서 잡음은 로그 정규 분포를 따르는 것으로 보이며, 이는 오른쪽으로 치우쳐 있어 다루기 어려울 수 있다. 오른쪽 플롯에서는 로그 변환 후 잡음이 정규 분포를 따르는 것으로 보이며, 이는 추론하고 모델링하기가 더 쉽다.

이러한 잡음의 정규화는 그림 2에서 더 자세히 분석된다. 그림 2는 x축에서 크기 28의 슬라이딩 윈도우로 계산된 세 가지 오차 지표(평균 절대 오차 - MAE, 평균 제곱근 오차 - RMSE, 평균 절대 로그 오차 - MALE)의 선 그래프를 제시한다. y축은 독립 변수(x)에 대해 그려진 오차를 나타낸다. 각 오차 지표는 서로 다른 색으로 표현되며, 해당하는 평활화된 선이 원래 선 위에 겹쳐져 있다(이것은 시뮬레이션된 데이터이므로 오차 추정이 다소 불안정하다). 이러한 오차 지표는 서로 다른 x 값에 걸쳐 잡음이 어떻게 변하는지를 측정하는 척도를 제공한다.

로그-로그 선형 모델은 많은 현상이 거듭제곱 법칙 행동을 보이는 경제학, 생물학, 물리학 등 다양한 분야에서 널리 사용된다. 또한 이분산성 데이터를 다루는 회귀 분석에서도 유용한데, 로그 변환이 분산을 안정화하는 데 도움이 될 수 있기 때문이다.

응용

두 축 모두에서 한 자릿수 이상의 범위에 걸친 정보를 압축하는 로그-로그 그래프

이러한 그래프는 매개변수 ab를 수치 데이터로부터 추정해야 할 때 유용하다. 이와 같은 사양은 경제학에서 자주 사용된다.

한 가지 예는 재고 이론에 기반한 화폐 수요 함수의 추정으로, 시점 t에서의 화폐 수요가 다음과 같이 주어진다고 가정할 수 있다. M_t = AR_t^bY_t^cU_t, 여기서 M은 대중이 보유하는 실질 화폐량, R은 화폐 대비 초과 수익률을 가진 대안적 고수익 자산의 수익률, Y는 대중의 실질 소득, U는 로그정규분포를 따르는 것으로 가정되는 오차항, A는 추정할 규모 매개변수, bc는 추정할 탄력성 매개변수이다. 로그를 취하면 다음을 얻는다. m_t = a + br_t + cy_t + u_t, 여기서 m = log M, a = log A, r = log R, y = log Y, 그리고 u = log U이며, u는 정규분포를 따른다. 이 방정식은 최소제곱법을 사용하여 추정할 수 있다.

또 다른 경제학적 예는 기업의 콥-더글러스 생산함수의 추정으로, 이는 다음 방정식의 우변이다. Q_t=AN_t^{\alpha}K_t^{\beta}U_t, 여기서 Q는 월간 생산 가능한 산출량, N은 월간 생산에 투입되는 노동 시간 수, K는 월간 활용되는 물적 자본의 시간 수, U는 로그정규분포를 따르는 것으로 가정되는 오차항, 그리고 A, \alpha, \beta는 추정할 매개변수이다. 로그를 취하면 다음의 선형 회귀 방정식을 얻는다. q_t = a + \alpha n_t + \beta k_t + u_t 여기서 q = log Q, a = log A, n = log N, k = log K, 그리고 u = log U이다.

로그-로그 회귀는 자연적으로 발생하는 프랙탈의 프랙탈 차원을 추정하는 데에도 사용할 수 있다.

그러나 반대 방향으로 — 데이터가 로그-로그 스케일에서 대략적인 직선으로 나타나는 것을 관찰하고 해당 데이터가 거듭제곱 법칙을 따른다고 결론짓는 것은 — 항상 유효하지는 않다.[^1]

실제로 다른 많은 함수 형태들도 로그-로그 스케일에서 대략적으로 직선으로 나타나며, 결정계수(R2)를 사용하여 로그 변환된 데이터에 대한 선형 회귀의 적합도를 단순히 평가하는 것은 유효하지 않을 수 있다. 이는 가우시안 오차와 같은 선형 회귀 모형의 가정이 충족되지 않을 수 있기 때문이다. 또한 로그-로그 형태의 적합도 검정은 낮은 통계적 검정력을 보일 수 있는데, 이러한 검정은 다른 참된 함수 형태가 존재할 때 거듭제곱 법칙을 기각할 가능성이 낮을 수 있기 때문이다. 단순한 로그-로그 그래프가 가능한 거듭제곱 법칙을 탐지하는 데 유익할 수 있고 1890년대 파레토 시대부터 사용되어 왔지만, 거듭제곱 법칙으로서의 검증에는 더 정교한 통계 기법이 필요하다.[^1]

이러한 그래프는 제어 변수를 지수 함수를 따라 변화시키면서 데이터를 수집하는 경우에도 매우 유용하다. 이 경우 제어 변수 x는 로그 스케일로 나타내는 것이 더 자연스러우며, 이렇게 하면 데이터 점들이 낮은 쪽에 압축되지 않고 균등하게 분포된다. 출력 변수 y는 선형으로 나타낼 수 있으며 이 경우 선형-로그 그래프(log x, y)가 되고, 또는 로그를 취할 수도 있으며 이 경우 로그-로그 그래프(log x, log y)가 된다.

보드 선도(시스템의 주파수 응답 그래프)도 로그-로그 그래프이다.

화학 반응속도론에서 반응 속도의 농도 의존성의 일반적인 형태는 거듭제곱 법칙(질량 작용의 법칙)의 형태를 취하므로, 로그-로그 그래프는 실험으로부터 반응 매개변수를 추정하는 데 유용하다.

같이 보기

  • 반로그 그래프 (선형–로그 또는 로그–선형)
  • 거듭제곱 법칙
  • 지프의 법칙
  • 로그선형 모형
  • 로그정규분포
  • 로그로지스틱 분포
  • 데이터 변환 (통계학)
  • 분산 안정화 변환

de:Logarithmenpapier#Doppeltlogarithmisches Papier


각주

[^1]: cite journal author1=Clauset, A. author2=Shalizi, C. R. author3=Newman, M. E. J. year=2009 title=경험적 데이터에서의 거듭제곱 법칙 분포 journal=SIAM Review volume=51 issue=4 pages=661–703

[^2]: Bourne, Murray. 7. 로그-로그 및 반로그 그래프