산포도이란?

Question

![Example of samples from two populations with the same mean but different dispersion. The blue population is much more dispersed than the red population.](https://upload.wikimedia.org/wikipedia/commo...

MOAI Technologies · Accepted Answer

!Example of samples from two populations with the same mean but different dispersion. The blue population is much more dispersed than the red population. 통계학에서 산포도(散布度, 변동성, 산란, 퍼짐이라고도 함)는 분포가 늘어나거나 압축되는 정도를 말한다.[^1] 통계적 산포도의 대표적인 측도로는 분산, 표준편차, 사분위수 범위 등이 있다. 예를 들어, 데이터 집합의 분산이 크면 데이터가 넓게 흩어져 있는 것이다. 반면에 분산이 작으면 데이터 집합의 데이터가 밀집되어 있는 것이다. 산포도는 위치 또는 중심경향과 대비되며, 이 둘은 함께 분포에서 가장 많이 사용되는 속성이다. 통계적 산포도의 측도 통계적 산포도의 측도는 모든 데이터가 동일할 때 0이 되고, 데이터가 다양해질수록 증가하는 음이 아닌 실수이다. 대부분의 산포도 측도는 측정되는 양과 동일한 단위를 가진다. 즉, 측정값이 미터나 초 단위라면 산포도 측도도 마찬가지이다. 산포도 측도의 예는 다음과 같다: - 표준편차 - 사분위수 범위(IQR) - 범위 - 평균절대차(지니 평균절대차라고도 함) - 중위절대편차(MAD) - 평균절대편차(또는 간단히 평균편차) - 거리 표준편차 이들은 척도 모수의 추정량으로서 (척도 인수와 함께) 자주 사용되며, 이 경우 척도 추정량이라 불린다. 강건한 척도 측도는 소수의 이상치에 영향을 받지 않는 것으로, IQR과 MAD가 이에 해당한다. 위의 모든 통계적 산포도 측도는 위치 불변이고 척도에 대해 선형이라는 유용한 성질을 가진다. 이는 확률변수

X

의 산포도가

SX

일 때, 실수

a

와

산포도

통계적 산포도의 측도

출처

산포의 부분 순서

같이 보기

참고 문헌

관련 인사이트