비대칭도
비대칭도: 데이터의 분포가 비대칭인 정도를 나타내는 지표
통계학에서 비대칭도(Skewness)와 첨도(Kurtosis)는 데이터의 분포를 이해하는 데 중요한 역할을 하는 지표입니다. 주로 사용되는 정규분포(Normal distribution)는 대칭적인 특성을 가지지만, 실제로 대부분의 데이터는 비대칭적인 분포를 보입니다. 비대칭도와 첨도는 이러한 비대칭적 특성과 분포의 모양을 수치적으로 분석할 수 있게 해줍니다. 이번 글에서는 비대칭도와 첨도의 개념, 특징, 계산 방법에 대해 자세히 알아보겠습니다.
1) 왜도 (비대칭도)
의의 및 특징
왜도(Skewness)는 데이터 분포가 얼마나 비대칭적인지를 나타내는 지표입니다. 데이터가 대칭적일 경우 왜도는 0이 되며, 우측 비대칭(positive skew) 또는 좌측 비대칭(negative skew)에 따라 왜도 값이 달라집니다. 왜도가 0보다 크면 우측으로 꼬리가 긴 분포를, 0보다 작으면 좌측으로 꼬리가 긴 분포를 의미합니다.
- 우측 비대칭 (Right skew): 데이터의 오른쪽 꼬리가 길어지고, 평균이 중앙값보다 큽니다.
- 좌측 비대칭 (Left skew): 데이터의 왼쪽 꼬리가 길어지고, 평균이 중앙값보다 작습니다.
왜도는 실제 데이터의 분포 특성을 파악하는 데 유용하며, 특히 경제, 금융, 사회과학 등 여러 분야에서 분석에 사용됩니다.
피어슨 대칭도 (Pearson’s Skewness)
피어슨 대칭도는 왜도를 계산하는 가장 일반적인 방법입니다. 이 방법은 데이터의 평균, 중앙값, 표준편차를 이용해 비대칭도를 측정합니다. 피어슨 대칭도의 공식은 다음과 같습니다.
피어슨 왜도 공식:
피어슨 왜도 = 3(평균 - 중앙값) / 표준편차
이 공식에서 평균과 중앙값의 차이를 표준편차로 나누어 상대적인 비대칭도를 구합니다. 피어슨 대칭도가 0이면 데이터는 대칭적이며, 양수일 경우 우측 비대칭, 음수일 경우 좌측 비대칭을 나타냅니다.
2) 첨도
의의 및 특징
첨도(Kurtosis)는 데이터 분포의 뾰족함과 관련이 있습니다. 즉, 분포의 중심 부분이 얼마나 뾰족하고, 꼬리가 얼마나 두꺼운지를 나타냅니다. 정규분포의 첨도는 3으로 설정되어 있으며, 이를 기준으로 분포가 얼마나 뾰족하거나 평평한지를 평가할 수 있습니다.
- 첨도가 높음 (Leptokurtic): 분포가 정규분포보다 더 뾰족하고, 극단적인 값이 자주 나타납니다.
- 첨도가 낮음 (Platykurtic): 분포가 평평하고, 극단적인 값은 적습니다.
첨도는 분포의 꼭대기와 꼬리 두께를 파악하는 데 중요합니다. 예를 들어, 금융 자산 수익률에서 첨도가 높은 분포는 가격 변동성이 클 수 있다는 신호를 주며, 첨도가 낮은 분포는 변동성이 적다는 것을 의미합니다.
첨도 계산식
첨도는 다음과 같은 공식으로 계산됩니다:
첨도 = (1/n) ∑ (xᵢ - 평균)⁴ / 표준편차⁴ - 3
이 공식에서 3을 빼는 이유는 정규분포의 첨도가 3이기 때문입니다. 이를 통해 분포가 정규분포와 얼마나 차이가 나는지를 파악할 수 있습니다. 첨도 값이 0에 가까우면 데이터 분포가 정규분포와 유사하다고 볼 수 있습니다.
3) 비대칭도와 첨도의 관계
비대칭도와 첨도는 각각 분포의 비대칭성과 꼬리의 두께를 측정하는 지표로, 두 지표는 서로 보완적인 역할을 합니다. 예를 들어, 우측 비대칭이면서 첨도가 높은 데이터는 극단적인 값이 우측에서 자주 발생할 수 있음을 시사합니다. 이처럼 두 지표를 함께 고려하면, 데이터 분포에 대한 보다 명확한 해석을 할 수 있습니다.