검색결과 리스트
글
[楞嚴] 생각 나누기/[平] 사회조사와 데이터분석
2023. 11. 1. 19:40
표본이 정규분포(정규성)인지 여부를 어떻게 알 수 있는가?
반응형
표본의 정규분포를 확인하는 방법은 다양하다. 히스토그램과 같은 도표를 보고 추정할 수도 있고, 왜도와 첨도, 또는 정규성 검정을 통해 확인할 수도 있다.
정규성 검정은 표본의 크기에 따라 두 가지로 나뉜다.
첫째, n≥30이면, Kolmogorov-Smirnov(콜모고로프-스미르노프) 검정(ks test)을 통해 확인한다.
둘째, n<30이면, Shapiro-Wilk(샤피로-윌크) 검정을 통해 확인할 수 있다.
검정 결과 p>.05이면, 정규성을 가정한다. 다만 이 두 검정은 매우 엄밀한 검정으로 정규성을 가정하는 경우를 확보하는 것이 쉽지 않다.
이에 조금 더 유연한 방법이 왜도와 첨도를 확인하는 방법이다. 기술통계를 통해 확인되는 왜도의 절댓값이 2보다 작고, 첨도의 절댓값이 7보다 작으면 정규성을 가정한다.
데이터분석을 실시하기에 앞서 표본의 정규성을 먼저 확인하는 것이 전제되어야 모수통계 검정을 실시할지 비모수통계 검정을 실시할지를 결정하게 된다.
한편 중심극한정리(central limit theorem, CLT)를 예로 들어 표본의 수(n)가 30 이상이면 정규성을 가정한다는 주장이 있는데, 이는 틀린 표현이다. 중심극한정리는 ‘표본집단’의 수가 증가함에 따라 모집단의 분포가 정규분포에 근접해 가는 현상을 말한다. 즉 표본집단의 수가 판단의 기준이다. 표본의 수를 말하는 것이 아닌데, 이를 오해해 잘못 전하는 경우가 있어 주의가 필요하다.
n≥30이라고, 정규성을 가정하는 것은 아니다.
반응형
'[楞嚴] 생각 나누기 > [平] 사회조사와 데이터분석' 카테고리의 다른 글
리커트(Likert) 척도는 서열척도인가? (0) | 2023.11.01 |
---|---|
측도와 척도 (0) | 2023.11.01 |
평균 추론에 필요한 조건 (0) | 2023.11.01 |
왜 유의확률(p value)은 0.05를 기준으로 하는가? (0) | 2023.11.01 |
p value(유의확률)를 표기하는 방법 (0) | 2023.11.01 |
RECENT COMMENT