[사회복지자료분석론] 카이제곱(χ²)

분포의 차이 : 카이제곱 (χ²)

 

■ 확인사항
1. 자유도가 1인 경우
전체사례수가 30보다 크면서 각 셀(cell)의 빈도가 5 이상일 때 적용 가능

 

2. 자유도가 1보다 큰 경우
사례수가 30보다 크면서 5미만의 기대빈도의 셀이 전체의 모든 칸의 20%보다 적고, 모든 셀에 1.00이상의 기대빈도가 있다면 척도에 관계없이 사용 가능

 

카이제곱 분포표를 토대로 자유도와 비교하여 분포차이의 여부를 봅니다.
해당 자유도와 유의수준에서의 카이제곱 값보다 크다면 분포차이가 있다고 봅니다.
이때 p값을 표시해주는 것은 기본입니다.

 

 

(해석)
위 예제에서 우리는 Pearson Chi-Square(χ², 이하 카이제곱)의 값만 읽는 것으로 합니다.
우선 아래에서 N이 604로 30보다 크면서, a에서 언급한 것처럼 기대빈도가 5보다 작은 셀이 1개 이며 이는 전체 셀의 10%에 해당하여 20%보다 적기 때문에 확인사항에서 언급했던 기본적인 활용의 조건은 충족합니다.
이에 카이제곱의 값은 21.591이면서, 자유도(df)가 4이고, 양방향 검정(양측 검정)에 따른 유의도는 0.000으로 바꿔 표현하면 p<0.001이기 때문에 두 변수 간에는 분포의 관련성이 있다고 볼 수 있습니다.
이때 자유도와 양측검정의 유의도에 대한 카이제곱분포표를 살펴보면, 18.47이 나옵니다. 따라서 카이제곱 값(21.591)이 분포표의 값(18.47)보다 크기 때문에 분포에 있어 관계가 있다고 해석할 수 있습니다.

 

 

카이제곱.hwp

 

한편, 자유도와 양측검정의 유의도만 가지고 분포의 관련성 여부를 파악하려면, 카이제곱 분포표나 엑셀의 CHIINV 함수를 사용하시면 됩니다. 위 예제의 경우, 분포값은 20.00(단측검정의 경우는 18.47)이 나옵니다. 따라서 카이제곱 값(21.591)이 분포표의 값(20.00)보다 크기 때문에 분포에 있어 관계가 있다고 해석할 수도 있습니다.

첨부한 엑셀을 참조하세요~

 

단, 단측검정과 양측검정에 대한 해석은 제가 참조한 교재에서는 설명이 제대로 되어 있지 않았습니다.

때문에 틀린 점이 있을 수도 있음을 미리 밝혀둡니다.

 

카이제곱 교차분포표.xls