[사회복지자료분석론] 상관관계 분석

반응형

상관관계 분석

 

1) 상관관계의 성격
① 상관관계는 인과관계가 아닐 수도 있다. → 회귀분석 필요
② 상관관계는 대체로 음의 방향 또는 음의 방향과 같은 관계의 방향이 있다.

 

2) 상관관계 분석

① 등간/비율 척도의 경우는 피어슨 적률상관을 실시합니다.

② 서열 척도의 경우는 스피어만 로 또는 캔달타우b를 실시합니다.

 

3) 상관관계 계수에 따른 해석

± 0.2 미만       : 상관관계가 거의 없다

± 0.2~0.4 미만 : 상관관계가 있으나 낮다

± 0.4~0.7 미만 : 상관관계가 다소 높다

± 0.7~0.9 미만 : 상관관계가 높다

± 0.9 이상       : 상관관계가 아주 높다

 

4) 예제 해석 

※ 참고 : 심리적 이웃관계는 역문항으로 "① 매우 친하다 ~ ⑤ 전혀 친하지 않다" 입니다. 한편 이 척도는 서열척도이나 여기서는 해석을 위해 등간척도라고 가정합니다.

 

(해석)
연령과 심리적 이웃관계에 대한 상관분석 결과 p<0.01에서 Pearson's r이 -.230으로 음의 낮은 상관관계를 보이고 있음을 알 수 있습니다. 즉 연령이 높아질수록 심리적 이웃관계가 친해지는 경향이 있다고 해석할 수 있습니다.
덧붙여 사례의 수(N)이 커지면 커질수록 유의도는 높아지지만, 그것이 상관관계를 높게 하지는 않습니다.

 

 

상관관계.hwp

 

 


 

반응형

부처님오신날 제등행진

반응형

 

불기 2556년 부처님오신날을 맞아, 올해로 11년째 제등행진 참석!!

올해는 작년에 이어 구덕운동장에서 용두산공원까지~

반응형

[사회복지자료분석론] 카이제곱(χ²)

반응형

분포의 차이 : 카이제곱 (χ²)

 

■ 확인사항
1. 자유도가 1인 경우
전체사례수가 30보다 크면서 각 셀(cell)의 빈도가 5 이상일 때 적용 가능

 

2. 자유도가 1보다 큰 경우
사례수가 30보다 크면서 5미만의 기대빈도의 셀이 전체의 모든 칸의 20%보다 적고, 모든 셀에 1.00이상의 기대빈도가 있다면 척도에 관계없이 사용 가능

 

카이제곱 분포표를 토대로 자유도와 비교하여 분포차이의 여부를 봅니다.
해당 자유도와 유의수준에서의 카이제곱 값보다 크다면 분포차이가 있다고 봅니다.
이때 p값을 표시해주는 것은 기본입니다.

 

 

(해석)
위 예제에서 우리는 Pearson Chi-Square(χ², 이하 카이제곱)의 값만 읽는 것으로 합니다.
우선 아래에서 N이 604로 30보다 크면서, a에서 언급한 것처럼 기대빈도가 5보다 작은 셀이 1개 이며 이는 전체 셀의 10%에 해당하여 20%보다 적기 때문에 확인사항에서 언급했던 기본적인 활용의 조건은 충족합니다.
이에 카이제곱의 값은 21.591이면서, 자유도(df)가 4이고, 양방향 검정(양측 검정)에 따른 유의도는 0.000으로 바꿔 표현하면 p<0.001이기 때문에 두 변수 간에는 분포의 관련성이 있다고 볼 수 있습니다.
이때 자유도와 양측검정의 유의도에 대한 카이제곱분포표를 살펴보면, 18.47이 나옵니다. 따라서 카이제곱 값(21.591)이 분포표의 값(18.47)보다 크기 때문에 분포에 있어 관계가 있다고 해석할 수 있습니다.

 

 

카이제곱.hwp

 

한편, 자유도와 양측검정의 유의도만 가지고 분포의 관련성 여부를 파악하려면, 카이제곱 분포표나 엑셀의 CHIINV 함수를 사용하시면 됩니다. 위 예제의 경우, 분포값은 20.00(단측검정의 경우는 18.47)이 나옵니다. 따라서 카이제곱 값(21.591)이 분포표의 값(20.00)보다 크기 때문에 분포에 있어 관계가 있다고 해석할 수도 있습니다.

첨부한 엑셀을 참조하세요~

 

단, 단측검정과 양측검정에 대한 해석은 제가 참조한 교재에서는 설명이 제대로 되어 있지 않았습니다.

때문에 틀린 점이 있을 수도 있음을 미리 밝혀둡니다.

 

카이제곱 교차분포표.xls

반응형

[사회복지자료분석론] 신뢰도와 내적, 외적 타당도

반응형

○ 신뢰도 : 실험도구가 갖는 실험(조사, Research)결과 반영의 일관성 정도 또는 실험결과의 일관성

 

 

○ 타당도 : 실험도구가 목적하는 실험/조사를 측정할 수 있는가에 대한 도구 또는 결과의 적절성

- 내적 타당도 : 이 조사는 해당 실험집단에 대한 실험효과를 정말로 반영할 수 있는가?

- 외적 타당도 : 이 실험결과를 어느 정도 일반화할 수 있는가?

반응형

[사회복지자료분석론] 유의확률과 유의수준을 통해 본 1종오류

반응형

사회복지조사론/자료분석론에서 사용되는 유의확률과 유의수준을 통해 1종 오류에 대하 간단히 정리해 보았다.

실은 용어가 비슷하고 또 같은 의미인데도 다른 표현을 쓰는 등 헷갈리는게 많은 것이 사실이다.

 

그중 가장 헷갈리는 1종 오류와 2종 오류를 유의수준, 유의확률을 통해서 정리해 보았다.

 

 

유의확률 : 1종 오류를 일으킬 확률

→ 유의확률이란 결국 대부분 참인데 "우연" 등이 개입되어 참의 결과가 나오지 않을 확률을 얘기한다.

    통상 우리는 95%의 신뢰수준에 동의하고 있으며, 이를 p<0.05라고 표시하고 있다.

 

○ 유의수준(α) : 1종 오류를 범할 수 있는 최대허용치

→ 한편, 유의수준은 유의확률과 크게 다르지 않지만 그 최대값이 얼마냐로 구분할 수 있을 것이다.

    자료분석을 실시해보면, 딱 떨어지는 어떤 값으로 표기되어 나온다.

    즉, 허용할 수 있는 오류의 최대치라고 보면 될 것이며, 오류의 최대치인 유의수준은 유의확률보다 커야만 영가설을 기각할 수 있고, 곧 그것은 내가 원하던 연구가설을 채택한다는 것과 같은 의미라 볼 수 있다.

 

○ 1종 오류 : 귀무가설이 참인데, 그것을 기각하는 경우

→ 지금까지 언급했던 모든 유의수준, 유의확률은 곧 1종 오류와 관련이 있다.

    내가 원하는 연구가설은 채택되어야 한다. 하지만 반드시 그렇게 되는 것은 아니기에 우리는 1종 오류에 주목해야한다. 곧 실제로는 참이 아님에도, 내가 억지로 우겨서 기각해야하는 것을 채택하고 있지는 않을까? 다시금 귀무가설의 입장에서 본다면, 귀무가설을 채택해야함에도 기각해서 본질을 흐리게 되었을 확률 그리고 그 결과가 바로 1종 오류이다.


○ 2종 오류 : 연구가설이 참인데, 그것을 기각하는 경우

→ 2종 오류는 바로 1종 오류의 반대개념으로 이해하면 될것이다.

 

<결론>

▶ 유의확률 < 유의수준 → 귀무가설 기각, 연구가설 채택 : 유의미하다.

→ 이때 만일 귀무가설을 채택해야함에도 잘못하여 기각하였다면 이는 1종 오류이다.


유의확률 > 유의수준 → 귀무가설 채택, 연구가설 기각 : 관계없다.

→ 반대로 오류가 있을 확률이 허용치를 넘어선다면 우린 당연히 귀무가설을 채택(연구가설 기각, 관계가 없음)해야하는데, 그렇지 못했다면 우리는 2종 오류를 범하게 되는 것이다.

 

반응형