다중응답에 대한 카이제곱(χ²) 검정 방법 by SPSS

반응형

SPSS 다중반응 변수를 처리하다보면 두 가지 불편한 점을 만나게 된다.

하나는 다중반응에 대한 변수군을 정의한 것은 저장되지 않는다는 사실이다. 따라서 컴퓨터를 껐다가 새로 켜서 분석을 하려하면 그때마다 매번 변수군을 새로 정의해야만 한다.

다른 하나는 다중반응에 대해 교차분석을 하면 교차표만 제공해줄 뿐 카이제곱검정 등 검정통계량을 알려주지는 않는다.

 

이 두 가지는 생각보다 불편하다. 

이와 관련하여 두번째는 다음과 같은 절차를 통해서 확인할 수 있다.

분석  >  표  >  다중응답변수군  >  다중응답변수군 정의

 

1. 다중반응 변수군을 정의한다.

다중반응 변수군 정의

 

2. 사용자 정의 표를 통해 분석할 변수를 입력한다.

분석  >  표  >  다중응답변수군  >  사용자 정의 표

- 이때 독립변수를 행(W)에, 종속변수를 열(O)에 마우스를 이용해 끌어다 놓는다.

 

3. 검정통계량 탭에서 옵션을 선택한다.

검정통계량

- 여기서 [□ 독립성 검정(카이제곱)(T)]을 체크해준다.

 

4. 결과를 확인한다.

다중반응에 대한 카이제곱검정 결과

- 위 결과에서 보듯이, 성별에 따른 노인일자라시압 참여이유에 대한 검정결과 χ²=125.399(p<.01)로 나타난 것을 확인할 수 있다.

 

다중반응 카이제곱.pdf
0.28MB

 

 

반응형

Excel로 통계분석하기 #3

반응형

Excel(엑셀)은 데이터 분석을 위해, 추가기능을 통해 분석도구를 제공하고 있다.

2021.11.07 - [[정보] 복지 이야기/[福] 복지 배우기] - Excel로 통계분석하기 #1

 

Excel로 통계분석하기 #1

굳이 비싼 통계 프로그램을 사용하지 않더라도, 업무에서 많이 사용하는 엑셀로도 간단한 통계분석은 충분히 할 수 있다. 그 방법 몇가지에 대해 안내하고자 한다. 첫째, 통계분석에 대한 수식

welfareact.net

 

또한 Add on을 사용하는 방법도 있다.

2021.11.07 - [[정보] 복지 이야기/[福] 복지 배우기] - Excel로 통계분석하기 #2

 

Excel로 통계분석하기 #2

2021.11.07 - [[정보] 복지 이야기/[福] 복지 배우기] - Excel로 통계분석하기 #1 Excel로 통계분석하기 #1 굳이 비싼 통계 프로그램을 사용하지 않더라도, 업무에서 많이 사용하는 엑셀로도 간단한 통계

welfareact.net

 

한편, 진짜로 통계를 공부하고 싶다면, 직접 함수를 통해 수식으로 만드는 것도 가능하다.

여기서 제공하는 파일은 단순한 기본수식만으로 회귀분석까지 가능하도록 만들어 본 것이다.

 

  • ○  정규분포곡선 그리기
  •   신뢰구간 공식
  •   적절한 표본의 크기
  •   검정통계량 공식
  •   모비율추정
  •   단일표본 t 검정(계산식)
  •   단일표본 t 검정(데이터분석)
  •   독립표본 t 검정
  •   등분산 검정
  •   대응표본 t 검정
  •   ANOVA
  •   ANOVA(2)
  •   카이제곱 검정
  •   산포도 그리기
  •   산포도 그리기2(추세선)
  •   상관분석
  •   회귀식의 이해(최소자승법)
  •   단순 회귀분석
  •   단순 회귀분석2
  •   순위상관분석
  •   다중 회귀분석

 

수식을 하나하나 뜯어보는 것만으로도 통계에 대한 이해를 높일 수 있지 않을까한다.

 

통계 기본 수식 v4.1.xlsx
1.30MB

 

※ 기존 v3.3에서는 등분산 가정 t 검정에서 공분산을 구하는 수식에 오류가 있었습니다.

    이를 바로잡은 수정버전을 배포합니다.

 

 

 

 

반응형

알아두면 쓸모있는 통계관련 잡학상식

반응형

아두면 모있는 계관련 학상식

 

  • 검증(檢證)과 검정(檢正)
  • 공(空)과 무(無), 0과 null
  • 부등식의 표현 이해
  • p value(유의확률)를 표기하는 방법
  • p value(유의확률)와 통계량
  • 왜 유의확률(p value)은 0.05를 기준으로 하는가?
  • 확률(probability)과 가능도(likelihood)
  • Z 점수(Z score, 표준점수)
  • 평균 추론에 필요한 조건
  • 표본이 정규분포(정규성)인지 여부를 어떻게 알 수 있는가? (수정) → https://welfareact.net/851
  • 중심극한정리(central limit theorem, CLT)
  • 부트스트랩(Bootstrap)
  • 독립변수와 종속변수: 인과관계와 변수
  • 측도와 척도
  • 리커트(Likert) 척도는 서열척도인가?
  • 무작위(random) 표본추출(표집, sampling)
  • 표본오차(sampling error)
  • 제1종 오류와 제2종 오류
  • 통계에서 ‘로버스트(robust)’의 의미
  • Mann Whitney U = .000

 

이전 포스팅을 포함해 한데 모아보았습니다.

 

알쓸통잡.pdf
0.36MB

 

반응형

표본오차(sampling error)

반응형

일반적으로 우리는 모집단이 아닌 표본집단을 대상으로 분석을 실시한다. 하지만 이런 표본집단과 모집단 사이에는 작은 차이가 존재할 수밖에 없다. 이런 차이를 표본오차(sampling error)라 부른다.
예를들어 지난 20대 대통령선거 지상파 3사의 출구조사 결과를 살펴보자.

신뢰수준과 표본오차

이를 하나하나 해석해보면 다음과 같다.
첫째, 신뢰수준 95%는 같은 조사를 100번 했을 때 95번은 같은 결과가 나올 것이라 기대할 수 있다는 뜻이다.
둘째, 표본오차 ±0.8%p는 윤석열 후보의 실제 득표율이 47.6%~49.2%, 이재명 후보의 득표율은 47.0%~48.6% 사이에서 결정될 것으로 기대된다는 의미이다. 
그리고 이 말은 출구조사의 결과만 놓고 살펴본다면, 누가 최종적으로 대통령이 될 지에 대한 예측은 되지만 결과값이 오차범위 내에 있다는 뜻이다.

한편 이런 표본오차(e)는 표본의 크기와 관련이 있다.

표본오차

그리고 이런 표본오차는 오차한계(margin of error), 최대허용오차, 오차범위, 표집오차 등과 같은 의미로 사용된다.

표본오차 = 오차한계(margin of error) = 최대허용오차 = 오차범위 = 표집오차

반응형

리커트(Likert) 척도는 서열척도인가?

반응형

사회조사 논문을 보면 리커트 척도를 등간척도로 다루어 상관분석과 회귀분석을 해 놓은 것을 많이 볼 수 있다. 하지만 뭔가 이상하지 않은가? 분명 배운대로라면 리커트 척도는 서열척도가 맞다. 이에 대한 논쟁은 과거부터 꾸준히 있어왔던 듯하다. 이에 대해 잘 정리한 논문이 있어 한편 소개한다.


바로 후이핑 우(Huiping Wu)와 싱온 렁(Shing-On Leung)이 2017년 Journal of Social Service Research에 기고한 "Can Likert Scales be Treated as Interval Scales? - A Simulation Study"이다. 이 연구의 Introduction을 보면, Jamieson(제이미슨, 2004)을 비롯한 인용해 엄밀히 말해 서열척도인건 분명하다고 본다. 한편 척도를 만들어낸 Stevens(스티븐스, 1946) 또한 서열척도를 등간척도로 다루었을 때의 유용성에 동의했다며, 리커트 척도의 개수를 늘려간다면 연속적인 척도로 보아 산술연산을 하는 것도 가능하다는 입장도 소개한다. 또한 Borgatta(보가타) & Bohrnstedt(보른스테드)는 리커트 척도를 불완전한 등간척도라 부르기도 한다.
서열척도를 등간척도로 다루는 것은 기본 가정을 위반한다는 문제점에도 불구하고 그 실효성이 높다는 딜레마를 안고 있다. 이 논문의 저자들은 그렇다면 얼마나 리커트 척도를 늘려가야 등간척도와 유사한 결과를 얻을 수 있는지에 대해 실험하고 그 결과 0~10까지 11점 척도가 된다면 등간척도로 보아도 무방한 결과를 도출한다고 결론내리고 있다.

반응형