다중응답에 대한 카이제곱(χ²) 검정 방법 by SPSS

반응형

SPSS 다중반응 변수를 처리하다보면 두 가지 불편한 점을 만나게 된다.

하나는 다중반응에 대한 변수군을 정의한 것은 저장되지 않는다는 사실이다. 따라서 컴퓨터를 껐다가 새로 켜서 분석을 하려하면 그때마다 매번 변수군을 새로 정의해야만 한다.

다른 하나는 다중반응에 대해 교차분석을 하면 교차표만 제공해줄 뿐 카이제곱검정 등 검정통계량을 알려주지는 않는다.

 

이 두 가지는 생각보다 불편하다. 

이와 관련하여 두번째는 다음과 같은 절차를 통해서 확인할 수 있다.

분석  >  표  >  다중응답변수군  >  다중응답변수군 정의

 

1. 다중반응 변수군을 정의한다.

다중반응 변수군 정의

 

2. 사용자 정의 표를 통해 분석할 변수를 입력한다.

분석  >  표  >  다중응답변수군  >  사용자 정의 표

- 이때 독립변수를 행(W)에, 종속변수를 열(O)에 마우스를 이용해 끌어다 놓는다.

 

3. 검정통계량 탭에서 옵션을 선택한다.

검정통계량

- 여기서 [□ 독립성 검정(카이제곱)(T)]을 체크해준다.

 

4. 결과를 확인한다.

다중반응에 대한 카이제곱검정 결과

- 위 결과에서 보듯이, 성별에 따른 노인일자라시압 참여이유에 대한 검정결과 χ²=125.399(p<.01)로 나타난 것을 확인할 수 있다.

 

다중반응 카이제곱.pdf
0.28MB

 

 

반응형

Excel로 통계분석하기 #3

반응형

Excel(엑셀)은 데이터 분석을 위해, 추가기능을 통해 분석도구를 제공하고 있다.

2021.11.07 - [[정보] 복지 이야기/[福] 복지 배우기] - Excel로 통계분석하기 #1

 

Excel로 통계분석하기 #1

굳이 비싼 통계 프로그램을 사용하지 않더라도, 업무에서 많이 사용하는 엑셀로도 간단한 통계분석은 충분히 할 수 있다. 그 방법 몇가지에 대해 안내하고자 한다. 첫째, 통계분석에 대한 수식

welfareact.net

 

또한 Add on을 사용하는 방법도 있다.

2021.11.07 - [[정보] 복지 이야기/[福] 복지 배우기] - Excel로 통계분석하기 #2

 

Excel로 통계분석하기 #2

2021.11.07 - [[정보] 복지 이야기/[福] 복지 배우기] - Excel로 통계분석하기 #1 Excel로 통계분석하기 #1 굳이 비싼 통계 프로그램을 사용하지 않더라도, 업무에서 많이 사용하는 엑셀로도 간단한 통계

welfareact.net

 

한편, 진짜로 통계를 공부하고 싶다면, 직접 함수를 통해 수식으로 만드는 것도 가능하다.

여기서 제공하는 파일은 단순한 기본수식만으로 회귀분석까지 가능하도록 만들어 본 것이다.

 

  • ○  정규분포곡선 그리기
  •   신뢰구간 공식
  •   적절한 표본의 크기
  •   검정통계량 공식
  •   모비율추정
  •   단일표본 t 검정(계산식)
  •   단일표본 t 검정(데이터분석)
  •   독립표본 t 검정
  •   등분산 검정
  •   대응표본 t 검정
  •   ANOVA
  •   ANOVA(2)
  •   카이제곱 검정
  •   산포도 그리기
  •   산포도 그리기2(추세선)
  •   상관분석
  •   회귀식의 이해(최소자승법)
  •   단순 회귀분석
  •   단순 회귀분석2
  •   순위상관분석
  •   다중 회귀분석

 

수식을 하나하나 뜯어보는 것만으로도 통계에 대한 이해를 높일 수 있지 않을까한다.

 

통계 기본 수식 v4.1.xlsx
1.30MB

 

※ 기존 v3.3에서는 등분산 가정 t 검정에서 공분산을 구하는 수식에 오류가 있었습니다.

    이를 바로잡은 수정버전을 배포합니다.

 

 

 

 

반응형

알아두면 쓸모있는 통계관련 잡학상식

반응형

아두면 모있는 계관련 학상식

 

  • 검증(檢證)과 검정(檢正)
  • 공(空)과 무(無), 0과 null
  • 부등식의 표현 이해
  • p value(유의확률)를 표기하는 방법
  • p value(유의확률)와 통계량
  • 왜 유의확률(p value)은 0.05를 기준으로 하는가?
  • 확률(probability)과 가능도(likelihood)
  • Z 점수(Z score, 표준점수)
  • 평균 추론에 필요한 조건
  • 표본이 정규분포(정규성)인지 여부를 어떻게 알 수 있는가? (수정) → https://welfareact.net/851
  • 중심극한정리(central limit theorem, CLT)
  • 부트스트랩(Bootstrap)
  • 독립변수와 종속변수: 인과관계와 변수
  • 측도와 척도
  • 리커트(Likert) 척도는 서열척도인가?
  • 무작위(random) 표본추출(표집, sampling)
  • 표본오차(sampling error)
  • 제1종 오류와 제2종 오류
  • 통계에서 ‘로버스트(robust)’의 의미
  • Mann Whitney U = .000

 

이전 포스팅을 포함해 한데 모아보았습니다.

 

알쓸통잡.pdf
0.36MB

 

반응형

[통계] 가중치를 활용한 회귀분석(WLS, Weighted Least Square, 가중최소제곱법)

반응형

※ 자료가 등분산성을 충족하지 못할 때, 즉 이분산일 때에는 OLS(최소제곱법)이 아니라 WLS 방식으로 보정하여 분석을 해야한다.

 

- 종속변수 : Y

- 독립변수: X1, X2, X3

- 가중치(weights) = 1/σ^2

 

SPSS를 활용해서 가중치를 구하고, 이를 통해 WLS의 방식으로 회귀분석 하는 방법

 

① 분석>회귀분석>선형
- 종속변수: Y
- 독립변수: X1, X2, X3
- 저장 > 예측값 > 비표준화 체크 # 예측값을 새 변수(PRE_1)수로 저장
- 저장 > 잔차 > 비표준화 체크 # 잔차를 새 변수(RES_1)수로 저장

② 변환>변수 계산
- 목표변수: absRES # 잔차의 절대값을 absRES로 생성
- 숫자표현식: abs(RES_1)

③ 분석>회귀분석>선형 # 잔차의 절대값과 예측치 간의 회귀분석
- 종속변수: absRES
- 독립변수: PRE_1
- 저장 > 예측값 > 비표준화 체크 # 예측값을 새 변수(PRE_2)수로 저장

④ 변환>변수 계산 # 가중치 계산
- 목표변수: weights # 가중치를 weights 변수로 생성
- 숫자표현식: 1/(PRE_2**2) # 1을 PRE_2의 제곱으로 나눔

⑤  분석>회귀분석>가중추정
- 종속변수: Y
- 독립변수: X1, X2, X3
- 가중변수: weights

 

--------------------------------------

 

R을 활용하는 방법: 가중치(weights) 구하는 두가지 계산식

 

① model <- lm(Y ~ X1+X2+X3, data="데이터") # 회귀분석 실시

 

 weights <- 1/fitted(lm(abs(residuals(model)) ~ fitted(model)))^2 # 가중치구하는 방법 첫번째
② weights <- 1/lm(abs(model$residuals) ~ model$fitted.values)$fitted.values^2 # 가중치 구하는 방법 두번째

- 둘중 어느 방법을 사용해도 결과값은 동일하다.

- residuals(model) # 회귀모델에서의 잔차 (SPSS에서 RES_1)

- fitted(model) # 회귀모델에서의 예측치 (SPSS에서 PRE_1)

- fitted(lm(abs(residuals(model)) ~ fitted(model))) # 잔차의 절대값과 예측치(PRE_1)간의 회귀모형에서의 예측치 (SPSS에서 PRE_2)

 

반응형
[하루] 일상과 독백 2021. 11. 23. 18:36

코로나19, 사회복지시설의 일상회복? 거리두기 강화!

반응형

코로나19 감염증 확산 추이를 검토해보았습니다.

전국 코로나19 감염증 확산 추이
부산 코로나19 감염증 확산 추이


1. 감소하는 치명률: 백신접종의 효과? 그리고 부스터 샷이 필요한 이유
확실히 누적 치명률은 2021년 2월 백신 접종을 기점으로 감소하고 있는 것이 맞습니다.
전국 기준 2%를 웃돌던 치명률이 1% 이하로 떨어졌기 때문입니다.
하지만 월간 치명률을 봤을 때, 지난 여름 0.17%까지 감소했던 치명률이 다시 0.8%대로 증가하였습니다. 확진자수가 많기 때문이기도 할터이지만, 기간이 지나면서 백신의 효능이 떨어지고 있기 때문은 아닌가 추측되기도 합니다.

2. 코로나19 확산정도: 계절의 영향?
코로나19가 계절과 관련이 있는진 모르겠지만, 지난 2년을 짧은 통계로 보건데, 통상 4개월을 주기로 증감을 반복합니다. 12월, 4월, 8월에 정점을 찍는 것으로 보입니다.
그리고 2021년의 코로나19 확진자 20일 추세선을 보면, 증가 추세인 것을 확인할 수 있습니다.

3. 이번 겨울 부산 사회복지시설은 어떻게 대응할 것인가?
수치상으로만 보면, 전국과는 별도로 부산은 지난 9~10월 확진자수가 감소하고 있었습니다. 전국 확산세가 있어 단계를 낮출 수 없었다고 볼 수도 있겠지만 분명 부산은 이때 충분히 안정적이었습니다. 굳이 2단계에 준하는데도 강화된 3단계를 적용할 이유는 없어보였습니다.

한데, 거꾸로 지금 11월부터 증가세에 있는데 단계적 일상회복을 이행한다고 합니다. 다소 이해가 가지 않는 대응입니다.

자영업자 등을 위해 필요하다고 판단했다는 점에서 어쩔 수 없다고도 생각합니다만, 사회복지시설은 자영업의 영리활동과도 관계가 없어 그 적용이 타당하지 않습니다.

 

만일 저라면 자영업과는 별도로 사회복지시설의 거리두기를 강화할 거 같습니다.

수치상으로 보면 부산은 이전의 거리두기 3단계에 준하는 상황입니다. 즉 지금은 조여야할 때입니다.
제가 있는 곳은 기본적으로는 정부 방침과 지자체 방침을 준용하겠지만, 내부 논의를 거쳐 조금더 강화된 이용기준을 적용할까 합니다.

1회 이용인원인원을 기준에 따라 줄이고, 방역을 강화하며, 백신 2차 접종자에 한해서만 이용을 허가할까 합니다.

또한 프로그램 및 행사는 최소화하고, 일정 인원 이상은 비대면을 중심으로 진행하는 것이 타당하다고 판단하고 있습니다.

 


계속적으로 코로나19 같은 감염병을 대응함에 있어 지자체의 자율적 판단과 대응, 사회복지시설 직능단체를 중심으로 별도의 능동적인 대응 방안을 만들 수 있어야 한다고 판단하는 이유입니다.

반응형

'[하루] 일상과 독백' 카테고리의 다른 글

반란  (0) 2022.07.22
내가 싫어하는 사람  (0) 2021.12.08
플레이톡(playtalk.net)  (0) 2021.07.06
구글 애드센스 계좌입금  (0) 2021.01.26
구글 애드센스 수표 도착  (0) 2020.09.22