[통계] STATA: table 옵션 변경

반응형

STATA가 버전이 바뀌면서 table의 옵션이 바뀌었다.

 

STATA table Syntax

기존의 버전에서는 table의 옵션에 contents가 있어서, 평균, 표준편차 등을 행으로 해서 비교가 가능했었다.

흔히들

.table 변수1 변수2, c(평균 표준편차)

위와 같은 형태로 사용했었다. 

하지만 이젠 이 옵션이 사라진 것이다.

 

STATA table contents

STATA 17 버전에서 table의 sysntax를 살펴보면,

STATA17 table sysntax

 

따라서 17버전에서는 해당 명령어를 달리해야만 내용을 확인할 수 있다.

 

예를 들어, 아래와 같이 바꿔줘야만 한다.

.table h1601_1 h16_hc_all, c(mean h16_din sd h16_din)
.table h1601_1 h16_hc_all, statistic(mean h16_din) statistic(sd h16_din)

만일, 2개 이상의 변수에서 평균을 보고자 한다면, 같은 방식으로 병기해주면 된다.
예) .table h1601_1 h16_hc_all, statistic(mean h16_din h16_cin) statistic(sd h16_din h16_cin)

 

구버전에서는 c() 안에 mean, sd, max 등을 같이 나타낼 수 있었으나, 새버전에서는 평균은 mean으로 묶고, 표준편차는 sd로 따로 묶어주어야만 제대로 된 값을 출력해준다.

STATA17 table output

 

 

반응형

[통계] STATA에 패키지 오프라인 설치하기

반응형

보통 외부 패키지를 설치하고자 할때는 

.findit 패키지명

이렇게 검색하고, 거기서 바로 클릭해 설치를 합니다.

하지만 간혹 서버가 닫히면 패키지를 다운받을 수 없어 설치가 안됩니다.


오늘 wls0 패키지를 다운받으려고, 
.findit wls0
이렇게 했는데, 갑자기 안보이는 겁니다.
https://stats.oarc.ucla.edu/stat/stata/ado/analysis/
여기에서 제공하고 있었는데, 404 Forbidden이 뜨면서 연결이 안되었습니다.
https://stats.oarc.ucla.edu/stata/ado/analysis/

위와 같이 다운링크가 수정되었는데, 반영이 안되었나봅니다.

여기서 wls0를 클릭하셔서 직접 다운받으시면 됩니다.

 

그리고 다른 사람이 해당 패키지를 이미 갖고 있다면 그 파일을 복사해서 설치할 수도 있습니다.

일단, 해당패키지가 설치된 주소를 알아야 하는데,
C:\Users\사용자계정\ado\plus\
여기에 해당 알파벳 폴더에 패키지가 있습니다.
wls0는 C:\Users\사용자계정\ado\plus\w 폴더에 있습니다.

여기서 두 파일을 복사해야합니다.
****.ado
****.sthlp 또는 ****.hlp

만일 wls0라면 각각 wls0.ado, wls0.hlp가 될겁니다.

https://stats.oarc.ucla.edu/ 여기서 Softwares > Stata 찾아들어가시면,

Advanced Usage에 Stata Programs for Research and Teaching 링크가 있습니다.

바로 아래 링크가 그것입니다.

그리고 다시한번 IDRE Stata programs for data analysis 링크를 클릭하시면,

여기서 wls0를 클릭해 다운받으시면 되며, 그외 다른 다양한 패키지도 확인하실 수 있습니다.

https://stats.oarc.ucla.edu/stata/ado/analysis/

 

그리고 이 두 파일을 내 컴퓨터의 똑같은 경로에 붙여넣기만 하면 됩니다.
만일 해당 알파벳 폴더가 없다면 새로 만드시면 됩니다.
wls0는 w 폴더에 넣으시면 됩니다.

이제 STATA에서
.help wls0
이렇게 하시면 wls0의 용례(syntax)를 확인할 수 있으며, 분석도 가능해집니다.

반응형

[통계] 가중치를 활용한 회귀분석(WLS, Weighted Least Square, 가중최소제곱법)

반응형

※ 자료가 등분산성을 충족하지 못할 때, 즉 이분산일 때에는 OLS(최소제곱법)이 아니라 WLS 방식으로 보정하여 분석을 해야한다.

 

- 종속변수 : Y

- 독립변수: X1, X2, X3

- 가중치(weights) = 1/σ^2

 

SPSS를 활용해서 가중치를 구하고, 이를 통해 WLS의 방식으로 회귀분석 하는 방법

 

① 분석>회귀분석>선형
- 종속변수: Y
- 독립변수: X1, X2, X3
- 저장 > 예측값 > 비표준화 체크 # 예측값을 새 변수(PRE_1)수로 저장
- 저장 > 잔차 > 비표준화 체크 # 잔차를 새 변수(RES_1)수로 저장

② 변환>변수 계산
- 목표변수: absRES # 잔차의 절대값을 absRES로 생성
- 숫자표현식: abs(RES_1)

③ 분석>회귀분석>선형 # 잔차의 절대값과 예측치 간의 회귀분석
- 종속변수: absRES
- 독립변수: PRE_1
- 저장 > 예측값 > 비표준화 체크 # 예측값을 새 변수(PRE_2)수로 저장

④ 변환>변수 계산 # 가중치 계산
- 목표변수: weights # 가중치를 weights 변수로 생성
- 숫자표현식: 1/(PRE_2**2) # 1을 PRE_2의 제곱으로 나눔

⑤  분석>회귀분석>가중추정
- 종속변수: Y
- 독립변수: X1, X2, X3
- 가중변수: weights

 

--------------------------------------

 

R을 활용하는 방법: 가중치(weights) 구하는 두가지 계산식

 

① model <- lm(Y ~ X1+X2+X3, data="데이터") # 회귀분석 실시

 

 weights <- 1/fitted(lm(abs(residuals(model)) ~ fitted(model)))^2 # 가중치구하는 방법 첫번째
② weights <- 1/lm(abs(model$residuals) ~ model$fitted.values)$fitted.values^2 # 가중치 구하는 방법 두번째

- 둘중 어느 방법을 사용해도 결과값은 동일하다.

- residuals(model) # 회귀모델에서의 잔차 (SPSS에서 RES_1)

- fitted(model) # 회귀모델에서의 예측치 (SPSS에서 PRE_1)

- fitted(lm(abs(residuals(model)) ~ fitted(model))) # 잔차의 절대값과 예측치(PRE_1)간의 회귀모형에서의 예측치 (SPSS에서 PRE_2)

 

반응형

Excel로 통계분석하기 #2

반응형

2021.11.07 - [[정보] 복지 이야기/[福] 복지 배우기] - Excel로 통계분석하기 #1

 

Excel로 통계분석하기 #1

굳이 비싼 통계 프로그램을 사용하지 않더라도, 업무에서 많이 사용하는 엑셀로도 간단한 통계분석은 충분히 할 수 있다. 그 방법 몇가지에 대해 안내하고자 한다. 첫째, 통계분석에 대한 수식

welfareact.net

 

마지막 세번째 방법은 바로 real statistics라는 add in을 설치하는 방법이다.

http://www.real-statistics.com

 

Home Page (Welcome) | Real Statistics Using Excel

What is Real Statistics Using Excel? Real Statistics Using Excel is a practical guide for how to do statistical analysis in Excel plus free statistics software. This software package extends Excel’s built-in statistical capabilities. This will enable yo

www.real-statistics.com

 

앞서 분석도구가 단지 계산된 값만을 보여준다면, real statistics는 그 계산을 위한 수식을 그대로 보여준다는 점이다.

통계를 공부하고자 하는 이들이 그 원리를 파악하는데 많은 도움이 된다.

또한 ANOVA의 경우 엑셀에서는 Post Hoc Test(사후검정)를 하는 것이 쉽지 않은데, 여기서는 Tukey HSD, Scheffe 등의 옵션을 제공해준다.

 

<설치방법>
Real Statistics Resource Pack을 설치하기 전에 Excel의 Solver 기능(해 찾기 추가 기능)이 컴퓨터에 설치되어 있는지 확인해야한다. 다음의 과정을 통해 확인할 수 있다.

첫째, Solver 기능(해 찾기 추가 기능)
1. 빈 Excel 스프레드 시트를 연다.
2. Alt-T I를 누른다(즉, Alt 키를 누른 상태에서 T 및 I 키를 누른다).
3. 나타나는 대화 상자에서 "해 찾기 추가 기능"이 선택되어 있는지 확인한다. 
4. "해 찾기 추가 기능"이 미리 체크되어 있지 않았다면, 다음 단계로 진행하기 전에 Excel을 종료했다가 다시 실행해야한다.


"해 찾기 추가 기능"이 설치되었는지 확인하였다면, 다음 단계를 사용하여 Real Statistics Real Pack을 설치한다.

둘째, 리소스 팩 설치

1. 리소스팩(resource pack)을 다운로드한다. // XRealStats.xlam

real statistics 다운로드하기

https://www.real-statistics.com/wp-content/uploads/2021/10/XRealStats.xlam

2. 리소스 팩을 컴퓨터의 원하는 위치로 옮긴다. (아래 권장) 
   권장 위치: C:\Users\사용자\사용자명\AppData\Roaming\Microsoft\AddIns
   ※ 주의: 특정 위치에 리소스 팩을 설치하고나면, 나중에 이동하기가 더 어려워진다.
3. Excel 을 실행한다. 단, 다운로드한 XRealStats.xlam 파일을 먼저 열려고 하면 안된다.
4. [ 파일 > 옵션> 추가 기능 ]을 클릭한 후, 하단의 관리(A) : Excel 추가 기능 [이동(G)]을 클릭한다.
   이 메뉴의 단축키는 Alt + T I 이다.
5. 이때 나타나는 대화 상자 에서 Xrealstats 를 선택하고, 확인 버튼을 클릭한다.
   ※ 주의: 이전에 Realstats를 활성화한 경우 Realstats  옵션을 선택 취소 해야한다 .
   이 옵션이 나타나지 않으면 찾아보기를 클릭 하여 xrealstats.xlam 파일을 찾아 선택한다. 
   그런 다음 위에서 설명한대로 4단계를 완료한다.

Excel: 추가기능 - real statistics

<사용방법>

1. "추가 기능"이라는 메뉴가 새롭게 생기고, 이를 클릭하면 "Real Statistics"라는 메뉴와 그 아래에 "Data Analysis Tools"가 나타난다.

Excel: 추가 기능 - Real Statistics - Data Analysis Tools

 

2. 다양한 통계분석을 위한 메뉴들이 나타난다.

Excel: Real Statistics 분석 메뉴

 

3. 구체적인 사용법은 직접 하나씩 배워보도록 하자.

다양한 예제와 활용법에 대한 워크북도 제공한다.

https://www.real-statistics.com/free-download/real-statistics-examples-workbook/

 

Real Statistics Examples Workbooks | Real Statistics Using Excel

Thirteen Excel workbooks can be downloaded for free which contain worksheets that implement the various tests and analyses described in the rest of this website. In parentheses is a list of the Real Statistics website main menu topics covered in each examp

www.real-statistics.com

Download

아래에 있는 다양한 파일들을 다운받아 확인하고 배워보자.

 

반응형

Excel로 통계분석하기 #1

반응형

굳이 비싼 통계 프로그램을 사용하지 않더라도, 업무에서 많이 사용하는 엑셀로도 간단한 통계분석은 충분히 할 수 있다.

그 방법 몇가지에 대해 안내하고자 한다.

 

첫째, 통계분석에 대한 수식을 직접 입력하여서 구하는 방법

이건 조금 숙련도를 요구하는데, 이에 대해 가르쳐주는 곳이 있다.

통계청의 통계교육원(https://sti.kostat.go.kr/)이라는 곳이다.

굳이 엑셀뿐만 아니라 통계관련 프로그램에 대해 전반적으로 잘 설명해주고 있다.

이러닝을 통해 관심있는 분야를 배워보는 것도 좋을 것이다.

이 포스팅과 관련하여서는 "엑셀로 배우는 통계분석(2021)"라는 강좌가 있다.

기본적인 개념도 잘 설명해주고 내용도 충실하다. 강력추천!!!

 

둘째, 엑셀의 추가기능으로 "분석도구"를 사용하는 방법

"엑셀 + 분석도구"로 구글 검색하면 방법이 많이 나오니 참고하자.

엑셀: 옵션 - 추가기능
엑셀: 옵션 - 추가기능 - 분석도구
엑셀 메뉴: 데이터 - 데이터 분석
엑셀 데이터 분석 메뉴

셋째, real statistics 애드온(add on)을 추가설치

 

... to be contineued

반응형