Ⅲ. 가설은 어떻게 검정되는가?

반응형

Ⅲ. 가설은 어떻게 검정되는가?
- 기본개념의 이해 -

 

자, 일련의 과정을 건너뛰고, 우리는 궁금한 질문에 대해 우선 답을 찾아보자. 도대체 내가 알고 싶은 연구주제는 어떻게 그 사실 여부를 확인할 수 있는 것일까? 물론 우린 사회조사를 얘기하고 있기 때문에 조사된 결과가 있을 것이고 이를 바탕으로 통계 프로그램을 활용해 결과를 확인하게 될 것이다.
그런데 한 가지 문제가 있다. 우리는 SPSS와 같은 통계 프로그램을 활용하면서 그것이 바로 결론까지 일사천리로 보여주었으면 하는 기대를 갖는다. 하지만 단적으로 말해 통계 프로그램은 계산기일 뿐이다. 즉 계산의 결과값은 바로 알려주지만 그것이 어떤 의미인지는 연구자가 직접 해석해야만 한다. 

예를 하나 들어 보자.

우리는 증감을 두 가지 방식으로 표현할 수 있다. 사전(A)-사후(B)하여 “1이 감소했다”고 말할 수도 있고, 사후(B)-사전(A)하여 “증감이 –1이 되었다”고 말할 수도 있다. 바꿔말해 분석을 어떤 방식으로 하였는지에 따라 결과값은 다르게 나타날 수 있으나 의미는 동일하다. 그리고 그 결과를 해석해 문장으로 만들어내는 것은 연구자의 몫이 된다.

이처럼 우리는 알고 싶은 것을 질문으로 만들어 컴퓨터(통계 프로그램)에게 물어봐야한다. 그런데 컴퓨터는 “예/아니오”로 밖에 답할 수 없다. 엄밀히 말하면, “‘아니오’일 확률이 몇 %입니다.”가 될 것이다. 
 그렇다면 어떤 질문을 던져야 할까? 컴퓨터 통계 프로그램에게 던지는 질문을 우리는 영가설이라고 하고, 영가설의 형태는 “차이가 없다”라는 형식으로 정해져있다.
아마도 연구자는 “성별에 따른 TV 시청 시간에는 평균의 차이가 없다.”는 영가설을 만들 수 있을 것이다. 이 질문에 대해 컴퓨터는 영가설을 기각할 수 있는지 없는지를 알려줄 것이다.

연구자의 질문 → 영가설 설정 → 영가설 입증 → 결과의 해석

그렇다면 도대체 영가설은 또 뭐란 말인가?

 

반응형

Ⅱ. 사회조사와 데이터분석 시나리오

반응형

Ⅱ. 사회조사와 데이터분석 시나리오

 

우리는 실천 현장에서, 학계에서 논문을 쓰기 위해 등의 이유로 통계를 사용하게 된다. 이런 상황을 가정하여 그것이 어떻게 진행이 될지를 한번 상상해 보자. 아마도 다음과 같은 순서를 떠올릴 수 있을 것이다.

일반적 진행 순서

예를 들어서 살펴보자. 
연구자는 ‘부모의 양육태도’가 ‘청소년의 가출’에 유의미한 영향을 미칠 것이라고 생각한다(연구할 주제). 그래서 ‘부모의 양육태도와 청소년의 가출은 상관관계가 있다.’는 가설을 세웠다.
이제 해야할 일은 부모의 양육태도와 관련하여 다른 학자들은 어떻게 정의했는가? 공통된 입장은 무엇인가? 다른 의견은 없는가? 기존에 부모의 양육태도는 어떤 하위 개념들로 구성되어 있는가? 등을 확인해보는 일이다(이론적 배경 검토). 예를 들어 부모의 양육태도를 Baumrind는 허용적/방임적, 민주적/독재적이라는 4가지 양육태도로 구분하고 있다. 
그리고 이를 측정이 가능한 개념으로 변환(변수 정의)해야하는데, 앞선 이론적 배경을 바탕으로 기존에는 어떻게 측정하였는지, 그리고 나는 어떻게 생각하는지, 그리고 그 생각은 타당한지를 검토해야한다. 즉 양육태도가 허용적인지 방임적인지는 어떤 질문을 통해 알 수 있는 것일까? 그것이 변수가 될 것이다. 하지만 걱정할 필요는 없다. 이미 많은 연구자들이 개념과 측정방법을 정립해 두었고, 우리는 이를 차용하면 된다.
이러한 생각을 담아 설문지를 구성하고, 실제 조사를 실시한 다음, 얻어진 결과들을 컴퓨터 프로그램이 받아들일 수 있는 방식으로 변환(코딩)한다.
하지만 설문응답이 늘 성실한 것은 아니다. 5점 척도 설문에 모두 3번으로만 체크했다든지, 대부분의 질문에 응답을 하지 않았다든지 한다면, 이것이 신뢰할 수 있는 데이터인지를 연구자는 판단해야한다(이상값 처리). 우리는 이상값이라는 것을 어떻게 판단할 수 있을까? 이에 대해서는 중급통계 이상에서 다루게 된다.
 또한 사람이 하는지라 설문지는 맞게 수렴되었는데, 코딩해서 입력하는 과정에서 실수가 있을 수도 있을 것이다. 
이마저 끝이 났다면, 이제 통계 프로그램을 활용해 데이터를 분석하고, 나온 결과값이 어떤 의미인지 해석해서 보고서로 정리하게 될 것이다.

만일 당신이 사회조사를 통해 연구를 진행하고자 한다면, 위 일련의 과정에서 필요한 개념들을 하나하나 익혀갈 필요가 있다. 그리고 많은 교재들은 위 순서대로 목차가 구성되어 있다. 물론 우리는 조금 다른 방식으로 이야기를 풀어가고자 한다.

반응형

Ⅰ. 들어가며

반응형

사회조사와 데이터분석에 대한 몇 가지 질문
- 추리통계, 인문계열의 관점에서 이해하기 -

 

Ⅰ. 들어가며

 

사회조사가 사회학 등에서 필요한 이유에 대한 설명들은 매우 많다. 하지만 여전히 사회조사와 데이터분석은 어렵기만 하다. 여러 경험에 비추어 보건 데 그 어려움은 몇 가지 이유에 기인한다.
첫째, 말이 너무 어렵다. 사회조사와 데이터분석에 대한 책을 읽는 것은 분명 한글로 쓰여있음에도 불구하고 러시아어를 보는 것과 별반 다르지 않은 느낌이다. 게다가 전공마다 학자마다 같은 말을 다르게 표현한다. 분석방법은 그것을 개발한 학자의 이름을 따오다 보니 발음하기조차 쉽지 않은 것이 현실이다. 
둘째, 교재에 많은 내용들이 생략되어 있다. 용어 하나하나가 낯설어 이해가 잘 안가는데, 교재는 이미 그것을 알고 있다고 전제한다. 어찌보면 당연한 얘기인데, 우리는 이미 중고등학교를 통해 확률이라는 개념을 배웠기 때문이다. 하지만 인문계열의 경우 대학을 진학했다 하더라도 기억에 남아있지 않을뿐더러, 사회학 실천 현장에 나온 경우 더욱 긴 시간을 건너 접하게 되는 용어들은 낯설기만 하다.
셋째, 그 원리를 직관적으로 이해하기 어렵다. 사실 천천히 따져서 살펴본다면 이해못할 것도 없겠지만 우리에게 배움의 시간은 제한적이다. 그러다보니 왜 그런지는 이해하지 못한 채 단편적으로 통계패키지의 활용법에 그치는 경우가 많다. 그로 인해 똑같은 이야기임에도 표현 하나만 달라져도 그것이 옳은지 그른지 판단하지 못한다.
이런 이유로 누구 하나 쉽게 사회조사의 결과를 분석하기 위한 통계에 대해 잘 알고 있다고 말하기가 쉽지 않다.
이 글은 이런 고민에서 출발한다. 하여 글의 구성 또한 기본적인 이론적 배경이 아니라 현실에서 경험하게 되는 일련의 시나리오를 바탕으로 인문계열의 입장에서 의식의 흐름을 쫓아가며 써내려가 보았다. 또한 이야기의 흐름에 방해가 되는 부분들은 각주 처리하여 뒷부분으로 옮겨놓았으니 필요하다고 느낄 때 확인하면 될 것이다.
이 길지 않은 글이 사회조사와 데이터분석을 하는 이들에게 조금은 쉬운 해설이 되기를 바란다.

반응형