The PLT Blog

Hanging memories by one progress at a time.

도시통계분석 제2강(3/27) 정리

도시통계분석 1강에서는 과학적 지식의 특징으로서 논리성과 실증성에 대해서 배웠고, 사회과학은 사회현상을 탐구하는 학문으로서 어떻게 과학적 방법론을 적용하고 있는 지에 관해 고찰해 보았다. 연역적으로 수립한 가설을 실제 데이터를 통해 증명할 수도 있고, 귀납적인 방법으로 기존에 존재하는 데이터를 통해 현상을 설명할 수 도 있을 것이다.

제2강에서는 연구를 디자인 함에 있어서 연구의 1) 목적, 2) 설계, 그리고 3) 논문 리뷰에 관한 수업으로 구성되어 있었다.

연구설계의 분류

연구설계의 분류. 도시통계분석 강의자료 week3 中

연구 설계를 몇 가지로 유형화 하자면, 위와 같이, 연구 목적에 따라서도, 연구 상황이나 시점에 따라서도 분류가 가능하다.

하나씩 차근차근 살펴보면

연구설계의 목적에 따른 분류

  1. 탐색적 연구(Exploratory Research) – 주로 알고자 하는 현상에 대한 사전 지식이 없거나 선행연구가 없을 때 수행하며, 문헌조사, 전문가 조사, 사례 조사, 표적집단면접법(FGI) 등을 통해 필요한 정보를 획득하고 ‘완전히 신뢰할 수 있는 결과’보다는 아이디어나 통찰을 얻어내고자 한다.
  2. 서술적 연구(Descriptive Research) – 실제 현상이나 사건의 생성된 자료를 수집하고 통계분석을 적용하여 정보를 도출하는 연구 설계이며 ‘기술적 연구’로도 불린다. 연구대상의 특성, 기술, 빈도, 변수들 간의 연관성, 예측 등을 목적으로 하며 대부분 서베이를 통해 자료를 습득할 수 있다.
  • 연구시점에 따른 분류*
  • 횡단적 조사(Cross-sectional study) – 한 시점에서 다양한 대상과 변수에 대해 측정하는 조사 설계 방법을 의미하며, 대인면접, 우편면접, 전화면접, 인터넷면접 등을 통한 서베이를 활용하여 수집된 자료의 변수들 간 상호 관계나 분포를 연구하게 된다.
  • 종단적 조사(Longitudinal study) – 동일한 대상에 대해 시간 간격을 두고 반복 측정하는 연구설계기법으로 조사 대상의 변화를 추적이 가능한다
    • 추세연구: 시간에 따른 모집단의 변화를 조사
    • 코호트 연구: 특정한 하위집단, 즉 코호트(통계적으로 동일한 특성이나 행동 양식을 공유하는 집단)가 시간이 지남에 따라 어떻게 변동하는 지 연구
    • 패널연구: 각 시점마다 동일한 표본으로부터 자료 수집

3. 설명적/인과적 연구(Explanatory Research) – 주로 가설로서 수립한 원인과 결과 간의 관계를 규명하기 위한 조사이며 인과적 관계를 명확히 하기 위해서 매우 엄격한 조사설계가 필요하다.(독립변수 외에 결과 변수에 영향을 미치는 외생 변수에 대한 통제가 필요)

  • 연구상황에 따른 분류*
  • 유사실험설계(현장실험설계): 실제 상황에서 실험이 이루어져 현실성이 높지만 외생변수의 통제가 어려움
  • 실험 설계: 외생변수에 대한 통제가 가능하나 현실성이 떨어짐.
  • 자료 분석: 가설에서 제기된 명제들을 개념화하여 자료 수집 및 분석을 통해 인과관계의 통계적 유의성을 검증함.

인과관계의 판단 기준

통계적인 자료조사나 분석을 시행할 때 많은 경우 명백한 인과관계를 드러내기가 쉽지 않은데, 이를 경험적으로 증명하는 것이 일단 쉽지 않고 때문에 대체로 확률적 인과관계에 토대를 두고 있다.

  1. 특히 Correlation과 Causation을 구분하라.
    * 두 변수의 경험적 관계가 연관성이 있을 수 있고, 이는 통계적으로 상당히 유의미하지만, 이를 반드시 인과관계로 볼 수는 없는 점
  2. 시간 순서의 확인 필요
    * 두 변수 간 시간적 우선성이 확인 되어야만 인과성을 확인할 수 있음
  3. 비허위적 관계(Nonspurious relationship)인 경우
    * 두 변수 간에 나타나는 공변성과 시간적 우선성의 관계가 제 3의 다른 변수들로 인해 유발되는 지 여부를 검증해야 함. 이러한 허위적 변수를 spurious variable이라고 하는데, 예를 들면, 키가 큰 아이들의 지적 수준이 더 높다라는 부분이 통계적으로 유의미할 수 있지만, 여기에서 ‘나이’라는 허위적 변수가 작용하고 있다면 이는 허위적 관계에 해당한다고 볼 수 있다.

인과관계의 판단 기준(정리)

인과관계의 판단기준에 대한 내용을 위와 같이 표로 정리할 수 있다. 위 세 가지 사항이 확인되었을 때 특정 관계가 인과관계인 것에 어느정도 확신을 담보할 수 있다.

연구 설계의 타당성

윤리적 질문으로 넘어간다면, 우리가 실험을 통한 연구를 진행하는 이유는 결국 일반적인 사회현상에 대한 유의미한 이해를 도출하고 사회의 지식을 향상하기 위함일 것이다. 땜누에, 연구가 일반적으로 그리고 자체적으로 논리적이고 타당한지그 진실성에 대한 검증이 매우 중요하다.

연구 설계의 타당성(Validity)이란 원인변수와 결과변수 간의 인과 관계를 조사하는 연구 설계의 과정이 얼마나 진실에 가깝게 추론되는 지의 정도를 이야기한다.

이를 위해서는 연구 설계 전 과정에서 인과적 추론을 왜곡하는 요인(외생변수 등)을 배제하는 설계가 필요하다.

  • 내적 타당성
    • 측정된 종속 변수의 변화가 독립변수의 변화로 인한 것임을 확신할 수 있는 정도/영향 통제필요
    • *이에대한 위협요소로는 외적 사건, 시간의 경과에 따른 대상의 변화, 실험대상의 소멸, 측정방법의 변화 등을 들 수 있다.
  • 외적 타당성: 외적타당성(External validity)이란 표본에서 얻어진 결과가 얼마나 집단 전체로 일반화 될 수 있는 지의 정도를 말하며, 표본이 대표성을 가질 수 있을 정도로 규모, 상호작용 등이 중요한 영향 요소가 될 수 있다.
  • 내적타당성과 외적타당성에 대해서는 그 진실성이 다소 상호간에 배제성을 가지고 있어 실험실실험vs.현장실험간의 딜레마가 존재한다고 볼 수 있다.

분석단위와 연구 설계

연구를 설계 함에 있어 사회과학은 무엇을, 혹은 누구를 연구할 것인지에 한계를 두지 않고 있기 때문에 일반적으로는 개인, 그룹 조직, 지역, 사회적 상호작용 등 다양한 대상을 설정하여 연구에 임할 수 있다. 다만, 대상 설정에 있어서 대상이 일반화 될 수 있는 사회적 집단에 대한 인해도가 중요할 것으로 볼 수 있다. (여기에서 분석단위는 일반적으로 관찰 단위를 의미한다고 볼 수 있다)

  • 연구 설계
    • 문제제기
      • 문제에 대한 정의
      • 예비조사
    • 조사설계
      • 가설 형성
      • 조사 방법
      • 질문지, 표본 설계
    • 자료수집
    • 자료분석
    • 보고서 작성

사실 위와 같은 단계로 연구의 설계와 수행이 진행된다고 보면 간단하지만, 곧 과제를 통해 직접 연구를 설계하고 수행하게 될 수 있기 때문에 보다 심층 적으로 연구 설계과정을 바라보자면,

  1. 문제제기
    * 개인적 경험, 흥미, 관심, 타인과 상호작용, 기존 이론, 실제적인 상황의 바생 등에 따라 문제를 인식하고 문제를 ‘연구문제’로서 정의함으로써 연구하고자 하는 것이 정확히 무엇인지, 왜 필요한지, 문제가 연구의 목적을 반영하는 지 여부 등을 명확화 할 필요가 있다.
    * 연구문제를 찾는 과정은 전체 연구과정에서 가장 중요한 일이며(교수님 피셜), 조사 연구의 모든 과정은 연구문제와 긴밀히 연관되어 있다.
  2. 문제 설정 시 고려사항
    * 독창성: 기존의 것을 답습X, 비교분석 또는 재구성은 OK
    * 연구범위의 적절성: 한정된 범위의 구체적인 조사
    * 조사의 현실적 여건: 연구에 소요되는 돈, 시간, 에너지, 자료수집의 용이성 등의 현실적 실행가능성을 고려해야 한다.
    * 검증 가능성: 경험적 검증의 가능성이 필요하다.
    * 효용성: 연구 결과를 통해 ‘무엇을 하려는 것인지’, 즉 연구의 효용성에 대한 의도가 연구 문제에 포함되어야 한다.
    ** 위와 같은 점들을 고려하여 연구를 이끌어나갈 연구 문제와 가설을 명확하게 기술할 수 있어야 한다.

연구 설계 과정: 가설 형성

가설 형성의 단계에서 연구를 통해 검정하고자 하는 둘 또는 그 이상의 변수들 간의 관계에 대한 가정적 명제(연역 또는 귀납법으로 구성)를 설정하고 변수들 간의 관계를 명확히 서술할 수 있어야 한다.

물론, 모든 연구에 가설이 필요한 것은 아니나 연구 문제에 따라 연구의 영역과 방법, 결과 활용에 대한 전반적인 계획은 수립되어야 마땅하다.

개념화와 조작화*

개념화와 조작화는 Conceptualization과 operationalization이다.

개념화(Conceptualization)는 모든 개념에 대해 확실한 의미를 구체화 하고 동일한 단어나 용어라도 사용되는 분야나 맥락에 따라 다양하게 정의될 수 있다는 점을 기억하여 이를 규정해 주어야 한다.

조작화(Operationalization)는 위의 명확하게 정의된 개념을 측정가능한 형태로 측정방법을 명확히 하고 측정방법의 타당성을 밝히는 것으로 볼 수 있다. 예를 들자면, 한 연구에서 빈곤을 낮은 소득수준으로 정의할 때 이를 조작화하여 4인가족 기준 월 소득이 100만원 이하일때 이를 ‘빈곤’으로 분류할 수 있도록 하면, 이는 ‘빈곤’을 개념화 및 조작화 한 것이다.

마지막으로, 연구를 할 때 앞서 설명한 것처럼 외재변수나 허위변수에 유의해야 하며, 명확한 이들 외재 변수에 대해서는 이를 통제변수(Controlled variable)로 설정하여 영향을 최소화 할 필요가 있다.

조사 방법을 결정하고, 조사설계의 단계에서는 1차 자료(Primary source)와 2차자료(Secondary source)중 어떤 자료에 의존할 것인가, 그리고 특히 1차 자료의 경우에는 질문지 설계, 표본 설계 등의 과정을 거치는데 표본설계의 경우 전수조사는 대부분 불가능 하기 때문에 어떻게 하면 모집단(전수)을 대표할 수 있는 표본을 대상으로 조사를 수행할 것인가, 어떻게 하면 설문을 통해 보다 객관적인 자료를 도출할 수 있을 것인가에 대한 고민이 필요할 것으로 볼 수 있다.

자료의 수집과 분석

일반적으로 설문을 실시할 때 질문지 사전조사를 실시하여 이를 보완 및 수정하며, 면접원에 대한 선바과 사전교육이 필요할 수 있다.

마지막으로, 자료 분석의 단계에서는 우선적으로 수집된 자료의 타당성, 정확성, 일관성과 객관성을 검정해야 하며, 자료를 분류하고 부호화(coding)하여 사용한다. 계량 분석법을 통해 비모수검정 등 자료 및 표본의 타당성을 검증할 수 있으며, 이에 대해서는 이후 강의에서 차차 확인할 수 있을 예정이다.

Leave a Reply