The PLT Blog

Hanging memories by one progress at a time.

도시통계분석 제3강(4/3) 정리

도시통계분석 수업을 들으면서, 비대면 수업이 진행되는 동안 학생인 우리들도 수업을 진행하는 교수님도 서로를 알아가고 있는 단계에 있으며, 수업의 내용을 구성이 기대와 실제의 차이에 따라서도 달라질 수 있겠다는 생각을 했다.

이번에 수강학하게 된 도시통계분석 수업에서는 우선 ‘사회조사방법론’의 이론과 절차를 간략하게 개론적으로 설명한 이후 사회조사 및 데이터분석에 필요한 기초통계학을 공부하고, 이를 실제 프로젝트에서 활용해 보는 것을 목표로 하고 있다.

3강의 내용은 2강에서 이미 다루었던 연구의 목적과 설계과정에서 나아가 연구를 설계 하기 위해 필요한 척도법과 신뢰성과 정확성의 중요성, 그리고 이를 측정하는 방법들에 대해 배웠다.

측정이란 무엇인가?

측정을 딱딱하게 정의하자면 “대상, 사건, 사람들의 속성에 일정한 규칙에 따라서 수치를 부여하는 과정”이라 명명할 수 있다. 일반적으로 숫자를 사용하고, 수치로 표현된 자료는 대상에 대한 정확한 표현, 정확한 의사 전달 및 각종 통계기법의 적용도 가능하다.

사회과학의 경우 자연과학보다 측정작업이 어렵다고 볼 수 있는데 그 이유는 측정 대상이 추상적인 개념인 경우가 다수 있고 이 개념이 다른 개념과 섞여 복합적으로 작용하는 경우가 많기 때문이다.

측정의 수준(Level of Measurement)에 따른 분류

정보의 정확성이나 양에 따른 다양한 측정의 수준이 존재하는데 명목 수준, 서열 수준, 등간 수준, 비율 수준 등이 있다.

  1. 명목 측정
    명목 척도(Nominal measures)란 측정 대상의 특성을 종류별, 유형별로 구분하여 각 대상에 숫자를 부여할 수 있는데, 여기에서 숫자는 크기나 정도의 의미를 갖지 않고 단지 범주의 의미를 갖게 된다. 단순히, Categorical variable(범주형 변수)의 분석 작업을 용이하게 하기 위해서 번호를 부여한 것으로 생각할 수 있다. (*따라서 산출 된 측정값들의 연산 조작은 허용되지 않는다.)
    * 더불어, 범주형 변수를 중심으로 생각했을 때 하나의 값이 반드시 해당하는 값을 포괄하는 포괄성이 있어야 하고, 상호 간 겹치는 값이 존재해서는 안되는 상호 배타성이 있어야 한다.
  2. 서열측정(Ordinal measures)
    측정 대상을 속성에 따라 분류하되 각 범주 간에 상대적 순서나 서열을 부여하는 방법으로, 서열 간의 간격은 임의로 지정될 수 있으며 상대적인 기준을 가지고 A집단 보다 ‘더 좋다’ ‘더 안 좋다’등으로 표시될 수도 있다.
  3. 등간 측정(Interval Measures)
    등간 측정은 서열 측정과 마찬가지로 범주 간 서열을 부여하 되 서열 간의 간격이 동일하도록 수치를 부여하는 것을 말한다. 등간 측정의 경우 수치를 값으로 나타내어 연산을 하는 것이 가능하며, 대표적인 예로 IQ수치, 온도 등이 있다.
  4. 비율 측정(Ratio measures)
    측정 대상을 분류하고 서열을 정할 수 있으며, 카테고리 간의 간격을 측정 가능한 측정 방법으로 실제하는 값으로 0을 정하며 -값은 나타나지 않게 된다. 예시로는 화폐단위(소득액), 나이, 교육 수준(0년) 등을 들 수 있다.

위 네 가지 측정 법은 1940년대 Stanley Smith Stevens에 의해 고안되었는데 명목측정(Nominal measures)과 서열측정(Ordinal measures)은 정성적인 측정법에, 등간측정(Interval Measures)과 비율측정(Ratio measures)은 정량적 측정법에 해당한다.

측정 수준별 특성 및 자료 적용

위 표는 위에서 설명한 네 가지 측정법을 특성별로 구분하고 있다.

설문지 작성

사회적 현상이나 상호관계를 탐구하는 연구 설계에 있어 중요한 도구 중 하나는 설문지 이다.

설문지는 연구 내용과 관련된 응답자들의 생각, 느낌, 행동 등을 측정하는 도구로 연구 목적에 맞추어 개바하거나 기존 설문 결과를 이용할 수도 있다.

설문지 작성시 유의해야 할 사항으로는

  • 연구가설을 구성하는 변수들을 모두 측정할 수 있도록 “측정할 개념을 결정”하고
  • 어떤 항목들을 어떤 통계기법으로 분석할 것인가를 고민하며(분석 방법의 고려)
  • 질문의 표현 방법에 있어서 아래 사항 등을 고려하여야 한다.
    • 응답자 수준에 맞추어 질문
    • 애매모호한 질문을 지양
    • 유도질문을 하지 않아야 함
    • 응답자가 답변하기 쉬운 질문
    • 한 번에 두 개 이상의 질문X

척도법의 종류와 활용

척도란 ‘측정(measurement)을 목적으로 일정한 규칙에 따라 측정 대상에 적용할 수 있도록 만들어진 도구’를 의미한다.

사람의 키를 재는 행위(측정) vs. 사람의 키를 재기 위한 자 혹은 cm단위(척도)

다음 네 가지 척도법은 사회조사 연구에서 특히 자주 활용되고 있다.

  1. 리커트 척도법(Likert Scaling)
    리커트 척도법은 대표적인 응답자 중심의 척도화 방법으로 질문에 대한 동의 정도에 따라 응답 항목을 ‘매우 찬성, 찬성, 중립, 반대, 매우 반대’의 5점 척도로 설계하고 각 항목에 5, 4, 3, 2, 1 등으로 배점하여 항목의 측정치를 합산하여 평가하는 방법을 말한다.
    * 장점: 간편한 구성
    * 단점: 각 항목에 대한 응답자의 태도의 강도가 정확히 일치하기 힘들어 엄격한 의미의 등간 척도가 되기는 어려운 점.
    * 구성절차: 의견 수집 – 응답 범주 작성 – 응답 – 점수 환산 – (문항 분석) – 응답자 총점 산출
  2. 거트만 척도법(Guttman Scaling)
    거트만 척도법은 주로 단일 의견에 대한 응답자의 찬성 정도를 평가하기 위해 그 정도의 순위가 매겨진 일련의 동일한 의견의 문장에 대해 응답자가 ‘네’라고 대답하는 빈도를 통해 관련된 주관적 찬성 정도를 파악할 수 있는 방법이다. 일반적으로 설문에서 동일한 질문을 하는 것은 지향하나, 거트만 척도법과 같이 설계된 방식으로 이를 진행하는 경우에는 용인된다.
  3. 서스턴 척도법(Thurstone Scaling)
    서스턴 척도법은 태도를 측정하기 위해 고안된 척도법으로 응답자의 태도를 찬반의 연속성을 가진 문항들에 의해 측정하게 되는데 문항 작성 과정에서 전문가인 평가자들에 의한 문항 평가를 실시하여 순항을 선정하고 척도치를 부여하게 된다.
    *서스턴 척도법은 유사동간척도(equal-appearing interval scale)라고도 불린다.
  4. 어의변별 척도(Semantic Differential)
    어의 변별척도 혹은 의미차별화 척도 역시 응답자의 태도를 측정하고자 고안된 척도법으로 두 가지 상반되는 의미의 형용사나 평가척도가 주어지고, 이 두 가지 상반되는 양극 사이의 어느 한 지점을 응답자가 선택하여 응답자 본인의 태도가 중립적인지 혹은 어느정도 찬반불호를 나타내는 지 선택하게 된다.
    *장점: 척도구성이 용이하며 가치와 태도 같은 주관적 개념측정에 용이
    *단점: 어의 차이가 애매하거나 모호한 경우 적절한 평가가 어려움

설문을 활용하여 대상에 대한 모집단의 주관적 의견이나 태도에 대한 사회연구를 진행하는 경우 위에서 언급된 네 가지 척도법을 활용할 수 있을 것이다.

측정 오류

연구의 자료조사 및 데이터 수집 단계에서 측정 오류가 발생할 수 있다.

측정오류란 대상을 측정할 때 본래의 대상이 갖는 실상과 측정 결과 간의 차이에서 오는 불일치를 이야기 하는데, 다음의 관계를 참고할 수 있다.

측정된 관찰값은 정확한 진실된 값에서 구조적 오차와 우연히 발생하는 무작위적 오류가 더해진 것으로 볼 수 있다.

측정의 신뢰도 확보

측정에 있어서 오류를 최소화 하는 것 만큼이나 중요한 것은 측정값의 신뢰도(Reliability)를 확보하는 것이다. 측정의 신뢰도를 높이기 위해서는

  • 측정도구에 해당하는 설문 문항/ 조사방법 등을 가능한 명확히 기술하고
  • 측정도구를 가능한 표준화하고 통제하며
  • 다수의 측정문항을 사용하고
  • Cronbach’s alpha계수 조사를 통해 일부 신뢰도가 낮은 항목은 제거한다.

더불어 신뢰도를 평가할 수 있는 방법으로는 동일한 검사를 다른 시점에서 혹은 동일특성의 대상에 실시하는 ‘재검사법’ 그리고 측정 도구를 임의로 반으로 나누어 독립된 두 개의 척도로 사용하여 측정해 보았을 때 연산을 통해 단일 측정시와 동일한 결과가 나오는 지를 검사하는 ‘반분법’ 등이 있다.

*크론바우 알파 계수를 통한 내적 일관성 분석의 겨우 동일한 개념에 대한 여러 항목의 척도를 구성하여, 측정값들의 일관성을 분석하는 것으로 일반적으로 0.7 이상이면 합당하고 0.8 이상이면 바람직 한 것으로 본다.

측정의 타당성

측정 타당성이란 ‘측정하고자 하는 대상을 측정도구가 얼마나 정확히 측정하는가에 관한 것으로 한 측정 방법이 개념의 실제 의미를 얼마나 적절하게 반영하고 있는 지의 정도를 나타낸다.

  • 기준관련 타당성(Criterion validity/ Concrete validity): 측정대상과 측정도구간의 연관성이 합당한지
    • Predictive validity(예측타당성): 측정 대상과 측정도구간의 관계가 예측과 결과로서 나타날 때
    • Concurrent validity(동시타당성): 상단의 관계가 동시에 발생하는 경우
  • 내용 타당성(Content validity/Logical validity)
    • 측정도구가 측정하고자 하는 대상을 얼마나 종합적으로 반영하고 있는 지/ 대변하는 지를 의미하며 (*특히 내용타당성의 경우에는 주관적 판단에 따라 측정되는 만큼 임의의 측정도구보다는 기존 선행연구에서 사용된 측정도구를 사용하는 것이 내용 타당성 확보에 유리하다고 볼 수 있음)
  • 구성 타당성(Construct Validity): Construct는 사회학을 비롯한 심리학에서 주로 사용되는 개념으로 연구자의 가설을 측정하기 위한 추상적인 개념으로 볼 수 있는데 구성 타당성이란 측정도구가 실제 이와 같은 가설을 측정하기에 얼마나 적합한 도구인지를 확인하는 것으로 보 수 있다. 예를 들어 A와 B의 두 가지 측정도구를 활용하여 동일한 가설을 검증할 때, 얼마나 결과의 상관성이 높은지(집중타당성: convergent validity), 그리고 이 경우 A와 B의 측정도구간 상관성이 얼마나 존재하는 지(상관성이 낮을 수록 구성타당성(=판별타당성: Discriminant validity 이 높다고 볼 수 있음)

신뢰도와 타당도의 상호 관계

아래 그림을 보면, 오류의 발생 정도와 여부를 통한 데이터의 진실성(신뢰도)와 타당성의 관계를 시각적으로 이해해 볼 수 있다.

위 그림은 좌측 상단부터 차례로 1. 낮은 신뢰도와 낮은 타당성; 2는 열외로 함; 3. 높은 신뢰도와 낮은 타당성; 4. 높은 신뢰도와 높은 타당성을 나타내는 그림으로 볼 수 있음.

위의 그림을 통해 이해햐자면, 신뢰도가 낮은 경우 측정방식이나 오차의 발생등으로 측정하고자 하는 진실된 값에서 벗어나는 결과가 나타나는 것이며, 타당도가 낮은 경우에는 연구의 설계나 구성이 타당하지 못하여 전혀 다른 대상을 측정하고 있는 것이 수 있다. 따라서, 연구의 결과는 높은 신뢰도와 타당도를 검증 받아야만이 가치있는 결과를 낸다고 볼 수 있을 것이다.

-끝-

Leave a Reply