SPSS 활용하기_실전연습

[SPSS#10] 교차분석, 카이제곱( χ²) 검정 하는 방법

나눔의시작 2023. 2. 10. 18:00
728x90

10. GO-STAT 교차분석(credit_card.sav).sav
1.24MB

오늘은 교차분석(카이제곱/ χ² 검정)을 해보려고 한다. 교차분석은 다른 말로 카이제곱(χ²) 검정이라고 부른다. 이는 범주형 자료들 간의 비율을 비교하고자 할 때 사용되는 분석이다. 그래서 연구에 사용되는 독립변수와 종속변수가 모두 범주형 자료(예 : 성별, 연령대, 지역 등) 일 때만 사용 가능하다. 만일 하나의 변수라도 범주형 자료가 아닐 경우 교차분석을 진행할 수 없으니 이 점에 유의하자.

오늘 사용할 파일은 ‘credit_card.sav’ 파일이다. 파일을 열어주면 다음과 같은 데이터를 확인할 수 있다. 데이터셋 안에 포함된 변수는 11개이지만, 실제 분석에 사용할 변수는 범주형 변수인 '성별[gender]'과 '카드사[card]'이다.

교차분석을 통해 성별에 따른 카드사에 차이가 있는지 검증하고 싶으므로, 독립변수 자리에 성별[gender]을 놓고, 종속변수 자리에 카드사[card]를 넣어서 분석하고자 한다. (사실, 교차분석에서 독립변수다.. 종속변수다.. 말하는 것이 적절하지 않을 수 있는데 이 두 개의 범주형 변수 간의 관계를 설명하기 위해 편의상 독립변수-종속변수라는 표현을 사용하였다.)

만일, 교차분석을 진행한다면 가설의 형태는 다음과 같이 표현되어야 할 것이다.

H1 : 성별[gender]에 따른 카드사[card] 비율에는 유의한 차이가 있을 것이다.

정말로 성별에 따른 카드사 비율에 유의한 차이가 있는가는 검증 해보아야 알 수 있는 부분이므로 바로 분석으로 들어가 보자. [분석 → 기술통계량 → 교차분석]을 눌러준다. 

‘행’과 ‘열’에 분석하고자 하는 변수(반드시 범주형 자료로 구성되어야 함)를 넣어주면 된다. 참고로 교차분석에서는 행/열을 굳이 나누어 구분할 필요가 없다. 어떤 변수를 행으로 정하던, 열로 정하던 결과에는 차이가 없기 때문.. 다만, 집단이 적은 범주로 구성된 변수를 열에 넣는 것이 보기에 편하다. 그래서 나는 2개 집단으로 구성된 성별[gender]을 ‘열’에 넣어주고, 5개 집단으로 구성된 카드사[card]를 ‘행’에 넣어주었다.

다음으로는 ‘통계랑’에 들어가 ‘☑카이제곱(H)’을 눌러주고 계속을 눌러준다.

‘셀(E)’을 눌러주고, 퍼센트에서 ‘☑열(C)’에 체크한 다음 계속을 눌러주자. 만일, 독립변수를 행에 넣었다면, 열이 아닌 행에 체크를 해주어야 한다. 여기서 행/열을 선택하는 기준은 내가 어떤 독립변수를 행 또는 열에 넣었는지 확인하고 진행하면 된다. 나는 독립변수(성별[gender])를 처음부터 ‘열’에 넣어주었기 때문에, 이 단계에서도 ‘☑열(C)’에 체크해 주었다.

이제 ‘확인’을 눌러서 분석 결과를 확인해 보자.
먼저 케이스 처리 요약표가 나온다. 유효 케이스와 결측 케이스를 간단히 기술통계 결과로 나타낸 표라고 생각하면 되겠다. 결측 케이스도 없고 전반적으로 이상 없으므로 넘어가자.

다음으로는 교차표가 나타날 텐데, 일단 스크롤을 좀 더 내려서 카이제곱 검정 결과부터 확인해 보자. 여기서 가장 중요한 건, 근사 유의확률(p) 값이다. 보다시피, 카이제곱은 1003.713(df=4)이며, p <0.001로 통계적으로 유의한 결과가 도출되었다.

이 말인즉, 처음에 제시했던 가설이 채택되는 결과를 보인 것이다.

H1 : 성별[gender]에 따른 카드사[card] 비율에는 유의한 차이가 있을 것이다 → 가설 채택 (o)

Q. 그러면, 교차분석이 통계적으로 유의한 결과를 보였는데 이 내용을 어떻게 해석해야 할까? 조금 전에 언급했던 ‘교차표’를 유심히 들여다보자.

  • 성별[gender]
    0 = 남성, 1 = 여성
  • 카드사[card] 
    1 = American Express
    2 = Visa
    3 = Mastercard
    4 = Discover
    5 = Other

위 내용으로 코딩되었다는 것은 모두가 알고 있는 사실이다. 첫 번째 행을 기준으로 설명하면 다음과 같다.

이러한 결과는..

'카드사[card] x 성별[gender] 교차표를 살펴본 결과, American Express(1)의 경우, 남성(23.2%)이 여성(19.6%)보다 비율이 높은 것으로 나타났으며 이는 통계적으로 유의(p <0.001) 하였다'라고 해석하면 된다. 나머지 카드사(Visa, Mastercard, Discover, Other)에 대해서도 이 방법으로 동일하게 기술해 주면 된다.

이렇게 하여 교차분석은 어렵지 않게 시도해 볼 수 있다. 꼭 기억해야 하는 부분이 있다면, 교차분석은 비교하고자 하는 두 개의 변수가 반드시 명목형 척도(범주형 자료로 구성된 변수)로 이루어져야 한다는 점이며, 등간/비율 척도로 설문을 받았다면 ‘변수변환’ 기능을 통해 명목형 척도로 바꿔준 다음에 분석할 것을 권장한다. 또한, 교차분석 결과와 함께 p값을 제시하여야 하며 비율도 논문에 적어주어야 하는 점을 기억하면 되겠다. 

728x90