SPSS 활용하기_실전연습

[SPSS#12] 편상관관계분석 하는 방법(상관관계에 영향을 미치는 통제변수 찾기)

나눔의시작 2023. 2. 17. 16:00
728x90

12. GO-STAT 편상관관계분석(bankloan.sav).sav
0.02MB

지난번 포스팅([SPSS#11] 피어슨 상관관계분석) 에서 연속형 변수로 이루어진 변수들 간의 상관성을 보기 위해 피어슨 상관관계분석을 하였다. 이번에는 다소 생소할 수 있지만, 알아두면 유용한 편상관관계분석을 해보려고 한다.

 

편상관이란 무엇일까? ‘편’은 쉽게 말해서 특정 변수를 통제한다는 의미를 담고 있다. 그래서 일반적인 상관관계분석보다는 좀 더 발전한 형태의 분석 방법이라고 할 수 있으며, 특정 변수를 통제한 상태에서의 상관성을 확인할 수 있으므로 상관관계에 영향을 주는 외생변수를 파악하기에 유용한 분석 방법이다. 먼저 예제 파일을 열어보자. 지난번에 사용한 예제파일과 동일하다.

지난번에는 [연령], [재직기간], [신용카드부채] 변수들 간의 상관관계를 보고 싶어서 이 세 개의 변수를 넣고 일반적인 상관관계분석을 하였다. 그런데 만약, 특정 변수를 통제한 상태에서 동일하게  [연령], [재직기간], [신용카드부채] 간의 상관관계를 보고 싶으면 어떻게 해야 할까?

[가구소득] 변수를 통제한 상태에서  [연령], [재직기간], [신용카드부채] 간의 상관관계를 알아보기 위해 [분석 → 상관분석(C) → 편상관(R)]을 눌러보자.

처음 상관관계분석할 때 투입했던 변수들을 ‘변수’ 칸에 넣어주고, 통제하고 싶은 변수를 ‘제어변수’ 칸에 넣어준다.

그러면 편상관관계분석표가 나타난다. 정확한 비교를 위해 [가구소득] 변수를 통제하지 않은 상태에서의 상관관계분석표와 [가구소득]을 통제한 상태에서의 편상관관계분석표를 비교해야 한다. 일단 아래의 사진은 [가구소득]을 통제한 상태에서의 상관관계분석 결과이다.

[가구소득*]을 통제한 상태에서 [연령 ↔ 재직기간]의 상관계수는 0.374이며 p <0.001 수준에서 유의하였다. [가구소득*]을 통제한 상태에서 [연령 ↔ 신용카드부채] 간의 상관계수는 0.022이며 이는 통계적으로 유의하지 않았다. 마찬가지로, [가구소득*]을 통제한 상태에서 [재직기간 ↔ 신용카드부채] 간의 상관계수는 0.057이며 이는 통계적으로 유의하지 않았다. (통계적으로 유의한가 vs 유의하지 않은가는 유의확률(p값)을 살펴보면 된다.)

그러면, [가구소득]을 통제하기 전과 후를 비교해 보아야 정확히 알 수 있지 않을까? 쉬운 비교를 위해 편의상 색상으로 표시해 보았다. 동일한 색상으로 표시한 부분을 중점적으로 비교해 보길 바란다.

즉,  [가구소득]을 통제하였어도 [연령 ↔ 재직기간]의 관계는 동일하게 양의 상관관계를 보이는 것으로 나타났으며, 이러한 결과는 통계적으로 유의하였다.

 

반면, [가구소득]을 통제하기 전까지는 [연령 ↔ 신용카드부채, r=0.554**] [재직기간 ↔ 신용카드부채, r=0.382**]의 상관관계가 정(+)적으로 유의한 것처럼 나타났지만, [가구소득]을 통제한 결과, [연령 ↔ 신용카드부채, r=0.022] [재직기간 ↔ 신용카드부채, r=0.057]의 상관관계는 통계적으로 유의하지 않은 결과가 검증되었다.

이처럼, 편상관관계분석을 통해 특정 변수를 통제한 상태에서 분석을 진행하다 보면 변수들 간의 상관성에 영향을 미치는 변수를 파악하는데 큰 힌트를 얻을 수 있다. 다시 말해 상관관계에 영향을 미치는 통제변수와 영향을 미치지 않는 통제변수 찾아보는 데에는 편상관관계분석이 유용하다는 뜻이다. 막연하게 상관관계분석만 진행해 보았다면, 이제는 연구의 결과에 영향을 끼칠 수 있는 통제(외생) 변수를 찾아보는 것은 어떨까? 

728x90