SPSS 활용하기_실전연습

[SPSS#11] 피어슨 상관관계분석 하는 방법 + 스피어만/켄달은 어떤 경우에?

나눔의시작 2023. 2. 15. 14:00
728x90

11. GO-STAT 상관관계분석(bankloan.sav).sav
0.02MB

오늘은 SPSS에서 상관관계분석을 해보려고 한다. 정확히는 이변량 상관관계분석에 해당하며 유의성을 확인하기 위해 양측검정을 진행할 것이다. 피어슨 상관관계분석은 연속형 변수들 간의 1:1 상관관계를 확인하고 싶을 때 적용할 수 있는 분석 방법이다. 

참고로, ‘스피어만 상관관계분석(Spearman Correlation)’과 ‘켄달(Kendall)의 타우 상관관계분석’은 서열 or 순서 척도로 이루어진 데이터를 가지고 상관성을 검증하고 싶을 때 사용한다. 서열척도(다른 말로 순서척도라고 말함)란.. 학년(1학년/2학년/3학년), 계급(사장/부장/차장/대리/사원), 순위(금메달/은메달/동메달) 등의 계급이나 순서 또는 서열이 있는 경우를 뜻한다.

나는 연속형 변수로 이루어진 변수들 간의 상관성을 보고 싶으므로 피어슨 상관관계분석을 하였다. 먼저 예제 파일을 열어보자.

분석에 사용한 파일은 ‘bankloan.sav’이다. 파일명에서 알 수 있는 것처럼 은행대출과 관련된 자료들로 구성되어 있음을 유추할 수 있다. 원본 데이터 파일에는 변수명이 모두 영어로 되어 있었는데, 분석에 불필요한 변수들을 일부 제거하고 편의상 변수명을 한글명으로 변환해 주었다. 변수명은 ‘이름’에서, 해당 변수에 대한 설명은 ‘레이블’에서 확인할 수 있다.

상관관계를 검증하기 위해 [분석 → 상관분석(C) → 이변량상관(B)]을 눌러준다.

여기서 상관성을 보려는 변수들을 모두 ‘변수’ 칸에 넣어주면 된다. 나는 [연령], [재직기간], [신용카드부채] 간의 상관관계를 보고 싶어서 이 3개의 변수를 넣어주었다. 상관계수는 자동으로 ‘☑ Pearson’에 체크되어 있을 것이다. 내가 투입한 변수는 모두 연속형 척도로 구성되었기 때문에 이 부분은 따로 건드리지 않았다. 만약, 서열이나 순서척도로 구성된 변수들 간의 상관성을 보고 싶다면 ‘☑ Kendall의 타우-b’, 또는 ‘☑ Spearman’을 클릭해 주면 된다. 유의성 검정으로는 ‘양측’에 체크되어 있는데, 이 부분은 굳이 바꾸지 않았다. 이 외의 다른 옵션도 크게 건드릴 부분이 없었다.

결과를 확인해 보자.
상관관계에서 상관성의 정도는 ‘Pearson 상관 계수(Pearson 상관이라고 되어 있는 부분)’를 참고하면 된다. [연령 ↔ 연령]은 서로 같은 변수이므로 당연히 Pearson 상관계수는 ‘1’로 확인된다.

그러면 각각의 변수별로 얼마만큼의 상관성을 가지는지 확인해 볼까? [연령 ↔ 재직기간]의 상관계수는 0.554이며 p <0.001 수준에서 유의하였다. [연령 ↔ 신용카드부채] 간의 상관계수는 0.279이며 이 또한 p <0.001 수준에서 유의하였다. 마찬가지로 [재직기간 ↔ 신용카드부채] 간의 관계에서는 상관계수가 0.382로 p <0.001 수준에서 유의한 것으로 나타났다.

상관관계 표를 세로로 보나 가로로 보나 결과에는 차이가 없다. 즉, 편한 방법대로 보면 되는데 어떻게 보아도 동일한 결과가 나타나는 것을 알 수 있다. 그 결과, 분석에 투입한 변수들 간의 상관계수는 저마다 값에 차이가 있었지만 모두 양(+)의 상관관계를 나타내는 것을 알 수 있었다.

이를 굳이 해석하자면..

  • [연령 ↔ 재직기간] : 연령이 높을수록 재직기간 또한 늘어나는 양의 상관관계를 보이는 결과가 나타났으며, 이는 통계적으로 유의하였다.
  • [연령 ↔ 신용카드부채] : 연령이 높을수록 신용카드부채 또한 대체로 늘어나는 양의 상관관계를 보이며, 이는 통계적으로 유의하였다고 해석할 수 있다.
  • [재직기간 ↔ 신용카드부채] : 이 역시도 재직기간이 많을수록 대체로 신용카드부채 또한 늘어나는 양의 상관관계를 보이는 것이 확인되었으며, 이는 통계적으로 유의하였다고 해석한다.

만약, 상관계수의 부호가 음(-)이라면 하나의 변수가 증가할수록 다른 변수는 감소하는 상관관계를 보인다고 해석하는 것이 적절할 것이다. 이런 식으로 어렵지 않게 상관관계분석을 할 수 있다. 

 

참고로, 상관계수 값의 범위는 –1 ≤ r ≤+1 사이의 값을 가진다. -1이면 완벽한 음의 상관관계이며, 1이면 완벽한 정의 상관관계이다. 그런데 상관관계분석은 어렵지 않게 할 수 있으나 해석을 할 때 유의해야 한다. 상관관계는 인과관계를 나타내는 지표가 아니므로, [연령 ↔ 재직기간]의 관계에서 양의 상관관계가 나왔다고 하더라도 대체로 그렇다는 것이지, 인과관계를 해석할 때처럼 반드시 연령이 높을수록 재직기간이 높아진다고 해석해서는 안 된다 :)

728x90