SPSS 활용하기_실전연습 19

[SPSS#09] 무작위 층화 & 군집표본추출을 동시에 하고 싶다면?

분석을 하다 보면 다양한 표본추출방법을 선택하기 마련이다. 그중에서도 오늘은 SPSS에서 무작위 층화표본추출과 군집표본추출을 어떻게 동시에 진행할 수 있는지 연습해보려고 한다. 거두절미하고 이 두 가지(층화표본추출/군집표본추출)의 방법 및 기본 원리를 알고 있다는 가정 하에 바로 SPSS로 들어가 보자. 오늘 사용할 데이터 파일은 ‘debate.sav’ 파일이다. 이전에 설명한 대로 코딩된 값이 아닌 값 레이블(설명)로 보고 싶다면, 다음과 같이 설정하고 보면 된다. 어떤 방법이던 편한 방법을 선택하면 된다는 사실~ 일단 데이터를 간단하게 살펴보자. 각각의 변수별로 코딩된 값은 다음을 의미한다 agecat : 연령 카테고리 - [1] 31세 미만 [2] 31~45세 [3] 46~60세 [4] 60세 초과..

[SPSS#08] 신뢰도분석 하는 방법(Cronbach's α 알파 계수 구하기)

오늘은 지난번 [SPSS#07] 탐색적 요인분석을 마친 다음에 진행할 수 있는 신뢰도 분석이다. 요인분석은 내가 가져온 척도(측정 도구, 또는 설문 문항들이) 얼마나 타당성을 지니는지 검증하는 과정이라면, 신뢰도 분석은 응답자들이 얼마나 일관성 있게 응답했는가를 알 수 있게 하는 지표가 된다. 경험상 타당도가 높게 나오면(요인분석 결과가 좋을 경우), 신뢰도 분석에서도 우수한 결과가 나오는 경우가 많았다. 하지만 직접 해보기 전까지는 신뢰도가 어느 정도 충족되는지 정확히 알 수 없기 때문에 따로 분석을 해서 요인분석 결과와 함께 제시하는 편이다. 신뢰도를 측정 또는 검증하는 방법은 방법론 책만 봐도 최소 네 가지 이상 존재한다. 재검사법, 반분법 등.. 매우 다양하나, SPSS에서는 주로 Cronbach..

[SPSS#07] 탐색적 요인분석 하기(타당도 검증)

요인분석은 타당도를 검증하기 위해 사용되는 주요 분석 방법 중 하나이다. 오늘 하려는 건 탐색적 요인분석(Exploratory Factor Analysis; EFA)이다. 요인분석은 크게 1) 탐색적 요인분석과 2) 확인적 요인분석으로 나뉠 수 있다. 이름에서 왜 탐색적 요인분석이라고 부르는지 궁금하다면, 요인분석을 해봐야지 만이 결과를 알 수 있기에.. 어떻게 요인이 묶일지는 분석하기 전에 미리 알기 어렵기 때문이라고 할 수 있다. 분석을 위해 어떤 데이터를 활용해 볼까..? 고민하던 중 ‘2018 외래관광객 실태조사 원자료(sav)’파일로 요인분석을 해보면 좋겠다는 생각이 들었다. 몇 년 지난 자료이지만 분석하는 데에는 이상이 없으므로 데이터 파일을 먼저 다운로드해 주자. 직접 사이트에서 다운로드하려..

[SPSS#06] 인구통계학적 특성 구하기 + 기술통계분석이 필요한 다양한 경우

논문을 작성하거나 데이터 분석을 하다 보면 기술통계분석을 해야 하는 경우가 자주 있다. 대표적인 예로는, 인구통계학적 특성을 제시할 때 기술통계분석을 하곤 한다. 그 외에도 나는 이상 값을 확인하기 위한 목적으로(코딩을 제대로 했는지 한 번 더 점검하기 위함) 기술통계분석을 하기도 하고, 표준화점수 z-score를 편리하게 구하기 위해 기술통계분석을 하곤 한다. 기술통계분석을 하는 경우를 간단하게 요약하면 다음과 같다. - 주요 변수의 평균값과 표준편차를 확인하고 싶을 때 - 주요 변수의 최대/최솟값을 확인하면서 잘못코딩된 값은 없는지 확인하고 싶을 때 - 왜도와 첨도를 알고 싶을 때 - 표준화점수를 분석에 사용하고 싶을 때 등.. 이번에는 SPSS에서 샘플로 제공하는 ‘customer_subset.sa..

[SPSS#05] 왜도와 첨도 구하는 방법, 적절한 왜도와 첨도의 범위는?

SPSS에서 분석에 사용할 자료가 정규분포를 이루고 있는지 검증하기 위한 하나의 방법으로 왜도와 첨도를 확인하곤 한다. 왜도와 첨도를 구하는 방법은 어렵지 않다. 다소 오래된 방법이기는 하지만, 꽤 많은 논문에서 변수의 자료가 정규분포를 이루는지 알기 위한 지표로 왜도와 첨도를 제시한다. 왜도는 한문으로 하면 ‘기울 왜’, ‘법도 도’를 사용하는데, 이는 데이터의 기울어진 정도를 보고자 할 때 사용된다. 그래서 완벽한 왜도를 갖추지 않는 이상 왜도는 0을 기준으로 좌, 우로 틀어진 모양을 할 수 있다. 반면, 첨도는 ‘뾰족할 첨’, ‘법도 도’를 사용하는데, 이는 데이터의 뾰족함 정도를 보고자 할 때 사용하는 지표이다. 여기서 말하는 뾰족함의 정도는 내가 분석하고자 하는 자료의 분포가 평균을 중심으로 얼..

[SPSS#04] 파일 분할, 파일 합치기, 케이스 선택 (나중에 업데이트)

오늘은 SPSS에서 파일분할, 파일합치기, 케이스 선택을 연습해보려고 한다. 먼저 파일을 분할하는 방법이다. 샘플 파일을 불러와서 연습하도록 하겠다. 만약 WORKTYPE(근무 타입)을 기준으로 파일 분할을 하고 싶을 경우이다. 나는 보기에서 ‘값 레이블’에 체크를 했기 때문에 ① 풀타임 근무, ② 파트타임 근무, 그리고 ③ 기타로 표시되는데 실제로는 1=풀타임 근무, 2=파트타임 근무, 3=기타로 각각 코딩했다. 여러분도 파일을 열어보면 처음에는 위 사진처럼 보이지 않고 숫자로 코딩되어 있는 것을 확인할 수 있을 것이다. ... 업데이트 예정

[SPSS#03] 코딩된 값 말고 레이블로 데이터 값을 보고싶다면? (옵션 설정방법)

SPSS 창을 켰을 때 값 레이블을 보고 싶다면 어떻게 해야 할까? SPSS를 사용하다 보면.. 예를 들어, 성별을 코딩할 때 연구자는 ‘남성’, 또는 ‘여성’ 이라고 값을 입력하지 않고, 1 = 남성, 2 = 여성.. 이런 식으로 숫자나 문자에 뜻을 부여해서 명목척도로 코딩하는 경우가 종종 있다. 그런데 SPSS상에서 숫자로 코딩된 값들이 무엇을 나타내는지 보려면 당신은 어떻게 하는가? 보편적인 방식으로는 ‘변수 보기’ 탭에 들어가서 해당 변수의 레이블(설명)과 값에 대한 설정이 어떻게 되어 있는지를 확인할 것이다. 그렇다면 좀 더 쉬운 방법은 없을까? 물론 있다. 일단 실습 파일을 불러와보자. 여기서 ‘WORKTYPE(워크타입)’ 이라는 변수를 보면 1, 2, 3의 숫자로 코딩된 것을 알 수 있다. ..

[SPSS#02] 중복 케이스와 특이 케이스를 식별하는 방법

오늘은 SPSS에서 중복 케이스와 특이 케이스를 식별하는 방법에 대하여 알아보고자 한다. ‘주요 분석만 잘하면 됐지, 굳이 이런 부분을 알아야 해?’라고 생각할 수는 있는데 내가 직접 사용해 보니 ‘꽤나 유용하더라..’ 생각되어서 포스팅을 하게 되었다. SPSS 분석툴은 정말이지 신기하면서 다양한 기능을 많이 제공하고 있다. 다만, 내가 이 수많은 SPSS 기능들을 다 알지도 못할뿐더러 제대로 다루지 못하는 경우가 많다는 것...(쩝) 아무튼 어떤 도구라도 잘 다룰 줄만 안다면 그만큼 분석에 있어서도 일종의 효율성을 증대시킬 수 있으니까 좋게 생각하는 편이다. 자, 먼저 분석을 위한 데이터파일을 불러와준다. 내가 만든 샘플 파일을 이용해서 분석해봐도 좋고, 바로 분석을 해야하는 경우라면 각자 코딩한 데이..

[SPSS#01] 코딩된 데이터 값의 결측값(결측치) 처리하는 방법

파일을 불러왔는데(또는 코딩했더니).. 다음과 같은 결측치가 있다면 연구자는 어떻게 해야 할까? 결측치 처리는 데이터 클리닝 작업 중 하나이다. 본격적인 분석을 하기 전 반드시 거쳐야 하는 데이터 상태의 점검 과정을 뜻한다. SPSS에서 변수에 코딩된 결측값(또는 결측치)을 처리하는 방법은 다음과 같다. 그런데 결측치는 왜 발생하지? (응답자는 제대로 응답을 했지만) 연구자 실수로 코딩을 잘못했을수도 있고, 응답자가 처음부터 응답을 안 한 경우도 있을 것이며, 때로는 응답하기 곤란해서 비워두는 경우도 있다. 이처럼 결측치가 발생하는 경우의 수는 매우 다양하다. 그런데, 이 같은 결측치가 존재한다면 연구자 입장에서는 분석을 할 때 무척 고민되는 것이 사실이다. 그래서 오늘은 SPSS 상에서 결측치를 처리하..

728x90