분류 전체보기 57

요즘 나의 최애 빵 '몽블랑제 생생모닝롤'

어렸을 때는 식빵이나 바게트를 무슨 맛으로 먹나 했는데.. 이제는 내가 그런 사람이 되었다. 씹을수록 적당히 고소하고 달달하니 부담 없는 식사용 빵을 찾게 된다. 그러던 중, 앉으면 한 봉지를 다 먹어버리는 빵이 생겼다. 우연히 접하게 된 홈플러스 몽블랑제 생생모닝롤 아! 고소하고 부드럽다! 그리고 자꾸만 손이 간다. (살이 찌는 신호인가 보다)

일상 기록 2023.02.18

[SPSS#12] 편상관관계분석 하는 방법(상관관계에 영향을 미치는 통제변수 찾기)

지난번 포스팅([SPSS#11] 피어슨 상관관계분석) 에서 연속형 변수로 이루어진 변수들 간의 상관성을 보기 위해 피어슨 상관관계분석을 하였다. 이번에는 다소 생소할 수 있지만, 알아두면 유용한 편상관관계분석을 해보려고 한다. 편상관이란 무엇일까? ‘편’은 쉽게 말해서 특정 변수를 통제한다는 의미를 담고 있다. 그래서 일반적인 상관관계분석보다는 좀 더 발전한 형태의 분석 방법이라고 할 수 있으며, 특정 변수를 통제한 상태에서의 상관성을 확인할 수 있으므로 상관관계에 영향을 주는 외생변수를 파악하기에 유용한 분석 방법이다. 먼저 예제 파일을 열어보자. 지난번에 사용한 예제파일과 동일하다. 지난번에는 [연령], [재직기간], [신용카드부채] 변수들 간의 상관관계를 보고 싶어서 이 세 개의 변수를 넣고 일반적..

스텐레스 제품 구매 후 '연마 제거' 작업을 꼭 해야하는 이유

며칠 전 스텐레스 컵을 교체하였다. 꼼꼼하게 설명서부터 읽던 중 그동안 간과했던 부분이 떠오르는 것이 아닌가? 스텐레스 제품은 겉보기에 깨끗해 보여서 한 번 세척하고 바로 사용하곤 했는데 실상은 연마제 작업을 꼭 해주어야 한다는 것! 설명서에 나와있는 방법대로 연마제거 작업을 해주었다. 1단계는 식용유를 키친타월에 묻혀서 컵을 돌려가며 닦아주라는 내용이다. 뭐~ 얼마나 묻어 나오겠어했으나 닦아내면 닦아낼수록 경악을 금치 못했다. 세상에나! 이렇게나 많은 연마제가 묻어 나오는 것이 아닌가? 심지어 고무장갑에도 까만 것들이 묻어있더라는.. 모르고 그냥 사용했으면 정말 찝찝할 뻔했다.

일상 기록 2023.02.17

[SPSS#11] 피어슨 상관관계분석 하는 방법 + 스피어만/켄달은 어떤 경우에?

오늘은 SPSS에서 상관관계분석을 해보려고 한다. 정확히는 이변량 상관관계분석에 해당하며 유의성을 확인하기 위해 양측검정을 진행할 것이다. 피어슨 상관관계분석은 연속형 변수들 간의 1:1 상관관계를 확인하고 싶을 때 적용할 수 있는 분석 방법이다. 참고로, ‘스피어만 상관관계분석(Spearman Correlation)’과 ‘켄달(Kendall)의 타우 상관관계분석’은 서열 or 순서 척도로 이루어진 데이터를 가지고 상관성을 검증하고 싶을 때 사용한다. 서열척도(다른 말로 순서척도라고 말함)란.. 학년(1학년/2학년/3학년), 계급(사장/부장/차장/대리/사원), 순위(금메달/은메달/동메달) 등의 계급이나 순서 또는 서열이 있는 경우를 뜻한다. 나는 연속형 변수로 이루어진 변수들 간의 상관성을 보고 싶으므로..

[SPSS#10] 교차분석, 카이제곱( χ²) 검정 하는 방법

오늘은 교차분석(카이제곱/ χ² 검정)을 해보려고 한다. 교차분석은 다른 말로 카이제곱(χ²) 검정이라고 부른다. 이는 범주형 자료들 간의 비율을 비교하고자 할 때 사용되는 분석이다. 그래서 연구에 사용되는 독립변수와 종속변수가 모두 범주형 자료(예 : 성별, 연령대, 지역 등) 일 때만 사용 가능하다. 만일 하나의 변수라도 범주형 자료가 아닐 경우 교차분석을 진행할 수 없으니 이 점에 유의하자. 오늘 사용할 파일은 ‘credit_card.sav’ 파일이다. 파일을 열어주면 다음과 같은 데이터를 확인할 수 있다. 데이터셋 안에 포함된 변수는 11개이지만, 실제 분석에 사용할 변수는 범주형 변수인 '성별[gender]'과 '카드사[card]'이다. 교차분석을 통해 성별에 따른 카드사에 차이가 있는지 검증하..

[SPSS#09] 무작위 층화 & 군집표본추출을 동시에 하고 싶다면?

분석을 하다 보면 다양한 표본추출방법을 선택하기 마련이다. 그중에서도 오늘은 SPSS에서 무작위 층화표본추출과 군집표본추출을 어떻게 동시에 진행할 수 있는지 연습해보려고 한다. 거두절미하고 이 두 가지(층화표본추출/군집표본추출)의 방법 및 기본 원리를 알고 있다는 가정 하에 바로 SPSS로 들어가 보자. 오늘 사용할 데이터 파일은 ‘debate.sav’ 파일이다. 이전에 설명한 대로 코딩된 값이 아닌 값 레이블(설명)로 보고 싶다면, 다음과 같이 설정하고 보면 된다. 어떤 방법이던 편한 방법을 선택하면 된다는 사실~ 일단 데이터를 간단하게 살펴보자. 각각의 변수별로 코딩된 값은 다음을 의미한다 agecat : 연령 카테고리 - [1] 31세 미만 [2] 31~45세 [3] 46~60세 [4] 60세 초과..

[SPSS#08] 신뢰도분석 하는 방법(Cronbach's α 알파 계수 구하기)

오늘은 지난번 [SPSS#07] 탐색적 요인분석을 마친 다음에 진행할 수 있는 신뢰도 분석이다. 요인분석은 내가 가져온 척도(측정 도구, 또는 설문 문항들이) 얼마나 타당성을 지니는지 검증하는 과정이라면, 신뢰도 분석은 응답자들이 얼마나 일관성 있게 응답했는가를 알 수 있게 하는 지표가 된다. 경험상 타당도가 높게 나오면(요인분석 결과가 좋을 경우), 신뢰도 분석에서도 우수한 결과가 나오는 경우가 많았다. 하지만 직접 해보기 전까지는 신뢰도가 어느 정도 충족되는지 정확히 알 수 없기 때문에 따로 분석을 해서 요인분석 결과와 함께 제시하는 편이다. 신뢰도를 측정 또는 검증하는 방법은 방법론 책만 봐도 최소 네 가지 이상 존재한다. 재검사법, 반분법 등.. 매우 다양하나, SPSS에서는 주로 Cronbach..

[SPSS#07] 탐색적 요인분석 하기(타당도 검증)

요인분석은 타당도를 검증하기 위해 사용되는 주요 분석 방법 중 하나이다. 오늘 하려는 건 탐색적 요인분석(Exploratory Factor Analysis; EFA)이다. 요인분석은 크게 1) 탐색적 요인분석과 2) 확인적 요인분석으로 나뉠 수 있다. 이름에서 왜 탐색적 요인분석이라고 부르는지 궁금하다면, 요인분석을 해봐야지 만이 결과를 알 수 있기에.. 어떻게 요인이 묶일지는 분석하기 전에 미리 알기 어렵기 때문이라고 할 수 있다. 분석을 위해 어떤 데이터를 활용해 볼까..? 고민하던 중 ‘2018 외래관광객 실태조사 원자료(sav)’파일로 요인분석을 해보면 좋겠다는 생각이 들었다. 몇 년 지난 자료이지만 분석하는 데에는 이상이 없으므로 데이터 파일을 먼저 다운로드해 주자. 직접 사이트에서 다운로드하려..

[SPSS#06] 인구통계학적 특성 구하기 + 기술통계분석이 필요한 다양한 경우

논문을 작성하거나 데이터 분석을 하다 보면 기술통계분석을 해야 하는 경우가 자주 있다. 대표적인 예로는, 인구통계학적 특성을 제시할 때 기술통계분석을 하곤 한다. 그 외에도 나는 이상 값을 확인하기 위한 목적으로(코딩을 제대로 했는지 한 번 더 점검하기 위함) 기술통계분석을 하기도 하고, 표준화점수 z-score를 편리하게 구하기 위해 기술통계분석을 하곤 한다. 기술통계분석을 하는 경우를 간단하게 요약하면 다음과 같다. - 주요 변수의 평균값과 표준편차를 확인하고 싶을 때 - 주요 변수의 최대/최솟값을 확인하면서 잘못코딩된 값은 없는지 확인하고 싶을 때 - 왜도와 첨도를 알고 싶을 때 - 표준화점수를 분석에 사용하고 싶을 때 등.. 이번에는 SPSS에서 샘플로 제공하는 ‘customer_subset.sa..

[SPSS#05] 왜도와 첨도 구하는 방법, 적절한 왜도와 첨도의 범위는?

SPSS에서 분석에 사용할 자료가 정규분포를 이루고 있는지 검증하기 위한 하나의 방법으로 왜도와 첨도를 확인하곤 한다. 왜도와 첨도를 구하는 방법은 어렵지 않다. 다소 오래된 방법이기는 하지만, 꽤 많은 논문에서 변수의 자료가 정규분포를 이루는지 알기 위한 지표로 왜도와 첨도를 제시한다. 왜도는 한문으로 하면 ‘기울 왜’, ‘법도 도’를 사용하는데, 이는 데이터의 기울어진 정도를 보고자 할 때 사용된다. 그래서 완벽한 왜도를 갖추지 않는 이상 왜도는 0을 기준으로 좌, 우로 틀어진 모양을 할 수 있다. 반면, 첨도는 ‘뾰족할 첨’, ‘법도 도’를 사용하는데, 이는 데이터의 뾰족함 정도를 보고자 할 때 사용하는 지표이다. 여기서 말하는 뾰족함의 정도는 내가 분석하고자 하는 자료의 분포가 평균을 중심으로 얼..

728x90