통계를 뽀갠다고 하고서, 너무 뜸을 들였군요.
간만에 글을 올립니다.
많이 듣는 몇 가지 질문에 대해 간략히 답을 하고 들어가겠습니다.
Q. 통계분석 하려면 무엇을 알아야 하나요?
A. 크게 세 가지만 알면 됩니다. (1) 양적(통계) 조사방법, (2) 기초 통계 지식, (3) 통계 패키지(S/W). 각각 약간만 알면 됩니다. 이 세 가지 모두 중요하고 무엇보다도 세 구슬을 하나로 꿰어야 합니다. 그리고 플러스 알파로, 연구조사절차를 알아 두어야 합니다. 그래도 제일 중요한 걸 꼽자면 (양적) 조사방법입니다. 대부분 사람들은 이에 대한 이해가 부족해서 많은 실수를 합니다. 염주알 꿰는 실이라고나 할까요?
Q. 통계분석을 하려면 통계학을 알아야 하나요?
A. 통계학을 알면 좋지만, 몰라도 약간의 개념만 익히면 됩니다. 계산기를 생각하시면, 실제로 사용하는 건 '더한다', '뺀다', '나눈다', '곱한다'는 개념과 손동작이지 계산은 기계가 하죠. 마찬가지로, 통계학의 몇 가지 기본 개념만 알면, 통계 패키지가 계산해서 산출해내는 결과를 해석하면 됩니다. 그러니까 C언어를 몰라도 윈도우만 조금 알아도 컴퓨터를 사용하는 것과 같죠.
Q. 그래도 통계학을 공부하고 싶으면 어떤 책을 봐야 하나요?
A. 시중에 나와 있는 아무 통계학 책을 보시면 됩니다. 기초 통계학은 몇 십년 전이나 별 내용 차이가 없기 때문에 예전 책도 전혀 상관 없습니다. 단지, 최근에 많이 쓰는 통계 패키지를 고려하면 요즘 나오는 책이 좋겠죠. 그리고 요새는 통계학 책들이 쉽고 실용적으로 나오는 추세입니다. 상업적인 관계를 떠나서,
Q. 통계 패키지 가운데 뭐가 좋을까요?
A. 많이 사용하는 범용 패키지는 네 가지 입니다. SAS(새스/사스), STATA(스타타), SPSS(에스피에스에스), EXCEL(엑셀). S/W가지고 좀 질문이 많아서 좀 길게 답하겠습니다.
(1) 이 가운데서 엑셀은 통계 전문 패키지가 아니라서 권하지 않습니다. 물론 엑셀도 웬만한 통계를 돌리 수 있지만 기능에 한계가 많고 무엇보다 불편합니다. 엑셀로 기초 통계를 배우는데 전혀 문제가 없습니다만, 여하튼 엑셀은 패쓰.
(2) SAS는 가장 강력한 통계 패키지 입니다. 만약에 전문적으로 통계를 배우고 싶다면, SAS가 좋습니다. 강력한 기능과 폭넓은 확장성이 장점인데다가, 새로운 통계 기법이 나오면 보통 SAS를 기준으로 보고됩니다. 하지만, '프로그램을 손으로 짜야 하는' 단점이 있습니다. 즉, 배우기 힘들죠(물론 클릭질로도 할 수도 있지만요). 그리고 패키지를 쉽게 구하기 힘들고 용량이 큽니다. 여하튼 어렵기 때문에 SAS는 패쓰.
(3) STATA도 좋은 패키지 입니다. 용량이 매우 작지만 SAS에 못지 않은 실력을 보여줍니다. 하지만 역시 제대로 쓰려면 프로그램을 손으로 짜야하고(클릭질로 해도 됩니다만), 무엇보다 국내에 보급이 거의 되어 있지 않다는 단점이 있습니다. 덧붙이면 STATA는 패널자료(가령, 한국노동패널처럼 정해진 사람들을 매년마다 조사한 자료) 분석에 장점이 있습니다. 여하튼 좀 어렵고 구하기 힘들고 참고문헌도 거의 없기 때문에 STATA도 패쓰.
(4) SPSS가 남았습니다. 이 패키지는 가장 많이 쓰고 가장 쉽고 참고문헌도 제일 많습니다. 한글화도 잘 되어 있으며, 여기저기 돌아 다니다 보면 쉽게 구할 수 있습니다. 단점은 후집니다. 후진 이유는 좀 못하는 분석이 많습니다. 게다가 프로그램 짜기도 힘듭니다. 하지만 이런 분석을 해야 하는 경우는 '거의 없다!'고 보시면 됩니다. 그래서 그냥 결론은 SPSS 쓰십시오. 현재 가장 많이 사용하는 한글 버전은 SPSS 12.0 입니다. 16이나 17버전 한글판은 좀 구하시기 힘들 수도 있습니다. 많이 쓰는 분석방법은 크게 다르지 않기 때문에 아무 버전이나 사용하세요. 영어 버전은 18.x 이상 나와 있습니다. 당나귀나 머 그런데서 재주껏 구하시면 됩니다. 컴퓨터 용량이 남으시면, 12.0 한글 버전과 14.0 이상 영어 버전을 같이 깔아 두세요. 왜냐? 딱 한 가지 기능 때문인데, 14.0 버전 이상에서 다중응답(가령, 다음 중 2개 이상 선택하시오와 같은 질문) 분석 기능이 추가되었습니다. 이런 질문지 형태를 실무에서 많이 쓰기 때문에 14버전 이상을 구하는 게 좋습니다.
Q. 통계 S/W 메뉴얼은 뭐가 좋나요?
A. 아무거나 보시면 됩니다만, 상업적인 이해관계를 떠나서 몇 권을 추천하려고 합니다. <SPSS 16.0 매뉴얼>
Q. 양적 조사방법론에 관한 책은 뭐가 있나요?
A. 보통 시중에 <사회조사방법론> 따위 제목이 붙은 책을 보면 됩니다만, 좋은 책은 없습니다! 너무 어렵거나 너무 내용이 많아서 뭐가 중요하고 뭐가 핵심인지 파악이 힘듭니다. 궁금한 사람이 아닌 엉뚱한 사람 다리 긁는 내용이랄까요. 차라리 시중에 보시면 <산업 및 조직심리학>(박동건 옮김) 가운데 '2장 산업 및 조직 심리학 연구방법'만 보시면 됩니다. 나머지는 이 통계뽀개기에서 간략히 정리하겠습니다.
이상을 요약하면, 실전 통계분석을 위한 레시피는 양적조사방법 약간+통계학 지식 약간+통계S/W 사용법 약간만 알면 됩니다. 각각 관련도서는 아무거나 보셔도 됩니다만, 없어도 됩니다. 왜냐? 본 뽀개기 시리즈만 보시면 됩니다. 그래서 준비물은 통계 S/W(SPSS 12.0이상)만 있으면 됩니다. 이건 당나귀나 주변에서 재주껏 구하세요.
== 번외 질문 ==
Q. 고급통계 분석을 하려면 어떻게 해야 하나요?
A. 열나 독학하시던가, 돈주고 학원 다니시던가, 대학원 다니시던가, 각종 대학 및 학회에서 개설하는 강좌(상대적으로 쌉니다)를 들으세요. 하지만 무턱대도 듣는다고 해서 실력이 늘지는 않습니다. 왜냐? 개념을 잡아 주는 강좌가 많지 않거든요. 혹은 백견이 불여일행이라고, 백번 말해도 못 알아 듣는 경우가 부지기수 입니다. 여튼 개념부터 잡으세요. 기법은 그럼 따라 옵니다.
Q. 그럼 독학 가능한가요?
A. 물론 입니다. 좀 과장하면 구글 검색으로도 할 수 있습니다. 해외 대학에서는 양적 조사의 경우 센타를 따로 두고 지원을 하는 곳이 많습니다. 그런 의미에서 해외 사이트 두 곳을 소개해 드리죠. UCLA 기술지원센타와인디애나대학 기술지운센타입니다. 기타 국내외의 좋은 사이트와 블로그, 온라인 카페가 많지만 두 곳이 충실한 편입니다. 그 외에도 구글링 하시면 웬만해서는 방법을 찾을 수 있습니다.
Q. 고급분석은 어디까지 배워야 하나요?
A. 끝이 없죠. 그냥 필요할 때마다 새로운 방법을 익혀야 하지요. 참고로, 요즘은 구조방정식(SEM), 위계선형모델(HLM), 네크워크분석, 패널분석(또는 다양한 생존분석) 정도 하면, 아~너 좀 하는구나 하죠. 근데 이런 분석을 하는 사람들 한국에 100명도 안됩니다. 그리고 고급분석일 수록 그만큼 경직된 분석인 경우가 많습니다. 여하튼 몰라도 통계분석의 98%는 할 수 있습니다. 앞으로 설명하겠지만, 통계분석은 기초통계(빈도, %, 평균, 분산), 교차분석, 분산분석, 회귀분석 정도만 제대로 알면 됩니다. 이건 차차 설명드리죠.