통계학 공부 후기 / 전공교재 리뷰 시리즈 |
1. 통계학 공부 후기 / 전공교재 리뷰 (상) - 왜 통계 공부? |
2. 통계학 공부 후기 / 전공교재 리뷰 (중) - 기초과목 리뷰 |
3. 통계학 공부 후기 / 전공교재 리뷰 (하) - 심화과목 리뷰 |
통계공부 커리큘럼
저번 포스트에 이어서, 통계학 전공 공부를 리뷰해볼까 합니다. 다시 한 번 말씀드리지만, 저는 비전공자고, 데이터 분석을 위한 수준만 날림 공부를 했습니다. 정말 전공자 분들이 하듯이 시험을 친다는 전제 하에 한땀한땀 증명하고 한땀한땀 연습문제 풀지는 않았습니다. (전혀 안하진 않았습니다) 그러니까 너무 진지하게 듣진 말아주세요, 저처럼 통계 깔짝 공부하려는 AI 개발자는 환영입니다ㅎㅎ
일단 커리큘럼은 아래 표처럼, 서울대 통계학과 학부 커리큘럼을 따라갔습니다. 저기서 2학년 1학기 확률의 개념 및 응용은 제가 학부 1학년때 들었던 통계학개론의 수준을 별로 벗어나지 않아서 따로 공부하진 않았고, 바로 선형대수학과 해석개론으로 넘어갔습니다. 쉽지 않더군요.
이번 포스트, (중)편에서는 여기서 2학년과 3학년 1학기 내용을 스쳐지나가듯이 공부하며 느낀점을 기록하겠습니다. 주관적 선호도와 사용한 교재도 소개하겠습니다. ("수치"라고 된 실습 과목은 일단 제외하고, 몇몇 저세상 난이도 수학 과목도 제외하고...)
선형대수학
- 선호도: 상. 모든 분야에 다 이 내용이 나옵니다.
- 교재: 저는 프리드버그 선형대수학 교재를 써서 공부했고, 그래도 선형대수학 책중에선 좀 쉬운 편이라는 명성에 걸맞게 딱 좋았습니다.
선형대수학은 쉽게 말하면 행렬과 벡터 계산입니다. 차원에 대한 이야기가 되기도 하죠. 세상을 (1, 2)와 같은 좌표의 공간으로 나타냈을 때, (4, 3, 5, 6, 7)과 같은 5차원 좌표 벡터의 공간으로 나타낼 수도 있고, 이 벡터들을 쌓고 쌓아서 행렬로 나타낼 수도 있습니다. 그리고 행렬은 행렬끼리 덧셈 뺄셈 뿐 아니라 여러 연산을 할 수 있고, 행렬로 만드는 공식도 있고, 이런 행렬을 이용한 수학을 다룹니다. 통계에서는 어떤 집단을 나타내는 행렬이 있고, 그 집단에서 뽑은 표본들이 그 행렬로 계산이 되기 때문에 통계공부 내내 계~속 질리도록 쓰이는 도구입니다.
해석학
- 선호도: 하. 선형대수학과 세트이지만 그렇게 본격적으로 사용되진 않습니다.
- 교재: 저는 해석학 첫걸음 (애벗 저) 교재를 써서 공부했고, 수학 전공자들에게는 쉬운 교재라는데 통계 전공자에게는 과한 교재인 것 같습니다.
해석학은 미분과 적분, 즉 미적분학의 뼈대를 세우는 학문입니다. 미적분은 여러 분야에서 도구로 많이 사용되는데, 그 뼈대를 사실 우린 미적분의 기본정리, 연속성 등 이름만 배우고 까먹죠ㅋㅋㅋ 그 정리들이 어떠한 흐름에서 나오는지를 바닥부터 설명해줍니다. 솔직히 미적분은 통계에서 계속 나오지만, 해석학에서 알려주는 그 미적분의 근본까지 통계에서 등장하진 않습니다. 그래서 선호도는 낮습니다.
표본설계 및 조사
- 선호도: 하. 실무에서 필요할 때 꺼내읽으면 될 것 같습니다.
- 교재: 국내 통계 교재를 꽉 잡고 있는 자유아카데미의 표본조사 교재를 봤는데, 예제도 재밌고 나쁘지 않았습니다.
통계학은 기본적으로 "A와 B가 같냐?" 란 질문을 하는 연구자를 위한 도구로서의 학문입니다. 따라서 효율적인 연구를 위해 연구표본을 어떻게 모을지에 대한 과목이 두 개가 있는데, 하나가 이 과목 표본설계 및 조사이고 다른 하나가 실험계획이라는 과목입니다. 이 과목은 "표본 몇 명 모아야 충분할까?" "표본 어떻게 모아야 조작이 아닐까?" 에 대한 해결책을 제시해줍니다. 치우치지 않는 표본을 모으는 다양한 방법이 나오는데, 솔직히 사회조사를 할 때에는 많이 쓸 것 같은데, 데이터과학 하는 입장에서는 냅다 다다익선이기 때문에 와닿진 않습니다.
수리통계학
- 선호도: 최상. 이게 통계다.
- 교재: 저는 수리통계학 개론 (호그 맥킨 크레이그 저) 교재를 썼는데, 수리통계학 과 같은 국내 교수님들이 쓰신 책을 샀더라면 어땠을까... 싶기도 합니다. 제가 공부한건 개념이 등장하는 자연스러운 흐름을 위해 공부 난이도가 들쑥날쑥해서...
수리통계학은 교양 통계학개론과 배우는 내용은 똑같습니다. 그래서 쉽게 생각했는데, 그 모든 것들을 다 증명합니다. 정규분포의 식을 보신 분들은 그 식이 엄청 복잡하단 걸 아시죠, 그걸 다 증명하는 과목입니다. 저도 수리통계학 공부할 때는 하나하나 증명하면서 따라갈 수 밖에 없었습니다. 물론 다 까먹었습니다. 하지만 이게 바로 통계의 근본이라는 그 느낌뽕은 듭니다. 확률이란? 표본이란? 분포란? 검정이란? 분석이란? 실제로 수리통계학 이후에 등장하는 과목들은 수리통계학에서 조금 모자란 부분들을 채우기 위한 1950년대 이후의 최신 결과들... 의 느낌이 강합니다. 저는 살면서 몇 번은 더 읽어야하지 않나 싶네요.
회귀분석
- 선호도: 상. 공부할 땐 몰랐는데, 회귀 없이는 그 이후 통계공부가 안됩니다.
- 교재: 저는 Chatterjee 예제를 통한 회귀분석 (채터지, 하디 저) 교재를 썼는데, 원서로 보시는 분들은 Introduction to Linear Regression Analysis (몽고메리 저) 교재를 많이 보시더라구요. 저는 채터지 교재 예제가 재밌어서 좋았습니다.
선형회귀를 다룹니다. 앞의 선형대수학과 선형이란 말이 겹치죠? 선형성은 쉽게 말하면 더하기와 곱하기가 가능한 성질입니다. 선형회귀는 한 표본이 갖고 있는 여러 성질에, 계수를 곱하거나 오차를 더하거나 해서 그 모집단이 갖고 있는 성질을 알고자 하는 방법론입니다. 저도 100% 이해가 됐으면 더 쉽게 설명하겠지만...ㅋㅋ 아무튼 저도 AI 할 때는 "제일 처음 배우는 모델" "그래봤자 랜덤포레스트 (random forest) 보다 성능이 안좋음ㅋㅋ" 과 같이 생각했지만, 통계 공부할 때 회귀 식 하나를 가지고 이렇게 뜯고, 저렇게 뜯고 하면서 정말 모든 종류의 데이터에 다 적용해볼 수 있는 좋은 모델입니다. 역시 이것도 몇 번 더 읽어봐야할 것 같습니다.
실험계획
- 선호도: 하. 표본설계처럼 실무에서 꺼내읽으면 될 것 같습니다.
- 교재: Montgomery 실험설계와 분석 이게 국룰이라고 하네요.
앞서 말씀드린 표본설계 및 조사처럼, 연구와 실험을 할 때 "어떻게 하면 싼 값에 좋은 표본들을 골라서 한 방에 통계분석을 빠르게 끝낼 수 있을까?" 전략을 잘 세우기 위한 과목입니다. 제가 대학원에 있을 때 동물실험을 할 때, 이 내용을 알고 있었다면 좀 집에 빨리 갈 수 있었을텐데... 하는 내용들이 스쳐지나가서 재밌었습니다. 하지만 역시 표본설계 및 조사처럼, 데이터과학에서는 그냥 돈으로 데이터를 해결하자는 한탕주의가 있기 때문에 당장 공부의 선호도가 높진 않았습니다. 분산분석(ANOVA)에 대한 디테일이 나오니 그 부분은 또 찾아서 읽게 될 것 같습니다.
남은 과목들은 하편에서 찾아뵙도록 하겠습니다. 돌이켜보니 자유아카데미가 교재를 참 좋은 걸 많이 냈네요. 혹시 담당자 분 제 포스트를 보시면 감사를 전하고 싶습니다.
'과학 > 통계' 카테고리의 다른 글
통계학 공부 후기 / 전공교재 리뷰 (하) - 심화과목 리뷰 (1) | 2022.11.12 |
---|---|
통계학 공부 후기 / 전공교재 리뷰 (상) - 왜 통계 공부? (0) | 2022.11.12 |
수리통계 확률분포 요약 총정리 한 눈에 보기 (0) | 2022.10.14 |
댓글