독서/머신러닝

벌거벗은 통계학

btpoint 2024. 5. 23. 11:51

의미과 쓰임새를 제대로 설명하는 수학통계 관련 도서를 만나기는 참으로 어렵다. 이 책은 중심극한정리에 한정해서는 그걸 해낸 좋은 책이다. 그 밖의 내용들도 그런대로 볼만하다. 

중심극한정리란?
모수에서 임의의 샘플 n개(30개 이상)를 뽑았을 때 각 샘플군들의 평균은 정규분포를 따르고, 표준오차는 s/sqrt(n)다.
 
중심극한정리의 의미
모수전체를 실험하기 어렵기 때문에 샘플을 통해 통계를 계산한다. 중심극한정리에서 샘플군들은 정규분포를 따르므로, 표준오차 s/sqrt(n)를 통해서 신뢰구간을 구할 수 있다.  ± 1시그마 구간에는 정규분포는 68%가 존재한다. 샘플 x의 평균값은 68%의 신뢰하에, x - σ < x < x + σ 사이에 있다고 말할 수 있다.

비율의 표준오차
이항분포의 E(x) = np, V(x) = npq이다. 이를 비율로 바꾸면 n으로 나눠야 하고(분산은 n^2), 그러면 E(x) = p, V(x) = pq/n 또는 p(1-p)/n이 된다. 그래서 비율의 표준오차는 sqrt(p(1-p)/n)이다. 트럼프 vs 바이든 같은 1:1 대선후보 여론조사 결과를 비율의 표준오차에 따라 해석 할 수 있다.

'독서 > 머신러닝' 카테고리의 다른 글

바닥부터 배우는 강화학습  (0) 2024.08.11
통계학입문  (0) 2024.05.24
통계101 데이터 분석  (0) 2024.05.12
파이썬 라이브러리를 활용한 머신러닝  (0) 2024.05.11
쉽게 시작하는 캐글 데이터 분석  (0) 2024.04.07