설명하되 설명하지 않는 책. 간추려지고 응축된 설명과 예제를 보여주는 scikit-learn 함수매뉴얼 같은 책이다. 이해를 원한다면 반드시 중간중간에 다른 자료들을 찾아봐야 하며, 사실은 다른 책을 보는 게 낫다.
이 책을 추천한 캐글마스터 이유한 님도 '이 책을 읽고 나면 내가 무엇을 모르는지 알게 된다'라고 했었는데.. 과연 맞는 말이다. 나는 제대로 모델을 이해하기전에 활용부터 해보는 방식을 불편해하는 편이라 읽는 과정이 더 고통스러웠다.
사실 간략한 소개 수준인 이 책 정도의 깊이라면 scikit-learn 매뉴얼을 읽어도 비슷한 설명과 코드가 있다. 하지만 매뉴얼들을 정말로 다 읽어내기는 쉽지 않다는 점에서, 그래도 이 책이 매뉴얼보다는 장점이 있다.
고통을 참으며 끝까지 읽어보면 '아 전체적으로 고전머신러닝 기법들은 이렇고, scikit-learn에서는 이렇게 쓰는구나' 하는 정도를 배울 수 있다. 이 책을 책상 위에 놓아두면, 필요할 때 예제코드 사전 역할을 해줄 수 있을 것도 같다.
고통 속에 이 책을 읽으며 배운 것은 아래와 같다.
(정확히는 이 책에서는 제목을 본거고, 공부는 따로 한 것에 가깝다)
1. 고전머신러닝 기법들
-linear regression(L1, L2)
-random forest
-GBM
-SVM
-bayes classifier
2. 비지도학습
-PCA
-t-SNE
-k-mean
3. 특성선택기법
-일변량통계, 모델기반선택, 반복적 선택
4.gridSearch를 이용한 모델최적화
-SVM 등 고전모델의 파라미터 최적화
-pipeline(전처리) 최적화
*참고했던 사이트들
https://angeloyeo.github.io/2019/09/08/LHopital_rule.html
https://steadiness-193.tistory.com/category/Machine%20Learning
https://devkor.tistory.com/category/Machine%20Learning
'독서 > 머신러닝' 카테고리의 다른 글
벌거벗은 통계학 (0) | 2024.05.23 |
---|---|
통계101 데이터 분석 (0) | 2024.05.12 |
쉽게 시작하는 캐글 데이터 분석 (0) | 2024.04.07 |
케라스 창시자에게 배우는 딥러닝 (0) | 2024.03.26 |
파이토치 딥러닝 마스터 (0) | 2024.03.09 |