독서/머신러닝

쉽게 시작하는 캐글 데이터 분석

btpoint 2024. 4. 7. 13:46

실제 모델을 개발하는 고달픔을 조금 경험할 수 있었던 책. 개발자의 고단함이라고 해야하나... 이 책을 통해 배운 것은 아래와 같다.
 
data preprocessing
어떻게 pandas data frame을 쉽고 효율적으로 처리해낼 수 있을 것인가. 좀 오래된 책이라 그런지 몰라도 이 책에서 최선은 sklearn.preprocessing이다. 답을 찾아가는 과정에서 찾은 python의 dtale이라는 시각화 라이브러리, 주피터 노트북을 vscode py파일에서 #%% 구문을 활용해서 접근하는 방법, 내가 몰라서 나쁘다 생각했던 주피터(코랩주소 뒤에 github주소 이어붙이기, 현재셀까지 실행 : Ctrl+F8), 이런 잡스러운 지식들을 이 책을 읽어가며 익히게 되었다.
 
고전적인 머신러닝 기법들 with scikit-learn
딥러닝 계열 공부를 하다가, 고전모델로 돌아와 gbm, xgboost, random-forest 등의 알고리즘이 경우에 따라 실무에서 더 효율일 수 있다는 것을 알게되었다. 클러스터링 기법인 k-mean, pca 기법 같은 것도 실습해볼 수 있어서 좋았다.

'독서 > 머신러닝' 카테고리의 다른 글

통계101 데이터 분석  (0) 2024.05.12
파이썬 라이브러리를 활용한 머신러닝  (0) 2024.05.11
케라스 창시자에게 배우는 딥러닝  (0) 2024.03.26
파이토치 딥러닝 마스터  (0) 2024.03.09
그로킹딥러닝  (0) 2024.02.09