[Kaggle] 케글 필사 - Titanic
<서론>
예전 부터 드문 드문 하던 케글필사
최근 들어 SQL 과 Tableau를 공부하느라
가끔 Python을 보니 순간적으로 여러 문법이 막히는 느낌을 들었다.!ㅠㅠ
데이터 분석가로써 가장 중요한 언어 중 하나인 파이썬을 헷갈리는 나자신을 보고 매우 당황하였다...
그렇다고 다시 기초 책을 사서 보기엔 너무 돌아가는 것 같고 시간이 성장이 아닌 복구 정도에 그칠것 같았다.
그래서 생각해낸 방법은 2가지
1) 케글필사 & 2) 파이썬 PS 및 알고리즘 공부!
우선 두 가지 방법 다 파이썬 문법과 친숙해지고 여러 패키지에 대해 감각을 다시 찾는 것.
케글은 다양한 데이터셋의 EDA와 피쳐 엔지니어링을 해볼 수 있는 경험을 얻어 과제 전형등의 취업 준비에 도움이 될것 같고,
파이썬 PS 및 알고리즘 공부는 알고리즘과 자료구조에 대해 공부 할 수 있을 것 같다.
필사는 우선 항상 몇번 첨부터 따라하다가 실패한 이유한님의 케글 필사 커리큘럼을 이번엔 끝까지 도전해보려고 한다!
(4트째..)
https://kaggle-kr.tistory.com/32
[이유한님] 캐글 코리아 캐글 스터디 커널 커리큘럼
유한님이 이전에 공유해주신 캐글 커널 커리큘럼 정리본입니다. 다들 Keep Going 합시다!! 커리큘럼 참여 방법 필사적으로 필사하세요 커널의 A 부터 Z 까지 다 똑같이 따라 적기! 똑같이 3번적고 다
kaggle-kr.tistory.com
필사를 쭉 해보고 느낀점 혹은 새로 알게된 지식을 정리 하고, 행여 필사가 현재에 있는 패키지 버전들과 차이가 있다면 그런 부분을 짚고 넘어가 보려고한다.
이번에 진행한 케글 필사
https://kaggle-kr.tistory.com/17?category=868316
타이타닉 튜토리얼 1 - Exploratory data analysis, visualization, machine learning
My_kernel_chapter_data_check_EDA /*!** Twitter Bootstrap**//*! * Bootstrap v3.3.7 (http://getbootstrap.com) * Copyright 2011-2016 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/master/LICENSE) *//*! normalize.css v3.0.3 | MIT Li
kaggle-kr.tistory.com
<느낀점>
기초적인 Seaborn과 결측값들을 찾아보는 EDA를 오랜만에 해보니 반갑기도 하고 신기했다.
태블로에서 간단하게 드래그 드롭으로 그래프를 구현하다가 seaborn을 임포트 하고, f,ax 및 figsize등을 지정한 후에
각 그래프 별로 함수를 넣어주는 코드를 직접 구현해보니 많이 감회가 새로웠다.
새삼 BI툴이나 쿼리로 테이블을 보는 작업이 편했던 것이구나를 다시 느끼게 되었다.
또한 버전이 오래된 부분이 있어 수정해야하는 부분이 있었다.
Factorplot은 이제 더이상 seaborn에서 사용하지 않아 catplot으로 수정해주고 kind='point' 를 넣어 주어야했다.
각 플롯별 X축 지정도 이제는 해주어야한다.
오랜만의 케글 필사이지만 3번째 시도를 하는 것이라 크게 시야가 트이는 느낌은 없었다.
같은 타이타닉 이지만 다른 사람이 진행하는 것도 해봐서 feature engineering과 모델링도 해봐야 할것 같다.
해당 링크를 통해 내가 만든 케글 필사를 볼 수 있다.
https://colab.research.google.com/drive/1D2U8lsueUz1bGpbb32h7QSdZRwFyaMUu?usp=sharing
Kaggle Titanic Practice
Colaboratory notebook
colab.research.google.com