케글 4

[Kaggle] 케글 필사 - Porto Seguro’s safe driver prediction 2

지난번에 필사한 대회와 동일한 데이터이다. 다만 이번에는 피처 엔지니어링에서 끝난게 아니라 모델링 후 제출까지 진행하였다! https://www.kaggle.com/code/gpreda/porto-seguro-exploratory-analysis-and-prediction/notebook Porto Seguro Exploratory Analysis and Prediction Explore and run machine learning code with Kaggle Notebooks | Using data from Porto Seguro’s Safe Driver Prediction www.kaggle.com 지난번과 데이터의 특성이 동일하여 큰 방법은 비슷하지만 좀 다른 점도 있었다. 1. 메타데이터 우선은..

IT/Analysis 2024.02.23

[Kaggle] 케글 필사 - Porto Seguro’s safe driver prediction

이번에는 새로운 케글필사를 진행하였다. Porto Seguro 보험회사에서 진행한 보험 청구 예측 대회이다. 타겟 열의 보험 계약자에 대한 보험 청구가 되었는지 여부를 맞추는 대회였다. https://www.kaggle.com/c/porto-seguro-safe-driver-prediction Porto Seguro’s Safe Driver Prediction | Kaggle www.kaggle.com 이번 대회는 지난번 타이타닉과 좀 다른 점이 있었다. 1. Null 값은 -1로 표시되었다. 2. 컬럼명이 무엇이다라는걸 지칭하는것이 아닌 값이 이진 특성이라면 bin, 범주형 특성이라면 cat 같은 접미사로만 표현되었다. 생각해보니 제출자 입장에서는 회사 보안을 위해 테이블을 정확히 공개할 수는 없기 때..

IT/Analysis 2024.02.23

[Kaggle] 케글 필사 - Titanic_2

지난번에 작성한 이유한님의 케글 필사와 똑같은 타이타닉 데이터셋이다! 다만 이번에 필사한 것은 다른 해외 분의 케글을 필사하였다. https://www.kaggle.com/code/ash316/eda-to-prediction-dietanic/notebook EDA To Prediction(DieTanic) Explore and run machine learning code with Kaggle Notebooks | Using data from Titanic - Machine Learning from Disaster www.kaggle.com 지난번 이유한님의 케글 필사는 EDA 까지였다 하지만 이번에는 EDA 부터 Feature Engineering, 그리고 모델링까지 진행하였다! 느낀 부분 1. 오탈자..

IT/Analysis 2024.02.15

[Kaggle] 케글 필사 - Titanic

예전 부터 드문 드문 하던 케글필사 최근 들어 SQL 과 Tableau를 공부하느라 가끔 Python을 보니 순간적으로 여러 문법이 막히는 느낌을 들었다.!ㅠㅠ 데이터 분석가로써 가장 중요한 언어 중 하나인 파이썬을 헷갈리는 나자신을 보고 매우 당황하였다... 그렇다고 다시 기초 책을 사서 보기엔 너무 돌아가는 것 같고 시간이 성장이 아닌 복구 정도에 그칠것 같았다. 그래서 생각해낸 방법은 2가지 1) 케글필사 & 2) 파이썬 PS 및 알고리즘 공부! 우선 두 가지 방법 다 파이썬 문법과 친숙해지고 여러 패키지에 대해 감각을 다시 찾는 것. 케글은 다양한 데이터셋의 EDA와 피쳐 엔지니어링을 해볼 수 있는 경험을 얻어 과제 전형등의 취업 준비에 도움이 될것 같고, 파이썬 PS 및 알고리즘 공부는 알고리즘..

IT/Analysis 2024.02.13