머신러닝

본 포스팅에서는 Feature engineering 실습을 위해 1차적으로 가공된 타이타닉 생존자 예측 데이터를 활욯했다. 데이터 로딩 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns %matplotlib inline titanic = pd.read_csv('data/titanic.csv') titanic.info() 결측치 처리 titanic.isnull().mean() 결측치를 조회해보면 Age, Cabin, Embarked라는 변수에서 결측치가 보인다. 나이는 평균으로 처리해주고, 다른 두 변수는 새로운 범주를 지정해준다. 결측치를 굳이 새로운 범주로 분리하는 가장 큰 이유는 결측치..
xoghks_h
'머신러닝' 태그의 글 목록