feature enginearing のカテゴリ系
# 量で分割 --> categorical (pd.Interval) df['price_range'] = pd.qcut(allfeat['price'], 5) # 値で分割 --> categorical (pd.Interval) df['age_range'] = pd.qcut(allfeat['age'], 5) >>> iv = pd.Interval(left=0, right=5) >>> iv Interval(0, 5, closed='right') >>> 2.5 in iv True # null処理 ミディアン allfeat['fare']. = allfeat['fare'].fillna(train['fare'].median()) # null処理 ランダム allfeat['age']=allfeat['age'].fillna(value=np.random.randint(avg-std,avg+std)) # one-hot encoding の継ぎ足し allfeat=pd.concat([allfeat,pd.get_dummies(allfeat['age_range'])],axis=1) allfeat.drop(columns=['age_range'], inplace=True)