feature enginearing のカテゴリ系

# 量で分割 --> categorical (pd.Interval)
df['price_range'] = pd.qcut(allfeat['price'], 5)

# 値で分割 --> categorical (pd.Interval)
df['age_range'] = pd.qcut(allfeat['age'], 5)

>>> iv = pd.Interval(left=0, right=5)
>>> iv
Interval(0, 5, closed='right')

>>> 2.5 in iv
True


# null処理 ミディアン
allfeat['fare']. = allfeat['fare'].fillna(train['fare'].median())

# null処理 ランダム
allfeat['age']=allfeat['age'].fillna(value=np.random.randint(avg-std,avg+std))


# one-hot encoding の継ぎ足し
allfeat=pd.concat([allfeat,pd.get_dummies(allfeat['age_range'])],axis=1) 
allfeat.drop(columns=['age_range'], inplace=True)