OneHotEncoder输入必须是int数组,所以直接传入字符串特征值是不行的,需要先通过LabelEncoder转化成整型特征,再传入OneHotEncoder。

1
2
3
4
5
le = LabelEncoder()
df.feature = le.fit_transform(df.feature)
ohe = OneHotEncoder()
trans_feature = ohe.fit_transform(df)

image.png