sklearn数值特征多项式处理: PolynomialFeatures

import pandas as pd
poke_df = pd.read_csv('Pokemon.csv', encoding='utf-8')
atk_df = poke_df[['Attack', 'Defense']]
atk_df.head()

sklearn数值特征多项式处理: PolynomialFeatures_第1张图片

from sklearn.preprocessing import PolynomialFeatures

pf = PolynomialFeatures(degree = 2, interaction_only = False, include_bias = False)
res = pf.fit_transform(atk_df)
res

sklearn数值特征多项式处理: PolynomialFeatures_第2张图片
多项式 : 使用sklearn.preprocessing.PolynomialFeatures进行特征构造 (特征自己与自己相乘, 特征自己与其它特征相乘).
有a,b两个特征, 那么它的2次多项式为[1,a,b,a2,ab,b2].

参数:
  • degree: 控制多项式的次数
  • interaction_only: 默认为False, 如果指定为True, 那么就不会有特征自己与自己相乘的项, 即没有a2和b2.
  • include_bias: 默认为True. 如果为True, 那么就会有0次幂项, 即全为1这一列.
intr_features = pd.DataFrame(res, columns=['Attack','Defense','Attack^2','Attack x Defense','Defense^2'])
intr_features.head()

sklearn数值特征多项式处理: PolynomialFeatures_第3张图片

你可能感兴趣的:(#,sklearn数据预处理)