100-Days-Of-ML-Code day1-day6 notes

X = dataset.iloc[ : , :-1].values  # 取所有行的从一列到最后一列
Y = dataset.iloc[ : , 3].values  # 取所有行的第列

 

OneHotEncoder:直观来说就是有多少个状态就有多少比特,而且只有一个比特为1,其他全为0的一种码制.机器学习中对于离散型的分类型的数据,需要对其进行数字化

单元线性回归用于单变量预测

 

多元线性回归类似单元线性回归模型,不过不太好画出直观二维图,只能用图展示测试值与预测值之间的误差

 

day3的多元线性回归可以最后计算下预测的误差,这里计算了均方误差和R2误差

from sklearn.metrics import r2_score
from sklearn.metrics import mean_squared_error
import scipy as sp

print(r2_score(Y_test,y_pred))
print(sp.sqrt(mean_squared_error(Y_test,y_pred)))

0.934706847328
9137.99015279

 

day4-day6

StandardScaler:特征缩放, (X-mean)/std , 即特征减去均值再除以标准差

你可能感兴趣的:(技术,Jack的机器学习专栏)