导入pandas
1.工作年限与薪资情况
导入matplotlib ,进行数据图形化
2.一元线性回归
结论:x与y有一定关系
从sklearn线性模型导入线性回归
预测年资
3.多项式回归
poly_reg把PF转为二次项
不过在这里,还是出现一点小意外,这个bug,目前还不知道怎么解决
4 多元回归分析房屋价格影响因素
顺便一提,调用pandas中的get_dummies进行数据处理:类别变量编码处理
对某个变量做get_dummies哑变量处理,就是当这个位置为1,其他位置就必须就是0。
引入其他变量,做concat拼接。在这里,只有brick,Neighborhood是类别型,只针对他们做拼接
然后去除类型型新增的多余内容
现在开始多元因素考虑
通过最小二乘法拟合结果,一般来说,主要是看 R-squared,越接近1,说明拟合度越高