机器学习线性回归代码总结

1.首先,用pandas读取一个文本的数据,要想给每列加一个标题,用:data = pd.read_csv(path, header=None, names=[‘Population’, ‘Profit’])
2.这是pandas自带的画图工具使用方法:
data.plot(kind=‘scatter’, x=‘Population’, y=‘Profit’, figsize=(12,8))
plt.show()
3.让我们在训练集中添加一列,以便我们可以使用向量化的解决方案来计算代价和梯度:
data.insert(0, ‘Ones’, 1) #这个代表在第0列,插入标题为ones的列,全部用1填充
4.cols = data.shape[1] #0行1列
5.pandas中的apply()函数:可以对每一行或者列全部运算,比如全部+1
return df.apply(lambda column: (column - column.mean()) / column.std()) #特征缩放
6.concat函数是在pandas底下的方法,可以将数据根据不同的轴作简单的融合
data = pd.concat([ones, df], axis=1) # 合并数据,根据列合并
7.ax.legend(loc=2) # loc参数设置图例的显示位置的
8.np.linspace()在指定的间隔内返回均匀间隔的数字
9.np.shape[0]返回行的长度,np.shape[1]返回列的长度,iloc[]通过行号来读取数据,np.shape返回各个维度的维数
10.numpy的tile()函数将变量内容复制成输入矩阵同样大小的矩阵
11.np.squeeze()函数从数组的形状中删除单维度条目,即把shape中为1的维度去掉
12.np.zeros(())一般有两个括号
13.np.pad()可以将numpy数组按指定的方法填充成指定的形状,一般用“constant”

你可能感兴趣的:(机器学习)