机器学习实战0基础入门(一)之简单入门

提要:

1.机器学习出现的原因:海量数据硬件,接地气

2.机器学习分类

data:机器学习分为监督学习(有标签),无监督学习(无标签),强化学习(环境封闭,从环境奖惩中学习,eg.玩游戏,alphago棋盘)

question:分类(标签离散,逻辑回归,决策树,神经网络)回归(标签连续,线性回归,神经网络),聚类 ,关联规则(找特征之间的关系),时间序列,结构化输出(输出结构),生成式学习,决策性问题

3.深度学习与普通机器学习的区别:无需人工手动特征提取,自动实现非结构化数据的结构化,减少特征工程,解决特征提取与分类任务(eg.识别“8”)

4.机器学习框架:Scikit-leam(sklearn)

5.深度学习框架:TensorFlow,Keras(最简单),Pytorch

附:一个简单的房价线性回归预测模型

1.数据读取和特征标签区分

import pandas as pd #pandas用于数据读取和处理
df_housing=pd.read_csv("./house.csv")
df_housing.head #数据框的head信息
X=df_housing.drop("median_house_value",axis=1)
#drop函数默认删除行,列需要加axis = 1
y=df_housing.median_house_value

2.线性回归模型

from sklearn.model_selection import train_test_split
X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.2,random_state=0)
#random_state相当于随机种子数
#线性回归模型
from sklearn.linear_model import LinearRegression
model=LinearRegression()
model.fit(X_train,y_train)
y_predict=model.predict(X_test)
print("给预测评分:",model.score(X_test,y_test))
coef=model.coef_
import numpy as np
row,col=np.where(coef==max(coef))#相关性最强所对应特征
#预测评分为R^2

3.画图

#画图
import matplotlib.pyplot as plt
plt.scatter(X_test.median_income,y_test,color='brown')
plt.plot(X_test.median_income,y_predict,color='green')
plt.xlabel('s')
plt.ylabel('g')
plt.show()

你可能感兴趣的:(机器学习,人工智能,python)