python-线性回归分类

波士顿房价预测

from sklearn.linear_model import LinearRegression#线性回归模型
print("线性回归模型训练例子")
clf = LinearRegression()
clf.fit([[0, 0], [1, 1], [2, 2]], [0, 1, 2])  # 模型训练例子
'''
y = 0.5*x1 + 0.5*x2   #线性方程(预测模型)
'''
pre = clf.predict([[3, 3]])   # 模型预测
print("回归系数",clf.coef_)
print("截距",clf.intercept_)
print("数据[3, 3]的预测值:",pre)
print("*****************************")

# 波士顿房价数据回归分析
print("波士顿房价数据回归分析")
from sklearn.datasets import load_boston  #导入波士顿房价数据集
from sklearn.linear_model import LinearRegression  #导入线性回归模型
import matplotlib.pyplot as plt  #导入画图模型
boston = load_boston()  # 实例化
x = boston.data[:, 5:6] #用房间数作为自变量(在第6列)
#print(boston)
clf = LinearRegression()
clf.fit(x, boston.target)   # 模型训练(房间数,房价)
clf.coef_   # 回归系数
y_pre = clf.predict(x)   # 模型输出值

#数据可视化
plt.scatter(x, boston.target)  # 样本实际分布
plt.plot(x, y_pre, color='red')   # 绘制拟合曲线
plt.show()

python-线性回归分类_第1张图片

研究生录取预测

print("前5个研究生信息",'\n',data.head())
print("研究生录取预测*************************************")
import pandas as pd
from sklearn.linear_model import LogisticRegression #逻辑回归模型(用来分类)
from sklearn.model_selection import train_test_split #划分数据集,分为测试集与训练集
from sklearn.metrics import classification_report #分类报告,预测值与实际值的分类报告

data = pd.read_csv('LogisticRegression.csv')
data_tr, data_te, label_tr, label_te = train_test_split(data.iloc[:, 1:], data['admit'], test_size=0.2)#data.iloc按位置取数据,20%的测试集
clf = LogisticRegression()#实例化
clf.fit(data_tr, label_tr)#拟合(训练集数据x,是否录取的标签集y)
pre = clf.predict(data_te) #用训练好的模型预测
res = classification_report(label_te, pre) #打印预测值与实际值的分类报告
print(res)
#precision(准确率):正确预测为正的,占全部预测为正的比例
#recall(召回率):正确预测为正的,占全部实际为正的比例。
#f1-score (f1值):精确率和召回率的调和平均数。
#support 各分类样本的数量或测试集样本的总数量。

python-线性回归分类_第2张图片

你可能感兴趣的:(机器学习,python,逻辑回归,数据分析,可视化)