RainOnTheMoon

西北工业大学2021数模校赛B题 - 波士顿房价的预测

文章目录

西北工业大学2021数模校赛B题 - 波士顿房价的预测
- 一.文章声明：
- 二.题目简述：
- 三.使用python机器学习对于问题进行分析：
- - - 3.1 数据基本样貌解析：
    - 3.2 数据相关性简介：
    - 3.3 机器学习与建模部分（使用原数据）：
    - 3.4 机器学习与建模部分（数据标准化）：
    - 3.5 模型评价以及数据分析：
    - 3.6 仅对于岭回归中k值较大的4个属性进行单独回归建模：

一.文章声明：

本篇文章是笔者自己结合网上的资料进行学习与建模的过程与心得，本人是python大数据小白，所以在拿到类似数据挖掘的题目时就向着数据挖掘的方向进行前进，5.1-5.3三天校赛数模主编程，第一次数模如有不正确不合适的地方，敬请指正，谢谢！！

二.题目简述：

由于本次B题的3，4问中开放性较高，所以本篇文章仅针对前两个问题进行解析与解答

三.使用python机器学习对于问题进行分析：

首先打开pycharm使用python进行环境变量的配置：

import pandas as pd
import numpy as np
from sklearn.linear_model import LinearRegression, SGDRegressor
from sklearn.linear_model import Lasso
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import mean_squared_error
import matplotlib.pyplot as plt
from sklearn.linear_model import Ridge
import seaborn as sns
import os
from scipy.stats import f as F_TEST

3.1 数据基本样貌解析：

问题一总述分析：
首先我们将所给附件转换为csv格式文件，使用Python的Pandas库将数据导入，用matplotlib和seaborn库绘制前13个变量与第14个变量户主拥有住房价值的中位数（以下简称房价）的散点图，以及变量间的热力相关图，分析出自变量与房价的线性相关关系，以及每一个自变量对房价的影响情况
加载数据集：

os.chdir(r'C:\Users\86135\Desktop\数模校赛B题')
f=open("boston.csv",encoding="utf-8")
df=pd.read_csv(f)

使用dataframe进行数据统计数据基本样貌：

data_pd=pd.DataFrame(data=df,columns=df.columns)
data_des=data_pd.describe()
data_des.plot()
plt.title("Description of data")
plt.legend(loc="best")
plt.savefig("数据基本样貌折线图.png")
plt.show()

对于数据基本面貌的折线图：

作出13个属性对于房价的影响的散点图：

plt.rcParams['font.sans-serif']=['SimHei']              #解决中文无法显示的问题
plt.rcParams['axes.unicode_minus']=False                #用来正常显示负号
titles=['CRIM','LRA','NCS','CR','NOX','ARN','HOB','WD5','RH','TAX','SFR','POAA','LSSP'] #设置标题
plt.figure(figsize=(12,9))                              #配置画布大小
for i in range(13):
    plt.subplot(4,4,i+1)
    plt.scatter(data_pd[titles[i]],data_pd['MV'],marker=".",color='g')
    plt.xlabel(titles[i])
    plt.title(str(i+1)+'.'+titles[i]+'-MV')
plt.tight_layout()
plt.savefig("13个属性的散点图")                            #依次做出13个图并且可视化
plt.show()

13个属性的散点图：

计算相关系数，选出相关系数>0.5的因素作为主要影响因素进行绘图：

print(data_pd.corr()['MV'])
corr = data_pd.corr()
corr = corr['MV']
corr[abs(corr)>0.5].sort_values().plot.bar(color=['lightblue','lightgreen','lightpink','orange'])
plt.title("Show the factors with correlation coefficient > 0.5")
plt.savefig("pearson_sorted_0.5.png")
plt.show()

主要因素：

对于上面的三个主属性进行散点绘图与放大分析：

#展示LSSP和MV之间的关系：
plt.scatter(data_pd['LSSP'],data_pd['MV'],c="lightblue")
plt.title("LSSP - MV")
plt.savefig("LSSP_MV散点图.png")
plt.show()

#展示SFR和MV之间的关系
plt.scatter(data_pd['SFR'],data_pd['MV'],c="lightgreen")
plt.title("SFR - MV")
plt.savefig("SFR_MV散点图.png")
plt.show()

#展示ARN和MV之间的关系
plt.scatter(data_pd['ARN'],data_pd['MV'],c="pink")
plt.title("ARN - MV")
plt.savefig("ARN_MV散点图.png")
plt.show()

三个主属性的相关散点图：

由散点图可以看出，部分变量与房价有比较明显的相关关系，同时从热力相关图的最后一行（13个自变量和房价的相关系数）可以看出，绝大多数的变量与房价的相关系数都超过了0.3，其中有3个超过了0.5，分别为ARN、SFR、LSSP，有着较为明显的相关关系。

3.2 数据相关性简介：

使用热力图进行属性之间的相关性解析：

_, ax = plt.subplots(figsize=(12, 10)) #分辨率1200×1000
ax.set_title("Pearson Heatmap")
corr = df.corr(method='pearson') # 使用皮尔逊系数计算列与列的相关性
sns.heatmap(corr,square=True,cmap="rainbow",cbar_kws={'shrink': .9},ax=ax,annot=True,annot_kws={'fontsize': 12})
plt.savefig("pearson_heatmap.png")
plt.show()

热力相关图：

根据13个变量与房价的相关系数（以及热力图中的观测）来说明单个变量如何影响房价并做出一定的解释：
CRIM： 与房价的相关系数为-0.39，为负值且绝对值在0.3~0.5之间，说明在其它因素相同的情况下，人均犯罪率高的地区，房价相对低，并且相关程度中等。实际上，人均犯罪率高的地区治安差，人群受教育程度低，黑势力较为集中，房价就较低。
LRA： 与房价的相关系数为0.36，为正值且绝对值在0.3~0.5之间，说明在其它因素相同的情况下，大块占地住宅区比例高的地区，房价相对高，并且相关程度中等。实际上LRA，反映的是与市中心的接近程度，显然越接近市中心的地区LRA越高，房价也越高，呈正相关，符合实际情况。
NCS： 与房价的相关系数为-0.48，为负值且绝对值在0.3~0.5之间，说明在其它因素相同的情况下，非零售商业占地比例高的地区，房价相对低，相关程度中等。根据资料显示，波士顿的批发厂主要分布在离市中心较远的地区，所以该变量同样能反映距离市中心的距离，比例越大，离市中心越远，房价越低。
CR： 与房价的相关系数为0.18，为正值且绝对值在0.3以下，说明在其它因素相同的情况下，靠近河流的地区，其房价相对高一点，相关程度较弱。实际上，靠近河流的地区，其自然环境相对较好，交通运输相对便利，但可能距离市中心较远，故综合起来看，房价受它的影响不大。更为关键的因素是，CR的取值只有0，1两种，故与其它变量的相关性不能明确的表现。
NOX： 与房价的相关系数为-0.43，为负值且绝对值在0.3~0.5之间，说明在其它因素相同的情况下，氮氧化物浓度高的地区，房价相对低，相关程度中等。实际上，氮氧化物浓度高的地区主要在大型工厂附近，自然环境相对差，且距离市中心较远，故房价相对低。
ARN： 与房价的相关系数为0.7，为正值且绝对值大于0.5，说明在其它因素相同的情况下，每户平均房间数高的地区，房价相对高，相关程度较强。实际上，房价最直接的影响因素就是房屋面积，每户平均房间数高的地区，其房屋面积大，甚至可能为别墅区，房价固然高并且影响程度较大。
HOB： 与房价的相关系数为-0.38，为负值且绝对值在0.3~0.5之间，说明在其它因素相同的情况下，1940年前建造的户主所有房比例大的地区，房价相对低，相关程度中等。实际上，HOB能反映该地区城市化的程度，HOB越大，说明该地区老旧房屋占比大，城市化程度低，房价自然相对较低。
WD5： 与房价的相关系数为0.25，为正值且绝对值在0.3以下，说明在其它因素相同的情况下，与五个波士顿劳动力聚集区的加权距离大的地区，房价相对高，相关程度较弱。理论上，WD5越大，说明该地区距离中心区相对远，房价应该相对低，但实际上，WD5不能准确的说明该地区是否在市区或者郊区，并且可能考虑到郊区别墅高房价、环境优的影响，使得WD5与房价表现了较弱的正相关性，与理论分析略有不同。
RH： 与房价的相关系数为-0.38，为负值并且绝对值在0.3~0.5之间，说明在其它因素相同的情况下，与辐射式公路的接近指数大的地区，房价相对低。相关程度中等。实际上，RH反映了该地区的交通情况，RH越小，说明附近交通便利，房价相对高。
TAX： 与房价的相关系数为-0.47，为负值且绝对值在0.3~0.5之间，说明在其它因素相同的情况下，每一万美元的全值财产税大的地区，房价相对较低。相关程度中等。实际上，TAX越大，说明财产税越大，更少人愿意去买，故而房价低。
SFR： 与房价的相关系数为-0.51，为负值且绝对值在0.5以上，说明在其它因素相同的情况下，学生与教师的比例大的区，房价相对低，相关程度较强。实际上，SFR反映了该地区的教育程度和学校的密集程度，SFR越小，说明教师相对学生多，教育程度高，并且附近学校较多，也可能为学区房，故房价高，呈现负相关。
POAA： 与房价的相关系数为0.33，为正值且绝对值在0.3~0.5之间，说明在其它因素相同的情况下，POAA大的地区，房价相对较高，相关程度中等。实际上，POAA反映了非洲裔美国人的比例，POAA高的地区，非洲裔美国人的比例小，由于美国种族因素的影响，黑人比例大的地区，往往人均社会地位相对较低，房价也低，故POAA高的地区黑人比例小，房价相对高。
LSSP： 与房价的相关系数为-0.74，为负值且绝对值在0.5以上，说明在其它因素相同的情况下，低社会地位人口的比例高的地区，房价相对低，相关程度较强。实际上LSSP越高，说明该地区处于较低层次的社会，生活质量相对低，房价低。

3.3 机器学习与建模部分（使用原数据）：

依次使用四种回归模型分别进行建模以及评价：

data_pd = pd.DataFrame(data=df,columns=df.columns)
data_pd = data_pd[['CRIM','LRA','NCS','CR','NOX','ARN','HOB','WD5','RH','TAX','SFR','POAA','LSSP','MV']]
y = np.array(data_pd['MV'])
data_pd=data_pd.drop(['MV'],axis=1)
X = np.array(data_pd)

# 分割训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=14)

print("--------------------LR-------------------------")
lr=LinearRegression()
lr.fit(X_train,y_train)
y_lr_pred=lr.predict(X_test)
error_lr=mean_squared_error(y_test,y_lr_pred)
print('斜率：',lr.coef_)
print('截距：',lr.intercept_)
print('均方误差：',error_lr)
#计算SST和R^2
ssr_lr=np.sum((y_lr_pred - np.mean(y_test)) ** 2)
R2_lr = 1-error_lr/ssr_lr
print('R方',R2_lr)
#F检验
up = ssr_lr/14
down = error_lr / (506-14-1)
F_lr = up/down
print("实际F值：",F_lr)
F_Theroy_lr=F_TEST.ppf(q=0.99,dfn=14,dfd=506-14-1)
print("理论F值：",F_Theroy_lr)

print("------------------------SGD--------------------")
sgd=SGDRegressor()
sgd.fit(X_train,y_train)
y_sgd_pred=sgd.predict(X_test)
error_sgd=mean_squared_error(y_test,y_sgd_pred)
print('斜率：',sgd.coef_)
print('截距：',sgd.intercept_)
print('均方误差：',error_sgd)
#计算SST和R^2
ssr_sgd =np.sum((y_sgd_pred - np.mean(y_test)) ** 2)
R2_sgd = 1-error_sgd/ssr_sgd
print(R2_sgd)
#F检验
up = ssr_sgd/14
down = error_sgd / (506-14-1)
F_sgd = up/down
print("实际F值：",F_sgd)
F_Theroy_sgd=F_TEST.ppf(q=0.99,dfn=14,dfd=506-14-1)
print("理论F值：",F_Theroy_sgd)

print("--------------------------LASSO--------------------------")
# 找到Lasso的alapha值
model = LassoCV(cv=20).fit(X, y)
# 进行Lasso回归
lasso = Lasso(max_iter=10000, alpha=model.alpha_)
lasso.fit(X_train, y_train)
y_pred_lasso =lasso.predict(X_test)
# 输出Lasso系数
print('斜率：',lasso.coef_)
print('截距：',lasso.intercept_)
print('lasso回归均方误差：',mean_squared_error(y_test,y_pred_lasso))
SSE = mean_squared_error(y_test,y_pred_lasso)
SSR = np.sum((y_pred_lasso - np.mean(y_test)) ** 2)
R2 = 1- SSE/SSR
print(R2)
#F检验
up = SSR /14
down = SSE / (506-14-1)
F_la = up/down
print("实际F值：",F_la)
F_Theroy_la=F_TEST.ppf(q=0.99,dfn=14,dfd=506-14-1)
print("理论F值：",F_Theroy_la)

print("-----------------------------Reidge-----------------------")
rd=Ridge()
rd.fit(X_train,y_train)
print(rd.coef_)
print(rd.intercept_)
y_rd_pred=rd.predict(X_test)
print('岭回归下均方误差：',mean_squared_error(y_test,y_rd_pred))
sse = mean_squared_error(y_test,y_rd_pred)
#计算SST和R^2：
ssr_rd = np.sum((y_rd_pred - np.mean(y_test)) ** 2)
R2_rd = 1 - sse / ssr_rd
print(R2_rd)
#F检验：
up = ssr_rd/14
down = sse / (506-14-1)
F_rd = up/down
print("实际F值：",F_rd)
F_Theroy_rd=F_TEST.ppf(q=0.99,dfn=14,dfd=506-14-1)
print("理论F值：",F_Theroy_rd)

运行结果展示：

正则化线性回归：
MV = - 9.21274736 * 10^-2 CRIM + 5.02784306 * 10^-2 LRA + 2.15284959 * 10^-2 NCS + 3.02469962 CR - 1.83410939 * 10^1 NOX + 3.91521885 ARN + 9.58916188 * 10^-3 HOB - 1.47452651 WD5 + 2.87337465 * 10^-1 RH - 1.20880049 * 10^-2 TAX - 9.91327765 * 10^-1 SFR + 6.01417187 * 10 ^-3 POAA - 5.63066192 * 10^-1 LSSP + 37.82941413023578

均方误差： 24.523741433124314
R方： 0.9957443759609029
实际F值： 8241.195239340266
理论F值： 2.118070479011805
---------------------------------------------------------------------------------------------------------------------------------
随机梯度下降回归：
MV = 3.37107738 * 10^10 CRIM + 5.21684013 * 10^11 LRA + 7.58522088 * 10^10 NCS + 1.47131403 * 10^10 CR + 6.73006346 * 10^9 NOX + 1.56414904 * 10^11 ARN + 1.00842835 * 10^11 HOB - 2.91362739 * 10^11 WD5 - 5.62180874 * 10^11 RH + 3.70666065 * 10^11 TAX - 4.25357407 * 10^11 SFR + 7.78190929 * 10^10 POAA - 3.76696379 * 10^11 LSSP - 9.52593132 *10^9

均方误差： 3.5223887252021308 * 10^28
R方： 0.9901960784313725
实际F值： 3577.285714285674
理论F值： 2.118070479011805
---------------------------------------------------------------------------------------------------------------------------------
Lasso回归：
MV = - 0.05735935 CRIM + 0.05190773 LRA - 0.0 NCS + 0.0 CR - 0.0 NOX + 2.02345913 ARN + 0.02554581 HOB - 0.69626584 WD5 + 0.25975989 RH - 0.01531205 TAX - 0.77482949 SFR + 0.00573684 POAA - 0.75441197 LSSP + 35.951395510062476
 
均方误差： 26.10064040505063
R方： 0.9952365271230845
实际F值： 7362.575473325399
理论F值： 2.118070479011805
---------------------------------------------------------------------------------------------------------------------------------
岭回归：
MV = - 8.71811362 * 10^-2 CRIM + 5.17323108 * 10^-2 LRA - 7.87028765 * 10^-3 NCS + 2.86136009 CR - 1.01757489 * 10 NOX + 3.96736900 ARN + 3.11907031 * 10^-3 HOB - 1.33551369 WD5 + 2.72485657 * 10^-1 RH - 1.30064740 * 10^-2 TAX - 8.97488401 * 10^-1 SFR + 6.41338767 * 10^-3 POAA - 5.75516375 * 10^-1 LSSP + 31.997674854058808

均方误差： 24.570308877217364
R方： 0.9956876090864352
实际F值： 8132.710896201309
理论F值： 2.118070479011805

3.4 机器学习与建模部分（数据标准化）：

在机器学习时将原始数据进行标准化之后再依次构建四种回归模型并进行检验：

# 制作训练集和测试集的数据
data_pd = data_pd[['CRIM','LRA','NCS','CR','NOX','ARN','HOB','WD5','RH','TAX','SFR','POAA','LSSP','MV']]
Y = np.array(data_pd['MV'])
data_pd=data_pd.drop(['MV'],axis=1)
X = np.array(data_pd)
X_train,X_test,y_train,y_test=train_test_split(X,Y,random_state=33,test_size=0.2)

#标准化
std=StandardScaler()
x_train=std.fit_transform(X_train)
x_test=std.transform(X_test)
y_train=std.fit_transform(y_train.reshape(-1,1))  #y需要转化为2维
y_test=std.transform(y_test.reshape(-1,1))

print("-----正则化LinearRegression-----")
lr=LinearRegression()
lr.fit(x_train,y_train)
y_lr_pred=std.inverse_transform(lr.predict(x_test))
error_lr=mean_squared_error(std.inverse_transform(y_test),y_lr_pred)
print('斜率：',lr.coef_)
print('截距：',lr.intercept_)
print('均方误差：',error_lr)
#计算SST和R^2
ssr_lr=np.sum((y_lr_pred - np.mean(y_test)) ** 2)
R2_lr = 1-error_lr/ssr_lr
print(R2_lr)
#F检验
up = ssr_lr/14
down = error_lr / (506-14-1)
F_lr = up/down
print("实际F值：",F_lr)
F_Theroy_lr=F_TEST.ppf(q=0.99,dfn=14,dfd=506-14-1)
print("理论F值：",F_Theroy_lr)

print("-----随机梯度下降法SGDRegressor-----")
sgd=SGDRegressor()
sgd.fit(x_train,y_train)
y_sgd_pred=std.inverse_transform(sgd.predict(x_test))
error_sgd=mean_squared_error(std.inverse_transform(y_test),y_sgd_pred)
print('斜率：',sgd.coef_)
print('截距：',sgd.intercept_)
print('均方误差：',error_sgd)
#计算SST和R^2
ssr_sgd =np.sum((y_sgd_pred - np.mean(y_test)) ** 2)
R2_sgd = 1-error_sgd/ssr_sgd
print(R2_sgd)
#F检验
up = ssr_sgd/14
down = error_sgd / (506-14-1)
F_sgd = up/down
print("实际F值：",F_sgd)
F_Theroy_sgd=F_TEST.ppf(q=0.99,dfn=14,dfd=506-14-1)
print("理论F值：",F_Theroy_sgd)

print("----------------Lasso回归----------------------")
lasso = Lasso()
lasso.fit(X_train, y_train)
y_pred_lasso =lasso.predict(X_test)
# 输出Lasso系数
print('斜率：',lasso.coef_)
print('截距：',lasso.intercept_)
print('lasso回归均方误差：',mean_squared_error(y_test,y_pred_lasso))
sse_la = mean_squared_error(y_test,y_pred_lasso)
ssr_la = np.sum((y_pred_lasso - np.mean(y_test)) ** 2)
R2 = 1- sse_la/ssr_la
print(R2)
#F检验
up = ssr_la/14
down = sse_la / (506-14-1)
F_la = up/down
print("实际F值：",F_la)
F_Theroy_la=F_TEST.ppf(q=0.99,dfn=14,dfd=506-14-1)
print("理论F值：",F_Theroy_la)


print("-----岭回归Ridge-----")
rd=Ridge(alpha=1.0)
rd.fit(x_train,y_train)
print(rd.coef_)
print(rd.intercept_)
y_rd_pred=std.inverse_transform(rd.predict(x_test))
print('岭回归下均方误差：',mean_squared_error(std.inverse_transform(y_test),y_rd_pred))
sse = mean_squared_error(std.inverse_transform(y_test),y_rd_pred)
#计算SST和R^2：
ssr_rd = np.sum((y_rd_pred - np.mean(y_test)) ** 2)
R2_rd = 1 - sse / ssr_rd
print(R2_rd)
#F检验：
up = ssr_rd/14
down = sse / (506-14-1)
F_rd = up/down
print("实际F值：",F_rd)
F_Theroy_rd=F_TEST.ppf(q=0.99,dfn=14,dfd=506-14-1)
print("理论F值：",F_Theroy_rd)

运行结果展示：

正则化线性回归：
MV = - 0.10652353 CRIM + 0.1248883 LRA + 0.02144814 NCS + 0.08447264 CR - 0.1851724 NOX +  0.3015255 ARN - 0.00436415 HOB - 0.33801186 WD5 + 0.28858221 RH - 0.23677719 TAX - 0.19424453 SFR + 0.07916941 POAA - 0.43398872 LSSP + 4.18819804 * 10 ^ -15

均方误差： 22.042579216213284
R方： 0.9995876421553258
实际F值： 85050.95519435528
理论F值： 2.118070479011805
---------------------------------------------------------------------------------------------------------------------------------
随机梯度下降回归：
MV = - 0.09017088 CRIM + 0.09381253 LRA - 0.029617 NCS + 0.09407728 CR - 0.13883074 NOX +  0.32370686 ARN - 0.01647585 HOB - 0.29189313 WD5 + 0.16190143 RH - 0.1052844 TAX - 0.1859067 SFR + 0.08232581 POAA - 0.42638702 LSSP + 1.36533229 * 10 ^ -5

均方误差： 22.293789831144753
R方： 0.9995866669969736
实际F值： 84850.29822113655
理论F值： 2.118070479011805
---------------------------------------------------------------------------------------------------------------------------------
Lasso回归：
MV = - 0.0 CRIM + 0.00218933 LRA - 0.0 NCS + 0.0 CR + 0.0 NOX + 0.0 ARN + 0.00084594 HOB - 0.0 WD5 + 0.0 RH - 0.00092818 TAX - 0.0 SFR + 0.00082548 POAA - 0.06964242 LSSP + 0.8517611

均方误差： 0.337201147275985
R方： 0.9934775184507464
实际F值： 5377.006942310473
理论F值： 2.118070479011805
---------------------------------------------------------------------------------------------------------------------------------
岭回归：
MV = - 0.10546956 CRIM + 0.12265543 LRA + 0.01810155 NCS + 0.08491327 CR - 0.18178902 NOX + 0.30268784 ARN - 0.00504133 HOB - 0.33433398 WD5 + 0.27964259 RH - 0.2279551 TAX - 0.19351241 SFR + 0.07916974 POAA - 0.43224374 LSSP + 4.19852261 * 10^-15

均方误差： 21.982909442895057
R方： 0.9995888250657292
实际F值： 85295.63854282866
理论F值： 2.118070479011805

3.5 模型评价以及数据分析：

数据分析：

（1）均方误差SSE：均方误差表示的是真实值和估计值差的平方和，对于一个回归数学模型的评价中均方误差的值应越小越好，通过比较上面的数据我们可知在均方误差这方面评估模型的优劣性上：岭回归Ridge模型 > 简单多元线性回归模型 > SDG随机梯度下降法模型 > Lasso回归模型（此处 > 表示优于，下同），说明岭回归Ridge模型总体山真实值跟模型构建出的估计值相差是相对较小的，因此在均方误差上岭回归Ridge模型同样是优于其他三个模型的，这就说明岭回归Ridge模型的模型拟合的精确程度是优于其他三个模型
（2）模型判定系数：模型判定系数表示的是模型拟合的好坏，且其取值范围为[ 0 , 1 ]，因此对于判定系数的评价标准有 > 0.8 即可认为拟合程度好，模型可以用于拟合，通过上面的数据我们可知，本次解决问题使用的四个模型的判定系数均 > 0.99 因此说明这四个模型的拟合均可以用于问题的解决，但精确地看其优劣程度，我们不难发现：岭回归Ridge模型 > 简单多元线性回归模型 > SDG随机梯度下降法模型 > Lasso回归模型，因此在判定系数上岭回归Ridge模型同样也是优于其他三个模型的，这就说明岭回归Ridge模型的模型拟合的精确程度是优于其他三个模型
（3）F检验： F检验分为两部分：理论F值和实际F值：对于理论F值中置信系数q的选择范围是在[ 0 , 1 ]之间，本次我们规范了置信系数为0.99，因此原数据给定的情况下，理论F值是相同的，均为2.11807048 ；对于实际F值，每一个模型是不同的，对于一个模型来说，实际F值 - 理论F值的差值越大，则说明模型的拟合程度越好，理论上差值在100以上就可以说明该模型的精确度较高，因此通过上面的数据，我们可知每个模型的拟合精确程度都较高，但是精确来看是：岭回归Ridge模型 > 简单多元线性回归模型 > SDG随机梯度下降法模型 > Lasso回归模型，因此在F检验上岭回归Ridge模型同样也是优于其他三个模型的，这就说明岭回归Ridge模型的模型拟合的精确程度是优于其他三个模型
（4）总结（1）（2）（3），通过上面的三条分析，我们不难发现岭回归Ridge模型在各个方面都是优于其他三个模型的，这就说明岭回归Ridge模型的模型拟合的精确程度在总体上确实是优于其他三个模型的，因此在本次数学建模解决问题中，我们最终选择使用岭回归Ridge回归模型作为解决问题的最终模型

3.6 仅对于岭回归中k值较大的4个属性进行单独回归建模：

由3.4中的运行结果可以看到对于岭回归中k值较大的四个属性分别是：‘ARN’,‘WD5’,‘SFR’,'LSSP’这四个，因此将这四个属性单独拎出来进行回归建模：

# 导包
from sklearn.linear_model import Ridge
from sklearn.metrics import mean_squared_error
import os
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from scipy.stats import f as F_TEST

os.chdir(r'C:\Users\86135\Desktop\数模校赛B题')
f=open("boston.csv",encoding="utf-8")
df=pd.read_csv(f)

#用dataframe进行数据统计
data_pd=pd.DataFrame(data=df,columns=df.columns)
data_pd = data_pd[['ARN','WD5','SFR','LSSP','MV']]
Y = np.array(data_pd['MV'])
data_pd=data_pd.drop(['MV'],axis=1)
X = np.array(data_pd)
X_train,X_test,y_train,y_test=train_test_split(X,Y,random_state=33,test_size=0.2)
#标准化
std=StandardScaler()
x_train=std.fit_transform(X_train)
x_test=std.transform(X_test)
y_train=std.fit_transform(y_train.reshape(-1,1))  #y需要转化为2维
y_test=std.transform(y_test.reshape(-1,1))

rd=Ridge(alpha=1.0)
rd.fit(x_train,y_train)
print(rd.coef_)
print(rd.intercept_)
y_rd_pred=std.inverse_transform(rd.predict(x_test))
print('岭回归下均方误差：',mean_squared_error(std.inverse_transform(y_test),y_rd_pred))
sse = mean_squared_error(std.inverse_transform(y_test),y_rd_pred)
#计算SST和R^2
sst = np.sum((y_rd_pred - np.mean(y_test)) ** 2)
R2 = 1 - sse / sst
print(R2)
#F检验：
up = sst / 14
down = sse / (506-14-1)
F_rd = up/down
print("实际F值：",F_rd)
F_Theroy_rd=F_TEST.ppf(q=0.99,dfn=14,dfd=506-14-1)
print("理论F值：",F_Theroy_rd)

运行结果展示：

4个主要特征岭回归：
MV = 0.33252121 ARN - 0.14154463 WD5 - 0.20936303 SFR - 0.53067059 LSSP + 5.75531201 * 10^-15

均方误差： 26.522384226498634
R方： 0.9995205616473111
实际F值： 73151.07015267797
理论F值： 2.118070479011805

计算机基础：编码01，无符号数编码水饺编程 MFC学习笔记 Win32学习笔记 mfc c++visual studio windows
专栏导航本节文章分别属于《Win32学习笔记》和《MFC学习笔记》两个专栏，故划分为两个专栏导航。读者可以自行选择前往哪个专栏。（一）WIn32专栏导航上一篇：计算机基础：二进制基础13，十六进制与二进制的相互转换回到目录下一篇：计算机基础：编码02，有符号数编码，原码（二）MFC专栏导航上一篇：计算机基础：二进制基础13，十六进制与二进制的相互转换回到目录下一篇：计算机基础：编码02，有符号数编
Python 错误处理赔罪 Python 系统学习 python 开发语言
目录try调用栈记录错误抛出错误练习小结在程序运行的过程中，如果发生了错误，可以事先约定返回一个错误代码，这样，就可以知道是否有错，以及出错的原因。在操作系统提供的调用中，返回错误码非常常见。比如打开文件的函数open()，成功时返回文件描述符（就是一个整数），出错时返回-1。用错误码来表示是否出错十分不便，因为函数本身应该返回的正常结果和错误码混在一起，造成调用者必须用大量的代码来判断是否出错：
【Python Qt 基本概念】深入探讨 PySide6 与 PyQt6：选择、共存与最佳实践泡沫o0 Qt应用开发 -探索Qt的魅力与实践 Python 基础教程 mfc c++qt 开发语言 python 嵌入式 linux
目录标题第一章:Python绑定的Qt库——PySide6与PyQt6的比较1.1PySide6与PyQt6的基本介绍1.1.1PySide6：Qt官方推荐的Python绑定1.1.2PyQt6：成熟的第三方Python绑定1.1.3主要差异：许可证1.2两者的相似性与差异性1.2.1功能和性能差异1.2.2API差异与兼容性1.3总结：选择的自由与责任第二章:在VSCode中使用PySide6与
《AI大模型趣味实战》第8集：多端适配个人新闻头条基于大模型和RSS聚合打造个人新闻电台(Flask WEB版) 2 带娃的IT创业者 AI大模型趣味实战人工智能 flask 前端
《AI大模型趣味实战》第8集：多端适配个人新闻头条基于大模型和RSS聚合打造个人新闻电台(FlaskWEB版)2摘要本文末尾介绍了如何实现新闻智能体的方法。在信息爆炸的时代，如何高效获取和筛选感兴趣的新闻内容成为一个现实问题。本文将带领读者通过Python和Flask框架，结合大模型的强大能力，构建一个个性化的新闻聚合平台，不仅能够自动收集整理各类RSS源的新闻，还能以语音播报的形式提供"新闻电台
机器学习knnlearn1 XW-ABAP 机器学习机器学习人工智能
importmatplotlib.pyplotaspltimportnumpyasnpimportoperator#定义一个函数用于创建数据集defcreateDataSet():#定义特征矩阵，每个元素是一个二维坐标点，代表不同策略数据点的坐标group=np.array([[20,3],[15,5],[18,1],[5,17],[2,15],[3,20]])#定义每个数据点对应的标签，用于区分
基于 MySQL 和 Spring Boot 的在线论坛管理系统设计与实现城南|阿洋-计算机从小白到大神 mysql spring boot 数据库
markdownCopy✌全网粉丝20W+,csdn特邀作者、博客专家、CSDN[新星计划]导师、java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、pyhton、机器学习技术领域和毕业项目实战✌哈喽兄弟们，好久不见哦～最近整理了一下之前写过的一些小项目/毕业设计。发现还是有很多存货的，想一想既然放在电脑里面也吃灰，那么还不如分享出去，没准还可以帮助到
LeetCode剑指offer题目记录3 t.y.Tang LeetCode记录学语言 c++leetcode 哈希算法
leetcode刷题开始啦,每天记录几道题.目录剑指offer05.替换空格题目描述思路pythonC++剑指offer06.从尾到头打印链表题目描述思路1python思路2pythonC++剑指offer05.替换空格题目描述让我们实现一个函数,把字符串s中的每个空格替换为%20.思路这个题目我只能想到遍历,在空间控制上应该有原地修改的办法会省一些.python如果用python,那直接用spl
RK3588开发笔记-DDR4降频实战与系统稳定性优化 flypig哗啦啦 RK3588 DDR
目录前言一、DDR变频原理与工具准备1.1DDR变频机制1.2工具链配置二、DDR降频操作步骤2.1找到RK3588DDR默认bin文件2.2修改DDRbin文件频率三、进阶优化与调试3.1温控策略调整3.2电源设计优化四、常见问题与解决方案总结前言RK3588作为瑞芯微旗舰级SoC，其DDR4/LPDDR4X内存接口最高支持2112MHz频率，但在实际开发中，高频可能导致系统不稳定或功耗过高。例
Python 中的 Iterable、Iterator 与生成器 CavenWang python python 开发语言
Python中的Iterable、Iterator与生成器Iterable（可迭代对象）Iterator（迭代器）生成器（Generator）Iterable、Iterator与生成器的关系实际应用生成器的高级用法（send()）总结在Python中，Iterable、Iterator和生成器是三个密切相关的概念，它们都与迭代操作有关，但各自扮演不同的角色。本文将深入探讨它们的定义、区别以及实际应
先验地图--slam学习笔记超级璐璐人工智能机器学习
先验信息(PriorInformation)先验信息指的是在收集新数据之前已有的知识或假设。这种信息可以来自之前的实验、历史数据、理论模型或专家意见。地图信息：在无人驾驶中，车辆通常会预先加载高精度地图数据，这些地图数据提供了道路布局、车道线位置、交叉口结构等信息。这些信息就是先验信息。车辆动力学模型：车辆的动力学模型，包括车辆的物理特性（如质量、轮胎摩擦系数等），这些模型可以帮助预测车辆的行为。
零基础入门机器学习：用Scikit-learn实现鸢尾花分类藍海琴泉机器学习 scikit-learn 分类
适合人群：机器学习新手|数据分析爱好者|需快速展示案例的学生一、引言：为什么要学这个案例？目的：明确机器学习解决什么问题，建立学习信心。机器学习定义：让计算机从数据中自动学习规律（如分类鸢尾花品种）。为什么选鸢尾花数据集：数据量小、特征明确，适合教学演示。Scikit-learn优势：提供现成算法和工具，无需从头写数学公式。二、环境准备：5分钟快速上手目的：搭建可运行的代码环境，避免卡在工具安装环
计算机网络笔记(四)——1.4计算机网络在我国的发展 xiao--xin 计算机网络计算机网络笔记面试学习
一、早期探索与奠基（1980-1994年）国际联网的起点1986年：中国启动首个国际联网项目“中国学术网（CANET）”，由北京计算机应用技术研究所与德国卡尔斯鲁厄大学合作，目标是实现电子邮件通信。1987年9月20日：中国发出第一封电子邮件《越过长城，走向世界》，标志着中国首次接入国际互联网。科研网络的突破1989年：中关村地区教育与科研示范网络（NCFC）立项，由中国科学院、北京大学、清华大学
Python Lambda 函数详解 2201_75491841 python 开发语言 lambda函数
一、引言在Python编程中，我们经常会遇到一些简单的函数，这些函数可能只在某个特定的地方使用一次，而且逻辑非常简单。如果为了这些简单的功能定义一个常规的函数，不仅会增加代码的冗余，还会使代码结构变得不够简洁。这时，lambda函数就派上用场了。lambda函数也被称为匿名函数，它为我们提供了一种简洁的方式来定义小型的、一次性使用的函数。在本文中，我们将深入探讨Python中的lambda函数，包
机器学习--DBSCAN聚类算法详解 2201_75491841 机器学习算法聚类人工智能
目录引言1.什么是DBSCAN聚类？2.DBSCAN聚类算法的原理3.DBSCAN算法的核心概念3.1邻域（Neighborhood）3.2核心点（CorePoint）3.3直接密度可达（DirectlyDensity-Reachable）3.4密度可达（Density-Reachable）3.5密度相连（Density-Connected）4.DBSCAN算法的步骤5.DBSCAN算法的优缺点5
小白学AI量化：DeepSeek+Python构建强大的金融数据挖掘与多维分析机器人老余捞鱼 AI顾投高级策略 AI探讨与学习人工智能 python 金融 deepseek
作者：老余捞鱼原创不易，转载请标明出处及原作者。写在前面的话：在机构主导的量化交易时代，普通投资者如何用一杯奶茶的钱（15元/天）打造专业级智能量化产品？本文将为您揭秘一个革命性的解决方案——基于国产大模型DeepSeek和Python构建的智能数据挖掘分析机器人。它不仅适用于通用网页数据抓取，更能深度应用于金融领域，精准捕捉市场信号。本文“干货”很多，请务必耐心读完。一、颠覆认知的性价比革命1.
软考中级软件设计师考点知识点笔记总结 day06 莫问alicia 软考中级软件设计师笔记数据结构算法
文章目录6、树和二叉树6.1、树的基本概念6.2、二叉树的基本概念6.3、二叉树的遍历6.4、查找二叉树（二叉排序树）BST6.5、构造霍夫曼树+6.6、线索二叉树6.7、平衡二叉树7、图7.1、存储结构-邻接矩阵7.2、存储结构-邻接表7.3、图的遍历7.4、拓扑排序7.5、最小生成树普利姆算法7.6、克鲁斯卡尔算法6、树和二叉树6.1、树的基本概念结点的度：一个结点的度是指该结点拥有的子树数量
【机器学习】机器学习工程实战-第3章数据收集和准备腊肉芥末果机器学习工程实战机器学习人工智能
上一章：第2章项目开始前文章目录3.1关于数据的问题3.1.1数据是否可获得3.1.2数据是否相当大3.1.3数据是否可用3.1.4数据是否可理解3.1.5数据是否可靠3.2数据的常见问题3.2.1高成本3.2.2质量差3.2.3噪声（noise）3.2.4偏差（bias）3.2.5预测能力低（lowpredictivepower）3.2.6过时的样本3.2.7离群值3.2.8数据泄露/目标泄漏3
python processpoolexecutor_Python多进程解决方案multiprocessing ProcessPoolExecutor weixin_39599046 python
大多数编程语言都会有多线程和多进程的概念，至于线程和进程的概念，大家可以百度一下。作为一门胶水语言，Python毫不意外，也可以利用多线程和多进程处理并发问题，但是多线程由于GIL的存在，起作用范围大打折扣，仅限于在IO等场景可以发挥点作用。所以，今天要跟大家分享的是Python多进程方案，更好地利用系统多核，从而提升性能。基础方案一：利用Process新建一个子进程，在子进程执行任务。我们写一个
python processpoolexecutor_Python线程和进程池并行编程三千香蕉三千 python
Python3.2版本之后发布了concurrent.futures模块，用以支持和管理并发编程，内容涵盖了进程和线程池(ThreadandProcessPooling)、非确定性执行流(NondeterministicExecutionFlows)以及进程和线程同步。本文通过将带有可选参数的任务提交(Submit)给执行器(Executor)来实例化futures对象。执行器是线程或者进程执行池
python 底层原理processpoolexecutor_Python 并发编程：PoolExecutor 篇风投小虾 python
个人笔记，如有疏漏，还请指正。使用多线程(threading)和多进程(multiprocessing)完成常规的并发需求，在启动的时候start、join等步骤不能省，复杂的需要还要用1-2个队列。随着需求越来越复杂，如果没有良好的设计和抽象这部分的功能层次，代码量越多调试的难度就越大。对于需要并发执行、但是对实时性要求不高的任务，我们可以使用concurrent.futures包中的PoolE
机器学习实战第一章机器学习基础 LuoY、 Machine Learning 机器学习算法人工智能
第一章机器学习1.1何谓机器学习1.2关键术语1.3机器学习的主要任务1.4如何选择合适的算法1.5开发机器学习应用程序的步骤1.6Python语言的优势1.1何谓机器学习 1、简单地说，机器学习就是把无序的数据转换成有用的信息； 2、机器学习能让我们自数据集中受启发，我们会利用计算机来彰显数据背后的真实含义； 3、机器学习横跨计算机科学、工程技术和统计学等多个学科，需要多学科的
数据挖掘实战-基于机器学习的垃圾邮件检测模型艾派森数据挖掘实战合集数据挖掘机器学习人工智能 python
‍♂️个人主页：@艾派森的个人主页✍作者简介：Python学习者希望大家多多支持，我们一起进步！如果文章对你有帮助的话，欢迎评论点赞收藏加关注+目录1.项目背景2.数据集介绍
conda篇----在已有conda环境的基础上升级python包心惠天意 conda python jvm
conda篇----在已有conda环境的基础上升级python包原先的python版本第一步：condaupdate--all(py11)[xxx@aivrs01xxx]$condaupdate--allCollectingpackagemetadata(current_repodata.json):doneSolvingenvironment:done==>WARNING:Anewervers
环境配置（1）：笔记本window、虚拟机ubuntu、开发板三者互ping通信，并且虚拟机ubuntu和开发板能上网 lishing6 ubuntu linux mcu 嵌入式硬件 arm开发物联网硬件工程
1.配置网络我们配置网络是为了方便后续调试开发板系统或者应用程序时，能够使用tftp协议nfs协议等拷贝文件，以及设置文件系统启动方式为nfs挂载启动。2.设置Ubuntu使用NAT网络NAT是什么意思？NetworkAddressTranslation，网络地址转换。举个例子，在NAT里，Windows就是一个爱护孩子的父亲，Ubuntu就是受保护的小孩。小孩要买东西，都由他父亲代劳，别人根本不
systemd-networkd 的 *.network 配置文件详解笔记250323 kfepiza 网络通讯传输协议物联 #控制台命令行 Shell脚本 sh cmd 等 #Linux CentOS Ubuntu 等笔记 tcp/ip 网络 linux
systemd-networkd的*.network配置文件详解笔记250323查看官方文档可以用mansystemd.network命令,或访问:https://www.freedesktop.org/software/systemd/man/latest/systemd.network.html名称systemd.network—网络配置概要network.network描述一个纯INI风格的
systemctl restart 和 systemctl reload 和 systemctl daemon-reload 对比笔记250322 kfepiza #Linux CentOS Ubuntu 等 #控制台命令行 Shell脚本 sh cmd 等笔记 bash
systemctlrestart和systemctlreload和systemctldaemon-reload对比以下是systemctlrestart、systemctlreload和systemctldaemon-reload的对比总结：命令作用对象行为适用场景对服务的影响systemctlrestart服务名具体服务强制停止服务，再重新启动。配置或代码有重大变更，或服务出现异常需完全重启。服
集成学习（随机森林） herry57 数学建模大数据随机森林集成学习
目录一、集成学习概念二、Bagging集成原理三、随机森林四、例子（商品分类）一、集成学习概念集成学习通过建⽴⼏个模型来解决单⼀预测问题。它的⼯作原理是⽣成多个分类器/模型，各⾃独⽴地学习和作出预测。这些预测最后结合成组合预测，因此优于任何⼀个单分类的做出预测。只要单分类器的表现不太差，集成学习的结果总是要好于单分类器的二、Bagging集成原理分类圆形和长方形三、随机森林在机器学习中，随机森林是
conda：一个当下最流行的Python虚拟环境工具 Wang_AI
点击上方“AI派”，选择“设为星标”最新分享，第一时间送达！作者：LeonWang，现为中科院特别研究助理(博士后)，在AI、数据科学和科学计算等方面相关的工程实践上积累了丰富的经验。编辑：王老湿前面的文章中，为大家介绍过Python下的虚拟环境和包管理。在实际中，更为流行的是用Conda来管理Python环境。今天这篇文章就为大家介绍这方面的相关内容。Conda环境Conda简介Conda是目前
【机器学习】朴素贝叶斯入门：从零到垃圾邮件过滤实战吴师兄大模型 0基础实现机器学习入门到精通机器学习人工智能朴素贝叶斯深度学习 pytorch sklearn 开发语言
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
轻松上手：Matplotlib的基本用法全知道大数据方向陪跑私教 python
《轻松上手：Matplotlib的基本用法全知道》嗨，小伙伴们！之前咱们了解了好多厉害的Python包，今天咱们来好好讲讲Matplotlib这个在数据可视化方面超棒的包。**Matplotlib到底该怎么用呢？**这就像是探索一个新的游乐场，每个功能都是一样好玩的项目。一、安装Matplotlib在开始使用Matplotlib之前，得先把它安装好。如果你已经安装了Python的包管理工具pip，
安装数据库首次应用 Array_06 java oracle sql
可是为什么再一次失败之后就变成直接跳过那个要求 enter full pathname of java.exe的界面这个java.exe是你的Oracle 11g安装目录中例如：【F:\app\chen\product\11.2.0\dbhome_1\jdk\jre\bin】下的java.exe 。不是你的电脑安装的java jdk下的java.exe！注意第一次，使用SQL D
Weblogic Server Console密码修改和遗忘解决方法 bijian1013 Welogic
在工作中一同事将Weblogic的console的密码忘记了，通过网上查询资料解决，实践整理了一下。一.修改Console密码打开weblogic控制台，安全领域 --> myrealm -->&n
IllegalStateException: Cannot forward a response that is already committed Cwind java Servlets
对于初学者来说，一个常见的误解是：当调用 forward() 或者 sendRedirect() 时控制流将会自动跳出原函数。标题所示错误通常是基于此误解而引起的。示例代码： protected void doPost() { if (someCondition) { sendRedirect(); } forward(); // Thi
基于流的装饰设计模式木zi_鸣设计模式
当想要对已有类的对象进行功能增强时，可以定义一个类，将已有对象传入，基于已有的功能，并提供加强功能。自定义的类成为装饰类模仿BufferedReader，对Reader进行包装，体现装饰设计模式装饰类通常会通过构造方法接受被装饰的对象，并基于被装饰的对象功能，提供更强的功能。装饰模式比继承灵活，避免继承臃肿，降低了类与类之间的关系装饰类因为增强已有对象，具备的功能该
Linux中的uniq命令被触发 linux
Linux命令uniq的作用是过滤重复部分显示文件内容，这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个及以后更多个重复行将被删去，行比较是根据所用字符集的排序序列进行的。该命令加工后的结果写到输出文件中。输入文件和输出文件必须不同。如果输入文件用“- ”表示，则从标准输入读取。 AD： uniq [选项] 文件说明：这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个
正则表达式Pattern 肆无忌惮_ Pattern
正则表达式是符合一定规则的表达式，用来专门操作字符串，对字符创进行匹配，切割，替换，获取。例如，我们需要对QQ号码格式进行检验规则是长度6~12位不能0开头只能是数字，我们可以一位一位进行比较，利用parseLong进行判断，或者是用正则表达式来匹配[1-9][0-9]{4,14} 或者 [1-9]\d{4,14} &nbs
Oracle高级查询之OVER (PARTITION BY ..) 知了ing oracle sql
一、rank()/dense_rank() over(partition by ...order by ...) 现在客户有这样一个需求，查询每个部门工资最高的雇员的信息，相信有一定oracle应用知识的同学都能写出下面的SQL语句： select e.ename, e.job, e.sal, e.deptno from scott.emp e, (se
Python调试矮蛋蛋 python pdb
原文地址： http://blog.csdn.net/xuyuefei1988/article/details/19399137 1、下面网上收罗的资料初学者应该够用了，但对比IBM的Python 代码调试技巧： IBM：包括 pdb 模块、利用 PyDev 和 Eclipse 集成进行调试、PyCharm 以及 Debug 日志进行调试： http://www.ibm.com/d
webservice传递自定义对象时函数为空，以及boolean不对应的问题 alleni123 webservice
今天在客户端调用方法 NodeStatus status=iservice.getNodeStatus(). 结果NodeStatus的属性都是null。进行debug之后，发现服务器端返回的确实是有值的对象。后来发现原来是因为在客户端，NodeStatus的setter全部被我删除了。本来是因为逻辑上不需要在客户端使用setter，结果改了之后竟然不能获取带属性值的
java如何干掉指针，又如何巧妙的通过引用来操作指针————>说的就是java指针百合不是茶
C语言的强大在于可以直接操作指针的地址，通过改变指针的地址指向来达到更改地址的目的,又是由于c语言的指针过于强大，初学者很难掌握， java的出现解决了c，c++中指针的问题 java将指针封装在底层，开发人员是不能够去操作指针的地址，但是可以通过引用来间接的操作：定义一个指针p来指向a的地址（&是地址符号）：
Eclipse打不开，提示“An error has occurred.See the log file ***/.log” bijian1013 eclipse
打开eclipse工作目录的\.metadata\.log文件，发现如下错误： !ENTRY org.eclipse.osgi 4 0 2012-09-10 09:28:57.139 !MESSAGE Application error !STACK 1 java.lang.NoClassDefFoundError: org/eclipse/core/resources/IContai
spring aop实例annotation方法实现 bijian1013 java spring AOP annotation
在spring aop实例中我们通过配置xml文件来实现AOP，这里学习使用annotation来实现，使用annotation其实就是指明具体的aspect,pointcut和advice。1.申明一个切面(用一个类来实现)在这个切面里,包括了advice和pointcut AdviceMethods.jav
[Velocity一]Velocity语法基础入门 bit1129 velocity
用户和开发人员参考文档 http://velocity.apache.org/engine/releases/velocity-1.7/developer-guide.html 注释 1.行级注释## 2.多行注释#* *# 变量定义使用$开头的字符串是变量定义，例如$var1, $var2, 赋值使用#set为变量赋值，例
【Kafka十一】关于Kafka的副本管理 bit1129 kafka
1. 关于request.required.acks request.required.acks控制者Producer写请求的什么时候可以确认写成功，默认是0， 0表示即不进行确认即返回。 1表示Leader写成功即返回，此时还没有进行写数据同步到其它Follower Partition中 -1表示根据指定的最少Partition确认后才返回，这个在 Th
lua统计nginx内部变量数据 ronin47 lua nginx　统计
server { listen 80; server_name photo.domain.com; location /{set $str $uri; content_by_lua ' local url = ngx.var.uri local res = ngx.location.capture(
java-11.二叉树中节点的最大距离 bylijinnan java
import java.util.ArrayList; import java.util.List; public class MaxLenInBinTree { /* a. 1 / \ 2 3 / \ / \ 4 5 6 7 max=4 pass "root"
Netty源码学习-ReadTimeoutHandler bylijinnan java netty
ReadTimeoutHandler的实现思路：开启一个定时任务，如果在指定时间内没有接收到消息，则抛出ReadTimeoutException 这个异常的捕获，在开发中，交给跟在ReadTimeoutHandler后面的ChannelHandler，例如 private final ChannelHandler timeoutHandler = new ReadTim
jquery验证上传文件样式及大小(好用) cngolon 文件上传 jquery验证
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> <script src="jquery1.8/jquery-1.8.0.
浏览器兼容【转】 cuishikuan css 浏览器 IE
浏览器兼容问题一：不同浏览器的标签默认的外补丁和内补丁不同问题症状：随便写几个标签，不加样式控制的情况下，各自的margin 和padding差异较大。碰到频率:100% 解决方案：CSS里 *{margin:0;padding:0;} 备注：这个是最常见的也是最易解决的一个浏览器兼容性问题，几乎所有的CSS文件开头都会用通配符*来设
Shell特殊变量：Shell $0, $#, $*, $@, $?, $$和命令行参数 daizj shell $#$?特殊变量
前面已经讲到，变量名只能包含数字、字母和下划线，因为某些包含其他字符的变量有特殊含义，这样的变量被称为特殊变量。例如，$ 表示当前Shell进程的ID，即pid，看下面的代码： $echo $$ 运行结果 29949 特殊变量列表变量含义 $0 当前脚本的文件名 $n 传递给脚本或函数的参数。n 是一个数字，表示第几个参数。例如，第一个
程序设计KISS 原则-------KEEP IT SIMPLE, STUPID! dcj3sjt126com unix
翻到一本书，讲到编程一般原则是kiss：Keep It Simple, Stupid.对这个原则深有体会，其实不仅编程如此，而且系统架构也是如此。 KEEP IT SIMPLE, STUPID! 编写只做一件事情，并且要做好的程序；编写可以在一起工作的程序，编写处理文本流的程序，因为这是通用的接口。这就是UNIX哲学.所有的哲学真正的浓缩为一个铁一样的定律，高明的工程师的神圣的“KISS 原
android Activity间List传值 dcj3sjt126com Activity
第一个Activity： import java.util.ArrayList;import java.util.HashMap;import java.util.List;import java.util.Map;import android.app.Activity;import android.content.Intent;import android.os.Bundle;import a
tomcat 设置java虚拟机内存 eksliang tomcat 内存设置
转载请出自出处：http://eksliang.iteye.com/blog/2117772 http://eksliang.iteye.com/ 常见的内存溢出有以下两种: java.lang.OutOfMemoryError: PermGen space java.lang.OutOfMemoryError: Java heap space ------------
Android 数据库事务处理 gqdy365 android
使用SQLiteDatabase的beginTransaction()方法可以开启一个事务，程序执行到endTransaction() 方法时会检查事务的标志是否为成功，如果程序执行到endTransaction()之前调用了setTransactionSuccessful() 方法设置事务的标志为成功则提交事务，如果没有调用setTransactionSuccessful() 方法则回滚事务。事
Java 打开浏览器 hw1287789687 打开网址 open浏览器 open browser 打开url 打开浏览器
使用java 语言如何打开浏览器呢? 我们先研究下在cmd窗口中,如何打开网址使用IE 打开 D:\software\bin>cmd /c start iexplore http://hw1287789687.iteye.com/blog/2153709 使用火狐打开 D:\software\bin>cmd /c start firefox http://hw1287789
ReplaceGoogleCDN：将 Google CDN 替换为国内的 Chrome 插件 justjavac chrome Google google api chrome插件
Chrome Web Store 安装地址： https://chrome.google.com/webstore/detail/replace-google-cdn/kpampjmfiopfpkkepbllemkibefkiice 由于众所周知的原因，只需替换一个域名就可以继续使用Google提供的前端公共库了。同样，通过script标记引用这些资源，让网站访问速度瞬间提速吧
进程VS.线程 m635674608 线程
资料来源： http://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000/001397567993007df355a3394da48f0bf14960f0c78753f000 1、Apache最早就是采用多进程模式 2、IIS服务器默认采用多线程模式 3、多进程优缺点优点：多进程模式最大
Linux下安装MemCached 字符串 memcached
前提准备：1. MemCached目前最新版本为：1.4.22，可以从官网下载到。2. MemCached依赖libevent，因此在安装MemCached之前需要先安装libevent。2.1 运行下面命令，查看系统是否已安装libevent。[root@SecurityCheck ~]# rpm -qa|grep libevent libevent-headers-1.4.13-4.el6.n
java设计模式之--jdk动态代理（实现aop编程） Supanccy2013 java DAO 设计模式 AOP
与静态代理类对照的是动态代理类，动态代理类的字节码在程序运行时由Java反射机制动态生成，无需程序员手工编写它的源代码。动态代理类不仅简化了编程工作，而且提高了软件系统的可扩展性，因为Java 反射机制可以生成任意类型的动态代理类。java.lang.reflect 包中的Proxy类和InvocationHandler 接口提供了生成动态代理类的能力。 &
Spring 4.2新特性-对java8默认方法(default method)定义Bean的支持 wiselyman spring 4
2.1 默认方法(default method) java8引入了一个default medthod; 用来扩展已有的接口,在对已有接口的使用不产生任何影响的情况下,添加扩展使用default关键字 Spring 4.2支持加载在默认方法里声明的bean 2.2 将要被声明成bean的类 public class DemoService {

西北工业大学2021数模校赛B题 - 波士顿房价的预测

西北工业大学2021数模校赛B题 - 波士顿房价的预测

文章目录

一.文章声明：

二.题目简述：

三.使用python机器学习对于问题进行分析：

3.1 数据基本样貌解析：

3.2 数据相关性简介：

3.3 机器学习与建模部分（使用原数据）：

3.4 机器学习与建模部分（数据标准化）：

3.5 模型评价以及数据分析：

3.6 仅对于岭回归中k值较大的4个属性进行单独回归建模：

你可能感兴趣的:(python与机器学习,笔记,数据挖掘,机器学习,python,逻辑回归,数学建模)