我是大学渣

基于回归分析的广告投入销售额预测——K邻近，决策树，随机森林，线性回归，岭回归

文章目录

基于回归分析的广告投入销售额预测——K邻近，决策树，随机森林，线性回归，岭回归
1. 项目背景
2. 项目简介
- 2.1 项目内容
- 2.2 数据说明
- 2.3 技术工具
3.算法原理
- 3.1 K—近邻
- 3.2 决策树
- 3.3随机森林
- 3.4 线性回归
- 3.5 岭回归
4. 分析步骤
- 4.1 理解数据
- 4.2 数据预处理
- - 4.2.1 数据类型转换
  - 4.2.2 缺失值处理
- 4.3 探索性数据分析
- 4.4 销售额预测
- - 4.4.1 建模及模型预测
  - - 4.4.1.1使用线性回归模型：
    - 4.4.1.2 使用岭回归：
    - 4.4.1.3 使用随机森林模型：
    - 4.4.1.4 使用 k邻近模型分析：
    - 4.4.1.5 使用决策树模型分析：
5.实验总结
- 5.1 结果分析
- 5.2 改善建议
- 5.3 实验心得

1. 项目背景

随着人们生活节奏的加快，广告在商品销售中起到的作用越来越大，各个公司都已经十分重视自身产品的广告投入方式，从而将广告的作用发挥到最大，来实现收益的最大化。精准投放广告的作用有以下几个方面。
1、广告是最大、最快、最广泛的信息传递媒介。通过广告，企业或公司能把产品与劳务的特性、功能、用途及供应厂家等信息传递给消费者，沟通产需双方的联系，引起消费者的注意与兴趣，促进购买。
如果出现某些产品在某地积压滞销，而彼地却缺少货源，也可通过广告沟通联系。为了沟通产需之间的联系，现在不仅生产单位和销售单位刊登广告，寻找顾客，而且一些急需某种设备或原材料的单位，也刊登广告，寻找货源。因此，广告的信息传递能迅速沟通供求关系，加速商品流通和销售。
2、广告能激发和诱导消费。消费者对某一产品的需求，往往是一种潜在的需求，这种潜在的需要与现实的购买行动，有时是矛盾的。广告造成的视觉、感觉映象以及诱导往往会勾起消费者的现实购买欲望。有些物美价廉、适销对路的新产品，由于不为消费者所知晓，所以很难打开市场，而一旦进行了广告宣传，消费者就纷纷购买。另外，广告的反复渲染、反复刺激，也会扩大产品的知名度，甚至会引起一定的信任感。也会导致购买量的增加。
3、广告能较好地介绍产品知识、指导消费。通过广告可以全面介绍产品的性能、质量、用途、维修安装等，并且消除他们的疑虑，消除他们由于维修、保养、安装等问题而产生的后顾之忧，从而产生购买欲望。
4、广告能促进新产品、新技术的发展。一新产品、新技术的出现，靠行政手段推广，既麻烦又缓慢，局限性很大，而通过广告，直接与广大的消费者见面，能使新产品、新技术迅速在市场上站稳脚跟，获得成功。
如果我们能分析出广告媒体投入与销售额之间的关系，我们就可以更好地分配广告开支并且使销售额最大化。

2. 项目简介

2.1 项目内容

本项目将分析广告的不同投入方式对销售额的影响，并建立相关模型对不同广告投入方式的销售额进行预测。主要研究以下内容：
不同广告投入方式与销售额之间的关系。
对不同广告投入方式所带来的销售额进行预测。
尝试给出合理化的广告投入建议

2.2 数据说明

实验使用从kaggle获取的不同广告投入方式和销售额的数据。该数据共有4个字段，共202条内容。每条内容包含了不同广告方式的投入额和相应的销售额。

指标名称指标含义
TV 电视广告投放
radio 电台广告投放
newspaper 报纸广告投放
sales 销售额

指标名称	指标含义
TV	电视广告投放
radio	电台广告投放
newspaper	报纸广告投放
sales	销售额

2.3 技术工具

本项目以Pycharm为平台，以Python语言为基础，采用pandas进行数据整理和统计分析，用matplotlib、seaborn进行可视化呈现，采用决策树、随机森林、K—近邻、线性回归四个模型进行客户流失预警。

3.算法原理

3.1 K—近邻

K近邻，是表示最近邻居 k的近邻，表示每一个样本都能以其最接近 k的邻居表示。
1、K-近邻算法(KNN)算法实现简单、高效。在分类、回归、模式识别等方面有着广泛的应用。将 KNN算法应用于求解问题时，应注意样本权重和特征权重两个方面。提出了基于 SVM的特征加权算法(FWKNN, featureweightedKNN)，用 SVM方法确定特征权重。试验表明， FWKNN可以在一定条件下大大提高分类精度。
2、 KNN算法的核心思想是如果样本在特征空间的 k个最相邻的样本中大部分属于某一类，那么该样本也属于这一类，并且具有这类样本的特征。在分类决策中，该方法仅根据样本的一个或少数几个样本的类别确定待分样本所属的类别。kNN方法仅适用于极少数相邻样本的分类决策。在 kNN方法中，由于 kNN方法主要依赖于周围有限的邻域样本，而不是依赖域判别法来确定类别，因此， kNN方法比其他方法更适合于交叉或重叠较多的待分样本集。
总结 KNN算法既可用于分类，也可用于回归。利用样本中 k个近邻，并对样本中邻居属性的平均值进行赋值，从而获得样本的属性属性。对于不同距离的邻居对这些样本的影响，采用不同的权值，这更有用(weight) 1）优点：精度高、对异常值不敏感、无数据输入假定；
缺点：计算复杂度高、空间复杂度高；适用数据范围：数值型和标称型。

3.2 决策树

决策树的概念非常简单。即使不知道它也可以通过简单的图形了解其工作原理，图3-1所示的流程图就是一个决策树，正方形代表判断模块（decision
block），椭圆形代表终止模块（terminating
block），表示已经得出结论，可以终止运行。从判断模块引出的左右箭头称作分支（branch），它可以到达另一个判断模块或者终止模块。图3-1
构造了一个假想的邮件分类系统，
它首先检测发送邮件域名地址。如果地址为myEmployer.com，则将其放在分类“无聊时需要阅读的邮件”中。如果邮件不是来自这个域名，则检查邮件内容里是否包含单词曲棍球，如果包含则将邮件归类到“需要及时处理的朋友邮件”，如果不包含则将邮件归类到“无需阅读的垃圾邮件”。
我们经常使用决策树处理分类问题，近来的调查表明决策树也是最经常使用的数据挖掘算法。它之所以如此流行，一个很重要的原因就是使用者基本上不用了解机器学习算法，也不用深究它是如何工作的。
虽然k-近邻算法可以完成很多分类任务，但是它最大的缺点就是无法给出数据的内在含义，决策树的主要优势就在于数据形式非常容易理解。

3.3随机森林

随机森林是一种包含多个决策树的分类器。随机森林的算法是由Leo Breiman和Adele
Cutler发展推论出的。随机森林，顾名思义就是用随机的方式建立一个森林，森林里面由很多的决策树组成，而这些决策树之间没有关联。随机森林就是用过集成学习的思想将多棵树集成的一种算法，它的基本单元是决策树，而它的本质属于机器学习的一大分支------集成学习（Ensemble
Learning）方法。集成学习就是使用一系列学习器进行学习，并将各个学习方法通过某种特定的规则进行整合，以获得比单个学习器更好的学习效果。集成学习通过建立几个模型，并将它们组合起来来解决单一预测问题。它的工作原理主要是生成多个分类器或者模型，各自独立地学习和作出预测。随机森林是由多棵决策树构成的。对于每棵树，他们使用的训练集是采用放回的方式从总的训练集中采样出来的。而在训练每棵树的结点时，使用的特征是从所有特征中采用按照一定比例随机地无放回的方式抽取的。优点如下：
随机森林可以计算出各例中的亲近度，在数据挖掘、侦测偏离者及将资料视觉化方面有着非常重要的作用。
在大数据集上表现良好。
能够评估在分类问题上的各个特征的重要程度。

3.4 线性回归

假定预测值与样本特征间的函数关系是线性的，回归分析的任务，就在于根据样本X和Y的观察值，去估计函数h，寻求变量之间近似的函数关系。定义：

其中，n = 特征数目；xj = 每个训练样本第j个特征的值，可以认为是特征向量中的第j个值。为了方便，记x0=
1，则多变量线性回归可以记为：(θ、x都表示(n+1，1)维列向量)注意多元和多次是两个不同的概念，“多元”指方程有多个参数，“多次”指的是方程中参数的最高次幂。多元线性方程是假设预测值y与样本所有特征值符合一个多元一次线性方程。

3.5 岭回归

岭回归主要解决回归中的两大问题：排除多重共线性和进行变量的选择。思想是在原先的最小二乘估计中加入一个小扰动，也叫惩罚项，使得原先无法求广义逆的情况下变为可以求广义逆，是的问题稳定并得以求解。岭回归通过对系数向量的长度平方添加处罚来收缩稀疏。当线性回归模型中存在多个相关变量时，它们的系数确定性变差并呈现高方差。比如说，在一个变量上的一个很大的正系数可能被在其相关变量上的类似大小的负系数抵消，岭回归就是通过在系数上施加约束来避免这种现象的发生。此外当特征数p>>样本数量时，矩阵X^TX不可逆，此时不可以直接使用最小二乘法，而岭回归没有这个限制。

4. 分析步骤

4.1 理解数据

在Pycharm中输入下面程序，导入数据和工具包，并查看数据集的信息、大小，并初步观察头部信息。

import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeRegressor  #决策树
from sklearn.linear_model import LinearRegression #线性回归
from sklearn.linear_model import Ridge   #岭回归
from sklearn.ensemble import RandomForestRegressor #随机森林
from sklearn.neighbors import KNeighborsRegressor #K邻近

from sklearn import metrics

plt.rcParams['font.sans-serif'] = ['SimHei']  # 解决中文显示
plt.rcParams['axes.unicode_minus'] = False  # 解决符号无法显示
data = pd.read_csv("azd1.csv")
	# 查看数据集大小
print(data.shape)
	# 设置查看前15条数据
print(data.head(15))

头部信息数据集有4个字段，与上述表 2 1所展示的信息一致，即说明信息加载成功。

4.2 数据预处理

在真实世界中，数据通常是不完整的（缺少某些感兴趣的指标值）、不一致的（包含代码或者名称的差异）、极易受到噪声（错误或异常值）的侵扰的。因为数据库太大，而且数据集经常来自多个异种数据源，低质量的数据将导致低质量的挖掘结果。就像一个大厨现在要做美味的蒸鱼，如果不将鱼进行去鳞等处理，一定做不成我们口中美味的鱼。数据预处理就是解决上述所提到的数据问题的可靠方法，因此，在进行数据分析之前我们需要进行数据预处理。
数据预处理一般要遵循以下规则：
1）完整性：单条数据是否存在空值，统计的字段是否完善。
2）全面性：观察某一列的全部数值，通过常识来判断该列是否有问题，比如：数据定义、单位标识、数据本身。
3）合法性：数据的类型、内容、大小的合法性。比如数据中是否存在非ASCII字符，性别存在了未知，年龄超过了150等。
4）唯一性：数据是否存在重复记录，因为数据通常来自不同渠道的汇总，重复的情况是常见的。行数据、列数据都需要是唯一的。
本项目对数据进行数据类型转换和缺失值处理两种预处理方法，以确保其完整性、全面性与合法性。

4.2.1 数据类型转换

首先，通过Dataframe中的info（）函数查看各数据字段数据类型和缺失值情况


经过观察，发现所有数据类型都为浮点型数据，所以不需要进行数据类型的转换。

4.2.2 缺失值处理

在上述数据类型转换过程中，发现radio和newspaper列存在数值缺失，需要对该缺失数据进行处理。缺失值指的是现有数据集中某个或某些指标的值是不完全的。其一般处理主要有以下方法：
1）删除指标或者删除样本：如果大部分样本该指标都缺失，这个指标能提供的信息有限，可以选择放弃使用该维指标。
2）统计填充：对于缺失值的指标，尤其是数值类型的指标，根据所有样本关于这维指标的统计值对其进行填充，如使用平均数、中位数、众数、最大值、最小值等，具体选择哪种统计值需要具体问具体分析。
3）统一填充：常用的统一填充值有“空”、“0”、“正无穷”、“负无穷”等；
4）预测/模型填充：可以通过预测模型利用不存在缺失值的指标来预测缺失值，如统计、学习等。这种虽然方法复杂，但是最后得到的结果比较好。
本项目通过dropna方法删除该样本的缺失值来进行缺失值处理


结果显示，缺失值处理已经完成，下面可以进行数据可视化分析。

4.3 探索性数据分析

探索性数据分析（Exploratory Data
Analysis，EDA）是对数据进行分析并得出规律的一种数据分析方法，是一种利用各种工具和图形技术（如柱状图、直方图等）分析数据的方法。它是一个开放式的过程，在这个过程中，我们可以绘制图表并计算统计数据以便探索我们的数据。
EDA的目标是确定我们的数据可以告诉我们什么。与目标相关的变量对模型很有用，因为他们是用于预测目标。简单说就是画图来理解数据，EDA探索性数据分析本质上就是用图画图的方式来理解数据。所有代码见附录1。
首先，

通过散点图分析每一种广告投放方式的销售额分布情况：

通过绘制每一个维度特征与销售额的散点图，可以大概看出，各种广告投入与销售额成正比。
然后我们在画出各个投放方式金额的平均数和销售额的条形图来更加直观的证明这个结论。
从下图我们也可以清晰的看出电视这种广告投放方式的平均值最高，这和我们上面得到的散点图基本一致，电视广告投放散点图分布有明显的集中趋势。

但是我们要清楚散点图分布只能看出一个模糊的大概，具体量化的关联性，可以通过关联矩阵和热力图进行展示，首先就是corr()方法输出关系矩阵。

然后可以将输出的数据进行图形可视化，较为常用的就是热力图，直接利用上面的结果进行输出。
绘制热力图的代码如下

def load_data():
	data = pd.read_csv(r'azd1.csv', sep=',')
	# 计算相关系数矩阵
	corr = data.corr()
	print(corr)
	cor = corr
	plt.figure()  # 绘制热力图
	sns.heatmap(cor, vmin=-1, cmap="plasma_r", annot=True)
	plt.savefig("5")
	plt.show()
	# 找出对y相关系数大于0.5的因素
	a = corr['sales']
	a = a[abs(a) > 0.5].sort_values(ascending=False)
	a_colums = np.array(a.index).tolist()
	return data, a_colums

查看关联矩阵和热力图都只需要查看主对角线（左上角到右下角对角线）的一侧即可，由于这里探究的是利润与其它三个影响因素之间的关系，因此只需要看最后一行的数据即可。数值在（0.45，1）或者（-1，-0,45）之间，都可以认为两者具有相关性。比如上面的输出结果，利润和电视投放以及广播投放都是有关联，而与新闻报纸的投放没有关联。

4.4 销售额预测

4.4.1 建模及模型预测

1）导入相应的工具包
2）本项目采用决策树、随机森林、K近邻、线性回归、岭回归四种算法，分别对广告投入进行学习和预测，并根据结果（见图 4 24至图 4 27所示）的均方误差，平均绝对误差，R值进行分析。

4.4.1.1使用线性回归模型：

def model_fit1(data, a_colums):
   # 制作训练集和测试集的数据
   data_01 = data[a_colums]
   Y = np.array(data_01['sales'])
   data_02 = np.array(data_01.drop('sales', axis=1))
   # 分割训练集和测试集
   train_X, test_X, train_Y, test_Y = train_test_split(data_02, Y, test_size=0.2)
   # 加载模型
   linreg = LinearRegression()
   # 拟合数据
   linreg.fit(train_X, train_Y)
   return linreg, test_X, test_Y

4.4.1.2 使用岭回归：

def model_fit2(data,a_colums):
   # 构建数据集 训练模型
   # 制作训练集和测试集的数据
   data_01 = data[a_colums]
   Y = np.array(data_01['sales'])
   data_02 = np.array(data_01.drop('sales', axis=1))
   # 分割训练集和测试集
   train_X, test_X, train_Y, test_Y = train_test_split(data_02, Y, test_size=0.2)
   ridge=Ridge()
   ridge.fit(train_X,train_Y)
   return ridge, test_X, test_Y

4.4.1.3 使用随机森林模型：

def model_fit3(data,a_colums):
   data_01 = data[a_colums]
   Y = np.array(data_01['sales'])
   data_02 = np.array(data_01.drop('sales', axis=1))
   # 分割训练集和测试集
   train_X, test_X, train_Y, test_Y = train_test_split(data_02, Y, test_size=0.2)
   randomForestRegressor=RandomForestRegressor(n_estimators=200, random_state=0)
   randomForestRegressor.fit(train_X,train_Y)
   return  randomForestRegressor, test_X, test_Y

4.4.1.4 使用 k邻近模型分析：

def model_fit4(data,a_colums):
   # 构建数据集 训练模型
   # 制作训练集和测试集的数据
   data_01 = data[a_colums]
   Y = np.array(data_01['sales'])
   data_02 = np.array(data_01.drop('sales', axis=1))
   # 分割训练集和测试集
   train_X, test_X, train_Y, test_Y = train_test_split(data_02, Y, test_size=0.2)
   k=5
   kNeighborsRegressor=KNeighborsRegressor(k)
   kNeighborsRegressor.fit(train_X,train_Y)
   return kNeighborsRegressor, test_X, test_Y

4.4.1.5 使用决策树模型分析：

def model_fit5(data,a_colums):
   data_01 = data[a_colums]
   Y = np.array(data_01['sales'])
   data_02 = np.array(data_01.drop('sales', axis=1))
   # 分割训练集和测试集
   train_X, test_X, train_Y, test_Y = train_test_split(data_02, Y, test_size=0.2)
   decisionTreeRegressor=DecisionTreeRegressor()
   decisionTreeRegressor.fit(train_X,train_Y)
   return decisionTreeRegressor, test_X, test_Y

结果显示，随机森林和决策树模型的R2（拟合优度）较高，均大于百分之九十。
3）接下来画出模型的学习曲线，观察模型的拟合情况。

线性回归模型结果
岭回归模型结果
随机森林模型结果

K邻近模型结果
决策树模型结果

从结果来看，随机森林模型预测的准确性最高，基本与实际曲线拟合，这也更加直观的说明了此数据集用随机森林模型更加准确。

5.实验总结

5.1 结果分析

根据以上分析，可以得到如下结果：
要想增加商品的销售额，我们应该首先考虑增加电视广告和电台广告的投入量，因为商品的销售额与这两种广告投放方式的关系最大
我们要严格控制在报纸上的广告投入量，因为经过我们分析，报纸广告投入这种方式与销售额并没有什么明显关系，换句话说，加大报纸广告投入量并不能提高销售额，所以我们也就没有必要增加报纸的广告投入。

5.2 改善建议

1）现代化企业的广告宣传并不能只着眼于传统宣传方式，随着互联网平台的崛起，在新媒体营销时代背景下，企业产品的销售模式也随之发生改变。当前企业转变生产产品营销可以借助新媒体中的互联网平台来开展，可以此有效的降低企业的销售成本和运输费用，以此实现企业的经济效益增长，为生产企业的健康发展提供保障。
2）企业不能只关心自身广告的效益，最根本的是要提升自身产品的质量，无论是什么广告投放方式，最重要的还是回归到商品本身，如果商品足够优秀，这已经是最好的广告了，我认为广告就是将那些发光发亮的产品或商品推荐给更多人。

5.3 实验心得

其实很早之前我就听说过python这门编程语言，它在各大编程排行网站上位居榜首，我也萌生出来想系统的学习它的想法，可是我总是给自己找借口，一拖再拖，始终没有开始学习。直到知道这学期我的专业课有python后，在选课时我特意选择了与之相关的这节选修课。在寒假时我也自行阅读了python的相关经典书籍和在专业课上的学习，掌握了基本语法和相关库的使用。可是我一直停留在看的阶段，并没有亲自去编写过较大的程序，也没有自己做过数据分析。经过这次项目的实战，我对python这门语言有了更深的理解，同时也了解了大数据分析的基本方法，也有了以下的总结。
1） python中的第三方库非常多，有很多程序不需要我们自己去编写，可以直接使用库里面的相关函数，这也是为什么python应用十分广泛的原因。
2）伴随着大数据、云平台、物联网、人工智能技术的快速发展，大数据分析必然会发挥更大的作用。大数据的意义归根到底就四个字：辅助决策。利用大数据分析，能够分析现状、分析原因、发现规律、总结经验、和预测趋势，这些都可以为辅助决策服务。我们掌握的数据信息越多，我们的决策才能更加科学、精确、合理。从这个方面看，也可以说数据本身不产生价值，大数据必须和其他具体的领域、行业相结合，能够给决策者提供帮助之后，才具有价值。政府或企业都可以借助大数据，提升管理、决策水平，提升经济效益。
3）只有实战才能真正提高自己的编程水平，和对相关知识的理解，单纯的听课和看书只能增加理论知识，编程需要实战，不然只会眼高手低，看着很简单的问题自己就是解决不了。
4）课程虽然结束了，但是我不能停止学习，在后期的学习中，我应该注重自己在语言的应用上层面上，不能只会纸上谈兵，在编程的过程中难买会遇到问题，保持独立思考的习惯，查询相关资料去解决，而不能就此放弃。

✨ 原创不易，还希望各位大佬支持一下
点赞，你的认可是我创作的动力！
⭐️ 收藏，你的青睐是我努力的方向！
✏️ 评论，你的意见是我进步的财富！

python 打包太大精简_pyinstaller打包结果瘦身 TIME python 打包太大精简
如果想把python程序发布成.exe的话，一般我们都会使用pyinstaller，怎么打包这里我就不说了。有时我们打包的结果会非常大，我最大的一次居然有900M......下面我就总结一下可以对发布结果瘦身的方法。注意：下面的方法只对打包成多个文件夹(pyinstaller-D)的情况有效;对打包成一个.exe文件(pyinstaller-F)的情况无效。使用from...import...进行
Python3.8 特性介绍刷漆猫咪
简介海象表达式:=仅位置参数/f-strings说明符=启动异步REPLunittest支持异步简介Python3.8已经发布了,官方文档看这里What’sNewInPython3.8.介绍一些Python3.8中的新特性.海象表达式:=新的语法:=将给变量赋值,这个变量是更大的表达式的一部分.if(n:=len(a))>10:print(f"Lististoolong({n}elements,e
使用pyinstaller配合nuitka打包，发布python程序孟德尔单杀豌豆射手 python
引言软件版本：pyinstaller6.3.0,nuitka2.0.3,win7及win11均已测试通过。使用本文打包方法打包完成后使用pyinstxtractor.py解包，源码均已加密。众所周知，python程序目前有两种常用的打包方式，pyinstaller及nuitka，根据我的经验总结，各自的优缺点如下：pyinstaller：打包速度很快，成功率很高，但是运行速度比nuitka打包的程
基于nodejs+vue的美妆彩妆网站的设计与实现(源码+LW+调试文档+讲解等) 程序员gelei nodejs毕业设计项目 vue.js 前端 javascript
目录：博主介绍：完整视频演示：系统技术介绍：后端Java介绍前端框架Vue介绍具体功能截图：部分代码参考：Mysql表设计参考：项目测试：项目论文：为什么选择我：源码获取：博主介绍：博主：程序员gelei：全网拥有20W+粉丝、CSDN作者、博客专家、全栈领域优质创作者、平台优质Java创作者、专注于Java、小程序、python、安卓技术领域和毕业项目实战✌Java精品实战案例《1000套》20
虚拟环境的创建和修改，删除撩本子高手 python pip conda
电脑有关环境的配置电脑版本为window10python==3.9.0Pip安装requirement.txt里面的第三方库pip安装requirement.txt的文件里面的第三方库，格式大概为如图所示。pipinstall-rrequirement.txtpip的虚拟环境的创建（使用方法为python3.x自带的venv）创建虚拟环境python-mvenvven_test#这里的话我是运用了
python中读取文件报错_python中读取json文件报错，TypeError：the Json object must be str, bytes or bytearray，not ‘TextI... weixin_39783915 python中读取文件报错
利用python中的json读取json文件时，因为错误使用了相应的方法导致报错：TypeError：theJsonobjectmustbestr,bytesorbytearray，not‘TextIOWrapper’。解决方法：首先要弄明白json有四个方法：dumps和loads、dump和load。其中，dumps和loads是在内存中转换(python对象和json字符串之间的转换)，而d
python有趣游戏代码大全 uolo_python 游戏
一.贪吃蛇运行以下代码，将会弹出一个窗口显示贪吃蛇游戏。你可以使用箭头键控制贪吃蛇的移动。吃到食物后蛇的长度会增加，如果蛇触碰到边界或者自己则游戏结束。按下Q键退出游戏，按下C键重新开始游戏。importpygameimportrandom#初始化pygame.init()#设置游戏窗口window_width,window_height=640,480window=pygame.display.
python 问题 ‘list‘ object cannot be interpreted as an integer 和‘int‘ object is not iterable annekqiu python
访问同一个excel表格（含有多个sheet）importnumpyasnpimportpandasaspdimportxlrd#读取excel的库importxlwt#写excel的库data=xlrd.open_workbook('./161005.xlsx')#打开excel文件读取数据table=data.sheets()[0]#读取sheet1h=table.ncols#获得列表数目a1
248、Python开发秘籍：技术选型与架构设计技巧解析多多的编程笔记 python 开发语言
Python开发：掌握如何处理技术债务和遗留系统作为软件开发者，我们经常会遇到两种问题：技术债务和遗留系统。技术债务是指在软件开发过程中，为了尽快完成项目而采用的短期解决方案，这会导致代码质量下降，维护成本增加。而遗留系统则是指那些已经存在很长时间，但不再适应现代技术需求的系统。在这篇文章中，我们将介绍如何使用Python来处理这两种问题。理解技术债务技术债务可以理解为一种“借债”。想象一下，你正
Python+Django毕业设计校园易购二手交易平台（程序+LW+部署） Python、JAVA毕设程序源码课程设计 java mysql
项目运行环境配置：Jdk1.8+Tomcat7.0+Mysql+HBuilderX（Webstorm也行）+Eclispe（IntelliJIDEA,Eclispe,MyEclispe,Sts都支持）。项目技术：SSM+mybatis+Maven+Vue等等组成，B/S模式+Maven管理等等。环境需要1.运行环境：最好是javajdk1.8，我们在这个平台上运行的。其他版本理论上也可以。2.ID
【已解决】ModuleNotFoundError: No module named ‘numpy’ 二川bro bug集合优化 python numpy
【已解决】ModuleNotFoundError:Nomodulenamed‘numpy’在Python编程中，遇到“ModuleNotFoundError:Nomodulenamed‘numpy’”这样的错误提示并不罕见。这个错误意味着Python解释器无法在你的环境中找到名为numpy的模块。numpy是Python中一个非常重要的库，广泛用于科学计算。本文将深入探讨此错误的根源、解决思路、具
Biopython提取和分离复合体PDB文件中所有链的结构信息 qq_27390023 生物信息学 python
从蛋白质复合体的PDB文件中提取每个链的结构信息，并保存成单独的pdb文件。示例代码fromBioimportPDBdefextract_chain_sequences(pdb_file,output_dir):"""从PDB文件中提取所有链的序列，并保存为独立的PDB文件。:parampdb_file:蛋白质复合体PDB文件路径:paramoutput_dir:输出目录，用于保存各链的PDB文件
ubuntu16 jsoncpp1.9编译及使用 noscallion ubuntu json c++
文章目录前言1.下载jsoncpp2.解压并安装3.编译4.使用（1）创建项目文件夹，编写main.cpp文件。如下：（2）新建一个config.json的json文件：（3）创建CMakeLists.txt文件，内容如下：（4）新建build文件夹后记前言网上现有教程存在各种问题，比如jsoncpp是很老的版本。直接运行高版本安装包中提供的python脚本，在使用时会导致链接库等问题。使用CMa
12312312 二进制掌控者 c++
c语言中的小小白-CSDN博客c语言中的小小白关注算法,c++,c语言,贪心算法,链表,mysql,动态规划,后端,线性回归,数据结构,排序算法领域.https://blog.csdn.net/bhbcdxb123?spm=1001.2014.3001.5343给大家分享一句我很喜欢我话：知不足而奋进，望远山而前行！！！铁铁们，成功的路上必然是孤独且艰难的，但是我们不可以放弃，远山就在前方，但我们
你知道什么是回调函数吗？二进制掌控者 #C语言专栏 c语言开发语言
c语言中的小小白-CSDN博客c语言中的小小白关注算法,c++,c语言,贪心算法,链表,mysql,动态规划,后端,线性回归,数据结构,排序算法领域.https://blog.csdn.net/bhbcdxb123?spm=1001.2014.3001.5343给大家分享一句我很喜欢我话：知不足而奋进，望远山而前行！！！铁铁们，成功的路上必然是孤独且艰难的，但是我们不可以放弃，远山就在前方，但我们
【Python】写入Pandas DataFrame到CSV文件 civilpy python pandas 开发语言
基本原理Pandas是一个强大的Python数据分析库，它提供了许多用于数据处理和分析的功能。在处理数据时，我们经常需要将数据保存到文件中，以便后续使用或分享。CSV（Comma-SeparatedValues，逗号分隔值）文件是一种常见的数据交换格式，它以纯文本形式存储表格数据，每行表示一个数据记录，列之间用逗号分隔。DataFrame是Pandas中用于存储表格数据的主要数据结构。它类似于Ex
python数据类型乐乐ovo python python
Python数据类型内置数据类型在编程中，数据类型是一个重要的概念。变量可以存储不同类型的数据，并且不同类型可以执行不同的操作。在这些类别中，Python默认拥有以下内置数据类型：文本类型：str数值类型：int,float,complex序列类型：list,tuple,range映射类型：dict集合类型：set,frozenset布尔类型：bool二进制类型：bytes,bytearray,m
python编程一个最简单游戏,python最简单的游戏代码 gpt886 pygame python 开发语言人工智能
大家好，小编为大家解答python编程一个最简单游戏代码的问题。很多人还不知道python编程一个最简单游戏，现在让我们一起来看看吧！前言初识pygame：pie游戏pygame游戏库使得如下功能成为可能：绘制图形、获取用户输入、执行动画以及使用定时器让游戏按照稳定的帧速率运行。使用pygame库；以一定字体打印文本；使用循环来重复动作；绘制圆、矩形、线条和户型；创建pie游戏；【----帮助Py
python毕业设计作品：python闲置物品二手交易平台系统设计与实现毕业设计源代码（Django框架）黄菊华老师毕设资料 python二手交易平台系统
博主介绍：黄菊华老师《Vue.js入门与商城开发实战》《微信小程序商城开发》图书作者，CSDN博客专家，在线教育专家，CSDN钻石讲师；专注大学生毕业设计教育和辅导。所有项目都配有从入门到精通的基础知识视频课程，学习后应对毕业设计答辩。项目配有对应开发文档、开题报告、任务书、PPT、论文模版等项目都录了发布和功能操作演示视频；项目的界面和功能都可以定制，包安装运行！！！如果需要联系我，可以在CSD
使用Python和wxPython创建动态HTML日历生成器 winfredzhang python html xml 带照片和节假日信息的日历
在这个数字化时代,日历仍然是我们日常生活中不可或缺的工具。今天,我们将探讨如何使用Python创建一个动态HTML日历生成器。这个项目不仅实用,还能帮助我们深入理解Python编程、GUI开发和网页生成的相关知识。项目概述我们的目标是创建一个应用程序,允许用户选择特定的年份和月份,然后生成并显示一个美观的HTML日历。这个日历不仅显示日期,还会包含中国的主要节假日信息。C:\pythoncode\
python数组的基本操作迟遇3 python 开发语言
一.创建数组arr:list[int]=[0]*8num1:list[int]=[1,5,9,8,6]二.访问元素1.指定访问（通过索引（下标））defrandom_a(nums:list[int])->int:returnnums[2]print(random_a(arr))2.随机访问(会访问不同的元素)defrandom_access(nums:list[int])->int:"""随机访问
python入门必备10个坑_新手注意！Python最容易掉进去的10个坑邵浩博士 python入门必备10个坑
图片图片相比于其他语言，Python的语法比较简单易学，但一旦不注意细节，刚入门的新手很容易就会掉进语法错误的坑里。1.忘记写冒号在if、elif、else、for、while、class、def语句后面忘记添加“:”ifspam==42print('Hello!')2.误用“=”做等值比较“=”是给变量赋值，“==”才是判断两个值是否相等：score=60ifscore=60:print('pa
Python笔记6----数组 weixin_34293911 python 数据结构与算法 c/c++
1、Python中的数组形式：用list和tuple等数据结构表示数组一维数组：list=[1,2,3,4]二维数组：list=[[1,2,3],[4,5,6],[7,8,9]]用array模块：array模块需要加载，而且运用的较少通过array函数创建数组（数组中的元素可以不是同一种类型），array.array('B',range(5))>>array('B',[1,2,3,4,5])提供a
Python中的“Try...Except...Finally”：掌握异常处理的艺术小鹿( ﹡ˆoˆ﹡ ) Python python 开发语言 Python
在编程的世界里，错误与异常就像是旅途中的迷雾，虽然不可避免，但通过正确的导航工具，我们可以安全地穿越。Python作为一种广泛使用的编程语言，提供了丰富的工具来帮助我们处理这些异常情况，其中之一便是“Try…Except…Finally”结构。本文将带你深入了解这一机制的核心概念、实际应用以及如何利用它来提升代码的健壮性和可维护性，无论你是刚入门的新手还是经验丰富的开发人员，都能从中受益匪浅。引言
Python中的策略模式：解锁编程的灵活之钥小鹿( ﹡ˆoˆ﹡ ) python 观察者模式开发语言 Python
引言在软件开发过程中，我们经常需要根据不同的条件或上下文来改变算法的行为。例如，在电子商务网站中，根据用户所在地区选择合适的支付方式；或者在游戏中，根据玩家等级调整敌人AI的行为。这些场景都需要我们的程序能够动态地切换算法。而这就是策略模式大显身手的地方了！策略模式允许我们将一组算法封装起来，并使它们可以互相替换。这样一来，算法的变化便不会影响到使用它的客户端代码，从而实现了算法的独立性和灵活性。
Python 将parquet文件转换为csv文件一个小坑货 #python常用功能方法 python 开发语言
Python将parquet文件转换为csv文件使用pyarrow插件将parquet文件转换为csv使用pyarrow插件将parquet文件转换为csv```pythonimportosimportpyarrow.parquetaspqfromconcurrent.futuresimportThreadPoolExecutorimportcsvimporttime#定义一个函数来处理单个Par
Python中的os.path.join() 小小小花儿
Python中的os.path.join()用于拼接路径名组件。路径组件之间会自动添加‘\’，也可以自己在组件的末尾加上‘\’。1、如果各路径组件名首字母均不包含‘\’，则函数会自动加上。importosa=os.path.join('save','test','1.jpg')print(a)输出：save\test\1.jpg注意：在windows系统中默认添加的是‘\’；在linux系统中，是
基于Python实现一个庆祝国庆节的小程序 LQS2020 python 小程序 pygame
功能：添加互动功能：允许用户选择不同的祝福语或者查询不同的国庆节信息。动态背景音乐：播放国庆节相关的背景音乐。增加节日小测验：提供一些关于国庆节的趣味小测验，让用户参与。增强图形用户界面(GUI)：使用更多的tkinter控件，比如按钮、复选框等，使界面更加丰富和互动。下面是一个更全面的示例代码，包括以上的改进：完整代码示例importtkinterastkfromtkinterimportPho
如何有效的学习AI大模型？ Python程序员罗宾学习人工智能语言模型自然语言处理架构
学习AI大模型是一个系统性的过程，涉及到多个学科的知识。以下是一些建议，帮助你更有效地学习AI大模型：基础知识储备：数学基础：学习线性代数、概率论、统计学和微积分等，这些是理解机器学习算法的数学基础。编程技能：掌握至少一种编程语言，如Python，因为大多数AI模型都是用Python实现的。理论学习：机器学习基础：了解监督学习、非监督学习、强化学习等基本概念。深度学习：学习神经网络的基本结构，如卷
ros2使用python包，通过launch文件加载yaml文件，无法覆盖默认参数的解决办法 SuJunV python 开发语言 ubuntu
首先确保已经创建config、launch文件夹，文件夹下有对应的文件，创建的节点能够通过launch文件正常启动。解决办法：在setup.py文件中，仿照添加launch文件步骤，添加config文件夹#addlaunchfile(os.path.join('share',package_name),glob('launch/*launch.[pxy][yma]*')),#addconfigfi
统一思想认识永夜-极光思想
1.统一思想认识的基础,才能有的放矢原因: 总有一种描述事物的方式最贴近本质,最容易让人理解. 如何让教育更轻松,在于找到最适合学生的方式. 难点在于,如何模拟对方的思维基础选择合适的方式. &
Joda Time使用笔记 bylijinnan java joda time
Joda Time的介绍可以参考这篇文章： http://www.ibm.com/developerworks/cn/java/j-jodatime.html 工作中也常常用到Joda Time，为了避免每次使用都查API，记录一下常用的用法： /** * DateTime变化（增减） */ @Tes
FileUtils API eksliang FileUtils FileUtils API
转载请出自出处：http://eksliang.iteye.com/blog/2217374 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
各种新兴技术不懂事的小屁孩技术
1:gradle Gradle 是以 Groovy 语言为基础，面向Java应用为主。基于DSL（领域特定语言）语法的自动化构建工具。现在构建系统常用到maven工具，现在有更容易上手的gradle，搭建java环境: http://www.ibm.com/developerworks/cn/opensource/os-cn-gradle/ 搭建android环境： http://m
tomcat6的https双向认证酷的飞上天空 tomcat6
1.生成服务器端证书 keytool -genkey -keyalg RSA -dname "cn=localhost,ou=sango,o=none,l=china,st=beijing,c=cn" -alias server -keypass password -keystore server.jks -storepass password -validity 36
托管虚拟桌面市场势不可挡蓝儿唯美
用户还需要冗余的数据中心，dinCloud的高级副总裁兼首席营销官Ali Din指出。该公司转售一个MSP可以让用户登录并管理和提供服务的用于DaaS的云自动化控制台，提供服务或者MSP也可以自己来控制。在某些情况下，MSP会在dinCloud的云服务上进行服务分层，如监控和补丁管理。 MSP的利润空间将根据其参与的程度而有所不同，Din说。 “我们有一些合作伙伴负责将我们推荐给客户作为个
spring学习——xml文件的配置 a-john spring
在Spring的学习中，对于其xml文件的配置是必不可少的。在Spring的多种装配Bean的方式中，采用XML配置也是最常见的。以下是一个简单的XML配置文件： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.or
HDU 4342 History repeat itself 模拟 aijuans 模拟
来源：http://acm.hdu.edu.cn/showproblem.php?pid=4342 题意：首先让求第几个非平方数，然后求从1到该数之间的每个sqrt(i)的下取整的和。思路：一个简单的模拟题目，但是由于数据范围大，需要用__int64。我们可以首先把平方数筛选出来，假如让求第n个非平方数的话，看n前面有多少个平方数，假设有x个，则第n个非平方数就是n+x。注意两种特殊情况，即
java中最常用jar包的用途 asia007 java
java中最常用jar包的用途 jar包用途axis.jarSOAP引擎包commons-discovery-0.2.jar用来发现、查找和实现可插入式接口，提供一些一般类实例化、单件的生命周期管理的常用方法.jaxrpc.jarAxis运行所需要的组件包saaj.jar创建到端点的点到点连接的方法、创建并处理SOAP消息和附件的方法，以及接收和处理SOAP错误的方法. w
ajax获取Struts框架中的json编码异常和Struts中的主控制器异常的解决办法百合不是茶 js json编码返回异常
一:ajax获取自定义Struts框架中的json编码出现以下问题: 1,强制flush输出 json编码打印在首页 2, 不强制flush js会解析json 打印出来的是错误的jsp页面却没有跳转到错误页面 3, ajax中的dataType的json 改为text 会
JUnit使用的设计模式 bijian1013 java 设计模式 JUnit
JUnit源代码涉及使用了大量设计模式 1、模板方法模式（Template Method）定义一个操作中的算法骨架，而将一些步骤延伸到子类中去，使得子类可以不改变一个算法的结构，即可重新定义该算法的某些特定步骤。这里需要复用的是算法的结构，也就是步骤，而步骤的实现可以在子类中完成。
Linux常用命令（摘录） sunjing crond chkconfig
chkconfig --list 查看linux所有服务 chkconfig --add servicename 添加linux服务 netstat -apn | grep 8080 查看端口占用 env 查看所有环境变量 echo $JAVA_HOME 查看JAVA_HOME环境变量安装编译器 yum install -y gcc
【Hadoop一】Hadoop伪集群环境搭建 bit1129 hadoop
结合网上多份文档，不断反复的修正hadoop启动和运行过程中出现的问题，终于把Hadoop2.5.2伪分布式安装起来，跑通了wordcount例子。Hadoop的安装复杂性的体现之一是，Hadoop的安装文档非常多，但是能一个文档走下来的少之又少，尤其是Hadoop不同版本的配置差异非常的大。Hadoop2.5.2于前两天发布，但是它的配置跟2.5.0，2.5.1没有分别。 &nb
Anychart图表系列五之事件监听白糖_ chart
创建图表事件监听非常简单：首先是通过addEventListener('监听类型',js监听方法)添加事件监听，然后在js监听方法中定义具体监听逻辑。以钻取操作为例，当用户点击图表某一个point的时候弹出point的name和value，代码如下： <script> //创建AnyChart var chart = new AnyChart(); //添加钻取操作&quo
Web前端相关段子 braveCS web前端
Web标准：结构、样式和行为分离使用语义化标签 0）标签的语义：使用有良好语义的标签，能够很好地实现自我解释，方便搜索引擎理解网页结构，抓取重要内容。去样式后也会根据浏览器的默认样式很好的组织网页内容，具有很好的可读性，从而实现对特殊终端的兼容。 1）div和span是没有语义的：只是分别用作块级元素和行内元素的区域分隔符。当页面内标签无法满足设计需求时，才会适当添加div
编程之美-24点游戏 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Arrays; import java.util.HashSet; import java.util.List; import java.util.Random; import java.util.Set; public class PointGame { /**编程之美
主页面子页面传值总结 chengxuyuancsdn 总结
1、showModalDialog returnValue是javascript中html的window对象的属性,目的是返回窗口值,当用window.showModalDialog函数打开一个IE的模式窗口时,用于返回窗口的值主界面 var sonValue=window.showModalDialog("son.jsp"); 子界面 window.retu
[网络与经济]互联网+的含义 comsci 互联网+
互联网+后面是一个人的名字 = 网络控制系统互联网+你的名字 = 网络个人数据库每日提示:如果人觉得不舒服,千万不要外出到处走动,就呆在床上,玩玩手游,更不能够去开车,现在交通状况不
oracle 创建视图 with check option daizj 视图 view oralce
我们来看下面的例子： create or replace view testview as select empno,ename from emp where ename like ‘M%’ with check option; 这里我们创建了一个视图，并使用了with check option来限制了视图。然后我们来看一下视图包含的结果： select * from testv
ToastPlugin插件在cordova3.3下使用 dibov Cordova
自己开发的Todos应用，想实现“ 再按一次返回键退出程序 ”的功能，采用网上的ToastPlugins插件，发现代码或文章基本都是老版本，运行问题比较多。折腾了好久才弄好。下面吧基于cordova3.3下的ToastPlugins相关代码共享。 ToastPlugin.java package&nbs
C语言22个系统函数 dcj3sjt126com c function
C语言系统函数一、数学函数下列函数存放在math.h头文件中Double floor(double num) 求出不大于num的最大数。Double fmod(x, y) 求整数x/y的余数。Double frexp(num, exp); double num; int *exp; 将num分为数字部分（尾数）x和以2位的指数部分n，即num=x*2n，指数n存放在exp指向的变量中，返回x。D
开发一个类的流程 dcj3sjt126com 开发
本人近日根据自己的开发经验总结了一个类的开发流程。这个流程适用于单独开发的构件，并不适用于对一个项目中的系统对象开发。开发出的类可以存入私人类库，供以后复用。以下是开发流程： 1. 明确类的功能，抽象出类的大概结构 2. 初步设想类的接口 3. 类名设计（驼峰式命名） 4. 属性设置(权限设置) 判断某些变量是否有必要作为成员属
java 并发 shuizhaosi888 java 并发
能够写出高伸缩性的并发是一门艺术在JAVA SE5中新增了3个包 java.util.concurrent java.util.concurrent.atomic java.util.concurrent.locks 在java的内存模型中，类的实例字段、静态字段和构成数组的对象元素都会被多个线程所共享，局部变量与方法参数都是线程私有的，不会被共享。
Spring Security（11）——匿名认证 234390216 Spring Security ROLE_ANNOYMOUS 匿名
匿名认证目录 1.1 配置 1.2 AuthenticationTrustResolver 对于匿名访问的用户，Spring Security支持为其建立一个匿名的AnonymousAuthenticat
NODEJS项目实践0.2[ express,ajax通信...] 逐行分析JS源代码 Ajax nodejs express
一、前言通过上节学习，我们已经 ubuntu系统搭建了一个可以访问的nodejs系统，并做了nginx转发。本节原要做web端服务及 mongodb的存取，但写着写着，web端就
在Struts2 的Action中怎样获取表单提交上来的多个checkbox的值 lhbthanks java html struts checkbox
第一种方法：获取结果String类型在 Action 中获得的是一个 String 型数据，每一个被选中的 checkbox 的 value 被拼接在一起，每个值之间以逗号隔开(,)。所以在 Action 中定义一个跟 checkbox 的 name 同名的属性来接收这些被选中的 checkbox 的 value 即可。以下是实现的代码：前台 HTML 代码：
003.Kafka基本概念 nweiren hadoop kafka
Kafka基本概念：Topic、Partition、Message、Producer、Broker、Consumer。 Topic：消息源（Message）的分类。 Partition： Topic物理上的分组，一
Linux环境下安装JDK roadrunners jdk linux
1、准备工作创建JDK的安装目录： mkdir -p /usr/java/ 下载JDK，找到适合自己系统的JDK版本进行下载： http://www.oracle.com/technetwork/java/javase/downloads/index.html 把JDK安装包下载到/usr/java/目录，然后进行解压： tar -zxvf jre-7
Linux忘记root密码的解决思路 tomcat_oracle linux
1：使用同版本的linux启动系统，chroot到忘记密码的根分区passwd改密码　　2：grub启动菜单中加入init=/bin/bash进入系统，不过这时挂载的是只读分区。根据系统的分区情况进一步判断. 　　3: grub启动菜单中加入 single以单用户进入系统. 　　4:用以上方法mount到根分区把/etc/passwd中的root密码去除　　例如: 　　ro
跨浏览器 HTML5 postMessage 方法以及 message 事件模拟实现 xueyou jsonp jquery 框架 UI html5
postMessage 是 HTML5 新方法，它可以实现跨域窗口之间通讯。到目前为止，只有 IE8+, Firefox 3, Opera 9, Chrome 3和 Safari 4 支持，而本篇文章主要讲述 postMessage 方法与 message 事件跨浏览器实现。postMessage 方法 JSONP 技术不一样，前者是前端擅长跨域文档数据即时通讯，后者擅长针对跨域服务端数据通讯，p

基于回归分析的广告投入销售额预测——K邻近，决策树，随机森林，线性回归，岭回归

基于回归分析的广告投入销售额预测——K邻近，决策树，随机森林，线性回归，岭回归

文章目录

1. 项目背景

2. 项目简介

2.1 项目内容

2.2 数据说明

2.3 技术工具

3.算法原理

3.1 K—近邻

3.2 决策树

3.3随机森林

3.4 线性回归

3.5 岭回归

4. 分析步骤

4.1 理解数据

4.2 数据预处理

4.2.1 数据类型转换

4.2.2 缺失值处理

4.3 探索性数据分析

4.4 销售额预测

4.4.1 建模及模型预测

4.4.1.1使用线性回归模型：

4.4.1.2 使用岭回归：

4.4.1.3 使用随机森林模型：

4.4.1.4 使用 k邻近模型分析：

4.4.1.5 使用决策树模型分析：

5.实验总结

5.1 结果分析

5.2 改善建议

5.3 实验心得

你可能感兴趣的:(Python,回归,决策树,随机森林)