lunan0320

机器学习实验一（李宏毅-预测PM2.5）

机器学习 Lab1 实验报告

欢迎大家访问我的GitHub博客

https://lunan0320.github.io/

文章目录

- 一、实验目的
- 二、实验要求及环境
- - 2.1 实验要求
  - 2.2实验环境
- 三、设计思想
- - 3.1 实验思想
  - 3.1参数更新
  - 3.2 偏微分计算
  - 3.3 Loss function
  - 3.4 Adagrad过程
- 3.2模型构想
- - 3.2.1 模型一：只考虑PM2.5这一个特征。
  - 3.2.2 模型二：考虑5个影响PM2.5较大的特征。
  - 3.2.3 模型三：考虑全部18个特征。
四、模型一
- 4.1数据读取及预处理
- 4.2梯度下降迭代过程
- - 4.2.1 Gradient Descent以及训练集分割
  - 4.2.2 Regularization正则化（可不做）
  - 4.2.3 Adagrad梯度更新
  - 4.2.4 对Validation Data计算Loss
- 4.3 对test.csv数据处理并预测
五、模型二
- 5.1 均匀选择Validation Data
- 5.2 Adagrade梯度下降
- 5.3对test.csv数据处理并预测
六、模型一、二优化
- 6.1 Feature单独提取
- 6.2矩阵运算
- 6.3 Adagrad效率优化
- 6.4 每天数据扩充统一
- 6.5 模型一优化后
- - 6.5.1Gradient Descent
  - 6.5.2Adagrad算法
- 6.6 模型二优化后
七、模型三
- 7.1 Feature Scaling归一化处理
- 7.2 优化Validation Data选取
- 7.3 Stochastic Gradient Descents随机梯度下降
- 7.4 Adagrad算法
八、模型评价
- 8.1优点
- - 8.1.1、模型特征由一而多
  - 8.1.2、矩阵运算效率大幅度提升
  - 8.1.3、使用多种高阶回归方法
  - 8.1.4、Feature Scaling归一化
  - 8.1.5、验证集均匀分布
- 8.2缺点
- - 8.2.1、预处理小于0直接替换为0
  - 8.2.2、验证集Validation没有完全随机
  - 8.2.3、影响大小应随距预测时间远近而动态变化
  - 8.2.4、Adagrad优化瓶颈
九、结论
十、参考文献
十一、提交文件注解

一、实验目的

掌握Linear Regression中梯度下降预测模型，根据空气质量监测网下载的观测数据，预测出空气污染指数(即PM2.5) 的数值。

二、实验要求及环境

2.1 实验要求

1、不可以使用numpy.linalg.lstsq
2、可以使用pandas库读取csv文件数据信息(其他库亦可)
3、必须使用线性回归，方法必须使用梯度下降法
4、可以使用多种高阶的梯度下降技术（如 Adam、Adagrad等
5、程序运行时间不得大于3分钟

2.2实验环境

戴尔G3游匣 Intel core i7 Windows10
Python3.8 PyCharm

三、设计思想

3.1 实验思想

train.csv：（24018）24即432024的表格，每一天有18个特征，共12个月，每个月20天的数据。
test.csv: (24018)9即43209的表格，每一天有18个特征，需要预测的是每一天第10小时的PM2.5，并输出到csv文件中。

3.1参数更新

3.2 偏微分计算

3.3 Loss function

3.4 Adagrad过程

3.2模型构想

3.2.1 模型一：只考虑PM2.5这一个特征。

3.2.2 模型二：考虑5个影响PM2.5较大的特征。

3.2.3 模型三：考虑全部18个特征。

四、模型一

每一天只考虑PM2.5这一个特征
代码及数据见文件：1.0_predict.py 1.0_predict.csv

4.1数据读取及预处理

train.csv文件中，需要提取3-27列的内容，其中RAINFALL行的内容‘NR’替换为数值0包是没有降雨，数值小于0的数替换为0，并将数据表转化为二维数组处理。

考虑将每一天分为15组（没有将每一天的数据连起来），每一组是一个189的数组，即0-8，1-9…14-22。此时共15240=3600的189的数组表。
那么此时的x应该是一个三维数组3600189，第一维度表示的是第几个189的数组表，第二维度表示189表格的第几行，第三维度表示189表格的第几列。y是一个3600个元素的列表，一一对应x每个表格应有的y值。

4.2梯度下降迭代过程

4.2.1 Gradient Descent以及训练集分割

每一次迭代都需要调用梯度下降算法，求出此时的梯度grad_w和grad_b。

需要遍历3600个18*9的表格，对每个表格根据loss_function的定义，对b和w求偏导。此处，将w视为向量数组，需要用到numpy中求向量积的方法np.dot()

此时的训练集为3000个18*9的表格，其余600个作为验证集。

4.2.2 Regularization正则化（可不做）

为了使得训练出的数据能够在test上更好的预测，此处采用正则化技术。但是由于正则化技术是针对高次项带来的误差所引起，引入正则项也是为了消除高次项的影响，因此在这里引入正则化方法，意义不大。

4.2.3 Adagrad梯度更新

为了能够在较短时间内尽快收敛，因此考虑采用高阶梯度收敛方法，对每个w以及b求出各自的learning rate，将不同参数的learning rate分开考虑。

区别于普通的Gradient Descent方法，当梯度值即微分值越大的时候、斜率越大的时候，更新的步伐要更大一些，在Adagrad的表达式中，分母表示梯度越大步伐越小，分子表示梯度越大步伐越大，这样二者可以相互约束，变化幅度比较合理。

据此，对于每次迭代过程中求得的梯度grad_w,grad_b均需要求平方并与各自的learning rate求和求得均方根，与初始化的Learning rate共同组成各自的learning rate，继而根据梯度下降的策略求出更新后的w和b。

4.2.4 对Validation Data计算Loss

Loss值的计算是根据原值与预测值的差值平方来估计的。
此处按照训练集3000，验证集600的比例即5:1划分。

4.3 对test.csv数据处理并预测

同样需要读取的是test.csv文件中的2-11行数据，对数据’NR’项预处理，对数据小于0的项替换为0。
读出每一天的PM2.5对应的行即可。

得到test数据后，用梯度下降求得的w和b去预测test数据对应的PM2.5，并做出图像。

可以看到，随着训练次数的增多，学习后的数据在验证集上的loss值越来越小，最终趋于稳定，将结果输出到了1.0_predict.csv文件中。

最终在验证集上的loss值也稳定在了40.12左右，训练的时间为72.7秒。

五、模型二

在每一天只选取几个影响PM2.5较大的特征。
代码及数据见文件：2.0_predict.py 2.0_predict.csv

查阅资料后发现，世界卫生组织[1]对空气质量和健康发布的一篇文章显示：影响PM2.5大小的主要因素就是几个。

因此，在模型二中考虑的是主要影响因素。综合考虑So2、No2、PM2.5、PM10、O3五种因素
y=b+(w1x1+w2x2+…+w9x9)_PM2.5 第9行
+(w1x1+w2x2+…+w9x9)_PM10 第8行
+(w1x1+w2x2+…+w9x9)_O3 第7行
+(w1x1+w2x2+…+w9x9)_So2 第12行
+(w1x1+w2x2+…+w9*x9)_No2 第5行

5.1 均匀选择Validation Data

在模型一中，验证集的选择是直接选取了18*9的数组的最后600个作为验证集，而不是在3600个数组中均匀选择，这必然会带来一定的误差影响。因此，在模型二中对验证集均匀分割，每9个之后将一个数据加入验证集。
训练集：3200，验证集：400即8：1的比例训练与loss验证。

5.2 Adagrade梯度下降

为了能够有更好的收敛性，与模型一相同，采取的是Adagrade的梯度下降方法。
除了参数较多之外，其余部分与模型一基本相同。

5.3对test.csv数据处理并预测

可以看到，随着训练次数的增多，模型趋于稳定，在验证集上的loss值逐渐减小。

从训练结果可以看出，当训练2000次后，在验证集上的loss值趋于57.8，在仅仅训练2000次情况下，时间竟然已经达到了2分钟左右。

六、模型一、二优化

6.1 Feature单独提取

将train.csv文件中的全部的PM2.5数据统一放入一个一维数组中。

6.2矩阵运算

在模型一、二中有个共同的问题是迭代次数受限制，当迭代次数达到2000以上时，训练时间就会急剧上升，从而超过实验要求的三分钟限制。因此，需要对模型做出改进，使用numpy自带的数组矩阵运算做效果会更好。

查阅资料后发现，对于bias而言，可以构造X的0次项，如此，便不需要单独考虑bias，只需考虑w的vector即可，构造如图所示的X矩阵即是训练数据。

继而在梯度下降的过程中，不需要单独考虑某个因素的影响，只需要综合考虑即可，迭代过程也变的更加清晰。

6.3 Adagrad效率优化

将向量之间的运算转换到矩阵运算之后，在传参以及计算的过程中效率会成倍的提升。

需要注意的是，在求偏导的过程中，为了完成矩阵之间的相乘，需要对X矩阵先做一个转置变化，这在numpy中是很容易的操作。
求平方根的过程也通过np.sqrt()函数显得非常快捷。

6.4 每天数据扩充统一

  在模型一、二中并没有把天与天之间的数据联系起来，是以天为单位训练，这对数据的最大化利用是不利的。因为每个月的数据是连续的，因此可以考虑将每个月的数据综合考虑。
  每个月20天，共2024=480h，但是最后9h是无法利用的，因此每个月可以组合出的189的数组共计480-9=471组。
  此时x是（12471）（189+1）即5652163的二维数组（加1是为了转换为矩阵，将bias的影响纳入）

6.5 模型一优化后

6.5.1Gradient Descent

对于最普通的梯度下降算法而言，设置learning rate为0.0000001，iteration为80000次
在最普通的梯度下降算法之下，得到的loss值在42.7左右,但是用时却大大缩短，只需20秒即可完成80000次的迭代。

6.5.2Adagrad算法

根据题目要求，需要测试四组不同learning rate情况下的loss曲线。
图中w=np.ones(1*9+1)是指共9个w参数，+1是最后一个用来表示bias的值，将bias在w的最后一个表示。

在不同的学习率下，分别测试各种情况下的loss值，并最终通过plot作图，得到四种learning rate下随着迭代次数的增多，loss的变化曲线。

可以看到，随着learning rate的增大，loss值的收敛过程是越来越快的，在Adagrad梯度下降算法下，这是符合的。
四种不同的learning rate对应的在最终w情况下的loss值：

6.6 模型二优化后

此时特征提取后对应的factors_arr数组是5行1列的二维数组，对应的5行依次是No2、O3、PM10、PM2.5、So2

Adagrad算法
分别在四种不同learning rate之下，求得验证集下不同的loss值。作图比较发现，随着learning rate的增大，梯度下降算法的收敛过程是越来越快的。

可以看到在迭代20000次是情况下，loss值在验证集下已经趋近于27.32。
在4中不同学习率情况下，每次迭代20000次，共计80000次，用时大概44秒，相当于依次迭代20000次用时11秒左右。在没有优化之前，迭代2000次需要120秒，比较下来，时间提升了109倍。优化效果是非常显著的。

七、模型三

在模型三中需要考虑18种特征的影响。对于一个189的最小单元，共有w和b 189+1=163个参数的影响。

7.1 Feature Scaling归一化处理

在如此多的特征面前，各个特征的分布范围是不同的，此时不同的特征值变化相同的幅度带来的影响是会有较大差别的，为了消除这种差异性，使得update的过程更为顺利，需要对数据进行归一化处理。

归一化处理之后，loss的图像接近于圆形，整体上都会顺着等高线的方向趋向于圆心移动，提高训练的效率。
此处使用的Feature Scaling方法是对每个特征归一化为标准正态分布，即每个Feature减去它的均值再除以标准差即可。

在具体的实现过程种需要使用numpy的mean和std方法。

factors_arr数组是18*5652的数组，每一行是一个特征的所有取值，因此直接对其按行求均值和方差即可。
最后还需要利用Feature Scaling公式更新每一个数据。

7.2 优化Validation Data选取

验证集不能够随意分布，而是应该均匀分布在12*471=5652之内，因此可以选择12为验证集的间隔。

7.3 Stochastic Gradient Descents随机梯度下降

为了让训练更加快速，考虑引入SGD随机梯度下降算法，看到一个样本点就去更新loss，此时，loss就不是所有样本的平方和，而是随机样本点的平方和。

该方法与Adagrad的最大不同就是红色框的部分，随机梯度下降算法并没有像Adagrad迭代所有数据，只是随机取一个样本点求其平方和。
在选择learning rate0.01，迭代次数150000时，得到的loss值为80.5左右。当选取的学习率较小，或者迭代次数较少时，得出的训练loss值都是非常大的。

对迭代次数20000和150000分别作图观察，可以看到这需要非常高的迭代次数才可以收敛到理想值，因此这不是我在本次梯度下降模型中选取的算法。

7.4 Adagrad算法

采用Adagrad算法是与模型二类似的，区别只是选取的特征数量的不同。

  得到在四种不同的learning rate下的loss值。每次迭代20000次，分为4组，共用时53秒左右，效率的提升非常显著。
  在learning rate为1的情况下，求出的loss值是27.62左右，这与只考虑5个特征的情况是差不多的。
  这也成功验证了我起初的猜想，在主要影响因素面前，其他的13个特征造成的改变基本上可以忽略不计。

在四种learning rate下，作图比较，可以看到，大致趋势与之前是相同的。

为了直观地看出最后预测模型的情况，作出了最终预测结果PM2.5的折线图。

此时为了对模型三更好评估，继续测试不同learning rate下的loss曲线。
按照learning rate每次扩大1000倍，迭代20000次。训练用时54秒。

按照learning rate每次扩大1000倍，迭代50000次。训练时间为142秒。
对比之下，可以看到，此时的主要影响因素已经不再是训练次数所影响，即使扩大5倍的训练量，此时的loss值也是变化很小的，已经达到了趋于收敛的状态。

八、模型评价

8.1优点

8.1.1、模型特征由一而多

从一个特征到主要特征再到全部特征，分为三次建模，两次优化，得到了线性回归模型下的最优解。

8.1.2、矩阵运算效率大幅度提升

为了消除时间瓶颈的影响，查阅资料后获得思路，转换为矩阵做时间提升达到了109倍。

8.1.3、使用多种高阶回归方法

在优化模型的过程中，使用了Adagrad作为主要优化方法，SGD辅助对比。

8.1.4、Feature Scaling归一化

使用归一化技术，使得消除了不同特征之间的影响，更容易收敛到最佳情况。

8.1.5、验证集均匀分布

将训练集和验证集分割，而验证集又是充分随机选取，使得模型更容易推广，从而降低了test数据下的误差。

8.2缺点

8.2.1、预处理小于0直接替换为0

对于数据中出现小于0的数值，直接替换为0欠妥，这会导致一些不确定因素加入。最合适的做法应当是将其从数据集中筛除。

8.2.2、验证集Validation没有完全随机

训练集的随机性是建立在固定的随机方式上，本质上没有做到完全随机均匀分布，且Validation Data与Training Data的分割可以更加均匀合理。

8.2.3、影响大小应随距预测时间远近而动态变化

未对各个小时的影响做淡化处理，随着时间的递增，组内第九小时、第八小时…第一小时对于待预测时刻的影响应该是递减的。也就是说距离待预测时刻越近，影响因素的影响会更大。

8.2.4、Adagrad优化瓶颈

  虽然通过Adagrad方法使得不同的变量有了各自的学习率，但是初始情况的全局学习率需要自己指定。
  此时，如果设置的全局学习率过大，则优化一样是不稳定的；
  如果设置的全局学习率过小，则随着迭代过程的进行，根据Adagrad的学习特性，学习率可能会越来越小，很有可能在没有到达极值点的时候就已经是停滞不前的状态了。

九、结论

  考虑不同的特征值会有不同的结果，但是在选择模型的时候如果可以优先挑选主要特征，这比直接选取全部特征来进行要更加有效。
  即使选取了所有特征值，在最终也需要对那些影响微乎其微的特征舍弃。
  不同的高阶梯度下降优化方法不一定总是适用的，如果迭代时间较长，那么Adagrad就存在明显的劣势，不容易在较短时间内找到最优解，SGD方法是的计算速度是要比Adagrad快一个数量级的。
  Training Data和Validation Data要区分开，不能在训练集中直接选取一部分用来验证求loss值的大小。Training Data中用来训练模型，而Validation Data用来验证模型优劣，计算loss值。

十、参考文献

[1]世卫组织环境（室外）空气质量和健康
https://www.who.int/zh/news-room/fact-sheets/detail/ambient-(outdoor)-air-quality-and-health
[2]哈工大2020秋机器学习Lab1实验报告
https://blog.csdn.net/weixin_44940258/article/details/109010846
[3] 数组对象
https://www.numpy.org.cn/reference/arrays/
[4] Data-Science-Notes
https://github.com/fengdu78/Data-Science-Notes/tree/master/2.numpy/numpy-100
[5] Pandas手册
https://www.pypandas.cn/docs/getting_started/basics.html
[6] Adagrad 优化
https://www.jiqizhixin.com/graph/technologies/7eab38a3-23ec-494c-a677-415b6f85e6c5

十一、提交文件注解

训练集：train.csv
预测集：test.csv
1、模型一：代码1.0_predict.py 数据1.0_predict.csv
2、模型一优化：代码1._factor.py 数据1._factor_predict.csv
3、模型二：代码2.0_predict.py 数据2.0_predict.csv
4、模型二优化：代码5_factors.py 数据5_factors_predict.csv
5、模型三：代码all_factors.py 数据all_factors_predict.csv

华为OD机试 - 最长回文字符串（C++ Java JavaScript Python） YOLO大师华为 c++java 算法华为od
题目描述如果一个字符串正读和反渎都一样（大小写敏感），则称它为一个「[回文串]，例如：leVel是一个「回文串」，因为它的正读和反读都是leVel；同理a也是「回文串」art不是一个「回文串」，因为它的反读tra与正读不同Level不是一个「回文串」，因为它的反读leveL与正读不同（因大小写敏感）给你一个仅包含大小写字母的字符串，请用这些字母构造出一个最长的回文串，若有多个最长的，返回其中字典序
自用力扣刷题记录（Python，数组、字符串） qq_40283123
文章目录一.数组69744844241274453最小操作次数使数组元素相等665非递减数列283移动的零118杨辉三角形119杨辉三角形2661图片平滑器598范围求和II419夹板上的战舰189旋转数组396旋转函数54螺旋矩阵59螺旋矩阵II498对角线遍历566重塑矩阵48旋转图像73矩阵置零289生命游戏303区域和检索-数组不可变304二维区域和检索-矩阵不可变238除自身以外数组的乘
Python 进程和线程-进程 vs. 线程赔罪 Python 系统学习 python 开发语言
目录ThreadLocal小结进程vs.线程线程切换计算密集型vs.IO密集型异步IOThreadLocal在多线程环境下，每个线程都有自己的数据。一个线程使用自己的局部变量比使用全局变量好，因为局部变量只有线程自己能看见，不会影响其他线程，而全局变量的修改必须加锁。但是局部变量也有问题，就是在函数调用的时候，传递起来很麻烦：defprocess_student(name):std=Student
一个数如果恰好等于它的因子之和，这个数就称为“完数“。例如6=1＋2＋3.编程找出1000以内的所有完数。-多语言赔罪 Practice questions 算法 java c语言 javascript python
目录C语言实现Python实现Java实现Js实现题目：一个数如果恰好等于它的因子之和，这个数就称为"完数"。例如6=1＋2＋3.编程找出1000以内的所有完数。完数（PerfectNumber）是一个正整数，它等于其所有正因子（不包括自身）的和。换句话说，如果一个数n的所有正因子（除了n本身）相加的结果等于n，那么n就是一个完数。完数的性质完数是稀有的，已知的完数都是偶数。根据欧几里得的定理，完
Python中的代码测试小白的高手之路 python学习 python 开发语言
编写函数或类时，可以为其编写测试。通过测试，可以确定代码面对各种输入都能正确按要求工作。在程序中添加新代码时，依然可以对其进行测试，确认它们不会影响原有的代码。1、测试函数先编写一个简单的函数：name_fun.pydefget_name(first,last):"""生成全名"""name=first+''+lastreturnname.title()name.pyfromname_funimp
Python----数据分析（Pandas四：一维数组Series的统计计算，分组和聚合）蹦蹦跳跳真可爱589 数据分析 Python pandas python 数据分析
一、统计计算1.1、count用于计算Series中非NaN（非空）值的数量。importpandasaspds=pd.Series([1,2,None,4,None])count_non_na=s.count()print(count_non_na)1.2、sumsum()函数会计算所有值的总和。Series.sum(axis=None,skipna=True,numeric_only=None
Python----数据分析（Pandas三：一维数组Series的数据操作：数据清洗，数据转换，数据排序，数据筛选，数据拼接）蹦蹦跳跳真可爱589 数据分析 Python python 数据分析 pandas
一、数据清洗1.1、dropna()删除包含NaN值的行。series.dropna(axis=0,inplace=False)描述说明axis可选参数，用于指定按哪个轴删除缺失值。对于Series对象，因为它是一维数据结构，只有一个轴，所以此参数默认值为0，且一般不需要修改这个参数（在处理DataFrame时该参数才有更多实际意义，如除，axis=1表示按列删除）。inplace可选参数，用于指
【手把手教你-Python】如何让 Flask 根据现有表结构生成 SQLAlchemy 模型文件？ EricLing2022 python flask 开发语言 sql database
首先你要具备一定Python基础，了解Flask框架，以及数据库工具SQLAchemy。为什么会有这个需求？在使用Python编写项目代码时，假设数据库中的表已经存在，我们需要根据现有的表结构来编写SQLAlchemy模型文件。为了避免逐行编写代码，我们可以使用一个工具来“一键生成”模型文件，那就是sqlacodegen。准备工作Python版本：3.11.5（只要是3.xx版本应该都可以）安装好
数组逆序重放 crmeb专业二开 python 开发语言
数组逆序重放的意思是将数组的元素逆序排列，然后重新放回原数组中。这个操作可以在很多编程语言中实现，例如Python、Java等。下面是一个Python的示例代码，可以实现这个操作：defreverse_and_rearrange(arr):#反转数组arr.reverse()#重新放回原数组result=[]foriinrange(len(arr)):result.append(arr[i])re
Python 程序运行过程 iteye_20309 python c/c++数据库
一.Python解释器Python是一门编程语言，同时也是一个解释器的软件包。解释器是一种让其他程序运行起来的程序。当你编写了一段Python程序，Python解释器将读取程序，并按照其中的命令执行，得出结果。解释器是代码与计算机硬件之间的软件逻辑层。当Python包安装后，它包含了一些最小化的组件：一个解释器和支持的库。根据使用情况的不同，Python解释器可能采取可执行程序的形式，或者作为链接
python记录6from flask import Flaskapp = Flask(__name__) @app.route(‘/‘)def hello_world(): retu 我讨厌python python 开发语言后端
利用pycharm实现视频分镜1.下载pip3installpycharm或者官网下载2.网页显示文字步骤想要在网页上显示：Hello，World!第一步先在PyCharm上新建项目然后在main.py中输入以下代码fromflaskimportFlaskapp=Flask(__name__)@app.route('/')defhello_world():return'Hello,World!'i
将一个数组逆序输出。-多语言赔罪 Practice questions 算法数据结构 python c语言 java javascript
目录C语言实现方法1:交换元素方法2:使用辅助数组方法3:使用递归方法4:使用标准库函数（C99及以上）总结Python实现方法1:交换元素方法2:使用切片方法3:使用reversed()函数方法4:使用list.reverse()方法方法5:使用for循环和append()总结Java实现方法1:交换元素方法2:使用Collections.reverse()方法（适用于对象数组）方法3:使用递归
app=Flask(__name__)中的__name__的意义 BirdMan98 flask python 后端
在app=Flask(__name__)这行代码中，Flask(__name__)用于初始化Flask应用对象，而__name__这个参数的作用主要是确定应用的根路径，影响Flask如何查找资源，如静态文件、模板等。1.__name__是Python内置变量__name__在Python模块中表示当前模块的名称：如果Python文件被直接运行，__name__的值为"__main__"。如果Pyt
使用yolov8+flask实现精美登录界面+图片视频摄像头检测系统 FL1623863129 深度学习 YOLO flask python
这个是使用flask实现好看登录界面和友好的检测界面实现yolov8推理和展示，代码仅仅有2个html文件和一个python文件，真正做到了用最简洁的代码实现复杂功能。测试通过环境：windowsx64anaconda3+python3.8ultralytics==8.3.81flask==1.1.2torch==2.3.0运行步骤：安装好环境执行pythonlogin.py后端实现代码：from
机器学习的下一个前沿是因果推理吗？——探索机器学习的未来方向！真智AI 人工智能机器学习
机器学习的进化：从预测到因果推理机器学习凭借强大的预测能力，已经彻底改变了多个行业。然而，要实现真正的突破，机器学习还需要克服实践和计算上的挑战，特别是在因果推理方面的应用。未来，因果推理或许将成为推动机器学习发展的新前沿。什么是因果推理，它如何与机器学习相关？如果你和我一样没有数学背景，你可能会好奇“因果推理”到底意味着什么？它与机器学习又有什么关系？当我刚开始学习机器学习时，第一次听到“因果推
python 解决 ‘win32api’ 模块找不到的问题 xybf python python 开发语言
出现这个问题可能是因为升级至python3.10之后，会遗漏两个重要的dll:`pythoncom310.dll`和`pywintypes310.dll`。解决方案就是在python目录下运行`pythonScripts/pywin32_postinstall.py-install`，然后这两个文件就会被创建在`C:\Windows\System32`或者是python目录下。如果这两个地方都找不
AI编程篇-python基础篇 cv工程师(ctrl+c\v) AI编程 python
转型AI算法后的总结-python基础篇python基础AI算法工程师的日常开发工作离不开python这门语言。python的优点：开源免费、简单易学、丰富的库。以下是我总结的python的一些基础：1.python及IDE工具安装对于初学者来说，python的安装是必不可少的，但是为了方便代码编辑和查看结果及debug，可以安装pycharm社区版暂时用来前期学习：python安装及注意事项：下
torch-torchvision-python版本对应问题 Thirtyaoe python 深度学习 pytorch
module‘torch.onnx.symbolic_helper’hasnoattribute‘quantized_args’今日在联系pytorch时，importtorchvision时报错：module‘torch.onnx.symbolic_helper’hasnoattribute‘quantized_args’查阅后发现是版本不兼容的问题，于是查看了正确的对应版本，对自己的进行修改。
torchvision与torch的版本冲突 RanGriffin python pytorch
在importtorchvision时报错：UserWarning:FailedtoloadimagePythonextension:[WinError127]解决在晚上查询之后，问题在于自己的torchvision版本与torch版本不对应。首先查询自己的torch和torchvision版本importtorchprint(torch.__version__)importtorchvision
xodooIP地址定位 odoo实施 XODOO PRO Xodoo odoo python
//src/packages/python/geoip2.rs实现特点：跨平台支持：通过Rust原生实现，兼容Windows、Linux、macOS等主流操作系统类型安全：使用Rust的Option类型处理可能缺失的字段严格校验IP地址格式自动处理编码转换性能优化：数据库文件只加载一次内存映射方式读取数据零拷贝解析技术错误处理：明确的错误类型（IOError/ValueError）友好的错误提示信
警告 torch.nn.utils.weight_norm is deprecate 的参考解决方法 wongHome 深度学习相关调试问题 Ubuntu pytorch
文章目录写在前面一、问题描述二、解决方法参考链接写在前面自己的测试环境：Ubuntu20.04一、问题描述运行pytorch程序，如下如下警告/home/wong/ProgramFiles/anaconda3/envs/pytorch_env/lib/python3.8/site-packages/torch/nn/utils/weight_norm.py:30:UserWarning:torch
如何用Python绘制柱状图堆叠图？上官美丽技术分享 python 开发语言
在数据分析和可视化的过程中，柱状图是一种非常常用的图表类型。它能清晰地展示不同类别之间的比较。而堆叠柱状图则是在此基础上，能够展示各个部分在整体中的占比！今天，我们来聊聊如何使用Python绘制堆叠柱状图，帮助你更好地理解数据。我们将使用一个非常流行的库：Matplotlib。准备工作首先，你需要确保安装了Matplotlib库。如果还没有安装，可以通过以下命令来安装：pipinstallmatp
python socket库详解 mosquito_lover1 python websocket
socket是Python标准库中的一个模块，提供了对底层网络通信的接口，允许开发者进行网络编程。通过socket你可以创建客户端和服务器应用程序，实现网络通信。1.基本概念-Socket：是网络通信的端点，用于在不同主机之间或同一主机上的不同进程之间进行数据传输。-IP地址：标识网络中的设备。-端口号：标识设备上的特定进程或服务。-协议：常用的协议有TCP（传输控制协议）和UDP（用户数据报协议
使用Python和LangChain创建可调用工具的智能对话机器人：全面指南 m0_57781768 python langchain 机器人
使用Python和LangChain创建可调用工具的智能对话机器人：全面指南在当今技术迅猛发展的时代，人工智能（AI）和自然语言处理（NLP）技术的应用范围越来越广。尤其是对话机器人，它们不仅能与人类进行自然交互，还能通过调用外部API与各种系统对接，为用户提供更加智能和灵活的服务。本文将通过一系列实例和代码演示，向您展示如何利用Python编程语言和LangChain框架，创建能够使用外部工具（
踩坑：VirtualBox：安装提示缺少python core和win32 api 过去的了 linux python
一、安装OracleVirtualBox时出现以下现象内容提示：安装OracleVMVirtualBox7.0.24的Python绑定需要先安装PythonCore包和win32api绑定。如果现在继续安装OracleVMVirtualBox7.0.24的Python绑定，那么这些依赖项需要在之后手动设置。用户可以参考OracleVMVirtualBox7.0.24SDK手册获取更多信息。如果忽视
YOLO11 环境安装你喜欢喝可乐吗？ conda deep learning 人工智能 conda
1.安装Anaconda/Miniconda在Ubuntu中安装MinicondaAnaconda/Minicondapip配置清华镜像源Anaconda/Miniconda基本操作命令2.创建python虚拟环境#创建condacreate-nyolo11_envpython=3.12#激活condaactivateyolo11_env3.安装pytorch#Pytorchhttps://pyt
Python3 【项目实战】深度解析：赛跑成绩统计分析工具李智 - 重庆 Python 精讲精练 -从入门到实战 python 案例学习编程技巧时间处理项目实战
Python3【项目实战】深度解析：赛跑成绩统计分析工具一、项目概述1.开发背景：田径比赛的成绩统计需要快速准确的计算选手成绩，传统人工计时和统计效率低且易出错。本工具通过程序化处理赛跑数据，自动计算各选手成绩及整体统计指标，主要应用于：学校运动会成绩实时统计田径锦标赛的自动化成绩公示运动员训练数据分析2.技术定位：时间数据处理与统计计算的典型案例字典数据结构的实践应用面向过程编程的教学范例二、项
深入解析LTE-A到5G的系统消息架构与功能演进罗博深
本文还有配套的精品资源，点击获取简介：系统消息是移动通信网络中，UE与网络间信息交换的核心，涵盖了网络状态、服务信息与系统配置。文章深入分析了4GLTE-A到5G网络中系统消息的组成、作用及其演进，包括MIB和SIBs的功能与内容，以及5G对系统消息的优化和新技术的引入，如动态调度、网络切片和针对物联网设备的特定参数配置。5G系统消息还通过机器学习和大数据分析实现智能化分发，增强了网络灵活性、智能
默默的学python——两个重要的函数dir()、help() xiaoli_panpan #python基础 python
一、dir()函数dir()函数在Python中用于返回一个对象的所有属性和方法的列表，当你对一个函数使用dir()时，它会返回函数对象的所有可访问的属性和方法的名字列表。具体的说，dir()函数获取的内容包括：1.特殊方法和魔法方法如call、code、defaults、doc、globals、__name__等，这些方法和属性是函数对象的一部分，提供了对函数元数据的访问。2.基础自基类的属性和
python xpath定位元素方法_关于python中的xpath解析定位 weixin_39975366 python xpath定位元素方法
爬取的网站：http://jbk.39.net/chancegz/这里只针对个别属性值：#例如：'别名'下的span标签文本，‘发病部位'下的span标签文本以及‘挂号科室‘下的span标签文本#defdisease(url):text=get_html(url)tree=etree.HTML(text)bm=tree.xpath('//ul[@class="information_ul"]/li
windows下源码安装golang 616050468 golang安装 golang环境 windows
系统： 64位win7，开发环境：sublime text 2， go版本： 1.4.1 1. 安装前准备(gcc, gdb, git) golang在64位系
redis批量删除带空格的key bylijinnan redis
redis批量删除的通常做法： redis-cli keys "blacklist*" | xargs redis-cli del 上面的命令在key的前后没有空格时是可以的，但有空格就不行了： $redis-cli keys "blacklist*" 1) "blacklist:12: [email protected]
oracle正则表达式的用法 0624chenhong oracle 正则表达式
方括号表达示方括号表达式描述 [[:alnum:]] 字母和数字混合的字符 [[:alpha:]] 字母字符 [[:cntrl:]] 控制字符 [[:digit:]] 数字字符 [[:graph:]] 图像字符 [[:lower:]] 小写字母字符 [[:print:]] 打印字符 [[:punct：]] 标点符号字符 [[:space:]]
2048源码(核心算法有，缺少几个anctionbar，以后补上) 不懂事的小屁孩 2048
2048游戏基本上有四部分组成， 1：主activity，包含游戏块的16个方格，上面统计分数的模块 2：底下的gridview，监听上下左右的滑动，进行事件处理， 3：每一个卡片，里面的内容很简单，只有一个text，记录显示的数字 4：Actionbar，是游戏用重新开始，设置等功能(这个在底下可以下载的代码里面还没有实现) 写代码的流程 1：设计游戏的布局，基本是两块，上面是分
jquery内部链式调用机理换个号韩国红果果 JavaScript jquery
只需要在调用该对象合适(比如下列的setStyles)的方法后让该方法返回该对象（通过this 因为一旦一个函数称为一个对象方法的话那么在这个方法内部this（结合下面的setStyles）指向这个对象） function create(type){ var element=document.createElement(type); //this=element;
你订酒店时的每一次点击背后都是NoSQL和云计算蓝儿唯美 NoSQL
全球最大的在线旅游公司Expedia旗下的酒店预订公司，它运营着89个网站，跨越68个国家，三年前开始实验公有云，以求让客户在预订网站上查询假期酒店时得到更快的信息获取体验。云端本身是用于驱动网站的部分小功能的，如搜索框的自动推荐功能，还能保证处理Hotels.com服务的季节性需求高峰整体储能。 Hotels.com的首席技术官Thierry Bedos上个月在伦敦参加“2015 Clou
java笔记1 a-john java
1，面向对象程序设计（Object-oriented Propramming，OOP）：java就是一种面向对象程序设计。 2，对象：我们将问题空间中的元素及其在解空间中的表示称为“对象”。简单来说，对象是某个类型的实例。比如狗是一个类型，哈士奇可以是狗的一个实例，也就是对象。 3，面向对象程序设计方式的特性： 3.1 万物皆为对象。
C语言 sizeof和strlen之间的那些事 C/C++软件开发求职面试题必备考点（一） aijuans C/C++求职面试必备考点
找工作在即，以后决定每天至少写一个知识点，主要是记录，逼迫自己动手、总结加深印象。当然如果能有一言半语让他人收益，后学幸运之至也。如有错误，还希望大家帮忙指出来。感激不尽。后学保证每个写出来的结果都是自己在电脑上亲自跑过的，咱人笨，以前学的也半吊子。很多时候只能靠运行出来的结果再反过来
程序员写代码时就不要管需求了吗？ asia007 程序员不能一味跟需求走
编程也有2年了，刚开始不懂的什么都跟需求走，需求是怎样就用代码实现就行，也不管这个需求是否合理，是否为较好的用户体验。当然刚开始编程都会这样，但是如果有了2年以上的工作经验的程序员只知道一味写代码，而不在写的过程中思考一下这个需求是否合理，那么，我想这个程序员就只能一辈写敲敲代码了。我的技术不是很好，但是就不代
Activity的四种启动模式百合不是茶 android 栈模式启动 Activity的标准模式启动栈顶模式启动单例模式启动
android界面的操作就是很多个activity之间的切换,启动模式决定启动的activity的生命周期 ; 启动模式xml中配置 <activity android:name=".MainActivity" android:launchMode="standard&quo
Spring中@Autowired标签与@Resource标签的区别 bijian1013 java spring @Resource @Autowired @Qualifier
Spring不但支持自己定义的@Autowired注解，还支持由JSR-250规范定义的几个注解，如：@Resource、 @PostConstruct及@PreDestroy。 1. @Autowired @Autowired是Spring 提供的，需导入 Package:org.springframewo
Changes Between SOAP 1.1 and SOAP 1.2 sunjing Changes Enable SOAP 1.1 SOAP 1.2
JAX-WS SOAP Version 1.2 Part 0: Primer (Second Edition) SOAP Version 1.2 Part 1: Messaging Framework (Second Edition) SOAP Version 1.2 Part 2: Adjuncts (Second Edition) Which style of WSDL
【Hadoop二】Hadoop常用命令 bit1129 hadoop
以Hadoop运行Hadoop自带的wordcount为例， hadoop脚本位于/home/hadoop/hadoop-2.5.2/bin/hadoop，需要说明的是，这些命令的使用必须在Hadoop已经运行的情况下才能执行 Hadoop HDFS相关命令 hadoop fs -ls 列出HDFS文件系统的第一级文件和第一级
java异常处理（初级）白糖_ java DAO spring 虚拟机 Ajax
从学习到现在从事java开发一年多了，个人觉得对java只了解皮毛，很多东西都是用到再去慢慢学习，编程真的是一项艺术，要完成一段好的代码，需要懂得很多。最近项目经理让我负责一个组件开发，框架都由自己搭建，最让我头疼的是异常处理，我看了一些网上的源码，发现他们对异常的处理不是很重视，研究了很久都没有找到很好的解决方案。后来有幸看到一个200W美元的项目部分源码，通过他们对异常处理的解决方案，我终
记录整理-工作问题 braveCS 工作
1）那位同学还是CSV文件默认Excel打开看不到全部结果。以为是没写进去。同学甲说文件应该不分大小。后来log一下原来是有写进去。只是Excel有行数限制。那位同学进步好快啊。 2）今天同学说写文件的时候提示jvm的内存溢出。我马上反应说那就改一下jvm的内存大小。同学说改用分批处理了。果然想问题还是有局限性。改jvm内存大小只能暂时地解决问题，以后要是写更大的文件还是得改内存。想问题要长远啊
org.apache.tools.zip实现文件的压缩和解压，支持中文 bylijinnan apache
刚开始用java.util.Zip，发现不支持中文（网上有修改的方法，但比较麻烦）后改用org.apache.tools.zip org.apache.tools.zip的使用网上有更简单的例子下面的程序根据实际需求，实现了压缩指定目录下指定文件的方法 import java.io.BufferedReader; import java.io.BufferedWrit
读书笔记-4 chengxuyuancsdn 读书笔记
1、JSTL 核心标签库标签 2、避免SQL注入 3、字符串逆转方法 4、字符串比较compareTo 5、字符串替换replace 6、分拆字符串 1、JSTL 核心标签库标签共有13个，学习资料：http://www.cnblogs.com/lihuiyy/archive/2012/02/24/2366806.html 功能上分为4类： (1)表达式控制标签：out
[物理与电子]半导体教材的一个小问题 comsci 问题
各种模拟电子和数字电子教材中都有这个词汇-空穴书中对这个词汇的解释是; 当电子脱离共价键的束缚成为自由电子之后,共价键中就留下一个空位,这个空位叫做空穴我现在回过头翻大学时候的教材,觉得这个
Flashback Database --闪回数据库 daizj oracle 闪回数据库
Flashback 技术是以Undo segment中的内容为基础的，因此受限于UNDO_RETENTON参数。要使用flashback 的特性，必须启用自动撤销管理表空间。在Oracle 10g中， Flash back家族分为以下成员： Flashback Database， Flashback Drop，Flashback Query(分Flashback Query,Flashbac
简单排序:插入排序 dieslrae 插入排序
public void insertSort(int[] array){ int temp; for(int i=1;i<array.length;i++){ temp = array[i]; for(int k=i-1;k>=0;k--)
C语言学习六指针小示例、一维数组名含义，定义一个函数输出数组的内容 dcj3sjt126com c
# include <stdio.h> int main(void) { int * p; //等价于 int *p 也等价于 int* p; int i = 5; char ch = 'A'; //p = 5; //error //p = &ch; //error //p = ch; //error p = &i; //
centos下php redis扩展的安装配置3种方法 dcj3sjt126com redis
方法一 1.下载php redis扩展包代码如下复制代码 #wget http://redis.googlecode.com/files/redis-2.4.4.tar.gz 2 tar -zxvf 解压压缩包，cd /扩展包（进入扩展包然后运行phpize 一下是我环境中phpize的目录，/usr/local/php/bin/phpize (一定要
线程池(Executors) shuizhaosi888 线程池
在java类库中，任务执行的主要抽象不是Thread，而是Executor，将任务的提交过程和执行过程解耦 public interface Executor { void execute(Runnable command); } public class RunMain implements Executor{ @Override pub
openstack 快速安装笔记 haoningabc openstack
前提是要配置好yum源版本icehouse，操作系统redhat6.5 最简化安装，不要cinder和swift 三个节点 172 control节点keystone glance horizon 173 compute节点nova 173 network节点neutron control /etc/sysctl.conf net.ipv4.ip_forward =
从c面向对象的实现理解c++的对象（二） jimmee C++面向对象虚函数
1. 类就可以看作一个struct，类的方法，可以理解为通过函数指针的方式实现的，类对象分配内存时，只分配成员变量的，函数指针并不需要分配额外的内存保存地址。 2. c++中类的构造函数，就是进行内存分配(malloc)，调用构造函数 3. c++中类的析构函数，就时回收内存(free) 4. c++是基于栈和全局数据分配内存的，如果是一个方法内创建的对象，就直接在栈上分配内存了。专门在
如何让那个一个div可以拖动 lingfeng520240 html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml
第10章高级事件（中） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
计算两个经纬度之间的距离 roadrunners 计算纬度 LBS 经度距离
要解决这个问题的时候，到网上查了很多方案，最后计算出来的都与百度计算出来的有出入。下面这个公式计算出来的距离和百度计算出来的距离是一致的。 /** * * @param longitudeA * 经度A点 * @param latitudeA * 纬度A点 * @param longitudeB *
最具争议的10个Java话题 tomcat_oracle java
1、Java8已经到来。什么！？ Java8 支持lambda。哇哦，RIP Scala！　　随着Java8 的发布，出现很多关于新发布的Java8是否有潜力干掉Scala的争论，最终的结论是远远没有那么简单。Java8可能已经在Scala的lambda的包围中突围，但Java并非是函数式编程王位的真正觊觎者。　　2、Java 9 即将到来　　 Oracle早在8月份就发布
zoj 3826 Hierarchical Notation(模拟) 阿尔萨斯 rar
题目链接：zoj 3826 Hierarchical Notation 题目大意：给定一些结构体，结构体有value值和key值，Q次询问，输出每个key值对应的value值。解题思路：思路很简单，写个类词法的递归函数，每次将key值映射成一个hash值，用map映射每个key的value起始终止位置，预处理完了查询就很简单了。这题是最后10分钟出的，因为没有考虑value为{}的情