vwvwvoo

test2

转

从简单的线性回归入门机器学习

2018年09月14日 21:08:24 vwvwvoo 阅读数 69 更多

分类专栏： 1.1_机器学习

编辑

                        声明：

参考用Sckit-Learn和Pandas学习线性回归
入门机器学习仅仅靠这一篇文章还是有些不够，建议大家戳一戳文中的链接，看一下相关的知识。

从简单的线性回归入门机器学习
- 获取数据，定义问题
- 整理数据
- 用pandas来读取数据
- 准备运行算法的数据
- 划分训练集和测试集
- 运行scikit-learn的线性模型
- 评价模型
- 调优
- 画图观察结果
- 总结

从简单的线性回归入门机器学习

虽然本文从一开始就限定了机器学习的方法——线性回归，但是在大多数情况下，解决问题的主要难点在于寻找合适的机器学习方法上。而这方面需要长期的积累，所以显然不是本文要讲的内容了。
下面，本文将用面向过程的方式分解解决线性回归问题的步骤（每一个章节标题都是一个步骤），以此来帮助大家对机器学习有一个初步的了解。

获取数据，定义问题

没有数据，当然没法研究机器学习啦。:) 这里我们用UCI大学公开的机器学习数据来跑线性回归。

数据的介绍戳戳戳

数据的下载地址戳戳戳

里面是一个循环发电场的数据，共有9568个样本数据，每个数据有5列，分别是:AT（温度）, V（压力）, AP（湿度）, RH（压强）,
PE（输出电力)。我们不用纠结于每项具体的意思。

我们的问题是得到一个线性的关系，对应PE是样本输出，而AT/V/AP/RH这4个是样本特征，机器学习的目的就是得到一个线性回归模型，即:
这5个参数。

整理数据

下载后的数据可以发现是一个压缩文件，解压后可以看到里面有一个xlsx文件，我们先用excel把它打开，接着“另存为”csv格式（只需要保存一个sheet就可以了），保存下来，后面我们就用这个csv来运行线性回归。
ps: 本文另存为了“ccpp.csv”。转成csv格式是为了读取更方便。

打开这个csv可以发现数据已经整理好，没有非法数据，因此不需要做预处理。但是这些数据并没有归一化，也就是转化为均值0，方差1的格式。也不用我们搞，后面scikit-learn在线性回归时会先帮我们把归一化搞定。

好了，有了这个csv格式的数据，我们就可以大干一场了。

所谓非法数据，主要是指空值，一般在机器学习或者深度学习中都不接受空值，需要删除或者插值处理。

用pandas来读取数据

推荐使用的一个交互式编程工具：jupyter notebook
读取数据到变量data中

import pandas as pd
import numpy as np
data = pd.read_csv(r'./ccpp.csv', header=0)
   
   
   
   
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
   
   
   
   
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3

查看data的信息

data.head()  # 前五行的信息
   
   
   
   
   
   
   
   
    
    
    
    1
   
   
   
   
   
   
   
   
    
    
    
    1

data.shape  # data的长和宽
'''输出'''
# (9568, 5)
   
   
   
   
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
   
   
   
   
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3

可以看到，data是一个pandas中的DataFrame类型，其列名是5个变量，索引是0, 1, 2…9567

准备运行算法的数据

我们的目的是通过对前四个变量AT, V, AP, RH建立一个线性关系来预测RE，即对于函数y=f(x)，机器通过输入x和输出y，找到它们之间的线性映射。

机器学习的含义也可以在这里得到解释：通过对大量数据的学习，找出一定的规律，当再次碰到相似的数据时，可以通过之前获得的规律来作出判断。

所以我们的输出数据X是表格data的前4列，输出真实值y是表格data的最后一列。

X = data[['AT', 'V', 'AP', 'RH']]
y = data[['PE']]
   
   
   
   
   
   
   
   
    
    
    
    1
    
    
    
    2
   
   
   
   
   
   
   
   
    
    
    
    1
    
    
    
    2

划分训练集和测试集

为什么要划分训练集和测试集？
上一个章节中，我们已经得到输入X和输出y，这足以让我们完成对机器的训练。但是，为了评估机器学习效果的好坏，还需要一些数据进行测试。
训练集和测试集分开是机器学习界的公式，这样可以防止过拟合，增强机器学习算法的泛化能力。
如何划分训练集和测试集？
在sklearn库中提供了一个划分函数：

# 首先从sklearn库中导入划分函数
from sklearn.model_selection import train_test_split
# 然后执行函数获得结果
x_train, x_test, y_train, y_test = train_test_split(X, y, random_state=0)

print('x_train.shape: ', x_train.shape)
print('y_train.shape: ', y_train.shape)
print('x_test.shape: ', x_test.shape)
print('y_test.shape: ', y_test.shape)
'''输出'''
# x_train.shape:  (7176, 4)
# y_train.shape:  (7176, 1)
# x_test.shape:  (2392, 4)
# y_test.shape:  (2392, 1)
   
   
   
   
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5
    
    
    
    6
    
    
    
    7
    
    
    
    8
    
    
    
    9
    
    
    
    10
    
    
    
    11
    
    
    
    12
    
    
    
    13
    
    
    
    14
   
   
   
   
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5
    
    
    
    6
    
    
    
    7
    
    
    
    8
    
    
    
    9
    
    
    
    10
    
    
    
    11
    
    
    
    12
    
    
    
    13
    
    
    
    14

这个函数涉及到两个问题：

random_state是什么？它是一个随机种子，用来生成随机数。当random_state一样时，划分的数据就服从同一种随机分布。
如何确定训练集和测试集分割的比例？默认参数test_size=0.25，即默认训练集：测试集=3：1。可以改变这个参数以获得不同的分割比例。

运行scikit-learn的线性模型

这一步就是线性回归算法部分了，看起来最神秘，但是由于sklearn库已经将算法封装好了，所以用起来相当简单。

# 首先从sklearn库中导入线性回归函数
from sklearn.linear_model import LinearRegression
# 执行函数获得一个线性回归模型
linreg = LinearRegression()  # 这是一个未经训练的机器学习模型
# 对模型传入输入数据x_train和输出数据y_train
linreg.fit(x_train, y_train)  # 这是一个经过训练的机器学习模型
'''输出线性回归的截距和各个系数'''
print('linreg.intercept_: ', linreg.intercept_)
print('linreg.coef_: ', linreg.coef_)
'''输出'''
# linreg.intercept_:  [ 451.19095935]
# linreg.coef_:  [[-1.98357941 -0.23219575  0.06559288 -0.15932893]]
   
   
   
   
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5
    
    
    
    6
    
    
    
    7
    
    
    
    8
    
    
    
    9
    
    
    
    10
    
    
    
    11
    
    
    
    12
   
   
   
   
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5
    
    
    
    6
    
    
    
    7
    
    
    
    8
    
    
    
    9
    
    
    
    10
    
    
    
    11
    
    
    
    12

经过训练的线性回归模型可以给我们返回一组系数，将这组系数带入前面的公式就可得线性回归预测的回归函数：

评价模型

现在，机器学习模型已经根据数据学习到了一个线性回归的规律。这一章节，我们需要评估我们的模型的好坏程度，对于线性回归来说，我们一般用均方差（Mean Squared Error, MSE）或者均方根差(Root Mean Squared Error, RMSE)在测试集上的表现来评价模型的好坏。

同时，sklearn提供了一套用于评估模型好坏的工具库——metrics，不用我们自己敲代码了。

前面划分的测试集在这里将排上用场：

y_pred = linreg.predict(x_test)
# 引入sklearn模型评价工具库
from sklearn import metrics
print("MSE: ", metrics.mean_squared_error(y_test, y_pred))
print("RMSE: ", np.sqrt(metrics.mean_squared_error(y_test, y_pred)))
'''输出'''
# MSE:  20.5442988776
# RMSE:  4.53258192178
   
   
   
   
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5
    
    
    
    6
    
    
    
    7
    
    
    
    8
   
   
   
   
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5
    
    
    
    6
    
    
    
    7
    
    
    
    8

确实，这样看模型的好坏程度很不直观，得到一个浮点数不能让我们确定模型训练的效果。但是这个数值的意义在于，当我们使用了多种机器学习模型时，如何进行横向比较选择效果最好的模型，具有重大的参考意义。

本文后面还会用可视化的方式直观的表示模型学习效果的好坏。

调优

所谓调优，就是调整机器学习模型（本文中为线性回归）中的参数。很多人认为机器学习很简单，就是选个模型然和调参，实际并非如此。

言归正传，进行调优最常用的方法是交叉验证。进行交叉验证，我们不仅需要训练集和测试集，还应该再把训练集分成子训练集和验证集。然后，通过子训练集和验证集获得最优的参数。最后用测试集进行评估作为当前模型（本位为简单线性回归）的最终评分。

画图观察结果

这里画图真实值和预测值的变化关系，离中间的直线y=x直接越近的点代表预测损失越低。代码如下：

%matplotlib inline  # 这是为了能在交互式界面中显示图像
import matplotlib.pyplot as plt
fig, ax = plt.subplots()
ax.scatter(y, predicted)
ax.plot([y.min(), y.max()], [y.min(), y.max()], 'k--', lw=4)
ax.set_xlabel('Measured')
ax.set_ylabel('Predicted')
plt.show()
   
   
   
   
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5
    
    
    
    6
    
    
    
    7
    
    
    
    8
   
   
   
   
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5
    
    
    
    6
    
    
    
    7
    
    
    
    8

为什么要这样画图？
对于输出y来说，真实值和预测值都是一维的，同时，真实值和预测值一一对应，它们之间的差值越小，预测越准确。显然，如果预测值=真实值，那么它们的差值最小，即上图中的黑色虚线。横坐标是真实值，纵坐标是预测值，那么对于所有的真实值，预测值离着黑线越近，预测越准确。

总结

这是本文进行线性回归的流程图：

转载: https://blog.csdn.net/hustqb/article/details/78193544

    

	
	
			机器学习：从线性回归说起		
	
		
			12-27
			
				阅读数 
				1129
			
		
	
	
		
			机器学习：从线性回归说起接触机器学习与深度学习仅一年的时间，现以笔记形式记录描述心得体会，必要时会实现相关算法。博客中将会提到的算法大多来自机器学习相关的书籍，如AndrewNG的机器学习讲义，李航老...
		
		
								博文
										来自：	 领悟


	
	
		
			
		
	
	
		
		
		 
			
				
			
			
			
			
			
			发表评论
			
				
				添加代码片
				
				
				
					HTML/XML
					objective-c
					Ruby
					PHP
					C
					C++
					JavaScript
					Python
					Java
					CSS
					SQL
					其它
				
			  
			
				还能输入1000个字符


    
        你可能感兴趣的:(1.1_机器学习)
        
            
                
                    简单理解机器学习中top_k、top_p、temperature三个参数的作用
                        无级程序员
机器学习人工智能
                        在机器学习中，top_k、top_p和temperature是用于控制生成模型（如语言模型）输出质量的参数，尤其在文本生成任务中常见。然而，网上文章很多很全，但大多晦涩难懂，今天我们来用最简单的语言谈谈它们的具体作用：1.点菜式筛选法：top_k参数英文全称：top-k中文名称：前k个具体意义：top_k参数就像是你在餐厅点菜时，服务员只给你推荐菜单上前k名的招牌菜。在AI文本生成中，top_k参
                    
                    小白零基础学数学建模系列-引言与课程目录
                        川川菜鸟
数学建模小白到精通系列数学建模
                        目录引言一、我们的专辑包含哪些内容？第一周：数学建模基础与工具第二周：高级数学建模技巧与应用第三周：机器学习基础与数据处理第四周：监督学习与无监督学习算法第五周：神经网络二、学完本专辑能收获到什么？三、适合什么样的人群学习？四、如何学习本专辑？课程目录第1周：数学建模基础与工具第1天：数学建模入门介绍第2天：数学建模工具介绍第3天：线性回归与曲线拟合第4天：线性规划第5天：动态规划第2周：高级数学
                    
                    初始OpenCV
                        指尖下的技术
OpenCVopencv人工智能计算机视觉
                        OpenCV是一个功能强大、应用广泛的计算机视觉库，它为开发人员提供了丰富的工具和算法，可以帮助他们快速构建各种视觉应用。随着计算机视觉技术的不断发展，OpenCV也将会继续发挥重要的作用。OpenCV提供了大量的计算机视觉算法和图像处理工具，广泛应用于图像和视频的处理、分析以及机器学习领域。所以学习人计算机视觉或者图像处理方面的知识，OpenCV是一个要重点学习的工具库。首先介绍一下OpenCV
                    
                    机器学习结合伏羲模型高精度多尺度气象分析与降尺度实现
                        Hardess-god
WRF算法人工智能
                        随着人工智能的发展，机器学习技术在气象预报领域展现出巨大潜力。本文详细探讨如何结合机器学习（ML）和伏羲模型进行高精度多尺度气象模拟分析，并提供详细的实现步骤和相关代码。1.研究目标与技术路线目标：结合机器学习模型与伏羲气象模式，实现区域和局地高精度降尺度。技术路线：伏羲模型提供大尺度气象数据和预报使用机器学习模型（如CNN、LSTM、XGBoost）进行降尺度2.数据准备与处理2.1气象数据获取
                    
                    基于ChatGPT、GIS与Python机器学习的地质灾害风险评估、易发性分析、信息化建库及灾后重建高级实践
                        weixin_贾
防洪评价风险评估滑坡泥石流地质灾害
                        第一章、ChatGPT、DeepSeek大语言模型提示词与地质灾害基础及平台介绍【基础实践篇】1、什么是大模型？大模型（LargeLanguageModel,LLM）是一种基于深度学习技术的大规模自然语言处理模型。代表性大模型：GPT-4、BERT、T5、ChatGPT等。特点：多任务能力：可以完成文本生成、分类、翻译、问答等任务。上下文理解：能理解复杂的上下文信息。广泛适配性：适合科研、教育、行
                    
                    人脸识别的一些代码
                        饿了就干饭
CV相关人脸识别
                        1、cv2入门函数imread及其相关操作2、（详解）opencv里的cv2.resize改变图片大小Python3、机器学习之人脸识别face_recognition使用4、使用face_recognition进行人脸校准5、简单的人脸识别通用流程示意图（这个看着写的挺好的）6、face_recognition和图像处理中left、top、right、bottom解释7、使用pillow库对图片
                    
                    探索Python中的集成方法：Stacking
                        Echo_Wish
Python笔记Python算法python开发语言
                        在机器学习领域，Stacking是一种高级的集成学习方法，它通过将多个基本模型的预测结果作为新的特征输入到一个元模型中，从而提高整体模型的性能和鲁棒性。本文将深入介绍Stacking的原理、实现方式以及如何在Python中应用。什么是Stacking？Stacking，又称为堆叠泛化（StackedGeneralization），是一种模型集成方法，与Bagging和Boosting不同，它并不直
                    
                    【Python】 Stacking: 强大的集成学习方法
                        音乐学家方大刚
Pythonpython集成学习开发语言
                        我们都找到天使了说好了心事不能偷藏着什么都一起做幸福得没话说把坏脾气变成了好沟通我们都找到天使了约好了负责对方的快乐阳光下的山坡你素描的以后怎么抄袭我脑袋想的薛凯琪《找到天使了》在机器学习中，单一模型的性能可能会受到其局限性和数据的影响。为了解决这个问题，我们可以使用集成学习（EnsembleLearning）方法。集成学习通过结合多个基模型的预测结果，来提高整体模型的准确性和稳健性。Stacki
                    
                    Stacking算法：集成学习的终极武器
                        civilpy
算法集成学习机器学习
                        Stacking算法：集成学习的终极武器在机器学习的竞技场中，集成学习方法以其卓越的性能而闻名。其中，Stacking（堆叠泛化）作为一种高级集成技术，更是被誉为“集成学习的终极武器”。本文将带你深入了解Stacking算法的原理和实现，并提供一些实战技巧和最佳实践。1.Stacking算法原理探秘Stacking算法的核心思想是训练多个不同的基模型，并将它们的预测结果作为新模型的输入特征，以此来
                    
                    集成学习（上）：Bagging集成方法
                        万事可爱^
机器学习修仙之旅#监督学习集成学习机器学习人工智能Bagging随机森林
                        一、什么是集成学习？在机器学习的世界里，没有哪个模型是完美无缺的。就像古希腊神话中的"盲人摸象"，单个模型往往只能捕捉到数据特征的某个侧面。但当我们把多个模型的智慧集合起来，就能像拼图一样还原出完整的真相，接下来我们就来介绍一种“拼图”算法——集成学习。集成学习是一种机器学习技术，它通过组合多个模型（通常称为“弱学习器”或“基础模型”）的预测结果，构建出更强、更准确的学习算法。这种方法的主要思想是
                    
                    【集成学习】：Stacking原理以及Python代码实现
                        Geeksongs
机器学习python机器学习深度学习人工智能算法
                        Stacking集成学习在各类机器学习竞赛当中得到了广泛的应用，尤其是在结构化的机器学习竞赛当中表现非常好。今天我们就来介绍下stacking这个在机器学习模型融合当中的大杀器的原理。并在博文的后面附有相关代码实现。总体来说，stacking集成算法主要是一种基于“标签”的学习，有以下的特点：用法：模型利用交叉验证，对训练集进行预测，从而实现二次学习优点：可以结合不同的模型缺点：增加了时间开销，容
                    
                    windows使用ssh-copy-id命令的解决方案
                        爱编程的喵喵
Windows实用技巧windowssshssh-copy-id解决方案
                          大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。  本文主要介绍了windows使用ssh-copy-
                    
                    PyTorch基础知识讲解（一）完整训练流程示例
                        苏雨流丰
机器学习pytorch人工智能python机器学习深度学习
                        文章目录Tutorial1.数据处理2.网络模型定义3.损失函数、模型优化、模型训练、模型评价4.模型保存、模型加载、模型推理Tutorial大多数机器学习工作流程涉及处理数据、创建模型、优化模型参数和保存训练好的模型。本教程向你介绍一个用PyTorch实现的完整的ML工作流程，并提供链接来了解这些概念中的每一个。我们将使用FashionMNIST数据集来训练一个神经网络，预测输入图像是否属于以下
                    
                    机器学习中的贝叶斯网络：如何构建高效的风险预测模型
                        AI天才研究院
DeepSeekR1&大数据AI人工智能大模型自然语言处理人工智能语言模型编程实践开发语言架构设计
                        作者：禅与计算机程序设计艺术文章目录机器学习中的贝叶斯网络：如何构建高效的风险预测模型1.背景介绍2.基本概念术语说明2.1马尔科夫随机场（MarkovRandomField）2.2条件随机场（ConditionalRandomField，CRF）2.3变量elimination算法2.4贝叶斯网络3.核心算法原理和具体操作步骤以及数学公式讲解3.1原理介绍1.贝叶斯网络基础2.贝叶斯网络构建风险
                    
                    使用 Milvus 进行向量数据库管理与实践
                        qahaj
milvus数据库python
                        技术背景介绍在当今的AI与机器学习应用中，处理和管理大量的嵌入向量是一个常见的需求。Milvus是一个开源向量数据库，专门用于存储、索引和管理深度神经网络以及其他机器学习模型生成的大规模嵌入向量。它的高性能和易用性使其成为处理向量数据的理想选择。核心原理解析Milvus的核心功能体现在其强大的向量索引和搜索能力。它支持多种索引算法，包括IVF、HNSW等，使其能够高效地进行大规模向量的相似性搜索操
                    
                    物理学不存在了？诺贝尔物理学奖颁给了人工智能
                        资讯新鲜事
人工智能
                        2024年10月8日，瑞典皇家科学院宣布，将2024年诺贝尔物理学奖授予美国普林斯顿大学教授约翰·J·霍普菲尔德（JohnJ.Hopfield）和加拿大多伦多大学教授杰弗里·E·辛顿（GeoffreyE.Hinton），以表彰他们“在人工神经网络机器学习方面的基础性发现和发明”。辛顿在接受电话采访时表示：“完全没想到”。实话实说，在结果出来前，大家也都没想到。因为在外界预测里，今年的诺贝尔物理学奖
                    
                    PHP 爬虫实战：爬取淘宝商品详情数据
                        EcomDataMiner
php爬虫开发语言
                        随着互联网技术的发展，数据爬取越来越成为了数据分析、机器学习等领域的重要前置技能。而在这其中，爬虫技术更是不可或缺。php作为一门广泛使用的后端编程语言，其在爬虫领域同样也有着广泛应用和优势。本文将以爬取斗鱼直播数据为例，介绍php爬虫的实战应用。准备工作在开始爬虫之前，我们需要做一些准备工作。首先，需要搭建一个本地服务器环境，推荐使用WAMP、XAMPP等集成化工具，方便部署PHP环境。其次，我
                    
                    强化学习中的深度卷积神经网络设计与应用实例
                        数字扫地僧
计算机视觉cnn人工智能神经网络
                        I.引言强化学习（ReinforcementLearning，RL）是机器学习的一个重要分支，通过与环境的交互来学习最优策略。深度学习，特别是深度卷积神经网络（DeepConvolutionalNeuralNetworks，DCNNs）的引入，为强化学习在处理高维度数据方面提供了强大工具。本文将探讨强化学习中深度卷积神经网络的设计原则及其在不同应用场景中的实例。II.深度卷积神经网络在强化学习中的
                    
                    模拟退火算法：原理、应用与优化策略
                        尹清雅
算法
                        摘要模拟退火算法是一种基于物理退火过程的随机搜索算法，在解决复杂优化问题上表现出独特优势。本文详细阐述模拟退火算法的原理，深入分析其核心要素，通过案例展示在函数优化、旅行商问题中的应用，并探讨算法的优化策略与拓展方向，为解决复杂优化问题提供全面的理论与实践指导，助力该算法在多领域的高效应用与创新发展。一、引言在现代科学与工程领域，复杂优化问题无处不在，如资源分配、路径规划、机器学习模型参数调优等。
                    
                    TensorFlow深度学习实战项目：从入门到精通
                        点我头像干啥
Ai深度学习tensorflow人工智能
                        引言深度学习作为人工智能领域的一个重要分支，近年来取得了显著的进展。TensorFlow作为Google开源的深度学习框架，因其强大的功能和灵活的架构，成为了众多开发者和研究者的首选工具。本文将带领大家通过一个实战项目，深入理解TensorFlow的使用方法，并掌握深度学习的基本流程。1.TensorFlow简介1.1TensorFlow是什么？TensorFlow是一个开源的机器学习框架，由Go
                    
                    国外7个最佳大语言模型 (LLM) API推荐
                        幂简集成
API新理念语言模型人工智能自然语言处理
                        大型语言模型(LLM)API将彻底改变我们处理语言的方式。在深度学习和机器学习算法的支持下，LLMAPI提供了前所未有的自然语言理解能力。通过利用这些新的API，开发人员现在可以创建能够以前所未有的方式理解和响应书面文本的应用程序。下面，我们将比较从Bard到ChatGPT、PaLM等市场上顶级LLMAPI。我们还将探讨整合这些LLM的潜在用例，并考虑其对语言处理的影响。什么是大语言模型(LLM)
                    
                    机器学习是怎么一步一步由神经网络发展到今天的Transformer架构的？
                        yuanpan
机器学习神经网络transformer
                        机器学习和神经网络的发展经历了一系列重要的架构和技术阶段。以下是更全面的总结，涵盖了从早期神经网络到卷积神经网络之前的架构演变：1.早期神经网络：感知机（Perceptron）时间：1950年代末至1960年代。背景：感知机由FrankRosenblatt提出，是第一个具有学习能力的神经网络模型。它由单层神经元组成，可以用于简单的二分类任务。特点：输入层和输出层之间直接连接，没有隐藏层。使用简单的
                    
                    奇异值分解（SVD）
                        文弱_书生
乱七八糟神经网络人工智能
                        奇异值分解(SVD)介绍奇异值分解(SVD)，这是最强大的矩阵分解技术之一。SVD广泛应用于机器学习、数据科学和其他计算领域，用于降维、降噪和矩阵近似等应用。与仅适用于方阵的特征分解不同，SVD可以应用于任何矩阵，使其成为一种多功能工具。在这里煮啵将分解SVD背后的理论，通过手动计算示例进行分析，并展示如何在Python中实现SVD。在本节结束时，您将清楚地了解SVD的强大功能及其在机器学习中的应
                    
                    yum install locate出现Error: Unable to find match: locate解决方案
                        爱编程的喵喵
Linux解决方案linuxlocateyum解决方案
                          大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。  本文主要介绍了yuminstalllocate出现
                    
                    【人工智能机器学习基础篇】——深入详解无监督学习之降维：PCA与t-SNE的关键概念与核心原理
                        猿享天开
人工智能数学基础专讲人工智能机器学习无监督学习降维
                        深入详解无监督学习之降维：PCA与t-SNE的关键概念与核心原理在当今数据驱动的世界中，数据维度的增多带来了计算复杂性和存储挑战，同时也可能导致模型性能下降，这一现象被称为“维度诅咒”（CurseofDimensionality）。降维作为一种重要的特征提取和数据预处理技术，旨在通过减少数据的维度，保留其主要信息，从而简化数据处理过程，并提升模型的性能。本文将深入探讨两种广泛应用于无监督学习中的降
                    
                    Flink启动任务
                        swg321321
flink大数据
                        Flink以本地运行作为解读例如：第一章Python机器学习入门之pandas的使用提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录Flink前言StreamExecutionEnvironmentLocalExecutorMiniClusterStreamGraph二、使用步骤1.引入库2.读入数据总结前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发
                    
                    计算机专业毕业设计题目推荐（新颖选题）本科计算机人工智能专业相关毕业设计选题大全✅
                        会写代码的羊
毕设选题课程设计人工智能毕业设计毕设题目毕业设计题目aiAI编程
                        文章目录前言最新毕设选题（建议收藏起来）本科计算机人工智能专业相关的毕业设计选题毕设作品推荐前言2025全新毕业设计项目博主介绍：✌全网粉丝10W+,CSDN全栈领域优质创作者，博客之星、掘金/华为云/阿里云等平台优质作者。技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、大数据、机器学习等设计与开发。主要内容：免费功能
                    
                    【机器学习】建模流程
                        CH3_CH2_CHO
什么？！是机器学习！！机器学习人工智能线性回归逻辑回归
                        1、数据获取1.1来源数据获取是机器学习建模的第一步，常见的数据来源包括数据库、API、网络爬虫等。数据库是企业内部常见的数据存储方式，例如：MySQL、Oracle等关系型数据库，以及MongoDB等非关系型数据库，它们能够存储大量的结构化和非结构化数据API（应用程序编程接口）提供了从外部获取数据的便捷方式，例如：社交媒体平台的API可以获取用户发布的内容和互动信息网络爬虫则适用于从网页中提取
                    
                    机器学习课堂4线性回归模型+特征缩放
                        木尘152132
机器学习线性回归python
                        一、实验2-2，线性回归模型，计算模型在训练数据集和测试数据集上的均方根误差代码：#2-2线性回归模型importpandasaspdimportnumpyasnpimportmatplotlib.pyplotasplt#参数设置iterations=3000#迭代次数learning_rate=0.0001#学习率m_train=3000#训练样本的数量flag_plot_lines=False
                    
                    【机器学习】模型拟合
                        CH3_CH2_CHO
什么？！是机器学习！！机器学习人工智能欠拟合过拟合
                        1、欠拟合1.1现象欠拟合是机器学习和统计建模中的一种常见问题，表现为模型无法充分捕捉数据中的潜在规律和模式。无论是训练数据还是测试数据，模型的预测误差都居高不下。在实际应用中，欠拟合的模型往往显得过于简单和粗糙，无法对数据进行有效的拟合和描述。1.2原因模型过于简单是导致欠拟合的主要原因：例如，使用直线去拟合具有明显曲线趋势的数据，或者使用低阶多项式去拟合高阶的复杂函数关系。这种情况下，模型的表
                    
                                sql统计相同项个数并按名次显示
                                    朱辉辉33
javaoracle
                                    现在有如下这样一个表： 
A表 
ID Name time 
------------------------------ 
0001 aaa 2006-11-18 
0002 ccc 2006-11-18 
0003 eee 2006-11-18 
0004 aaa 2006-11-18 
0005 eee 2006-11-18 
0004 aaa 2006-11-18 
0002 ccc 20
                                
                                Android+Jquery Mobile学习系列-目录
                                    白糖_
JQuery Mobile
                                    最近在研究学习基于Android的移动应用开发，准备给家里人做一个应用程序用用。向公司手机移动团队咨询了下，觉得使用Android的WebView上手最快，因为WebView等于是一个内置浏览器，可以基于html页面开发，不用去学习Android自带的七七八八的控件。然后加上Jquery mobile的样式渲染和事件等，就能非常方便的做动态应用了。 
  
从现在起，往后一段时间，我打算
                                
                                如何给线程池命名
                                    daysinsun
线程池
                                            在系统运行后，在线程快照里总是看到线程池的名字为pool-xx，这样导致很不好定位，怎么给线程池一个有意义的名字呢。参照ThreadPoolExecutor类的ThreadFactory，自己实现ThreadFactory接口，重写newThread方法即可。参考代码如下： 
    
public class Named
                                
                                IE 中"HTML Parsing Error:Unable to modify the parent container element before the
                                    周凡杨
html解析errorreadyState
                                      
错误：  IE   中"HTML Parsing Error:Unable to modify the parent container element before the child element is closed"      
  
  
现象：  同事之间几个IE 测试情况下，有的报这个错，有的不报。经查询资料后，可归纳以下原因。
                                
                                java上传
                                    g21121
java
                                    我们在做web项目中通常会遇到上传文件的情况，用struts等框架的会直接用的自带的标签和组件，今天说的是利用servlet来完成上传。 
我们这里利用到commons-fileupload组件，相关jar包可以取apache官网下载：http://commons.apache.org/ 
下面是servlet的代码： 
//定义一个磁盘文件工厂
DiskFileItemFactory fact
                                
                                SpringMVC配置学习
                                    510888780
springmvc
                                    spring MVC配置详解 
现在主流的Web MVC框架除了Struts这个主力 外，其次就是Spring MVC了，因此这也是作为一名程序员需要掌握的主流框架，框架选择多了，应对多变的需求和业务时，可实行的方案自然就多了。不过要想灵活运用Spring MVC来应对大多数的Web开发，就必须要掌握它的配置及原理。 
 
　　一、Spring MVC环境搭建：（Spring 2.5.6 + Hi
                                
                                spring mvc-jfreeChart 柱图(1)
                                    布衣凌宇
jfreechart
                                    第一步：下载jfreeChart包，注意是jfreeChart文件lib目录下的，jcommon-1.0.23.jar和jfreechart-1.0.19.jar两个包即可； 
第二步：配置web.xml; 
web.xml代码如下 
<servlet> 
    <servlet-name>jfreechart</servlet-nam
                                
                                我的spring学习笔记13-容器扩展点之PropertyPlaceholderConfigurer
                                    aijuans
Spring3
                                    PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java P
                                
                                java 线程池使用 Runnable&Callable&Future
                                    antlove
javathreadRunnablecallablefuture
                                    1. 创建线程池 
ExecutorService executorService = Executors.newCachedThreadPool(); 
  
2. 执行一次线程，调用Runnable接口实现 
Future<?> future = executorService.submit(new DefaultRunnable());
System.out.prin
                                
                                XML语法元素结构的总结
                                    百合不是茶
xml树结构
                                    1.XML介绍1969年   gml (主要目的是要在不同的机器进行通信的数据规范)1985年   sgml  standard generralized markup language1993年   html(www网)1998年  xml   extensible markup language
                                
                                改变eclipse编码格式
                                    bijian1013
eclipse编码格式
                                    1.改变整个工作空间的编码格式 
        改变整个工作空间的编码格式，这样以后新建的文件也是新设置的编码格式。 
        Eclipse->window->preferences->General->workspace-
                                
                                javascript中return的设计缺陷
                                    bijian1013
JavaScriptAngularJS
                                    代码1： 
<script>
var gisService = (function(window) 
{ 

    return
    {
        name:function ()
        {
            alert(1);
        }
    };

})(this);

gisService.name();
&l
                                
                                【持久化框架MyBatis3八】Spring集成MyBatis3
                                    bit1129
Mybatis3
                                    pom.xml配置 
Maven的pom中主要包括： 
 
 MyBatis 
 MyBatis-Spring 
 Spring 
 MySQL-Connector-Java 
 Druid 
 applicationContext.xml配置     
<?xml version="1.0" encoding="UTF-8"?>
&
                                
                                java web项目启动时自动加载自定义properties文件
                                    bitray
javaWeb监听器相对路径
                                    创建一个类 
public class ContextInitListener implements ServletContextListener 
使得该类成为一个监听器。用于监听整个容器生命周期的，主要是初始化和销毁的。 
 
类创建后要在web.xml配置文件中增加一个简单的监听器配置，即刚才我们定义的类。 
 

    <listener>
        <des
                                
                                用nginx区分文件大小做出不同响应
                                    ronin47

                                    昨晚和前21v的同事聊天，说到我离职后一些技术上的更新。其中有个给某大客户(游戏下载类)的特殊需求设计，因为文件大小差距很大——估计是大版本和补丁的区别——又走的是同一个域名，而squid在响应比较大的文件时，尤其是初次下载的时候，性能比较差，所以拆成两组服务器，squid服务于较小的文件，通过pull方式从peer层获取，nginx服务于较大的文件，通过push方式由peer层分发同步。外部发布
                                
                                java-67-扑克牌的顺子.从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的.2-10为数字本身，A为1，J为11，Q为12，K为13，而大
                                    bylijinnan
java
                                    package com.ljn.base;

import java.util.Arrays;
import java.util.Random;

public class ContinuousPoker {

    /**
     * Q67 扑克牌的顺子 从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的。
     * 2-10为数字本身，A为1，J为1
                                
                                翟鸿燊老师语录
                                    ccii
翟鸿燊
                                    一、国学应用智慧TAT之亮剑精神A 
1. 角色就是人格 
    就像你一回家的时候，你一进屋里面，你已经是儿子，是姑娘啦，给老爸老妈倒怀水吧，你还觉得你是老总呢？还拿派呢？就像今天一样，你们往这儿一坐，你们之间是什么，同学，是朋友。 
    还有下属最忌讳的就是领导向他询问情况的时候，什么我不知道，我不清楚，该你知道的你凭什么不知道
                                
                                [光速与宇宙]进行光速飞行的一些问题
                                    comsci
问题
                                     
 
     在人类整体进入宇宙时代，即将开展深空宇宙探索之前，我有几个猜想想告诉大家 
    仅仅是猜想。。。未经官方证实 
 
 
     1：要在宇宙中进行光速飞行，必须首先获得宇宙中的航行通行证，而这个航行通行证并不是我们平常认为的那种带钢印的证书，是什么呢？ 下面我来告诉
                                
                                oracle undo解析
                                    cwqcwqmax9
oracle
                                    oracle undo解析2012-09-24 09:02:01     我来说两句       作者：虫师收藏    我要投稿 
 
Undo是干嘛用的？         &nb
                                
                                java中各种集合的详细介绍
                                    dashuaifu
java集合
                                    一，java中各种集合的关系图 Collection       接口的接口     对象的集合  ├ List           子接口   &n
                                
                                卸载windows服务的方法
                                    dcj3sjt126com
windowsservice
                                    卸载Windows服务的方法 
在Windows中，有一类程序称为服务，在操作系统内核加载完成后就开始加载。这里程序往往运行在操作系统的底层，因此资源占用比较大、执行效率比较高，比较有代表性的就是杀毒软件。但是一旦因为特殊原因不能正确卸载这些程序了，其加载在Windows内的服务就不容易删除了。即便是删除注册表中的相 应项目，虽然不启动了，但是系统中仍然存在此项服务，只是没有加载而已。如果安装其他
                                
                                Warning: The Copy Bundle Resources build phase contains this target's Info.plist
                                    dcj3sjt126com
iosxcode
                                           
      
http://developer.apple.com/iphone/library/qa/qa2009/qa1649.html 
Excerpt: 
 
 You are getting this warning because you probably added your Info.plist file to your Copy Bundle 
                                
                                2014之C++学习笔记（一）
                                    Etwo
C++EtwoEtwoiterator迭代器
                                            已经有很长一段时间没有写博客了，可能大家已经淡忘了Etwo这个人的存在，这一年多以来，本人从事了AS的相关开发工作，但最近一段时间，AS在天朝的没落，相信有很多码农也都清楚，现在的页游基本上达到饱和，手机上的游戏基本被unity3D与cocos占据，AS基本没有容身之处。so。。。最近我并不打算直接转型
                                
                                js跨越获取数据问题记录
                                    haifengwuch
jsonpjsonAjax
                                    js的跨越问题，普通的ajax无法获取服务器返回的值。 
 
  第一种解决方案，通过getson，后台配合方式，实现。 
Java后台代码： 
protected void doPost(HttpServletRequest req, HttpServletResponse resp) 
throws ServletException, IOException { 
String ca
                                
                                蓝色jQuery导航条
                                    ini
JavaScripthtmljqueryWebhtml5
                                    效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/39.htmHTML文件代码： 
<!DOCTYPE html>
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<title>jQuery鼠标悬停上下滑动导航条 - 柯乐义<
                                
                                linux部署jdk,tomcat,mysql
                                    kerryg
jdktomcatlinuxmysql
                                    1、安装java环境jdk: 
    一般系统都会默认自带的JDK,但是不太好用，都会卸载了，然后重新安装。 
   1.1）、卸载： 
     （rpm -qa :查询已经安装哪些软件包； 
       rmp -q 软件包：查询指定包是否已
                                
                                DOMContentLoaded VS onload VS onreadystatechange
                                    mutongwu
jqueryjs
                                    1. DOMContentLoaded 在页面html、script、style加载完毕即可触发，无需等待所有资源（image/iframe）加载完毕。（IE9+） 
 
2. onload是最早支持的事件，要求所有资源加载完毕触发。 
 
3. onreadystatechange 开始在IE引入，后来其它浏览器也有一定的实现。涉及以下 document , applet, embed, fra
                                
                                sql批量插入数据
                                    qifeifei
批量插入
                                    hi， 
  自己在做工程的时候，遇到批量插入数据的数据修复场景。我的思路是在插入前准备一个临时表，临时表的整理就看当时的选择条件了，临时表就是要插入的数据集，最后再批量插入到数据库中。 
   
WITH tempT AS (
SELECT
item_id AS combo_id,
item_id,
now() AS create_date
FROM
a
                                
                                log4j打印日志文件 如何实现相对路径到 项目工程下
                                    thinkfreer
Weblog4j应用服务器日志
                                    最近为了实现统计一个网站的访问量，记录用户的登录信息，以方便站长实时了解自己网站的访问情况，选择了Apache 的log4j,但是在选择相对路径那块 卡主了，X度了好多方法(其实大多都是一样的内用，还一个字都不差的)，都没有能解决问题，无奈搞了2天终于解决了，与大家分享一下 
 
 
需求： 
用户登录该网站时，把用户的登录名,ip,时间。统计到一个txt文档里，以方便其他系统调用此txt。项目名
                                
                                linux下mysql-5.6.23.tar.gz安装与配置
                                    笑我痴狂
mysqllinuxunix
                                    1.卸载系统默认的mysql 
 
[root@localhost ~]# rpm -qa | grep mysql 
mysql-libs-5.1.66-2.el6_3.x86_64
mysql-devel-5.1.66-2.el6_3.x86_64
mysql-5.1.66-2.el6_3.x86_64
[root@localhost ~]# rpm -e mysql-libs-5.1
                                
                
            
        
    


    
        
            按字母分类：
            ABCDEFGHIJKLMNOPQRSTUVWXYZ其他
        
    


    
        
            首页 -
            关于我们 -
            站内搜索 -
            Sitemap -
            侵权投诉
        
        版权所有 IT知识库 CopyRight © 2000-2050 E-COM-NET.COM , All Rights Reserved.

test2

从简单的线性回归入门机器学习

从简单的线性回归入门机器学习

获取数据，定义问题

整理数据

用pandas来读取数据

准备运行算法的数据

划分训练集和测试集

运行scikit-learn的线性模型

评价模型

调优

画图观察结果

总结

机器学习：从线性回归说起

机器学习入门笔记——线性回归

机器学习入门——线性回归

机器学习入门1：线性回归

你可能感兴趣的:(1.1_机器学习)