RicardoSuzaku

机器学习与scikit-learn（一）——回归模型

作者：CUG_UESTC
出处：http://blog.csdn.net/qq_31192383/article/details/78723468

本博客主要是为了将一些常用的方法进行一个总结，之前许多方法都只是一知半解，也没有实现过。这次刚好想学习scikit-learn，所以顺便复习一下机器学习相关方法，结合理论加实践的方法。

安装

一般来说如果用Anaconda安装的python环境的话，会自带sklearn包。安装这里没什么好说的，详情参考：安装教程

线性回归

一元线性回归
线性回归是机器学习中最简单的模型，但是要知道许多复杂的模型都是从线性模型演化而来，其思想都是一脉相承的。所以我们先从线性回归模型入手进行学习。
生活中有一些问题是可以通过线性模型来解释的，譬如，我们有如下数据：

表示不同尺寸的披萨所对于的价格，可以很清楚的看到，披萨的尺寸越大，其价格呈线性增长。
线性回归模型主要学习具有如下形式的函数参数
(1)f(x)=w1x1+w2x2+...+...wdxd+b
其中的 wi 和 b 就是模型的参数，通过大量的数据可以学习到这些参数。参数一旦确定之后，对于一个模型从未见过的数据，好比上面的例子中问你尺寸为20的披萨多少钱，模型就可以基于现有数据所存在的规律，预测出一个结果。
```
#对于上述的例子，我们可以通过一个简单的例子了解一元线性回归和sklearn的基本使用


#-*-coding:utf-8-*-

import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
import numpy as np


#定义绘图格式

def runplt():
    plt.figure()
    plt.title('匹萨价格与直径数据')
    plt.xlabel('直径（英寸）')
    plt.ylabel('价格（美元）')
    plt.axis([0, 25, 0, 25])
    plt.grid(True)
    return plt
plt = runplt()


#表格中的数据

X = [[6], [8], [10], [14], [18]]
Y = [[7], [9], [13], [17.5], [18]]
plt.plot(X, Y, 'r.')

#创建一个线性回归模型

model = LinearRegression()

#将训练数据喂给模型并训练

model.fit(X, Y)

#测试披萨的尺寸大小

test = 20

#调用已训练的模型进行预测

pre = model.predict(test)
plt.plot(test, pre, 'y.')
print(pre[0][0])
plt.show()
```
代码的结果如图：

图中红点代表训练数据，黄色的点为预测结果。
上述例子其实是一个一元回归模型，因为它只有披萨的尺寸这一个影响价格的属性，因此式子(1)可以改写为下面这个式子：
(2)y=α+βx
也就是上面代码中的model学习的是这里的 α和β 。这其实就是一条直线：
```
#将上面最后一行代码注释掉

test = [[0], [25]]
pre = model.predict(test)
plt.plot(test, pre, 'b-')
plt.show()
```
可以看到其结果是一条直线。
至此，可以看到一元线性回归是很容易实现的，那它是如何学习到上面的参数的呢？
带成本函数的模型拟合评估
上述参数其实满足一条性质，那就是对所给的训练集，使其成本函数也就是损失函数最小，这里损失函数在机器学习领域有很多，对于线性回归，我们一般使用均方误差来作为损失函数，使得均方误差最小的参数即我们所需要的解。
在给出参数的求解公式之前，我们通过numpy内置的最小二乘的函数，对上表中的数据进行拟合，并预测披萨尺寸为20时的价格：

#在上面的代码后面添加如下代码手动求取最小二乘
from numpy.linalg import lstsq
X = [6, 8, 10, 14, 18]
X = np.vstack([X, np.ones(len(X))]).T
w, b = lstsq(X, Y)[0]
#输出参数
print(w, b)
pre = w * 20 + b
print(pre)
#输出结果和上面使用sklearn内置线性回归模型结果一样

  可以看到通过lstsq函数求出了参数$w和b$(即(2)中的$\alpha和\beta$)。然后通过公式(2)带入$x=20$解出$y$。
为了统一，我们先给出多元线性回归的表达式，再统一用矩阵的格式统一给出参数求解公式，其实一个数可以看作一个1X1矩阵。

多元线性回归
多元线性回归即具有式子(1)那样的表示形式， (f(x)=w1x1+w2x2+...+...wdxd+b ，可以看到这时，预测值 f(x) 不仅仅与一个 x 有关，而是d个 x 同时决定。但是每个x对最后结果的决定性分量是不一样的。写成矩阵表达形式为
(3) Y=Xβ
这里将 b 也统一到矩阵X中去了，比如对于前面的一元线性回归 y=α+βx ,用该矩阵表示就是
$[y] = [1 x] [α β]$
对于式子(3)即需要解一个 β 使得损失最小，根据线性代数和最优化理论的知识，可以解得
(4) β=(XTX)−1XTY
时求得方程(1)得系数矩阵。

#验证上述式子，在上面的代码后面添加如下代码：
w, b = np.dot(np.linalg.inv(np.dot(np.transpose(X), X)), np.dot(np.transpose(X), Y))
#输出和上面一样的w和b
print(w, b)

下面对于多元回归模型进行测试，假设在前面的披萨模型中，价格除了和尺寸有关以外，还和所加辅料种
类有关，有如下训练数据和测试数据

在训练多元回归模型之前，我们先用R方来评估模型的性能，首先R方指标定义为：
(5) R2=1−∑ni=1(yi−f(xi))2∑ni=1(yi−y∗)
其中 f(xi) 为模型对样本数据计算结果， y∗ 为样本数据中 y (上述例子中的价格)的均值。R方指标在model中可调用score函数求得。
下面我们对上面表格中的数据，在只考虑尺寸的情况下计算一下模型的性能：

#在上述代码后添加：
X = [[6], [8], [10], [14], [18]]
Y = [[7], [9], [13], [17.5], [18]]
model.fit(X, Y)
test_x = [[8], [9], [11], [16], [12]]
test_y = [[11], [8.5], [15], [18], [11]]
score = model.score(test_x, test_y)
#输出为0.66
print("只考虑尺寸时模型得分：", score)
plt.plot(model.predict(test_x), 'r-')

可以看到这种情况下算出来的R方为0.662，它大致可以表述为测试集中过半数的价格都可以通过模型解释，但是这个效果显然并不是最好。

下面我们加上辅料这一信息进行二元回归：

X = [[6, 2], [8, 1], [10, 0], [14, 2], [18, 0]]
Y = [[7], [9], [13], [17.5], [18]]
model.fit(X, Y)
test_x = [[8, 2], [9, 0], [11, 2], [16, 2], [12, 0]]
test_y = [[11], [8.5], [15], [18], [11]]
score = model.score(test_x, test_y)
#输出为0.77
print("同时考虑尺寸和辅料时模型得分：", score)
plt.plot(model.predict(test_x), 'g-')
plt.plot(test_y, 'b-')
plt.show()

下图蓝色曲线是真实价格曲线，红色是一元回归的结果，绿色是二元回归结果：

可以看到，虽然两种预测结果都不是和真实价格十分吻合，但是绿色曲线显然跟拟合蓝色曲线。拿预测结果来说，利用了两种信息的二元回归模型所预测出来的价格距离真实价格跟接近，R指标也更大，所以性能比只利用尺寸这一信息要好许多。

至于两种线性回归的结果都不是特别好，因此，下面介绍多项式回归，它可以更加拟合训练样本数据。

多项式回归
上面的例子中，我们只能对现有样本进行直线拟合，但是可能真实的数据并完全满足线性关系。下面我们使用多项式回归。
前面我们的一元线性回归模型可以用公式 (2)y=α+βx表示，看到，除了两个参数外，自变量的最高项的次数为1，而多项式回归的改进在于，增加自变量的次数，比如一元二次回归模型可以用公式
(6) y=α+β1x+β2x2
来拟合。这里参数从原来的两个变成了三个，我们可以通过实际例子来比较它和一元一次线性回归模型的性能差别。假设有下面数据：
```
#一元线性回归
X_train = [[6], [8], [10], [14], [18]]
Y_train = [[7], [9], [13], [17.5], [18]]
linear_model = LinearRegression()
linear_model.fit(X_train, Y_train)
X_test = np.linspace(0, 25, 25)
X_test = X_test.reshape(X_test.shape[0], 1)
Y_pre = linear_model.predict(X_test)
#输出0.91
print("一元线性回归的R方为：", linear_model.score(X_train, Y_train))
plt.plot(X_train, Y_train, 'y.')
plt.plot(X_test, Y_pre, 'b-')

#多项式回归
quadratic_featurizer = PolynomialFeatures(degree=2)
X_train_quadratic = quadratic_featurizer.fit_transform(X_train)
X_test_quadratic = quadratic_featurizer.fit_transform(X_test)
linear_model.fit(X_train_quadratic, Y_train)
Y_pre = linear_model.predict(X_test_quadratic)
#输出0.98
print("二次多项式回归的R方为：", linear_model.score(X_train_quadratic, Y_train))
plt.plot(X_test, Y_pre, 'r-')
plt.show()
```
可以看出，二次多项式回归的能够拟合曲线，即其学习能力更强，通过上面的例子，可以看到多项式回归的R方比一元线性回归的R方要大许多。

或许你认为如果我们把二次多项式换成更高次的多项式，岂不是拟合效果更好，那结果是不是会大幅度提高呢？我们将二次多项式改为10次多项式看看结果：
```
quadratic_featurizer = PolynomialFeatures(degree=5)
X_train_quadratic = quadratic_featurizer.fit_transform(X_train)
X_test_quadratic = quadratic_featurizer.fit_transform(X_test)
linear_model.fit(X_train_quadratic, Y_train)
Y_pre = linear_model.predict(X_test_quadratic)
#输出1
print("五次多项式回归的R方为：", linear_model.score(X_train_quadratic, Y_train))
plt.plot(X_test, Y_pre, 'g-')
plt.show()
```
看上面输出结果R方为1了，说明这条绿色曲线能够完全拟合训练数据，即训练数据在坐标系中对应的点都过这条绿色的曲线，然而我们可以看到，这条绿色的曲线其实并能很好的表示”尺寸越大，价格越高“这一事实，也就是说，如果我们预测的数据不是来自训练样本，那么，误差会很大。这就是过拟合现象。我们可以通过正则化来降低过拟合。
- 线性回归应用案例
我们使用UCI机器学习项目的酒数据集，一共有1599种酒的测试数据，其中属性取值是0到10之间的整数值。数据下载地址
首先，我们读取.csv文件生成dataframe，可以查看数据的格式和一些统计信息：
```
import pandas as pd
df = pd.read_csv('winequality-red.csv', sep=';')
print(df.head())
print(df.describe())
```
分别输出下表信息：

下面通过matplotlib绘制数据：
```
import matplotlib.pyplot as plt
plt.scatter(df['alcohol'], df['quality'])
plt.xlabel('Alcohol')
plt.ylabel('Quality')
plt.title('酒精度(Alcohol)与品质(Quality)')
plt.show()
```
通过绘制散点图可以看到酒精度和其品质有相对比较弱的正相关的特性，也就是酒精度高的酒可能品质更高。再看看挥发性酸性和酒精品质的相关性：

可以看出挥发性酸和酒精的品质呈负相关。但是我们并不知道每个特性对酒的品质的影响到底有多大，因此，我们可以使用前面的回归模型进行建模。

先将数据分为训练集和测试集，训练回归模型然后评估预测效果：
```
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split


def set_ch():
    from pylab import mpl
    # 指定默认字体
    mpl.rcParams['font.sans-serif'] = ['FangSong']
    # 解决保存图像是负号'-'显示为方块的问题
    mpl.rcParams['axes.unicode_minus'] = False
set_ch()

df = pd.read_csv('winequality-red.csv', sep=';')
#取出除了label列的所有列的head和label标签
feature = df[list(df.columns)[:-1]]
label = df['quality']
x_train, x_test, y_train, y_test = train_test_split(feature, label)
model = LinearRegression()
model.fit(x_train, y_train)
#这里输出的值每次都不一样，因为上面使用了随机划分训练集和测试集
print("R方为：", model.score(x_test, y_test))
```
为了降低因为训练样本选取所带来的随机性，我们可以使用交叉验证来降低这种随机性：
```
import sklearn
scores = sklearn.model_selection.cross_val_score(model, feature, label, cv=5)
print(scores.mean(), scores)
```
cross_val_score可以实现交叉验证功能，其原理如下图：
- 梯度下降法拟合模型
  前面讲的方法都是使用最小化损失函数来计算参数的，也就是公式(4) β=(XTX)−1XTY 。但是当样本的属性很大时， XTX 的计算量很大，而且如果 XTX 的行列式为0，即奇异矩阵时，就无法求得其逆矩阵。所以我们使用另一种方法来求解最小化损失函数的参数。
  首先，我们前面用的损失函数如下：
  (7) SSres=∑ni=1(yi−f(xi))2
  前面参数 β 的求取是通过求导为0解得驻点进行求参的。
梯度下降法的具体推导过程这里就不做详细介绍，主要说一下梯度下降有三种方法，主要是根据每一次迭代时所使用的训练样本的选取方式来进行划分的。第一种是批量梯度下降，每次迭代使用的是所有的训练样本，但是这样做对于数据量巨大的时候迭代会变得异常缓慢；另一种是随机梯度下降，也就是每一次随机从样本中选取一个样本进行训练，但是因为每一次只取一个，所含信息量是很少的，可能会导致收敛过程很震荡；另一种方法是随机批量梯度下降，这种方法综合了前两种方法的优缺点，一般比较常用。

下面使用sklearn的SGDRegressor类来计算模型参数。它可以通过优化不同的成本函数来拟合线性模型，默认的损失函数为上面(7)中的据方误差。

我们使用波士顿住房数据的13个解释变量来预测房屋价格：
首先加载数据集和分割训练集和测试集：
```
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.datasets import load_boston
from sklearn.linear_model import SGDRegressor
from sklearn.model_selection import cross_val_score
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
import numpy as np

def set_ch():
    from pylab import mpl
    # 指定默认字体
    mpl.rcParams['font.sans-serif'] = ['FangSong']
    # 解决保存图像是负号'-'显示为方块的问题
    mpl.rcParams['axes.unicode_minus'] = False
set_ch()

data = load_boston()
x_train, x_test, y_train, y_test = train_test_split(data.data, data.target)
```
然后我们对数据进行归一化处理：
```
y_train = np.reshape(y_train, (y_train.shape[0], 1))
y_test = np.reshape(y_test, (y_test.shape[0], 1))
x_scaler = StandardScaler()
y_scaler = StandardScaler()
x_train = x_scaler.fit_transform(x_train)
y_train = y_scaler.fit_transform(y_train)
x_test = x_scaler.transform(x_test)
y_test = y_scaler.transform(y_test)
```
这里使用StandarScaler进行归一化处理，后面会介绍。最后我们使用交叉验证来完成训练和测试：
```
model = SGDRegressor(loss='squared_loss')
scores = cross_val_score(model, x_train, y_train, cv=5)
print('交叉验证的R方值和均值：', scores, scores.mean())
model.fit(x_train, y_train)
print('测试集R方值：', model.score(x_test, y_test))
```
下一篇文章，将介绍处理不同类型的数据的方法，包括分类数据，文字，图像等。

主要参考资料：
Mastering Machine Learning With scikit-learn（中文文字版）
机器学习-周志华清华大学出版社

注：转载请注明原文出处：
作者：CUG_UESTC
出处：http://blog.csdn.net/qq_31192383/article/details/78723468

Python自动登陆、登出南京理工大学NJUST校园网程序 JimesMz python 开发语言
本文程序针对南京理工大学NJUST和NJUST-FREE校园网开发，其他学校无法使用。文章目录开发目的使用说明参考资料开发目的今天突然想要用代码实现一下自动登陆校园网，上网搜寻了一下。知乎有一些教程，CSDN也有一些完整的代码，但是我跟随教程或者直接运行现有代码都没有能够成功登陆，且NJUST校园网付费，我想要一个“登出”功能，借助Kimi自己写了一下。本人技术不精，以实现功能为主。使用说明请确保
Python爬虫笔记一（来自MOOC） Requests库入门小灰不停前进 #Python python pycharm 爬虫
Python爬虫笔记一通用代码框架：importrequestsdefgetHTMLText(url):try:r=requests.get(url,timeput=30)r.raise_for_status()#如果状态不是200，引发HTTPError异常r.encoding=r.apparemt_encodingreturnr.textexcept:return"产生异常"if__name_
Python调用fofa API接口并写入csv文件中 YOHO !GIRL 网络测绘 python 网络安全
前言一.功能目的二.功能调研三.编写代码1.引入库2.读取数据3.写入csv文件中总结前言上一篇我们讲述了目前较为主流的几款网络探测系统，简单介绍了页面的使用方法。链接如下，点击跳转：网络空间测绘引擎集合：Zoomeye、fofa、360、shodan、censys、鹰图然而当我们需要针对单个引擎进行二次开发时，页面就不能满足我们的需求了，这就需要参考API文档进行简单的数据处理，接下来，给大家介
SenseVoice 部署记录安静六角开源软件
最近试用了SenseVoice（阿里团队开源的语音转文字）效果可以，可以本地部署，有webui界面，测试了万字以上的转换效果可以。首先部署好conda环境和cuda，这个可以查看他人的文章。步骤1.创建虚拟环境：condacreate-nmainenvpython=3.102.然后安装依赖condaactivatemainenvpipinstall-rC:\Users\xx\Documents\P
178.HarmonyOS NEXT系列教程之列表交换组件错误处理机制 harmonyos-next
温馨提示：本篇博客的详细代码已发布到git:https://gitcode.com/nutpi/HarmonyosNext可以下载运行哦！HarmonyOSNEXT系列教程之列表交换组件错误处理机制效果演示1.错误处理架构1.1错误类型定义//错误类型枚举enumErrorType{DATA_ERROR,//数据错误OPERATION_ERROR,//操作错误NETWORK_ERROR,//网络错
Python基于深度学习的动物图片识别技术的研究与实现 Java老徐 Python 毕业设计 python 深度学习开发语言深度学习的动物图片识别技术 Python动物图片识别技术
博主介绍：✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w+、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌文末获取源码联系精彩专栏推荐订阅不然下次找不到哟2022-2024年最全的计算机软件毕业设计选题大全：1000个热门选题推荐✅Java项目精品实战案例《100套》Java微信小程序项目实战《100套》感兴趣的可以先收藏起来，还有大家
【深度学习与大模型基础】第7章-特征分解与奇异值分解 lynn-66 深度学习与大模型基础算法机器学习人工智能
一、特征分解特征分解（EigenDecomposition）是线性代数中的一种重要方法，广泛应用于计算机行业的多个领域，如机器学习、图像处理和数据分析等。特征分解将一个方阵分解为特征值和特征向量的形式，帮助我们理解矩阵的结构和性质。1.特征分解的定义对于一个n×n的方阵A，如果存在一个非零向量v和一个标量λ，使得：则称λ为矩阵A的特征值，v为对应的特征向量。特征分解将矩阵A分解为：其中：Q是由特征
Python实现微信自动发送消息热心市民小汪 python 微信开发语言
实现需求：Python定时发送微信消息importpyautoguiaspgimportpyperclipaspcfromapscheduler.schedulers.blockingimportBlockingScheduler"""实现定时自动发送消息"""#操作间隔为1秒pg.PAUSE=1name='Hello~'msg='是时候点餐啦！！'defmain():#打开微信pg.hotkey
197.HarmonyOS NEXT系列教程之图案锁振动反馈实现详解 harmonyos-next
温馨提示：本篇博客的详细代码已发布到git:https://gitcode.com/nutpi/HarmonyosNext可以下载运行哦！HarmonyOSNEXT系列教程之图案锁振动反馈实现详解效果预览1.振动功能实现startVibrator(vibratorCount?:number){try{vibrator.startVibration({//设置为'preset'，可使用系统预置振动效
187.HarmonyOS NEXT系列教程之列表切换案例交互实现详解 harmonyos-next
温馨提示：本篇博客的详细代码已发布到git:https://gitcode.com/nutpi/HarmonyosNext可以下载运行哦！HarmonyOSNEXT系列教程之列表切换案例交互实现详解效果演示1.交互系统概述1.1交互类型//支持的交互类型1.长按拖动排序2.左滑删除3.点击选择4.拖拽动画1.2手势配置//组合手势配置.gesture(GestureGroup(GestureMod
188.HarmonyOS NEXT系列教程之列表切换案例工具类与最佳实践 harmonyos-next
温馨提示：本篇博客的详细代码已发布到git:https://gitcode.com/nutpi/HarmonyosNext可以下载运行哦！HarmonyOSNEXT系列教程之列表切换案例工具类与最佳实践效果演示1.日志工具类1.1Logger类实现classLogger{privatedomain:number;privateprefix:string;privateformat:string='
186.HarmonyOS NEXT系列教程之列表切换案例数据管理详解 harmonyos-next
温馨提示：本篇博客的详细代码已发布到git:https://gitcode.com/nutpi/HarmonyosNext可以下载运行哦！HarmonyOSNEXT系列教程之列表切换案例数据管理详解效果演示1.数据模型设计1.1ListInfo类@ObservedexportclassListInfo{//列表项数据结构icon:ResourceStr='';//图标资源name:Resource
181.HarmonyOS NEXT系列教程之列表交换组件整体架构详解 harmonyos-next
温馨提示：本篇博客的详细代码已发布到git:https://gitcode.com/nutpi/HarmonyosNext可以下载运行哦！HarmonyOSNEXT系列教程之列表交换组件整体架构详解效果演示1.组件概述1.1功能介绍ListExchangeViewComponent是一个支持列表项交换和删除的自定义组件，主要用于实现如扣款列表等场景。主要功能包括：列表项拖拽排序滑动删除自定义列表项
六十天前端强化训练之第二十九天之深入解析：从零构建企业级Vue项目的完整指南编程星辰海 #前端前端 Vue项目
=====欢迎来到编程星辰海的博客讲解======看完可以给一个免费的三连吗，谢谢大佬！目录一、Vite核心原理与开发优势二、项目创建深度解析三、配置体系深度剖析四、企业级项目架构设计五、性能优化实战六、开发提效技巧七、质量保障体系八、扩展阅读推荐一、Vite核心原理与开发优势1.1为什么选择Vite？Vite采用现代浏览器原生ES模块系统（NativeESM）作为开发服务器，颠覆了传统打包工具的
【论文阅读】Persistent Homology Captures the Generalization of Neural Networks Without A Validation Set 开心星人论文阅读论文阅读
将神经网络表征为加权的无环图，直接根据模型的权重矩阵构造PD。计算相邻batch的权重矩阵PD之间的距离。比较同调收敛性与神经网络的验证精度变化趋势摘要机器学习从业者通常通过监控模型的某些指标来估计其泛化误差，并在训练数值收敛之前停止训练，以防止过拟合。通常，这种误差度量或任务相关的指标是通过一个验证集（holdoutset）来计算的。因为这些数据没有直接用于更新模型参数，通常假设模型在验证集上的
论文阅读笔记——MAGICDRIVE: STREET VIEW GENERATION WITH DIVERSE 3D GEOMETRY CONTROL 寻丶幽风论文阅读笔记论文阅读笔记 3d 人工智能自动驾驶
MagicDrive论文MagicDrive通过对3D数据和文本数据的多模态条件融合和隐式视角转换，实现了高质量、多视角一致的3D场景生成。几何条件编码Cross-attention：针对顺序数据，适合处理文本标记和边界框等可变长度输入。Additiveencoderbranch：对于地图等网络状规则数据，能够有效保留空间结构。对于文本按照模版构建：“Adrivingsceneat{locatio
【笔记】扩散模型（五）：Classifier-Free Guidance 理论推导与代码实现 LittleNyima Diffusion Models 笔记机器学习深度学习
论文链接：Classifier-FreeDiffusionGuidance上一篇文章我们学习了ClassifierGuidance，这种方法通过引入一个额外的分类器，使用梯度引导的方式成功地实现了条件生成。虽然ClassifierGuidance可以直接复用训练好的diffusionmodels，不过这种方法的问题是很明显的，首先需要额外训练一个分类器，而且这个分类器不仅仅分类一般的图像，还需要分
震惊！ “深度学习”都在学习什么扉间798 深度学习学习人工智能
常见的机器学习分类算法俗话说三个臭皮匠胜过诸葛亮这里面集成学习就是将单一的算法弱弱结合算法融合用投票给特征值加权重AdaBoost集成学习算法通过迭代训练一系列弱分类器，给予分类错误样本更高权重，使得后续弱分类器更关注这些样本，然后将这些弱分类器线性组合成强分类器，提高整体分类性能。（一）投票机制投票是一种直观且常用的算法融合策略。在多分类问题中，假设有多个分类器对同一数据进行分类判断。每个分类器
程序代码篇---Pyqt的密码界面 Ronin-Lotus 程序代码篇上位机知识篇 pyqt 数据库 python ubuntu
文章目录前言一、代码二、代码解释2.1用户数据库定义2.2窗口初始化2.3认证逻辑2.5角色处理2.6错误处理优化2.7功能扩展说明2.7.1用户类型区分管理员普通用户其他用户2.7.2安全增强建议三、运行效果四、运行命令五、界面改进建议5.1密码显示5.2用户头像显示5.3输入框动画效果5.4加载进度显示5.5键盘快捷键前言本文简单介绍了在Ubuntu系统上使用Python的Pyqt创建密码登录
【论文阅读】Availability Attacks Create Shortcuts 开心星人论文阅读论文阅读
还得重复读这一篇论文，有些地方理解不够透彻可用性攻击通过在训练数据中添加难以察觉的扰动，使数据无法被机器学习算法利用，从而防止数据被未经授权地使用。例如，一家私人公司未经用户同意就收集了超过30亿张人脸图像，用于构建商业人脸识别模型。为解决这些担忧，许多数据投毒攻击被提出，以防止数据被未经授权的深度模型学习。它们通过在训练数据中添加难以察觉的扰动，使模型无法从数据中学习太多信息，从而导致模型在未见
深度学习 | pytorch + torchvision + python 版本对应及环境安装 zfgfdgbhs 深度学习 python pytorch
目录一、版本对应二、安装命令（pip）1.版本（1）v2.5.1~v2.0.0（2）v1.13.1~v1.11.0（3）v1.10.1~v1.7.02.安装全过程（1）选择版本（2）安装结果参考文章一、版本对应下表来自pytorch的github官方文档：pytorch/vision:Datasets,TransformsandModelsspecifictoComputerVisionpytor
Python读取.nc文件的方法与技术详解傻啦嘿哟关于python那些事儿人工智能前端服务器
目录一、引言二、使用netCDF4库读取.nc文件安装netCDF4库导入netCDF4库打开.nc文件获取变量读取变量数据案例与代码三、使用xarray库读取.nc文件安装xarray库导入xarray库打开.nc文件访问变量数据案例与代码四、性能与优化分块读取使用Dask进行并行计算减少不必要的变量加载五、其他注意事项文件路径变量命名数据类型文件关闭六、总结一、引言.nc文件，即NetCDF（
《面向模式的软件体系结构3-资源管理模式》读书笔记（7）--- Coordinator模式 weixin_33699914 人工智能
3.3Coordinator模式Coordinator（协调者）模式描述了如何通过协调涉及多个参与者（每个参与者都包含资源、资源使用者和资源提供者）的任务的完成来维护系统的一致性。这个模式提出了一个解决方案，使得在涉及多个参与者的任务中，或者所有参与者的任务都完成，或者一项任务都没有完成。这确保了系统总是处于一致的状态。1.问题很多系统都会执行涉及不止一个参与者的任务。一个参与者是一个主动实体，既
机器学习 Day01人工智能概述山北雨夜漫步机器学习人工智能
1.什么样的程序适合在gpu上运行计算密集型的程序：此类程序主要运算集中在寄存器，寄存器读写速度快，而GPU拥有强大的计算能力，能高效处理大量的寄存器运算，因此适合在GPU上运行。像科学计算中的数值模拟、密码破解等场景的程序，都属于计算密集型，在GPU上运行可大幅提升运算速度。易于并行的程序：GPU采用SIMD架构，有众多核心，同一时间每个核心适合做相同的事。易于并行的程序能充分利用GPU这一特性
Python画词云图，Python画圆形词云图，API详解请一直在路上 python 开发语言
在Python中，词云图的常用库是wordcloud。以下是核心API参数的详细讲解，以及一个完整的使用示例。一、参数类型默认值说明参数类型默认值说明widthint400词云图的宽度（像素）heightint200词云图的高度（像素）background_colorstr“black”背景颜色，可以是颜色名称（如“white”）或十六进制值（如“#FFFFFF”）colormapstr/matp
23、nc文件快速切片与索引爱转呼啦圈的小兔子气象数据处理与可视化 python 气象气象可视化气候变化
1前言在气象、海洋学和环境科学等领域，.nc（NetCDF）格式文件是存储和共享多维科学数据的常用格式。这些数据文件通常包含大量的经度、纬度、时间和垂直层次数据。在处理这些数据时，研究人员常常需要根据特定的地理和时间范围提取数据，以便进行深入分析。为此，我们开发了一个名为nc_slice的Python函数，用于从一个或多个.nc格式文件中高效地筛选和提取数据。nc_slice函数提供了一种简洁而灵
【最新】TensorFlow、cuDNN、CUDA三者之间的最新版本对应及下载地址江上_酒开发环境及工具配置 TensorFlow CUDA cuDNN
TensorFlow、cuDNN、CUDA对应关系官网查询地址CUDA下载地址cuDNN下载地址VersionPythonversionCompilerBuildtoolscuDNNCUDAtensorflow_gpu-2.9.03.7-3.10MSVC2019Bazel5.0.08.111.2tensorflow_gpu-2.8.03.7-3.10MSVC2019Bazel4.2.18.111.
Python读取nc文件的几种方式请一直在路上 python
在Python中，有多种方式可以读取NetCDF(.nc)文件。常见的方法包括使用以下库：1.netCDF4这是最常用的库之一，提供了直接读取、写入和处理NetCDF文件的功能。它支持版本3和版本4的NetCDF文件格式。安装：pipinstallnetCDF4用法：importnetCDF4asnc#打开文件dataset=nc.Dataset('example.nc')#查看文件的维度prin
UV - Python 包管理丽英y Python uv python 开发语言
文章目录创建uv项目已有项目已有uv项目创建uv项目#创建项目uvinitm3#创建环境cdm3uvvenv--python3.11#激活环境source.venv/bin/activate#添加库uvaddflask如果创建项目后，给库取别的名字，add的时候，会自动创建.venv文件夹>uvvenv--python3.12e312[0]UsingCPython3.12.8interpreter
漫谈JVM weixin_34111790 运维 java python
2019独角兽企业重金招聘Python工程师标准>>>背景介绍创建了一个技术类公众号:一起源码分析，里面会分享最新的开源代码、源码解读、开发技巧等，欢迎大家关注。JVM已经是Java开发的必备技能了，JVM相当于Java的操作系统。JVM,javavirtualmachine,即Java虚拟机，是运行javaclass文件的程序。Java代码经过Java编译器编译，会编译成class文件，一种平台
jsonp 常用util方法 hw1287789687 jsonp jsonp常用方法 jsonp callback
jsonp 常用java方法 (1)以jsonp的形式返回:函数名(json字符串) /*** * 用于jsonp调用 * @param map : 用于构造json数据 * @param callback : 回调的javascript方法名 * @param filters : <code>SimpleBeanPropertyFilter theFilt
多线程场景 alafqq 多线程
0 能不能简单描述一下你在java web开发中需要用到多线程编程的场景？0 对多线程有些了解，但是不太清楚具体的应用场景，能简单说一下你遇到的多线程编程的场景吗？ Java多线程 2012年11月23日 15:41 Young9007 Young9007 4 0 0 4 Comment添加评论关注(2) 3个答案按时间排序按投票排序 0 0 最典型的如： 1、
Maven学习——修改Maven的本地仓库路径 Kai_Ge maven
安装Maven后我们会在用户目录下发现.m2 文件夹。默认情况下，该文件夹下放置了Maven本地仓库.m2/repository。所有的Maven构件(artifact)都被存储到该仓库中，以方便重用。但是windows用户的操作系统都安装在C盘，把Maven仓库放到C盘是很危险的，为此我们需要修改Maven的本地仓库路径。
placeholder的浏览器兼容 120153216 placeholder
【前言】自从html5引入placeholder后，问题就来了，不支持html5的浏览器也先有这样的效果，各种兼容，之前考虑，今天测试人员逮住不放，想了个解决办法，看样子还行，记录一下。【原理】不使用placeholder，而是模拟placeholder的效果，大概就是用focus和focusout效果。【代码】 <scrip
debian_用iso文件创建本地apt源 2002wmj Debian
1.将N个debian-506-amd64-DVD-N.iso存放于本地或其他媒介内，本例是放在本机/iso/目录下 2.创建N个挂载点目录如下： debian:~#mkdir –r /media/dvd1 debian:~#mkdir –r /media/dvd2 debian:~#mkdir –r /media/dvd3 …. debian:~#mkdir –r /media
SQLSERVER耗时最长的SQL 357029540 SQL Server
对于DBA来说，经常要知道存储过程的某些信息： 1. 执行了多少次 2. 执行的执行计划如何 3. 执行的平均读写如何 4. 执行平均需要多少时间列名 &
com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 7454103 eclipse
今天eclipse突然报了com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 错误，并且工程文件打不开了，在网上找了一下资料，然后按照方法操作了一遍，好了，解决方法如下：错误提示信息： An error has occurred.See error log for more details. Reason: com/genuitec/
用正则删除文本中的html标签 adminjun java html 正则表达式去掉html标签
使用文本编辑器录入文章存入数据中的文本是HTML标签格式，由于业务需要对HTML标签进行去除只保留纯净的文本内容，于是乎Java实现自动过滤。如下： public static String Html2Text(String inputString) { String htmlStr = inputString; // 含html标签的字符串 String textSt
嵌入式系统设计中常用总线和接口 aijuans linux 基础
嵌入式系统设计中常用总线和接口任何一个微处理器都要与一定数量的部件和外围设备连接，但如果将各部件和每一种外围设备都分别用一组线路与CPU直接连接，那么连线
Java函数调用方式——按值传递 ayaoxinchao java 按值传递对象基础数据类型
Java使用按值传递的函数调用方式，这往往使我感到迷惑。因为在基础数据类型和对象的传递上，我就会纠结于到底是按值传递，还是按引用传递。其实经过学习，Java在任何地方，都一直发挥着按值传递的本色。首先，让我们看一看基础数据类型是如何按值传递的。 public static void main(String[] args) { int a = 2;
ios音量线性下降 bewithme ios音量
直接上代码吧 //second 几秒内下降为0 - (void)reduceVolume:(int)second { KGVoicePlayer *player = [KGVoicePlayer defaultPlayer]; if (!_flag) { _tempVolume = player.volume;
与其怨它不如爱它 bijian1013 选择理想职业规划
抱怨工作是年轻人的常态，但爱工作才是积极的心态，与其怨它不如爱它。一般来说，在公司干了一两年后，不少年轻人容易产生怨言，除了具体的埋怨公司“扭门”，埋怨上司无能以外，也有许多人是因为根本不爱自已的那份工作，工作完全成了谋生的手段，跟自已的性格、专业、爱好都相差甚远。
一边时间不够用一边浪费时间 bingyingao 工作时间浪费
一方面感觉时间严重不够用，另一方面又在不停的浪费时间。每一个周末，晚上熬夜看电影到凌晨一点，早上起不来一直睡到10点钟，10点钟起床，吃饭后玩手机到下午一点。精神还是很差，下午像一直野鬼在城市里晃荡。为何不尝试晚上10点钟就睡，早上7点就起，时间完全是一样的，把看电影的时间换到早上，精神好，气色好，一天好状态。控制让自己周末早睡早起，你就成功了一半。有多少个工作
【Scala八】Scala核心二：隐式转换 bit1129 scala
Implicits work like this: if you call a method on a Scala object, and the Scala compiler does not see a definition for that method in the class definition for that object, the compiler will try to con
sudoku slover in Haskell (2) bookjovi haskell sudoku
继续精简haskell版的sudoku程序，稍微改了一下，这次用了8行，同时性能也提高了很多，对每个空格的所有解不是通过尝试算出来的，而是直接得出。 board = [0,3,4,1,7,0,5,0,0, 0,6,0,0,0,8,3,0,1, 7,0,0,3,0,0,0,0,6, 5,0,0,6,4,0,8,0,7,
Java-Collections Framework学习与总结-HashSet和LinkedHashSet BrokenDreams linkedhashset
本篇总结一下两个常用的集合类HashSet和LinkedHashSet。它们都实现了相同接口java.util.Set。Set表示一种元素无序且不可重复的集合；之前总结过的java.util.List表示一种元素可重复且有序
读《研磨设计模式》-代码笔记-备忘录模式-Memento bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; /* * 备忘录模式的功能是，在不破坏封装性的前提下，捕获一个对象的内部状态，并在对象之外保存这个状态，为以后的状态恢复作“备忘”
《RAW格式照片处理专业技法》笔记 cherishLC PS
注意，这不是教程！仅记录楼主之前不太了解的一、色彩（空间）管理作者建议采用ProRGB（色域最广），但camera raw中设为ProRGB，而PS中则在ProRGB的基础上，将gamma值设为了1.8（更符合人眼）注意：bridge、camera raw怎么设置显示、输出的颜色都是正确的（会读取文件内的颜色配置文件），但用PS输出jpg文件时，必须先用Edit->conv
使用 Git 下载 Spring 源码编译 for Eclipse crabdave eclipse
使用 Git 下载 Spring 源码编译 for Eclipse 1、安装gradle，下载 http://www.gradle.org/downloads 配置环境变量GRADLE_HOME，配置PATH %GRADLE_HOME%/bin，cmd，gradle -v 2、spring4 用jdk8 下载 https://jdk8.java.
mysql连接拒绝问题 daizj mysql 登录权限
mysql中在其它机器连接mysql服务器时报错问题汇总一、[running][email protected]:~$mysql -uroot -h 192.168.9.108 -p //带-p参数，在下一步进行密码输入 Enter password: //无字符串输入 ERROR 1045 (28000): Access
Google Chrome 为何打压 H.264 dsjt apple html5 chrome Google
Google 今天在 Chromium 官方博客宣布由于 H.264 编解码器并非开放标准，Chrome 将在几个月后正式停止对 H.264 视频解码的支持，全面采用开放的 WebM 和 Theora 格式。 Google 在博客上表示，自从 WebM 视频编解码器推出以后，在性能、厂商支持以及独立性方面已经取得了很大的进步，为了与 Chromium 现有支持的編解码器保持一致，Chrome
yii 获取控制器名和方法名 dcj3sjt126com yii framework
1. 获取控制器名在控制器中获取控制器名: $name = $this->getId(); 在视图中获取控制器名: $name = Yii::app()->controller->id; 2. 获取动作名在控制器beforeAction()回调函数中获取动作名: $name =
Android知识总结（二） come_for_dream android
明天要考试了，速速总结如下 1、Activity的启动模式 standard：每次调用Activity的时候都创建一个（可以有多个相同的实例，也允许多个相同Activity叠加。） singleTop：可以有多个实例，但是不允许多个相同Activity叠加。即，如果Ac
高洛峰收徒第二期：寻找未来的“技术大牛” ——折腾一年，奖励20万元 gcq511120594 工作项目管理
高洛峰，兄弟连IT教育合伙人、猿代码创始人、PHP培训第一人、《细说PHP》作者、软件开发工程师、《IT峰播》主创人、PHP讲师的鼻祖！首期现在的进程刚刚过半，徒弟们真的很棒，人品都没的说，团结互助，学习刻苦，工作认真积极，灵活上进。我几乎会把他们全部留下来，现在已有一多半安排了实际的工作，并取得了很好的成绩。等他们出徒之日，凭他们的能力一定能够拿到高薪，而且我还承诺过一个徒弟，当他拿到大学毕
linux expect heipark expect
1. 创建、编辑文件go.sh #!/usr/bin/expect spawn sudo su admin expect "*password*" { send "13456\r\n" } interact 2. 设置权限 chmod u+x go.sh 3.
Spring4.1新特性——静态资源处理增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
idea ubuntuxia 乱码 liyonghui160com
1.首先需要在windows字体目录下或者其它地方找到simsun.ttf 这个字体文件。 2.在ubuntu 下可以执行下面操作安装该字体： sudo mkdir /usr/share/fonts/truetype/simsun sudo cp simsun.ttf /usr/share/fonts/truetype/simsun fc-cache -f -v
改良程序的11技巧 pda158 技巧
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短永远永远不要把同一个变量用于多个不同的
300个涵盖IT各方面的免费资源（下）——工作与学习篇 shoothao 创业免费资源学习课程远程工作
工作与生产效率: A. 背景声音 Noisli:背景噪音与颜色生成器。 Noizio:环境声均衡器。 Defonic:世界上任何的声响都可混合成美丽的旋律。 Designers.mx:设计者为设计者所准备的播放列表。 Coffitivity:这里的声音就像咖啡馆里放的一样。 B. 避免注意力分散 Self Co
深入浅出RPC uule rpc
深入浅出RPC-浅出篇深入浅出RPC-深入篇 RPC Remote Procedure Call Protocol 远程过程调用协议它是一种通过网络从远程计算机程序上请求服务，而不需要了解底层网络技术的协议。RPC协议假定某些传输协议的存在，如TCP或UDP，为通信程序之间携带信息数据。在OSI网络通信模型中，RPC跨越了传输层和应用层。RPC使得开发

机器学习与scikit-learn（一）——回归模型

安装

线性回归

你可能感兴趣的:(笔记,机器学习,python,博客)