有梦想的雨

线性回归（Linear Regression）

1. 数学描述

$Y=\theta_0+\theta_1 X_1+\cdots+\theta_iX_i+\cdots+\theta_nX_n+\epsilon$ ，其中：

$Y$ 是要预测的因变量（结果）；
$X_1,\cdots,X_n$ 是自变量（协变量）的特征；
$\theta_0$ 是偏置， $\theta_1,\cdots,\theta_n$ 是权重系数，这些是需要学习和估计的；
$\epsilon$ 是偏差（随机误差）,服从正态分布， $\epsilon\sim N(0,\sigma^2)$ ，其中， $\sigma^2$ 未知。

需要注意的是：模型强加了许多需要检查/证明的假设！ $Y$ 应该是连续的，不适合于分类/二进制因变量。 $X_i$ 既可以是连续的或离散的。

线性回归看起来是过于简单的，但这并不简单的意味着， $Y$ 线性地依赖于 $X_i$ 。但是线性回归是非常有用和重要的，它是非线性回归和许多先进回归模型的基本框架。

线性项指的是 $\theta_i$ ，而非 $X_i$ 。如： $Y=\theta_0+\theta_1 X_1+\theta_2 e^{X_2}+\cdots+\theta_iX^3_i+\cdots+\theta_nX_2X_n+\epsilon$ ，依然是一个线性回归模型。准确的说， $X_1,X_2$ 是协变量，而模型中的 $X_1,e^{X_2},X^3_i,X_2X_n$ 是预测因子或特征。

2 简单线性回归

若 $Y=\theta_0+\theta_1 X+\epsilon$ ，则在给定 $X = x$ 时， $Y$ 的条件均值是关于 $x$ 的线性函数，
即： $\displaystyle \mu_{Y|X=x}=\mathrm E(Y|X=x)=\theta_0+\theta_1 x$ .

若 $\hat{\theta_0},\hat{\theta_1}$ 分别是 $\theta_0,\theta_1$ 的预估值，则有： $\displaystyle \hat\mu_{Y|X=x}=\hat\theta_0+\hat\theta_1 x$ ，这是 $\mathrm E(Y|X=x)$ 的点估计。这是对所有 $x$ 对应的平均因变量的估计。

同样的，使用 $\displaystyle \hat y_i=\hat\theta_0+\hat\theta_1 x_i$ 作为当输入是 $X=x_i$ 时的预测值， $y_i$ 是真实值。令 $\displaystyle e_i=y_i-\hat y_i$ 作为第 $i$ 项的残差。

因此，定义 残差平方和（residual sum of squares ，RSS） 为： $\displaystyle RSS(\hat{\theta_0},\hat{\theta_1})=\sum^n_{i=1}e^2_i=\sum^n_{i=1}(y_i-(\hat{\theta_0}+\hat{\theta_1}x_i))^2$ ，其中 $\{y_i,x_i,\;i=1,\cdots,n\}$ 是训练集。

能够使 $RSS(\hat{\theta_0},\hat{\theta_1})$ 最小的 $\hat{\theta_0},\hat{\theta_1}$ 就是最好的预测值，利用 最小二乘法（least squares method，LSM） 得到，可得： $\displaystyle \left\{ \begin{aligned} \hat{\theta_0}=\bar y-\hat{\theta_1}\bar x, \\ \hat{\theta_1}=\frac{\sum(x_i-\bar x)(y_i-\bar y)}{\sum(x_i-\bar x)^2}, \\ \end{aligned} \right.$

其中， $\bar x, \bar y$ 是训练集 $x_i, y_i$ 的均值。

3 一般情况的线性回归

3.1 常规数学计算

使用 最小均方（least mean squares，LMS） 进行一般化计算，其过程如下：

3.2 矩阵计算

3.3 概率阐述

因为， $\displaystyle\mathrm{E}[\hat{\theta}]=\mathrm{E}[\;(X^TX)^{-1}X^T\vec{y}\;]=\mathrm{E}[\;(X^TX)^{-1}X^T(\theta^TX+\epsilon)\;]=\theta+(X^TX)^{-1}X^T\mathrm{E}[\epsilon]=\theta$

故， $\hat{\theta}$ 是 $\theta$ 的无偏估计。

若 $\displaystyle \epsilon^{(i)}\sim\mathcal N(0,\sigma^2)$ ，则有 $\displaystyle \hat\theta\sim\mathcal N(\theta,\sigma^2(X^TX)^{-1})$ ；

当样本数量 $n$ 足够大时，有 $\displaystyle \left( \begin{array}{ccc}\hat{\theta} \\\hat\sigma^2\end{array} \right )\sim\mathcal N\left(\left[\begin{array}{ccc}{\theta} \\\sigma^2\end{array} \right ],\left[\begin{array}{ccc}\sigma^2(X^TX)^{-1}, &0 \\0,& \frac{2\sigma^4}{n}\end{array} \right ]\right )$ 。

4. 正则化——岭回归（Ridge regression）

4.1 LMS求解的问题

利用最小二乘法对模型参数进行估计时，得到 $\hat\theta=(X'X)^{-1}X'\vec y$ ；需要注意的是，该方法需要矩阵 $X^{'} X$ 的逆存在。

当 $X^{'} X$ 的逆不存在或者近似奇异时，有 $\displaystyle\mathrm{E}||\hat{\theta}-\theta||^2=\sigma^2\cdot tr((X'X)^{-1})$ 。其中， $t r (A)$ 是矩阵 $A$ 的迹，即 $A$ 的对角线元素的和。

多重共线性问题（Multicollinearity issue）：当 $X$ 中至少有两列是强相关的，那么 $X^{'} X$ 几乎是奇异的。而当矩阵是接近奇异的，或矩阵规模很大时，结果往往是不准确的。

因此，对模型进行正则化是有必要的：

向学习问题的公式中添加一个额外的惩罚项以减少过拟合的风险；
对于学习算法的任何修正，目的都是减小 泛化误差，而非 训练误差。

添加正则项后，其公式化形式为： $\displaystyle \argmin_fL(f(X),Y)\to\argmin_fL(f(x),Y)+R(f)$

4.2 岭回归

当存在多重线性问题时，就需要在对参数 $\hat\theta$ 做估计时，需要对参数做出一些限制，如

$\displaystyle\sum^n_{i=0}(y^{(i)}-\theta_0-\theta_1 x^{(i)}_1-\cdots-\theta_ix^{(i)}_j-\cdots-\theta_px^{(i)}_p)^2$ ，需满足 $\displaystyle\sum^p_{j=0}\theta_j^2j=0∑pθj2<t$

上述约束优化问题等价于： $\displaystyle \theta^{ridge}_\lambda=\argmin_\theta\sum^n_{i=1}(y^{(i)}-\sum^p_{j=0}\theta_jx^{(i)}_j)^2+\lambda\sum^p_{j=1}\theta_j^2$ ，其中， $\lambda>0$ 是缩放系数（shrinkage parameter）。

对上式的一些说明：

最小化带惩罚项的 RSS，其第二项控制参数的复杂度；
上式同时对误差项和模型复杂度进行优化；
注意到惩罚项不包括 $\theta_0$ ；
$\lambda$ 用于控制惩罚项，需要提前选择。

对于大多数问题，为了数学表达上的便利，会对数据进行中心化归一处理，可使得 $\theta_0=0$ ，则问题变为：
$\displaystyle \theta^{ridge}_\lambda=\argmin_\theta\sum^n_{i=1}(y^{(i)}-\sum^p_{j=1}\theta_jx^{(i)}_j)^2+\lambda\sum^p_{j=1}\theta_j^2$ 。

以矩阵化形式表述为： $\displaystyle \theta^{ridge}_\lambda=\argmin_\theta ||\vec y-X\theta||^2+\lambda\theta^TI_p\theta$ ，其中 $X$ 不能是列向量， $I_p$ 是尺寸为 $p$ 的单位阵。

可得， $\displaystyle \theta^{ridge}_\lambda=(X^TX+\lambda I_p)^{-1}X^T\vec y$ ；
偏差：岭回归的 $bias^2$ 高于最小二乘法；
方差：岭回归的方差小于最小二乘法；
当存在非零的 $\lambda$ 时，岭回归的结果优于最小二乘法。

4.3 LASSO 回归

$\displaystyle \theta^{lasso}_\lambda=\argmin_\theta\sum^n_{i=1}(y^{(i)}-\sum^p_{j=0}\theta_jx^{(i)}_j)^2+\lambda\sum^p_{j=1}|\theta_j|$ .

LASSO 采用了另一种惩罚项，用系数的绝对值替代系数的平方；
当需要做变量选择时经常采用LASSO 回归，因为当 $\lambda$ 足够大时，它会使得某些系数趋于变成 0;
LASSO 具有更好的解释性，因为它可以生成稀疏解；
岭回归选择所有的特征做预测，这导致缺乏解释性，但是其预测误差更好。

4.4 贝叶斯视角下的正则化

贝叶斯理论： $P(\theta|D)\sim P(D|\theta)\cdot P(\theta)$ ，其对应于 $Posterior(后验)\sim Likelihood(似然)\cdot Prior(先验)$ ；

若将 $\theta$ 的先验视为给定方差，均值为 0 的高斯分布时，最大化后验，即可得到岭回归的形式；
若将先验视为拉普拉斯分布(laplacian distributed)，则可得到 LASSO回归。

4.5 弹性网络（elastic net）

即在岭回归和LASSO回归之间做一个折中：
$\displaystyle \hat\theta_{en}=\argmin_\theta\sum^n_{i=1}(y^{(i)}-\sum^p_{j=0}\theta_jx^{(i)}_j)^2+\lambda\sum^p_{j=1}(\alpha\theta_j^2+(1-\alpha)|\theta_j|)$

其中， $\lambda\ge0，0<\alpha<1$ 。

弹性网络可以同 LASSO一样进行变量特征选择，同时像岭回归一样对相应的系数进行系数缩减。

5. Sklearn-Learning 中的线性回归模型

5.1标准线性回归

在机器学习库Sklearn-Learning 中，标准线性回归模型的接口如下：

sklearn.linear_model.LinearRegression(*, fit_intercept=True, 
										normalize='deprecated', 
										copy_X=True, 
										n_jobs=None, 
										positive=False)

其是一个拟合权重系数 $w = (w_1，... ，w_p)$ 的线性模型，以最小化数据观测目标和线性近似预测目标之间的残差平方和。各项参数及其含义如下：

参数1：fit_intercept，bool类型，默认为 True，其含义为是否向模型中添加偏置项（及截断项）

参数2：normalize，bool类型, 默认为 False。
	当 fit_intercept=False 时该参数被忽略；
	如果 fit_intercept=True，回归变量 x 将在回归之前通过减去平均值除以 l2范数，即做归一化。

参数3：copy_X，bool类型, 默认为True。
	如果为真，x 将被复制; 否则，它会被覆盖。

参数4：n_jobs，int类型, default=None。
	设定用于计算的cpu核数量。如果 n_tragets > 1，而变量 X 又是稀疏的；或者如果 positive=True 时，会在大问题时提供加速。
	n_jobs = None 表示 核数量为1；
	n_jobs = -1 时，表示cpu中所有的核都参与工作。

参数5：positive，bool类型, default=False。
		当positive = True 时，强制系数为正。此选项仅支持稠密数组。

5.2 岭回归

在机器学习库Sklearn-Learning 中，岭回归模型的目标函数为：||y - Xw||^2_2 + alpha * ||w||^2_2，其函数接口如下：

sklearn.linear_model.Ridge(alpha=1.0, *, 
							fit_intercept=True, 
							normalize='deprecated', 
							copy_X=True, 
							max_iter=None, 
							tol=0.001, 
							solver='auto', 
							positive=False, 
							random_state=None)

其中，各项参数含义如下：

参数1： alpha, {float, ndarray of shape (n_targets,)}, default=1.0;
		当alpha是float时，用于控制正则项的强度，必须是大于0的实数；
		当alpha是ndarray时，则视为针对具体的目标系数进行惩罚，因此必须和目标系数数量相对于。

参数2：fit_intercept，bool类型，默认为 True，其含义为是否向模型中添加偏置项（及截断项）

参数3：normalize，bool类型, 默认为 False。
	当 fit_intercept=False 时该参数被忽略；
	如果 fit_intercept=True，回归变量 x 将在回归之前通过减去平均值除以 l2范数，即做归一化。

参数4：copy_X，bool类型, 默认为True。
	如果为真，x 将被复制; 否则，它会被覆盖。

参数5：max_iter，int类型, default=None，求解器的最大迭代次数；
		当求解器是'sparse_cg'或'lsqr'时，默认值由scipy.sparse.linalg决定；
		当求解器是'sag' 时，默认值是 1000；
		当求解器是 'lfbs'时，默认值是 15000；

参数6：tol，float类型, default=1e-3；
		解的精度；

参数7：solver，str类型，default='auto'；求解器；
		'auto'，基于输入的数据类型自动选择求解器；
		'svd'，使用 x 的奇异值分解来计算岭回归系数。它是最稳定的求解器，特别是对于奇异矩阵来说，它比'cholesky'更稳定，但代价是速度更慢；
		'cholesky'，使用标准的 scipy.linalg.solve 函数来获得一个封闭形式的解；
		'sparse_cg'，使用共轭梯度求解器，如 scipy.sparse.linalg.cg。作为一种迭代算法，对于大规模数据(需要设置为 tol 和 max_iter) ，这种求解器比“ cholesky”更合适；
		'lsqr'，‘ lsqr’使用专用的正则化最小二乘例程 scipy.sparse.linalg.lsqr，它是最快的，并使用了一个迭代过程；
		'sag'，使用随机平均梯度下降法，'SAGA'使用改进后的无偏见版本，名为 SAGA。两种方法都使用了迭代过程，当 n 样本和 n 特征都很大时，它们通常比其他求解器更快。注意，'sag'和'saga'的快速收敛只有在大致相同规模的特征上才能得到保证；
		'lbfgs'，使用在 scipy.optimize.minimize 中实现的 L-BFGS-B 算法，只有当positive为 True 时才能使用。
		注意：除了 'svd'，所有的求解器都支持稀疏和稠密的数据；
			但是，只有当fit_intercept=True时，'lsqr'，'sag'，'sparse_cg'，'lbfgs'才能支持稀疏输入.

参数8：positive，bool类型, default=False。
		当positive = True 时，强制系数为正。此选项仅支持稠密数组。

参数9：random_state，int类型,  default=None；
		当求解器为 'sag'或'saga'时，该项用于控制打乱数据。

5.3 LASSO回归

在机器学习库Sklearn-Learning 中，LASSO回归模型的目标函数为：(1 / (2 * n_samples)) * ||y - Xw||^2_2 + alpha * ||w||_1，其函数接口如下：

sklearn.linear_model.Lasso(alpha=1.0, *, 
							fit_intercept=True, 
							normalize='deprecated', 
							precompute=False, 
							copy_X=True, 
							max_iter=1000, 
							tol=0.0001, 
							warm_start=False, 
							positive=False, 
							random_state=None, 
							selection='cyclic')

各项参数指标含义如下，与岭回归中有重复的在此不做重复描述：

参数4：precompute，bool 或 array-like of shape (n_features, n_features), default=False；
		是否使用预计算的 Gram 矩阵来加速计算；
		Gram 矩阵也可以作为参数传递；
		对于稀疏输入，此选项始终为 False 以保持稀疏性；
		
参数8：warm_start，bool类型，default=False；
		当warm_start=True 时，重用前一个调用的解决方案以适应初始化；
		否则，只需删除前一个解决方案；

参数11：selection，str类型，default='cyclic'；
		如果selection='random'，每次迭代都会更新一个随机系数；这(设置为“随机”)通常会导致明显加快收敛速度，特别是当 tol 高于1e-4时。
		如果selection='rcyclic'，循环遍历。

5.4 弹性网络

在机器学习库Sklearn-Learning 中，弹性回归模型的目标函数为：1 / (2 * n_samples) * ||y - Xw||^2_2+ alpha * l1_ratio * ||w||_1+ 0.5 * alpha * (1 - l1_ratio) * ||w||^2_2，其函数接口如下：

sklearn.linear_model.ElasticNet(alpha=1.0, *, 
								l1_ratio=0.5, 
								fit_intercept=True, 
								normalize='deprecated', 
								precompute=False, 
								max_iter=1000, 
								copy_X=True, 
								tol=0.0001, 
								warm_start=False, 
								positive=False, 
								random_state=None, 
								selection='cyclic')

各项参数指标含义如下，与LASSO回归中有重复的在此不做重复描述：

参数2：l1_ratio，float类型, default=0.5；
		用于控制 l1范数和 l2范数各自在惩罚项中的占比；

强化学习中策略网络模型设计与优化技巧数字扫地僧计算机视觉深度学习
I.引言强化学习（ReinforcementLearning,RL）是一种通过与环境交互，学习如何采取行动以最大化累积奖励的机器学习方法。策略网络（PolicyNetwork）是强化学习中一种重要的模型，它直接输出动作的概率分布或具体的动作。本篇博客将深入探讨策略网络的设计原则、优化技巧，并结合具体实例展示其应用。II.策略网络的基本概念A.策略网络的定义策略网络是一种神经网络，它接受当前状态作为
基于Python编程语言实现“机器学习”，用于车牌识别项目我的sun&shine Python python 机器学习计算机视觉
基于Python的验证码识别研究与实现1.摘要验证码的主要目的是区分人类和计算机，用来防止自动化脚本程序对网站的一些恶意行为，目前绝大部分网站都利用验证码来阻止恶意脚本程序的入侵。验证码的自动识别对于减少自动登录时长，识别难以识别的验证码图片有着重要的作用。对验证码图像进行灰度化、二值化、去离散噪声、字符分割、归一化、特征提取、训练和字符识别等过程可以实现验证码自动识别。首先将原图片进行灰度化处理
DS/ML：数据科学技术之数据科学生命周期(四大层次+机器学习六大阶段+数据挖掘【5+6+6+4+4+1】步骤)的全流程最强学习路线讲解之详细攻略一个处女座的程序猿资深文章(前沿/经验/创新)DataScience ML 数据科学数据科学的生命周期机器学习
DS/ML：数据科学技术之数据科学生命周期(四大层次+机器学习六大阶段+数据挖掘【5+6+6+4+4+1】步骤)的全流程最强学习路线讲解之详细攻略导读：本文章是博主在数据科学和机器学习领域，先后实战过几百个应用案例之后的精心总结，应该是完全覆盖了数据科学的整个生命周期及其各个阶段的要点。其中机器学习领域六大阶段更是在整个数据科学生命周期中扮演着极其重要的角色。同时，因为涉及到博主出书中出版社要求在
给普通人看的深度学习说明书：用快递系统理解AI如何思考嵌入式Jerry Python AI 人工智能深度学习
第一章：理解AI的思维方式（快递版）1.1快递分拣站的故事假设你管理一个快递分拣站：传统方法：手动制定规则（比如根据邮编分拣）机器学习：观察老员工的分拣记录，总结规律深度学习：搭建自动分拣流水线，自主发现隐藏规则1.2神经网络就像智能分拣机传送带（输入层）：接收包裹信息（图片像素/文字等）#就像扫描快递单input_data=[0.2,0.7,0.1]#归一化后的特征数据分拣工人（隐藏层）：每个工
简单理解机器学习中top_k、top_p、temperature三个参数的作用无级程序员机器学习人工智能
在机器学习中，top_k、top_p和temperature是用于控制生成模型（如语言模型）输出质量的参数，尤其在文本生成任务中常见。然而，网上文章很多很全，但大多晦涩难懂，今天我们来用最简单的语言谈谈它们的具体作用：1.点菜式筛选法：top_k参数英文全称：top-k中文名称：前k个具体意义：top_k参数就像是你在餐厅点菜时，服务员只给你推荐菜单上前k名的招牌菜。在AI文本生成中，top_k参
小白零基础学数学建模系列-引言与课程目录川川菜鸟数学建模小白到精通系列数学建模
目录引言一、我们的专辑包含哪些内容？第一周：数学建模基础与工具第二周：高级数学建模技巧与应用第三周：机器学习基础与数据处理第四周：监督学习与无监督学习算法第五周：神经网络二、学完本专辑能收获到什么？三、适合什么样的人群学习？四、如何学习本专辑？课程目录第1周：数学建模基础与工具第1天：数学建模入门介绍第2天：数学建模工具介绍第3天：线性回归与曲线拟合第4天：线性规划第5天：动态规划第2周：高级数学
初始OpenCV 指尖下的技术 OpenCV opencv 人工智能计算机视觉
OpenCV是一个功能强大、应用广泛的计算机视觉库，它为开发人员提供了丰富的工具和算法，可以帮助他们快速构建各种视觉应用。随着计算机视觉技术的不断发展，OpenCV也将会继续发挥重要的作用。OpenCV提供了大量的计算机视觉算法和图像处理工具，广泛应用于图像和视频的处理、分析以及机器学习领域。所以学习人计算机视觉或者图像处理方面的知识，OpenCV是一个要重点学习的工具库。首先介绍一下OpenCV
机器学习结合伏羲模型高精度多尺度气象分析与降尺度实现 Hardess-god WRF 算法人工智能
随着人工智能的发展，机器学习技术在气象预报领域展现出巨大潜力。本文详细探讨如何结合机器学习（ML）和伏羲模型进行高精度多尺度气象模拟分析，并提供详细的实现步骤和相关代码。1.研究目标与技术路线目标：结合机器学习模型与伏羲气象模式，实现区域和局地高精度降尺度。技术路线：伏羲模型提供大尺度气象数据和预报使用机器学习模型（如CNN、LSTM、XGBoost）进行降尺度2.数据准备与处理2.1气象数据获取
基于ChatGPT、GIS与Python机器学习的地质灾害风险评估、易发性分析、信息化建库及灾后重建高级实践 weixin_贾防洪评价风险评估滑坡泥石流地质灾害
第一章、ChatGPT、DeepSeek大语言模型提示词与地质灾害基础及平台介绍【基础实践篇】1、什么是大模型？大模型（LargeLanguageModel,LLM）是一种基于深度学习技术的大规模自然语言处理模型。代表性大模型：GPT-4、BERT、T5、ChatGPT等。特点：多任务能力：可以完成文本生成、分类、翻译、问答等任务。上下文理解：能理解复杂的上下文信息。广泛适配性：适合科研、教育、行
人脸识别的一些代码饿了就干饭 CV相关人脸识别
1、cv2入门函数imread及其相关操作2、（详解）opencv里的cv2.resize改变图片大小Python3、机器学习之人脸识别face_recognition使用4、使用face_recognition进行人脸校准5、简单的人脸识别通用流程示意图（这个看着写的挺好的）6、face_recognition和图像处理中left、top、right、bottom解释7、使用pillow库对图片
探索Python中的集成方法：Stacking Echo_Wish Python 笔记 Python 算法 python 开发语言
在机器学习领域，Stacking是一种高级的集成学习方法，它通过将多个基本模型的预测结果作为新的特征输入到一个元模型中，从而提高整体模型的性能和鲁棒性。本文将深入介绍Stacking的原理、实现方式以及如何在Python中应用。什么是Stacking？Stacking，又称为堆叠泛化（StackedGeneralization），是一种模型集成方法，与Bagging和Boosting不同，它并不直
【Python】 Stacking: 强大的集成学习方法音乐学家方大刚 Python python 集成学习开发语言
我们都找到天使了说好了心事不能偷藏着什么都一起做幸福得没话说把坏脾气变成了好沟通我们都找到天使了约好了负责对方的快乐阳光下的山坡你素描的以后怎么抄袭我脑袋想的薛凯琪《找到天使了》在机器学习中，单一模型的性能可能会受到其局限性和数据的影响。为了解决这个问题，我们可以使用集成学习（EnsembleLearning）方法。集成学习通过结合多个基模型的预测结果，来提高整体模型的准确性和稳健性。Stacki
Stacking算法：集成学习的终极武器 civilpy 算法集成学习机器学习
Stacking算法：集成学习的终极武器在机器学习的竞技场中，集成学习方法以其卓越的性能而闻名。其中，Stacking（堆叠泛化）作为一种高级集成技术，更是被誉为“集成学习的终极武器”。本文将带你深入了解Stacking算法的原理和实现，并提供一些实战技巧和最佳实践。1.Stacking算法原理探秘Stacking算法的核心思想是训练多个不同的基模型，并将它们的预测结果作为新模型的输入特征，以此来
集成学习（上）：Bagging集成方法万事可爱^ 机器学习修仙之旅 #监督学习集成学习机器学习人工智能 Bagging 随机森林
一、什么是集成学习？在机器学习的世界里，没有哪个模型是完美无缺的。就像古希腊神话中的"盲人摸象"，单个模型往往只能捕捉到数据特征的某个侧面。但当我们把多个模型的智慧集合起来，就能像拼图一样还原出完整的真相，接下来我们就来介绍一种“拼图”算法——集成学习。集成学习是一种机器学习技术，它通过组合多个模型（通常称为“弱学习器”或“基础模型”）的预测结果，构建出更强、更准确的学习算法。这种方法的主要思想是
【集成学习】：Stacking原理以及Python代码实现 Geeksongs 机器学习 python 机器学习深度学习人工智能算法
Stacking集成学习在各类机器学习竞赛当中得到了广泛的应用，尤其是在结构化的机器学习竞赛当中表现非常好。今天我们就来介绍下stacking这个在机器学习模型融合当中的大杀器的原理。并在博文的后面附有相关代码实现。总体来说，stacking集成算法主要是一种基于“标签”的学习，有以下的特点：用法：模型利用交叉验证，对训练集进行预测，从而实现二次学习优点：可以结合不同的模型缺点：增加了时间开销，容
windows使用ssh-copy-id命令的解决方案爱编程的喵喵 Windows实用技巧 windows ssh ssh-copy-id 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了windows使用ssh-copy-
PyTorch基础知识讲解（一）完整训练流程示例苏雨流丰机器学习 pytorch 人工智能 python 机器学习深度学习
文章目录Tutorial1.数据处理2.网络模型定义3.损失函数、模型优化、模型训练、模型评价4.模型保存、模型加载、模型推理Tutorial大多数机器学习工作流程涉及处理数据、创建模型、优化模型参数和保存训练好的模型。本教程向你介绍一个用PyTorch实现的完整的ML工作流程，并提供链接来了解这些概念中的每一个。我们将使用FashionMNIST数据集来训练一个神经网络，预测输入图像是否属于以下
机器学习中的贝叶斯网络：如何构建高效的风险预测模型 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术文章目录机器学习中的贝叶斯网络：如何构建高效的风险预测模型1.背景介绍2.基本概念术语说明2.1马尔科夫随机场（MarkovRandomField）2.2条件随机场（ConditionalRandomField，CRF）2.3变量elimination算法2.4贝叶斯网络3.核心算法原理和具体操作步骤以及数学公式讲解3.1原理介绍1.贝叶斯网络基础2.贝叶斯网络构建风险
使用 Milvus 进行向量数据库管理与实践 qahaj milvus 数据库 python
技术背景介绍在当今的AI与机器学习应用中，处理和管理大量的嵌入向量是一个常见的需求。Milvus是一个开源向量数据库，专门用于存储、索引和管理深度神经网络以及其他机器学习模型生成的大规模嵌入向量。它的高性能和易用性使其成为处理向量数据的理想选择。核心原理解析Milvus的核心功能体现在其强大的向量索引和搜索能力。它支持多种索引算法，包括IVF、HNSW等，使其能够高效地进行大规模向量的相似性搜索操
【IT大学生必会的】 10 种图表线性回归 .Boss. 深度学习开发语言人工智能机器学习算法
这段时间，不少同学提到了一些图表的问题。每次在使用matplotlib画图，运用这些图表说明问题的时候，很多时候是模糊的，比如说什么时候画什么图合适？其实这个根据你自己的需求，自己的想法来就行。今天的话，我这里举例在线性回归中，最常用的一些图表，应该可以cover绝大多数情况了。其他算法模型适用的图表，咱们在后面再给大家进行总结~至于数据集，表现方式，大家可以根据我给出的代码继续调整即可！那么，在
物理学不存在了？诺贝尔物理学奖颁给了人工智能资讯新鲜事人工智能
2024年10月8日，瑞典皇家科学院宣布，将2024年诺贝尔物理学奖授予美国普林斯顿大学教授约翰·J·霍普菲尔德（JohnJ.Hopfield）和加拿大多伦多大学教授杰弗里·E·辛顿（GeoffreyE.Hinton），以表彰他们“在人工神经网络机器学习方面的基础性发现和发明”。辛顿在接受电话采访时表示：“完全没想到”。实话实说，在结果出来前，大家也都没想到。因为在外界预测里，今年的诺贝尔物理学奖
PHP 爬虫实战：爬取淘宝商品详情数据 EcomDataMiner php 爬虫开发语言
随着互联网技术的发展，数据爬取越来越成为了数据分析、机器学习等领域的重要前置技能。而在这其中，爬虫技术更是不可或缺。php作为一门广泛使用的后端编程语言，其在爬虫领域同样也有着广泛应用和优势。本文将以爬取斗鱼直播数据为例，介绍php爬虫的实战应用。准备工作在开始爬虫之前，我们需要做一些准备工作。首先，需要搭建一个本地服务器环境，推荐使用WAMP、XAMPP等集成化工具，方便部署PHP环境。其次，我
强化学习中的深度卷积神经网络设计与应用实例数字扫地僧计算机视觉 cnn 人工智能神经网络
I.引言强化学习（ReinforcementLearning，RL）是机器学习的一个重要分支，通过与环境的交互来学习最优策略。深度学习，特别是深度卷积神经网络（DeepConvolutionalNeuralNetworks，DCNNs）的引入，为强化学习在处理高维度数据方面提供了强大工具。本文将探讨强化学习中深度卷积神经网络的设计原则及其在不同应用场景中的实例。II.深度卷积神经网络在强化学习中的
模拟退火算法：原理、应用与优化策略尹清雅算法
摘要模拟退火算法是一种基于物理退火过程的随机搜索算法，在解决复杂优化问题上表现出独特优势。本文详细阐述模拟退火算法的原理，深入分析其核心要素，通过案例展示在函数优化、旅行商问题中的应用，并探讨算法的优化策略与拓展方向，为解决复杂优化问题提供全面的理论与实践指导，助力该算法在多领域的高效应用与创新发展。一、引言在现代科学与工程领域，复杂优化问题无处不在，如资源分配、路径规划、机器学习模型参数调优等。
TensorFlow深度学习实战项目：从入门到精通点我头像干啥 Ai 深度学习 tensorflow 人工智能
引言深度学习作为人工智能领域的一个重要分支，近年来取得了显著的进展。TensorFlow作为Google开源的深度学习框架，因其强大的功能和灵活的架构，成为了众多开发者和研究者的首选工具。本文将带领大家通过一个实战项目，深入理解TensorFlow的使用方法，并掌握深度学习的基本流程。1.TensorFlow简介1.1TensorFlow是什么？TensorFlow是一个开源的机器学习框架，由Go
国外7个最佳大语言模型 (LLM) API推荐幂简集成 API新理念语言模型人工智能自然语言处理
大型语言模型(LLM)API将彻底改变我们处理语言的方式。在深度学习和机器学习算法的支持下，LLMAPI提供了前所未有的自然语言理解能力。通过利用这些新的API，开发人员现在可以创建能够以前所未有的方式理解和响应书面文本的应用程序。下面，我们将比较从Bard到ChatGPT、PaLM等市场上顶级LLMAPI。我们还将探讨整合这些LLM的潜在用例，并考虑其对语言处理的影响。什么是大语言模型(LLM)
机器学习是怎么一步一步由神经网络发展到今天的Transformer架构的？ yuanpan 机器学习神经网络 transformer
机器学习和神经网络的发展经历了一系列重要的架构和技术阶段。以下是更全面的总结，涵盖了从早期神经网络到卷积神经网络之前的架构演变：1.早期神经网络：感知机（Perceptron）时间：1950年代末至1960年代。背景：感知机由FrankRosenblatt提出，是第一个具有学习能力的神经网络模型。它由单层神经元组成，可以用于简单的二分类任务。特点：输入层和输出层之间直接连接，没有隐藏层。使用简单的
奇异值分解（SVD）文弱_书生乱七八糟神经网络人工智能
奇异值分解(SVD)介绍奇异值分解(SVD)，这是最强大的矩阵分解技术之一。SVD广泛应用于机器学习、数据科学和其他计算领域，用于降维、降噪和矩阵近似等应用。与仅适用于方阵的特征分解不同，SVD可以应用于任何矩阵，使其成为一种多功能工具。在这里煮啵将分解SVD背后的理论，通过手动计算示例进行分析，并展示如何在Python中实现SVD。在本节结束时，您将清楚地了解SVD的强大功能及其在机器学习中的应
yum install locate出现Error: Unable to find match: locate解决方案爱编程的喵喵 Linux解决方案 linux locate yum 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了yuminstalllocate出现
【人工智能机器学习基础篇】——深入详解无监督学习之降维：PCA与t-SNE的关键概念与核心原理猿享天开人工智能数学基础专讲人工智能机器学习无监督学习降维
深入详解无监督学习之降维：PCA与t-SNE的关键概念与核心原理在当今数据驱动的世界中，数据维度的增多带来了计算复杂性和存储挑战，同时也可能导致模型性能下降，这一现象被称为“维度诅咒”（CurseofDimensionality）。降维作为一种重要的特征提取和数据预处理技术，旨在通过减少数据的维度，保留其主要信息，从而简化数据处理过程，并提升模型的性能。本文将深入探讨两种广泛应用于无监督学习中的降
springmvc 下 freemarker页面枚举的遍历输出杨白白 enum freemarker
spring mvc freemarker 中遍历枚举 1枚举类型有一个本地方法叫values（），这个方法可以直接返回枚举数组。所以可以利用这个遍历。 enum public enum BooleanEnum { TRUE(Boolean.TRUE, "是"), FALSE(Boolean.FALSE, "否");
实习简要总结 byalias 工作
来白虹不知不觉中已经一个多月了，因为项目还在需求分析及项目架构阶段，自己在这段时间都是在学习相关技术知识，现在对这段时间的工作及学习情况做一个总结：（1）工作技能方面大体分为两个阶段，Java Web 基础阶段和Java EE阶段 1）Java Web阶段在这个阶段，自己主要着重学习了 JSP, Servlet, JDBC, MySQL，这些知识的核心点都过了一遍，也
Quartz——DateIntervalTrigger触发器 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208559 一.概述 simpleTrigger 内部实现机制是通过计算间隔时间来计算下次的执行时间，这就导致他有不适合调度的定时任务。例如我们想每天的 1：00AM 执行任务，如果使用 SimpleTrigger，间隔时间就是一天。注意这里就会有一个问题，即当有 misfired 的任务并且恢复执行时，该执行时间
Unix快捷键 18289753290 unix Unix；快捷键;
复制，删除，粘贴： dd:删除光标所在的行 &nbs
获取Android设备屏幕的相关参数酷的飞上天空 android
包含屏幕的分辨率以及屏幕宽度的最大dp 高度最大dp TextView text = (TextView)findViewById(R.id.text); DisplayMetrics dm = new DisplayMetrics(); text.append("getResources().ge
要做物联网？先保护好你的数据蓝儿唯美数据
根据Beecham Research的说法，那些在行业中希望利用物联网的关键领域需要提供更好的安全性。在Beecham的物联网安全威胁图谱上，展示了那些可能产生内外部攻击并且需要通过快速发展的物联网行业加以解决的关键领域。 Beecham Research的技术主管Jon Howes说：“之所以我们目前还没有看到与物联网相关的严重安全事件，是因为目前还没有在大型客户和企业应用中进行部署，也就
Java取模（求余）运算随便小屋 java
整数之间的取模求余运算很好求，但几乎没有遇到过对负数进行取模求余，直接看下面代码： /** * * @author Logic * */ public class Test { public static void main(String[] args) { // TODO A
SQL注入介绍 aijuans sql注入
二、SQL注入范例这里我们根据用户登录页面 <form action="" > 用户名：<input type="text" name="username"><br/> 密码：<input type="password" name="passwor
优雅代码风格 aoyouzi 代码
总结了几点关于优雅代码风格的描述：代码简单：不隐藏设计者的意图，抽象干净利落，控制语句直截了当。接口清晰：类型接口表现力直白，字面表达含义，API 相互呼应以增强可测试性。依赖项少：依赖关系越少越好，依赖少证明内聚程度高，低耦合利于自动测试，便于重构。没有重复：重复代码意味着某些概念或想法没有在代码中良好的体现，及时重构消除重复。战术分层：代码分层清晰，隔离明确，
布尔数组百合不是茶 java 布尔数组
androi中提到了布尔数组; 布尔数组默认的是false, 并且只会打印false或者是true 布尔数组的例子; 根据字符数组创建布尔数组 char[] c = {'p','u','b','l','i','c'}; //根据字符数组的长度创建布尔数组的个数 boolean[] b = new bool
web.xml之welcome-file-list、error-page bijian1013 java web.xml servlet error-page
welcome-file-list 1.定义： <welcome-file-list> <welcome-file>login.jsp</welcome> </welcome-file-list> 2.作用：用来指定WEB应用首页名称。 error-page1.定义： <error-page&g
richfaces 4 fileUpload组件删除上传的文件 sunjing clear Richfaces 4 fileupload
页面代码 <h:form id="fileForm"> <rich:
技术文章备忘 bit1129 技术文章
Zookeeper http://wenku.baidu.com/view/bab171ffaef8941ea76e05b8.html http://wenku.baidu.com/link?url=8thAIwFTnPh2KL2b0p1V7XSgmF9ZEFgw4V_MkIpA9j8BX2rDQMPgK5l3wcs9oBTxeekOnm5P3BK8c6K2DWynq9nfUCkRlTt9uV
org.hibernate.hql.ast.QuerySyntaxException: unexpected token: on near line 1解决方案白糖_ Hibernate
文章摘自：http://blog.csdn.net/yangwawa19870921/article/details/7553181 在编写HQL时，可能会出现这种代码： select a.name,b.age from TableA a left join TableB b on a.id=b.id 如果这是HQL，那么这段代码就是错误的，因为HQL不支持
sqlserver按照字段内容进行排序 bozch 按照内容排序
在做项目的时候，遇到了这样的一个需求：从数据库中取出的数据集，首先要将某个数据或者多个数据按照地段内容放到前面显示，例如:从学生表中取出姓李的放到数据集的前面； select * fro
编程珠玑-第一章-位图排序 bylijinnan java 编程珠玑
import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import java.io.IOException; import java.io.Writer; import java.util.Random; public class BitMapSearch {
Java关于==和equals chenbowen00 java
关于==和equals概念其实很简单，一个是比较内存地址是否相同，一个比较的是值内容是否相同。虽然理解上不难，但是有时存在一些理解误区，如下情况： 1、 String a = "aaa"; a=="aaa"; ==> true 2、 new String("aaa")==new String("aaa
[IT与资本]软件行业需对外界投资热情保持警惕 comsci it
我还是那个看法,软件行业需要增强内生动力,尽量依靠自有资金和营业收入来进行经营,避免在资本市场上经受各种不同类型的风险,为企业自主研发核心技术和产品提供稳定,温和的外部环境... 如果我们在自己尚未掌握核心技术之前,企图依靠上市来筹集资金,然后使劲往某个领域砸钱,然
oracle 数据块结构 daizj oracle 块数据块块结构行目录
oracle 数据块是数据库存储的最小单位，一般为操作系统块的N倍。其结构为：块头－－〉空行－－〉数据，其实际为纵行结构。块的标准大小由初始化参数DB_BLOCK_SIZE指定。具有标准大小的块称为标准块（Standard Block）。块的大小和标准块的大小不同的块叫非标准块（Nonstandard Block）。同一数据库中，Oracle9i及以上版本支持同一数据库中同时使用标
github上一些觉得对自己工作有用的项目收集 dengkane github
github上一些觉得对自己工作有用的项目收集技能类 markdown语法中文说明回到顶部全文检索 elasticsearch bigdesk elasticsearch管理插件回到顶部 nosql mapdb 支持亿级别map, list, 支持事务. 可考虑做为缓存使用 C
初二上学期难记单词二 dcj3sjt126com english word
dangerous 危险的 panda 熊猫 lion 狮子 elephant 象 monkey 猴子 tiger 老虎 deer 鹿 snake 蛇 rabbit 兔子 duck 鸭 horse 马 forest 森林 fall 跌倒；落下 climb 爬；攀登 finish 完成；结束 cinema 电影院；电影 seafood 海鲜；海产食品 bank 银行
8、mysql外键(FOREIGN KEY)的简单使用 dcj3sjt126com mysql
一、基本概念 1、MySQL中“键”和“索引”的定义相同，所以外键和主键一样也是索引的一种。不同的是MySQL会自动为所有表的主键进行索引，但是外键字段必须由用户进行明确的索引。用于外键关系的字段必须在所有的参照表中进行明确地索引，InnoDB不能自动地创建索引。 2、外键可以是一对一的，一个表的记录只能与另一个表的一条记录连接，或者是一对多的，一个表的记录与另一个表的多条记录连接。 3、如
java循环标签 Foreach shuizhaosi888 标签 java循环 foreach
1. 简单的for循环 public static void main(String[] args) { for (int i = 1, y = i + 10; i < 5 && y < 12; i++, y = i * 2) { System.err.println("i=" + i + " y="
Spring Security（05）——异常信息本地化 234390216 exception Spring Security 异常信息本地化
异常信息本地化 Spring Security支持将展现给终端用户看的异常信息本地化，这些信息包括认证失败、访问被拒绝等。而对于展现给开发者看的异常信息和日志信息（如配置错误）则是不能够进行本地化的，它们是以英文硬编码在Spring Security的代码中的。在Spring-Security-core-x
DUBBO架构服务端告警Failed to send message Response javamingtingzhao 架构 DUBBO
废话不多说，警告日志如下，不知道有哪位遇到过，此异常在服务端抛出(服务器启动第一次运行会有这个警告)，后续运行没问题，找了好久真心不知道哪里错了。 WARN 2015-07-18 22:31:15,272 com.alibaba.dubbo.remoting.transport.dispatcher.ChannelEventRunnable.run(84)
JS中Date对象中几个用法 leeqq JavaScript Date 最后一天
近来工作中遇到这样的两个需求 1. 给个Date对象，找出该时间所在月的第一天和最后一天 2. 给个Date对象，找出该时间所在周的第一天和最后一天需求1中的找月第一天很简单，我记得api中有setDate方法可以使用使用setDate方法前，先看看getDate var date = new Date(); console.log(date); // Sat J
MFC中使用ado技术操作数据库你不认识的休道人 sql mfc
1.在stdafx.h中导入ado动态链接库 #import"C:\Program Files\Common Files\System\ado\msado15.dll" no_namespace rename("EOF","end")2.在CTestApp文件的InitInstance()函数中domodal之前写::CoIniti
Android Studio加速 rensanning android studio
Android Studio慢、吃内存！启动时后会立即通过Gradle来sync & build工程。（1）设置Android Studio a) 禁用插件 File -> Settings... Plugins 去掉一些没有用的插件。比如：Git Integration、GitHub、Google Cloud Testing、Google Cloud
各数据库的批量Update操作 tomcat_oracle java oracle sql mysql sqlite
MyBatis的update元素的用法与insert元素基本相同，因此本篇不打算重复了。本篇仅记录批量update操作的 sql语句，懂得SQL语句，那么MyBatis部分的操作就简单了。　　注意：下列批量更新语句都是作为一个事务整体执行，要不全部成功，要不全部回滚。 MSSQL的SQL语句　WITH R AS（　　SELECT 'John' as name, 18 as
html禁止清除input文本输入缓存 xp9802 input
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; eg: <input type="text" autocomplete="off" name