Mikey_Sun

【统计学习系列】多元线性回归模型（二）——模型的参数估计I：点估计

文章目录

1. 前文回顾
2. 最小二乘法估计（Ordinary Least Squared Estimate, OLS）
3. 极大似然估计（Maximum Likelihood Estimate, ML）
4. 结论
5. 新问题的提出
- 参考文献
写在最后

【更新日志】
3/3/2020 对部分公式中出现的错误进行了修正
4/5/2020 修改了文章标题

1. 前文回顾

在上一篇文章中，我们建立了多元线性回归模型，以及模型的相关假设，并给出了对应的样本模型（详情请见：【统计学习系列】多元线性回归模型（一）——模型的建立与基本假设）（~~别问我为什么点开404，因为这一章的内容太多我还在补充中，暂未开放~~）：
$y_i= \beta_0 + \sum_{j=1}^{p} x_{ij} \beta_j + \epsilon_i , \ i=1,...,N$ 其中：
$\bm{\epsilon} = (\epsilon_i)_{N \times 1} \thicksim N(0,\bm{I_n}\sigma^2)$
因此，需要估计的参数有 p + 2 个：β₀, β₁, …, β_p, σ。我们如何利用样本来估计模型参数呢？我们的一般思路是：1）制定评价标准，2）在给定标准下寻找最优参数。这篇文章主要介绍最小二乘估计法和极大似然估计法这两种方法。话不多说，让我们开始探寻参数估计的秘密吧！

注：本篇涉及大量数学定理推导。尽管作者力求内容通俗易懂，但同时也希望保证证明的严谨性。因此在参数估计的推导中，我会把证明思路与过程尽可能清晰、完整地展示出来，这可能需要读者具有一定程度的凸优化问题求解和线性代数的基础。实操应用类读者可直接跳过2、3两章，而直接阅读第4章结论。

2. 最小二乘法估计（Ordinary Least Squared Estimate, OLS）

如果将 N 组样本对 (y_i, x_i) 看做是一个 p+1 维实空间中的N个点，那么我们现在要做的就是在空间中找到一个 p 维超平面，来尽可能“好”的拟合空间中的这N个样本的点。什么样的指标可以衡量这种拟合的好坏呢？样本点到拟合平面的距离则是一个衡量拟合好坏的测量工具：当点到平面距离和越小，说明估计量与真实值之间的“距离”越小（离得越近），模型对样本数据的拟合情况越好；而点到平面距离和越大，说明估计量与真实值之间的“距离”越大（离得越远），模型对样本数据的拟合情况越差。而对于距离的度量，我们可以使用两点差值的平方这一指标：
$distance(y_i, \hat{y}_i) = (y_i - \hat{y}_i)^2$
注1：使用平方而非绝对值是为了后边方便求导。
注2：这里的表述并不严谨。作为距离的测度，我们应该使用范数（例如2-范数）。其本质是因为定义范数作为距离的欧式空间是一个赋范线性空间。

最小二乘估计法的核心思想是：找到一组参数 β ，使得“样本点到平面的距离和最小”，或者说最小化残差平方和。用数学语言可以表示为：

$\min_{\beta_0, \beta_1,...,\beta_p} RSS(\beta_0, \beta_1,...,\beta_p) \\ \hskip{1.5em} = \sum_{i=1}^{N}(y_i - f(\bm{x_i} ))^2 \\ \hskip{5em} = \sum_{i=1}^{N}(y_i - \beta_0 - \sum_{j=1}^{p} x_{ij} \beta_j)^2$

注1：利用这一准则成立的合理前提是：(x_i, y_i)是从总体一种独立抽取的随机样本。若样本不满足随机性，y_i与x_i也应该条件独立。

注2：在利用这一准则进行参数估计时，其过程本身并不蕴含任何假设条件（即该过程并不蕴含模型的有效性假设）

为方便计算，我们首先将RSS的表达式改写为矩阵运算形式：
$\bm{\beta} ) = (\bm{y} - \bm{X} \bm{\beta} )^T (\bm{y} - \bm{X} \bm{\beta} )$

其中：
$\bm{\beta} = \begin{bmatrix} \beta_0 \\ \beta_1 \\ \vdots\\ \beta_p \end{bmatrix}_{(p+1) \times1}, \space \space \space \space \space \bm{y} = \begin{bmatrix} y_0 \\ y_1 \\ \vdots\\ y_N \end{bmatrix}_{N \times1}, \space \space \space \space \space \bm{X} = \begin{bmatrix} \space 1 \space\space x_{11} \space\space \dots \space\space x_{1p} \\ \space 1 \space\space x_{21} \space\space \dots \space\space x_{2p} \\ \vdots \space \space\space \space \space \vdots \space \space \space \space \space ⋱ \space \space \space \space \vdots\\ \space 1 \space\space x_{N1} \space\space \dots \space\space x_{Np} \end{bmatrix}_{N \times (p+1)}$
由于问题（I）可以视为无约束优化问题，分别对目标函数求其一阶和二阶导数，则有：
$\frac{ \partial RSS( \bm{\beta} ) } { \partial \bm{\beta} } = -2 \bm{X}^T ( \bm{y} - \bm{X} \bm{\beta})$ $\frac{ \partial^2 RSS( \bm{\beta} ) } { \partial \bm{\beta}^2 } = 2 \bm{X}^T \bm{X} \succcurlyeq 0$

由线性代数和凸优化问题（或多元函数极值问题）基础知识可知：RSS(β)为向量 β 的半正定二次型，同时RSS(β)是定义在 R^p+1 上的凸函数。

当 X^TX 满秩（亦称非奇异）时，RSS(β)为向量 β 的正定二次型，因此RSS(β)是定义在 R^p+1 上的严格凸函数。由严格凸函数性质可知，RSS(β)最小值点存在且唯一，且其取得最小值满足的充分必要条件是：RSS(β)关于向量 β 的一阶导函数为0。

根据上述结论，该最优化问题的解满足： $\bm{X}^T ( \bm{y} - \bm{X} \bm{ \hat\beta}) = 0$

移项得： $\bm{X}^T \bm{X} \bm{\hat\beta} = \bm{X}^T \bm{y}$

当自变量不存在多重共线性时， X^TX 矩阵非奇异，因此其逆矩阵存在，因此解得优化问题的解：
$\bm{\hat\beta} = ( \bm{X}^T \bm{X} )^{-1} \bm{X}^T \bm{y}$
注1：矩阵 X^TX 非奇异，等价于 样本资料阵 X 列满秩，等价于模型自变量不存在多重共线性。这部分证明请参考文献[1]《高等代数（第二版）上册》；
注2：关于矩阵函数的代数运算，例如乘法运算、逆运算、求导运算等更多细节，请参考文献[1]《高等代数（第二版）上册》；
注3：关于凸规划问题的相关基础知识，请参考文献[2]《数值最优化》。

将估计参数 β 带入模型中，可以得到学习样本的拟合值：
$\bm{\hat y} = \bm{X} \bm{\hat\beta} = \bm{X} ( \bm{X}^T \bm{X} )^{-1} \bm{X}^T \bm{y} \xlongequal{def} \bm{H} \bm{y}$ 其中，矩阵 H ： $\bm{H} = \bm{X} ( \bm{X}^T \bm{X} )^{-1} \bm{X}^T$ 被称为“帽子矩阵”（仿佛给 y 带了一个帽子）。

参数 σ 表示误差项的波动率。我们可以把残差序列作为误差项的估计量，因此可以使用残差序列的样本标准差对 σ 进行估计：
$\bm{\hat \sigma} = \sqrt{ \frac {( \bm{y} - \bm{\hat{y}} )^T ( \bm{y} - \bm{\hat{y}} ) } {N-p-1} } = \sqrt{ \frac { \sum _{i=1}^{N} (y_i - \hat{y}_i)^2} {N-p-1} }$

注：这里分母使用 N-p-1 是为了确保该方差估计量的无偏性，其具体论证我将在下一篇文章中进行说明。

3. 极大似然估计（Maximum Likelihood Estimate, ML）

在上一章使用最小二乘法对模型参数进行估计时，我们采用了用“残差平方和”作为评判模型拟合的好坏，其实质是希望找到一个拟合超平面（即为一个线性模型），使得所有样本到超平面的距离和最短（也就是最接近）。因此，这种评估方法是站在几何学的角度上进行的。除此之外，我们还有没有其他衡量拟合好坏的角度呢？

首先我们知道，样本具有“二元性” ：当在抽样之前，样本可以视为一个 随机变量（或随机向量）；而抽样之后，样本的取值被固定，因此又可以视为一个常数（或常向量）。因此，在抽样之前，N 个来自于总体的独立随机样本应该有联合分布，这是随机变量的特征决定的。若多元线性回归模型的正态性假设成立，那么N 个样本的因变量 y 的条件分布应满足：
$\bm{y} \thicksim N(\bm{X} \bm{\beta},\bm{I_n}\sigma^2)$

其联合概率密度函数存在，有：

$y_1, ..., y_N; \bm{x_1} , ..., \bm{x_N}, \bm{\beta }, \sigma ) \\ \hspace{4.5em} = \prod_{i=1}^{N} \frac {1} {\sqrt{2\pi}\sigma} \exp\{ - \frac{1}{2\sigma^2} (y_i - \beta_0 - \beta_1 x_{i1}- \dots - \beta_p x_{ip})^2 \} \\ \hspace{4.5em} = \frac {1} { ( \sqrt{2\pi}\sigma ) ^ N} \times \exp\{ - \sum_{i=1}^N \frac{1}{2\sigma^2}(y_i - \beta_0 - \beta_1 x_{i1}- \dots - \beta_p x_{ip} ) ^2 \} \\ \hspace{4.5em} =( \sqrt{2\pi}\sigma ) ^ {-N} \times \exp \{ - \frac{1}{2\sigma^2} (\bm{y} - \bm{X} \bm{\beta} )^ T(\bm{y} - \bm{X} \bm{\beta} ) \}$ 其中： φ(x) 为一元标准正态分布的分布函数。

注：关于随机变量与分布更多的资料请参考文献[3]《测度论与概率论基础》

在抽样之后，样本被固定，联合概率密度函数变成了关于总体参数 β 的函数。我们重新定义这个函数，称这一函数为“似然函数”（Likelihood Function），并记为 L (β)，其表达式为：
$\bm{\beta } , \sigma; \space (y_1, \bm{x_1}), ..., (y_N, \bm{x_N}) ) =( \sqrt{2\pi}\sigma ) ^ {-N} \times \exp \{ - \frac{1}{2\sigma^2} (\bm{y} - \bm{X} \bm{\beta} )^ T(\bm{y} - \bm{X} \bm{\beta} ) \}$

注：似然函数与联合概率密度函数在表达形式上一致，但是似然函数是关于总体参数 β 的函数，而概率密度函数是关于随机变量序列（即样本序列）( y_i, x_i ), i = 1, …, N 的函数。

为什么称他为似然函数呢？我们知道，概率密度函数展现了的随机变量发生的可能性的大小。因此似然函数的意义是：若我们已经抽出来了一组样本，那么这组样本来自参数为 β 的总体的可能性是多少？

注：这个说法不够严谨，但这是我能想到的最容易理解的表达了。。。

那么我们如何利用似然函数来估计参数呢？我们期望：“在一次试验中，若某一事件发生了，那么这一事件最有可能来自于发生可能性最大的哪一种情形”，或者说“发生概率最高的事件在一次实验中最有可能发生”。

这听起来完全就是废话啊！我们不妨举一个简单的例子：

例：一个箱子里有十个球，这十个球有可能是下面三种情况：
情况 1：十个球中，一个红球，九个白球；
情况 2：十个球中，五个红球，五个白球；
情况 3：十个球中，九个红球，一个白球；
已知有放回地随机抽，每次抽一个，结果三次都抽中了红球。请问，箱子里最有可能是这三种情况中的哪一种？

分别计算这三种情况所发生“有放回三次都抽中红球”这一事件的概率，可以知道情况3发生的可能性最大。因此我们可以认为箱子里装有九个红球和一个白球。

注：对一思想进行严格说明需要涉及贝叶斯决策，有兴趣的读者可自行查阅更多资料

通过这个例子的说明可知：我们需要找到一组参数，使得在这组参数下，样本的联合概率密度达到最大。因此，这个问题就变成了：在所有有可能的参数取值中（专业说法：在参数空间中），所抽中的样本来自哪一组参数的可能性最高？

至此，我们将问题抽象成了一个无约束优化问题，这与最小二乘估计的手段十分相似。但是由于似然函数是连乘运算，这在求导的过程中不够方便，因此我们对似然函数其进行对数化处理，得到“对数似然函数”（Logarithm Likelihood Function ），并记为 l (β)。因此，这一优化问题转化为了：

$\min_ \bm{\beta} l( \bm{\beta }, \sigma;\space (y_1, \bm{x_1}), ( y_2, \bm{x_2}), ... , (y_N, \bm{x_N}) ) = -N \ln { \sqrt{2\pi}\sigma } - \frac{1}{2\sigma^2} ( \bm{y} - \bm{X} \bm{\beta} )^ T(\bm{y} - \bm{X} \bm{\beta} )$

注：不难证明：对数似然函数与似然函数取最小值时，β 相等。

与第2部分过程相仿，其一阶导函数有：
$\frac{ \partial l( \bm{\beta},\sigma ) } { \partial \bm{\beta} } = -2 \bm{X}^T ( \bm{y} - \bm{X} \bm{\beta}) = 0$ $\frac{ \partial l( \bm{\beta},\sigma) } { \partial \sigma } = -\frac{N}{\sigma} + \frac{1}{\sigma^3} ( \bm{y} - \bm{X} \bm{\beta} )^ T(\bm{y} - \bm{X} \bm{\beta} ) = 0$

解得：
$\bm{\hat\beta} = ( \bm{X}^T \bm{X} )^{-1} \bm{X}^T \bm{y}$ $\hat{\sigma} = \sqrt { \frac{1}{N} ( \bm{y} - \bm{X} \bm{\beta} )^ T(\bm{y} - \bm{X} \bm{\beta} ) }$

4. 结论

基于第2部分和第3部分的讨论，我们知道：基于最小二乘法和极大似然估计法两种方法得到的参数估计结果是一致的（有没有一种殊途同归的艺术感！），估计值为：
$\bm{\hat\beta} = ( \bm{X}^T \bm{X} )^{-1} \bm{X}^T \bm{y}$

其中：
$\bm{\beta} = \begin{bmatrix} \beta_0 \\ \beta_1 \\ \vdots\\ \beta_p \end{bmatrix}_{(p+1) \times1}, \space \space \space \space \space \bm{y} = \begin{bmatrix} y_0 \\ y_1 \\ \vdots\\ y_N \end{bmatrix}_{N \times1}, \space \space \space \space \space \bm{X} = \begin{bmatrix} \space 1 \space\space x_{11} \space\space \dots \space\space x_{1p} \\ \space 1 \space\space x_{21} \space\space \dots \space\space x_{2p} \\ \vdots \space \space\space \space \space \vdots \space \space \space \space \space ⋱ \space \space \space \space \vdots\\ \space 1 \space\space x_{N1} \space\space \dots \space\space x_{Np} \end{bmatrix}_{N \times (p+1)}$
不过这两种方法对误差项方差的估计不同。最小二乘法对误差项标准差的估计量为：
$\bm{\hat \sigma} _{OLS} = \sqrt{ \frac {1 } {N-p-1} ( \bm{y} - \bm{\hat{y}} )^T ( \bm{y} - \bm{\hat{y}} ) }$

而极大似然估计对误差项标准差的估计量为： $\bm{\hat \sigma} _{ML} = \sqrt{ \frac { 1 } {N} ( \bm{y} - \bm{\hat{y}} )^T ( \bm{y} - \bm{\hat{y}} ) }$ 其中： $\bm{\hat y} = \bm{X} \bm{\hat\beta} = \bm{X} ( \bm{X}^T \bm{X} )^{-1} \bm{X}^T \bm{y}$
注：在机器学习领域中，我们首先设置目标函数（或称代价方程），通过寻找最优的参数使得目标函数达到最小值，从而实现参数估计的目的。因此从这个意义上讲，多元线性回归模型可以算机器学习模型中的一种。

5. 新问题的提出

在估计出了参数之后，小伙伴们 ~~（无中生有）~~ 一定会顺理成章地提出如下疑问：

（1）这些估计出来的参数好不好？准不准确呢？准确率有多高呢？
（2）估计出来的模型好不好？有没有效呢？
（3）估计出来的模型是否满足模型的基本假设条件呢？不满足可咋办呢？
（4）如何利用估计出来的模型进行预测呢？预测的准确性有多高呢？
~~（5）你还得拖多长时间才往后更新啊？~~

面对小伙伴们的灵魂拷问，让我们下回分解。

参考文献

[1]《高等代数（第二版）上册》丘维声著
[2]《数值最优化》李董辉等著
[3]《测度论与概率论基础》程士宏著

写在最后

欢迎感兴趣的小伙伴来跟作者一起挑刺儿~ 包括但不限于语言上的、排版上的和内容上的不足和疏漏~ 一起进步呀！
有任何问题，欢迎在本文下方留言，或者将问题发送至勘误邮箱： [email protected]
谢谢大家！XD

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
【中国国际航空-注册_登录安全分析报告】风控牛验证码接口安全评测系列安全行为验证极验网易易盾智能手机
前言由于网站注册入口容易被黑客攻击，存在如下安全问题：1.暴力破解密码，造成用户信息泄露2.短信盗刷的安全问题，影响业务及导致用户投诉3.带来经济损失，尤其是后付费客户，风险巨大，造成亏损无底洞所以大部分网站及App都采取图形验证码或滑动验证码等交互解决方案，但在机器学习能力提高的当下，连百度这样的大厂都遭受攻击导致点名批评，图形验证及交互验证方式的安全性到底如何？请看具体分析一、中国国际航空PC
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
七.正则化愿风去了
吴恩达机器学习之正则化（Regularization）http://www.cnblogs.com/jianxinzhou/p/4083921.html从数学公式上理解L1和L2https://blog.csdn.net/b876144622/article/details/81276818虽然在线性回归中加入基函数会使模型更加灵活，但是很容易引起数据的过拟合。例如将数据投影到30维的基函数上，模
机器学习-------数据标准化罔闻_spider 数据分析算法机器学习人工智能
什么是归一化，它与标准化的区别是什么？一作用在做训练时，需要先将特征值与标签标准化，可以防止梯度防炸和过拟合；将标签标准化后，网络预测出的数据是符合标准正态分布的—StandarScaler()，与真实值有很大差别。因为StandarScaler()对数据的处理是（真实值-平均值）/标准差。同时在做预测时需要将输出数据逆标准化提升模型精度：标准化/归一化使不同维度的特征在数值上更具比较性，提高分类
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性 aehrutktrjk 人工智能 easyui 前端 python
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性引言在机器学习和自然语言处理领域，选择合适的训练示例对模型性能至关重要。最大边际相关性(MaximalMarginalRelevance,MMR)是一种优秀的示例选择方法，它不仅考虑了示例与输入的相关性，还注重保持所选示例之间的多样性。本文将深入探讨如何使用MMR来选择示例，以提高AI模型的性能和泛化能力。什么是最大边际相关性(MM
LangChain集成指南:如何利用多样化的AI提供商 aehrutktrjk 人工智能 langchain python
LangChain集成指南:如何利用多样化的AI提供商引言在人工智能和机器学习领域,LangChain已成为一个强大而灵活的框架,允许开发者轻松集成各种AI服务提供商。本文将深入探讨LangChain的集成能力,介绍如何利用不同的AI提供商来增强你的应用程序,并提供实用的代码示例。LangChain集成概览LangChain支持多种AI提供商的集成,这些集成可以分为两类:独立包集成:这些提供商有独
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
【机器学习与R语言】1-机器学习简介苹果酱0567 面试题汇总与解析 java 中间件开发语言 spring boot 后端
1.基本概念机器学习：发明算法将数据转化为智能行为数据挖掘VS机器学习：前者侧重寻找有价值的信息，后者侧重执行已知的任务。后者是前者的先期准备过程：数据——>抽象化——>一般化。或者：收集数据——推理数据——归纳数据——发现规律抽象化：训练：用一个特定模型来拟合数据集的过程用方程来拟合观测的数据：观测现象——数据呈现——模型建立。通过不同的格式来把信息概念化一般化：一般化：将抽象化的知识转换成可用
Python前沿技术：机器学习与人工智能 4.0啊 Python 人工智能 python 机器学习
Python前沿技术：机器学习与人工智能一、引言随着科技的飞速发展，机器学习和人工智能（AI）已经成为了计算机科学领域的热门话题。Python作为一门易学易用且功能强大的编程语言，已经成为了这两个领域的首选语言之一。本文将深入探讨Python在机器学习和人工智能领域的应用，以及一些前沿技术和工具。二、Python机器学习基础2.1机器学习概述机器学习是人工智能（AI）的一个关键子集，它的核心在于让
chatgpt赋能python：如何在Python中计算平均值 tulingtest ChatGpt python chatgpt numpy 计算机
如何在Python中计算平均值计算平均值是数据分析、统计和机器学习等许多领域中的常见任务。Python作为一门功能强大且易于学习的编程语言，为计算平均值提供了多种方法。在本文中，我们将介绍如何在Python中计算平均值。什么是平均值简单来说，平均值是一组数字的总和除以数字的数量。例如，对于数字序列1，3，5，7，9，平均值是(1+3+5+7+9)/5=5。平均值在数据分析中非常有用，因为它可以提供
Python 初学者入门必知： Anaconda是什么？有什么作用？怎么使用？懒大王爱吃狼 Python基础 python 开发语言 python基础 python学习 anaconda anaconda安装 python教程
初学者在学习Python时，经常看到的一个名字是Anaconda。究竟什么是Anaconda，为什么它如此受欢迎？在这篇文章中，我们将探讨Anaconda，了解Anaconda的从安装到使用的。Anaconda是一个免费开源的Python和R编程发行版，包含上千个适用于数据科学和机器学习的包。同时，配备了Spyder和Jupyternotebook等工具，初学者可以使用它们来学习Python，使用
每天五分钟玩转深度学习PyTorch：模型参数优化器torch.optim 幻风_huanfeng 深度学习框架pytorch 深度学习 pytorch 人工智能神经网络机器学习优化算法
本文重点在机器学习或者深度学习中，我们需要通过修改参数使得损失函数最小化(或最大化)，优化算法就是一种调整模型参数更新的策略。在pytorch中定义了优化器optim，我们可以使用它调用封装好的优化算法，然后传递给它神经网络模型参数，就可以对模型进行优化。本文是学习第6步(优化器)，参考链接pytorch的学习路线随机梯度下降算法在深度学习和机器学习中，梯度下降算法是最常用的参数更新方法，它的公式
一切皆是映射：AI的去中心化：区块链技术的融合 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
一切皆是映射：AI的去中心化：区块链技术的融合作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词：AI，区块链，去中心化，智能合约，共识机制，数据安全，隐私保护，分布式账本技术，机器学习，数据隐私1.背景介绍1.1问题的由来随着人工智能（AI）技术的快速发展，其在各个领域的应用越来越广泛，从自动驾驶、智能医疗到金融服务，AI正在改变着我们的生活。
第五届核磁机器学习班（训练营：2023.6.5~6.17）茗创科技
茗创科技专注于脑科学数据处理，涵盖（EEG/ERP,fMRI,结构像,DTI,ASL,FNIRS）等，欢迎留言讨论及转发推荐，也欢迎了解茗创科技的脑电课程，数据处理服务及脑科学工作站销售业务，可添加我们的工程师（微信号MCKJ-zhouyi或17373158786）咨询。★课程简介★基于血氧水平依赖的功能磁共振成像(fMRI)技术,利用其数据构建的功能性脑网络后,发现脑并不是一个单纯对外界刺激进行
如何有效的学习AI大模型？ Python程序员罗宾学习人工智能语言模型自然语言处理架构
学习AI大模型是一个系统性的过程，涉及到多个学科的知识。以下是一些建议，帮助你更有效地学习AI大模型：基础知识储备：数学基础：学习线性代数、概率论、统计学和微积分等，这些是理解机器学习算法的数学基础。编程技能：掌握至少一种编程语言，如Python，因为大多数AI模型都是用Python实现的。理论学习：机器学习基础：了解监督学习、非监督学习、强化学习等基本概念。深度学习：学习神经网络的基本结构，如卷
JVM StackMapTable 属性的作用及理解 lijingyao8206 jvm 字节码 Class文件 StackMapTable
在Java 6版本之后JVM引入了栈图(Stack Map Table)概念。为了提高验证过程的效率，在字节码规范中添加了Stack Map Table属性，以下简称栈图，其方法的code属性中存储了局部变量和操作数的类型验证以及字节码的偏移量。也就是一个method需要且仅对应一个Stack Map Table。在Java 7版
回调函数调用方法百合不是茶 java
最近在看大神写的代码时,.发现其中使用了很多的回调 ,以前只是在学习的时候经常用到 ,现在写个笔记记录一下代码很简单: MainDemo :调用方法得到方法的返回结果
[时间机器]制造时间机器需要一些材料 comsci 制造
根据我的计算和推测,要完全实现制造一台时间机器,需要某些我们这个世界不存在的物质和材料... 甚至可以这样说,这种材料和物质,我们在反应堆中也无法获得......
开口埋怨不如闭口做事邓集海邓集海做人做事工作
“开口埋怨，不如闭口做事。”不是名人名言，而是一个普通父亲对儿子的训导。但是，因为这句训导，这位普通父亲却造就了一个名人儿子。这位普通父亲造就的名人儿子，叫张明正。　　　　张明正出身贫寒，读书时成绩差，常挨老师批评。高中毕业，张明正连普通大学的分数线都没上。高考成绩出来后，平时开口怨这怨那的张明正，不从自身找原因，而是不停地埋怨自己家庭条件不好、埋怨父母没有给他创造良好的学习环境。　　　　
jQuery插件开发全解析，类级别与对象级别开发 IT独行者 jquery 开发插件　函数
jQuery插件的开发包括两种：一种是类级别的插件开发，即给 jQuery添加新的全局函数，相当于给 jQuery类本身添加方法。 jQuery的全局函数就是属于 jQuery命名空间的函数，另一种是对象级别的插件开发，即给 jQuery对象添加方法。下面就两种函数的开发做详细的说明。 1 、类级别的插件开发类级别的插件开发最直接的理解就是给jQuer
Rome解析Rss 413277409 Rome解析Rss
import java.net.URL; import java.util.List; import org.junit.Test; import com.sun.syndication.feed.synd.SyndCategory; import com.sun.syndication.feed.synd.S
RSA加密解密无量加密解密 rsa
RSA加密解密代码代码有待整理 package com.tongbanjie.commons.util; import java.security.Key; import java.security.KeyFactory; import java.security.KeyPair; import java.security.KeyPairGenerat
linux 软件安装遇到的问题 aichenglong linux 遇到的问题 ftp
1 ftp配置中遇到的问题 500 OOPS: cannot change directory 出现该问题的原因:是SELinux安装机制的问题.只要disable SELinux就可以了修改方法:1 修改/etc/selinux/config 中SELINUX=disabled 2 source /etc
面试心得 alafqq 面试
最近面试了好几家公司。记录下；支付宝，面试我的人胖胖的，看着人挺好的；博彦外包的职位，面试失败；阿里金融，面试官人也挺和善，只不过我让他吐血了。。。由于印象比较深，记录下； 1，自我介绍 2，说下八种基本类型；（算上string。楼主才答了3种，哈哈，string其实不是基本类型，是引用类型） 3，什么是包装类，包装类的优点； 4，平时看过什么书？NND，什么书都没看过。。照样
java的多态性探讨百合不是茶 java
java的多态性是指main方法在调用属性的时候类可以对这一属性做出反应的情况 //package 1; class A{ public void test(){ System.out.println("A"); } } class D extends A{ public void test(){ S
网络编程基础篇之JavaScript-学习笔记 bijian1013 JavaScript
1.documentWrite <html> <head> <script language="JavaScript"> document.write("这是电脑网络学校"); document.close(); </script> </h
探索JUnit4扩展：深入Rule bijian1013 JUnit Rule 单元测试
本文将进一步探究Rule的应用，展示如何使用Rule来替代@BeforeClass，@AfterClass，@Before和@After的功能。在上一篇中提到，可以使用Rule替代现有的大部分Runner扩展，而且也不提倡对Runner中的withBefores()，withAfte
[CSS]CSS浮动十五条规则 bit1129 css
这些浮动规则，主要是参考CSS权威指南关于浮动规则的总结，然后添加一些简单的例子以验证和理解这些规则。 1. 所有的页面元素都可以浮动 2. 一个元素浮动后，会成为块级元素，比如<span>,a, strong等都会变成块级元素 3.一个元素左浮动，会向最近的块级父元素的左上角移动，直到浮动元素的左外边界碰到块级父元素的左内边界；如果这个块级父元素已经有浮动元素停靠了
【Kafka六】Kafka Producer和Consumer多Broker、多Partition场景 bit1129 partition
0.Kafka服务器配置 3个broker 1个topic，6个partition，副本因子是2 2个consumer，每个consumer三个线程并发读取 1. Producer package kafka.examples.multibrokers.producers; import java.util.Properties; import java.util.
zabbix_agentd.conf配置文件详解 ronin47 zabbix 配置文件
Aliaskey的别名，例如 Alias=ttlsa.userid:vfs.file.regexp[/etc/passwd,^ttlsa:.:([0-9]+),,,,\1]，或者ttlsa的用户ID。你可以使用key：vfs.file.regexp[/etc/passwd,^ttlsa:.: ([0-9]+),,,,\1]，也可以使用ttlsa.userid。备注: 别名不能重复，但是可以有多个
java--19.用矩阵求Fibonacci数列的第N项 bylijinnan fibonacci
参考了网上的思路，写了个Java版的： public class Fibonacci { final static int[] A={1,1,1,0}; public static void main(String[] args) { int n=7; for(int i=0;i<=n;i++){ int f=fibonac
Netty源码学习-LengthFieldBasedFrameDecoder bylijinnan java netty
先看看LengthFieldBasedFrameDecoder的官方API http://docs.jboss.org/netty/3.1/api/org/jboss/netty/handler/codec/frame/LengthFieldBasedFrameDecoder.html API举例说明了LengthFieldBasedFrameDecoder的解析机制，如下：实
AES加密解密 chicony 加密解密
AES加解密算法，使用Base64做转码以及辅助加密： package com.wintv.common; import javax.crypto.Cipher; import javax.crypto.spec.IvParameterSpec; import javax.crypto.spec.SecretKeySpec; import sun.misc.BASE64Decod
文件编码格式转换 ctrain 编码格式
package com.test; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; import java.io.OutputStream;
mysql 在linux客户端插入数据中文乱码 daizj mysql 中文乱码
1、查看系统客户端，数据库，连接层的编码查看方法： http://daizj.iteye.com/blog/2174993 进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+------
好代码是廉价的代码 dcj3sjt126com 程序员读书
长久以来我一直主张：好代码是廉价的代码。当我跟做开发的同事说出这话时，他们的第一反应是一种惊愕，然后是将近一个星期的嘲笑，把它当作一个笑话来讲。当他们走近看我的表情、知道我是认真的时，才收敛一点。当最初的惊愕消退后，他们会用一些这样的话来反驳： “好代码不廉价，好代码是采用经过数十年计算机科学研究和积累得出的最佳实践设计模式和方法论建立起来的精心制作的程序代码。” 我只
Android网络请求库——android-async-http dcj3sjt126com android
在iOS开发中有大名鼎鼎的ASIHttpRequest库，用来处理网络请求操作，今天要介绍的是一个在Android上同样强大的网络请求库android-async-http，目前非常火的应用Instagram和Pinterest的Android版就是用的这个网络请求库。这个网络请求库是基于Apache HttpClient库之上的一个异步网络请求处理库，网络处理均基于Android的非UI线程，通
ORACLE 复习笔记之SQL语句的优化 eksliang SQL优化 Oracle sql语句优化 SQL语句的优化
转载请出自出处：http://eksliang.iteye.com/blog/2097999 SQL语句的优化总结如下 sql语句的优化可以按照如下六个步骤进行：合理使用索引避免或者简化排序消除对大表的扫描避免复杂的通配符匹配调整子查询的性能 EXISTS和IN运算符下面我就按照上面这六个步骤分别进行总结：
浅析：Android 嵌套滑动机制（NestedScrolling） gg163 android 移动开发滑动机制嵌套
谷歌在发布安卓 Lollipop版本之后，为了更好的用户体验，Google为Android的滑动机制提供了NestedScrolling特性 NestedScrolling的特性可以体现在哪里呢？ 比如你使用了Toolbar，下面一个ScrollView，向上滚
使用hovertree菜单作为后台导航 hvt JavaScript jquery .net hovertree asp.net
hovertree是一个jquery菜单插件，官方网址：http://keleyi.com/jq/hovertree/ ，可以登录该网址体验效果。 0.1.3版本：http://keleyi.com/jq/hovertree/demo/demo.0.1.3.htm hovertree插件包含文件： http://keleyi.com/jq/hovertree/css
SVG 教程（二）矩形天梯梦 svg
SVG <rect> SVG Shapes SVG有一些预定义的形状元素，可被开发者使用和操作：矩形 <rect> 圆形 <circle> 椭圆 <ellipse> 线 <line> 折线 <polyline> 多边形 <polygon> 路径 <path>
一个简单的队列 luyulong java 数据结构队列
public class MyQueue { private long[] arr; private int front; private int end; // 有效数据的大小 private int elements; public MyQueue() { arr = new long[10]; elements = 0; front
基础数据结构和算法九：Binary Search Tree sunwinner Algorithm
A binary search tree (BST) is a binary tree where each node has a Comparable key (and an associated value) and satisfies the restriction that the key in any node is larger than the keys in all
项目出现的一些问题和体会 Steven-Walker DAO Web servlet
第一篇博客不知道要写点什么，就先来点近阶段的感悟吧。这几天学了servlet和数据库等知识，就参照老方的视频写了一个简单的增删改查的，完成了最简单的一些功能，使用了三层架构。 dao层完成的是对数据库具体的功能实现，service层调用了dao层的实现方法，具体对servlet提供支持。 &
高手问答：Java老A带你全面提升Java单兵作战能力！ ITeye管理员 java
本期特邀《Java特种兵》作者：谢宇，CSDN论坛ID: xieyuooo 针对JAVA问题给予大家解答，欢迎网友积极提问，与专家一起讨论! 作者简介：淘宝网资深Java工程师，CSDN超人气博主，人称“胖哥”。 CSDN博客地址： http://blog.csdn.net/xieyuooo 作者在进入大学前是一个不折不扣的计算机白痴，曾经被人笑话过不懂鼠标是什么，