VariableX

【线性回归】面向新手的基础知识

文章目录

线性回归建模
线性回归损失函数、代价函数、目标函数
线性回归模型的求解方法

1. 梯度下降法
2. 最小二乘法

带有正则化项的回归模型
回归任务的评价指标

1. 平均绝对误差(MAE)
2. 均方误差(MSE)
3. 均方根误差(RMSE)
4. 决定系数( $R^2$ )

线性回归建模

首先考虑一个情景，假设我们希望用线性回归预测房屋的售价。一般网上公开的房价预测数据集都至少包含房屋的面积、厅室数量等特征以及房屋的售价：

面积( $x_1$ )	厅室数量( $x_2$ )	价格(万元)(y)
64	3	225
59	3	185
65	3	208
116	4	508
……	……	……

对此数据，我们可以建立售价和特征属性之间的关系：
$f(x)=w_0+w_1x_1+w_2x_2$
更一般的，假如我们有数据集：
$\{(x^{(1)},y^{(1)},((x^{(2)},y^{(2)}),...,((x^{(n)},y^{(n)})\} \\ x_i = (x_{1};x_{2};x_{3};...;x_{d}),y_i\in R$
其中，n 表示样本的个数，d表示特征的个数。则y与样本x的特征之间的关系为：
$\begin{aligned} f(x) &= w_0 + w_1x_1 + w_2x_2 + ... + w_dx_d \\ &= \sum_{i=0}^{d}w_ix_i \\ \end{aligned}$
其中，我们假设 $x_0$ =1，下文都作此假设。

线性回归损失函数、代价函数、目标函数

损失函数：度量单个样本的错误程度。常用的损失函数有：0-1损失函数、平方损失函数、绝对损失函数、对数损失函数等。
代价函数：度量所有样本的平均错误程度，也就是所有样本损失函数的均值。常用的代价函数包括均方误差(MSE)、均方根误差(RMSE)、平均绝对误差(MAE)等。
目标函数：代价函数与正则化函数的结合，也是最终要优化的函数。

我们的目标是找到一组合适的w，使得 $f(x)\approx y$ 。对于回归问题，有许多性能度量方法，其中常用的一个是均方误差(MSE)，即：
$J(w)=\frac{1}{2}\sum_{j=1}^{n}(f_{w}(x^{(j)})-y^{(j)})^2$
我们称 $J (w)$ 为代价函数。注意到式子的系数不是1/n而是1/2，数是因为求导后的 $J^{'} (w)$ 系数为1，方便后续计算。为什么均方误差可以作为性能度量？可以从极大似然估计（概率角度）入手。

为了能够能精确的表达特征和目标值y的关系，引入了误差项ϵ，表示模型受到的未观测到的因素的影响。于是我们可以假设：
$y^{(i)} = w^T x^{(i)}+\epsilon^{(i)}$
使用回归模型需要满足许多前提假设，其中一个是要求ϵ独立同分布，且服从 $N(0, σ^2)$ 的高斯分布(正态分布)：
$p(\epsilon^{(i)}) = \frac{1}{\sqrt{2\pi}\sigma}exp\left(-\frac{(\epsilon^{(i)})^2}{2\sigma^2}\right)$
所以在给定w和x的前提下， $y^{(i)}$ 服从 $N(w^T x^{(i)}, σ^2)$ 的正态分布。
$p(y^{(i)}|x^{(i)};w) = \frac{1}{\sqrt{2\pi}\sigma}exp\left(-\frac{(y^{(i)}-w^T x^{(i)})^2}{2\sigma^2}\right)$
现在我们已经知道$y^{(i)} $的分布，但是我们不知道他的参数 $w^T x^{(i)}, σ^2$ ，极大似然估计法来正是用来解决此类问题的，假设样本独立同分布，最大化似然函数，来进行参数估计。最大化似然函数的原理说简单点就是在一次观测中，发生了的事件其概率应该大。概率大的事在观测中容易发生，所以我们希望让每一个 $p(y^{(i)}|x^{(i)};w)$ 都最大化，这等效于他们的乘积最大化。于是不难得到似然函数：
$\prod^n_{i=1}\frac{1}{\sqrt{2\pi}\sigma}exp\left(-\frac{(y^{(i)}-w^T x^{(i)})^2}{2\sigma^2}\right)$
现在，目标转换为找到最佳的w，使得L(w)最大化，这就是极大似然估计的思想。我们通常对L(w)取对数，转换成加法的形式来方便计算：
$\begin{aligned} L(w) &= log L(w) \\ &= log \prod^n_{i=1}\frac{1}{\sqrt{2\pi}\sigma}exp\left(-\frac{(y^{(i)}-w^T x^{(i)})^2} {2\sigma^2}\right) \\ & = \sum^n_{i=1}log\frac{1}{\sqrt{2\pi}\sigma}exp\left(-\frac{(y^{(i)}-w^T x^{(i)})^2}{2\sigma^2}\right) \\ & = nlog\frac{1}{{\sqrt{2\pi}\sigma}} - \frac{1}{\sigma^2} \cdot \frac{1}{2}\sum^n_{i=1}((y^{(i)}-w^T x^{(i)})^2 \end{aligned}$
因此，要最大化 $L (w)$ 只需要最小化：
$\frac{1}{2}\sum^n_{i=1}((y^{(i)}-w^T x^{(i)})^2$
这一结果即为均方误差的形式，因此使用 $J (w)$ 作为代价函数是合理的。

线性回归模型的求解方法

1. 梯度下降法

随机初始化参数w，不端迭代，直到w达到收敛的状态，此时 $J (w)$ 达到了最小值(有时候是局部最小值) ：
$w_j=w_j-\alpha\frac{\partial{J(w)}}{\partial w}$
上式中α为学习率，其中，
$\begin{aligned} \frac{\partial{J(w)}}{\partial w_j} &= \frac{\partial}{\partial w_j}\frac{1}{2}\sum_{i=1}^{n}(f_w(x)^{(i)}-y^{(i)})^2 \\ &= 2*\frac{1}{2}\sum_{i=1}^{n}(f_w(x)^{(i)}-y^{(i)})*\frac{\partial}{\partial w_j}(f_w(x)^{(i)}-y^{(i)}) \\ &= \sum_{i=1}^{n}(f_w(x)^{(i)}-y^{(i)})*\frac{\partial}{\partial w_j}(\sum_{j=0}^{d}w_jx_j^{(i)}-y^{(i)}))\\ &= \sum_{i=1}^{n}(f_w(x)^{(i)}-y^{(i)})x_j^{(i)} \\ \end{aligned}$
于是有：
$w_j = w_j + \alpha\sum_{i=1}^{n}(y^{(i)}-f_w(x)^{(i)})x_j^{(i)}$
将上式向量化后得到：
$\alpha\sum_{i=1}^{n}(y^{(i)}-f_w(x)^{(i)})x^{(i)}$
可以看到上面的式子每次都迭代所有的样本，完成w的梯度下降，迭代过程如下图所示（越靠近内部，代价函数的值越小）：

有时候我们不能将所有数据一次性加载到内存中，那么可以每次只用部分样本(例如16，32，64等)进行梯度下降，此时的梯度下降法又叫做批梯度下降法。

极端情况下，我们每次只对一个样本进行梯度下降，此时的梯度下降法又叫做随机梯度下降法（SGD）。好处是相对于使用多个样本的梯度下降法，SGD每次迭代计算量都比较小，因此迭代速度很快。缺点是容易受到噪声点的干扰，导致梯度下降的方向不稳定，如下图所示：

因此要结合实际场景选择合适的梯度下降算法。

2. 最小二乘法

令：
$x^{(i)} = \left[ \begin{array} {cccc} x_0^{(i)}\\ x_1^{(i)}\\ x_2^{(i)}\\ \ldots \\ x_d^{(i)} \end{array} \right]$
$\left[ \begin{array} {cccc} (x^{(0)})^T\\ (x^{(1)})^T\\ (x^{(2)})^T\\ \ldots \\ (x^{(n)})^T \end{array} \right]$
$\left[ \begin{array} {cccc} y^{(1)}\\ y^{(2)}\\ \ldots \\ y^{(n)} \end{array} \right]$
则有：
$f_w(x)=Xw$
且每个样本的误差组成的矩阵为：
$X w - Y$
进而有：
$J(w)=\frac{1}{2}(Xw-Y)^T(Xw-Y)$
由于这是个存在最小值的凸函数，故对w求导可得：
$\begin{aligned} \frac{\partial{J(w)}}{\partial w} &= \frac{\partial}{\partial w} \frac{1}{2}(Xw-Y)^T(Xw-Y) \\ &= \frac{1}{2}\frac{\partial}{\partial w} (w^TX^TXw - Y^TXw-w^T X^TY - Y^TY) \\ &= \frac{1}{2}(\frac{\partial (Xw)^T}{\partial w}Xw + \frac{\partial (Xw)^T}{\partial w}Xw-X^TY -X^TY - 0) \\ &= X^TXw - X^TY \end{aligned}\\$

可能用到的向量和矩阵求导公式：
$\cfrac{\partial\boldsymbol{a}^{\mathrm{T}}\boldsymbol{x}}{\partial\boldsymbol{x}}=\cfrac{\partial\boldsymbol{x}^{\mathrm{T}}\boldsymbol{a}}{\partial\boldsymbol{x}}=\boldsymbol{a} \\ \\ \cfrac{\partial\boldsymbol{x}^{\mathrm{T}}\mathbf{A}\boldsymbol{x}}{\partial\boldsymbol{x}}=(\mathbf{A}+\mathbf{A}^{\mathrm{T}})\boldsymbol{x}$

令导数等于0，得到：
$w = (X^TX)^{-1}X^TY$

注意到上式存在矩阵的逆运算，一般样本数量大于维度的时候矩阵可逆，利用最小二乘法可以得到目标函数的闭式解。但是，当数据维度大于样本数时，X 非满秩，则 $X^TX$ 的结果根据：
$rank(AB)\le \min{(rankA, rankB)}$
可知 $X^TX$ 也不是满秩的，故不可逆，此时会有无穷多个解。

带有正则化项的回归模型

为了简化模型复杂程度，缓解过拟合，可以引入正则化项。根据使用的正则项，回归模型又可以细分为：lasso回归、岭回归（ridge回归）、ElasticNet回归。

Lasso回归使用 $L_1$ 范数(向量中各个元素绝对值之和)来约束模型：
$\frac{1}{2}\sum^n_{i=1}((y^{(i)}-w^T x^{(i)})^2 + \lambda \|w\|_1 \tag 1$
岭回归使用 $L_2$ 范数(向量各元素平方和的平方根)的平方来约束模型：
$\frac{1}{2}\sum^n_{i=1}((y^{(i)}-w^T x^{(i)})^2 + \lambda \|w\|^2_2 \tag 2$

$L_1$ ， $L_2$ 都有助于减缓过拟合，但是前者可以使得部分不重要的特征 $x_j$ 对应的权重 $w_j$ 变为0，可以起到特征选择的作用。

为了更好的理解，我们假设模型只有两个参数 $x_1, x_2$ ，对应的权重为 $w_1, w_2$ ，将公式(1)，(2)等号右边的两项分别绘制图像可以得到：

公式(1)，(2)的最优解应该是均方误差项和正则化项的折中，即出现在均方误差项和正则化项的交点处。从上图可以看到，采用 $L_1$ 范数时，交点出现在 $w_2$ 等于0的坐标轴上，意味着对于此模型特征 $x_2$ 并没有起到作用，可以舍去。而采用 $L_2$ 范数的话，交点更容易落在某个象限中，即$w_1, w_2 $不等于 0 。总的来说，就是$ L_1 $范数比$ L_2$范数更容易得到稀疏的解。

ElasticNet回归则是同时使用了 $L_1$ ， $L_2$ 来约束模型：
$\frac{1}{2}\sum^n_{i=1}((y^{(i)}-w^T x^{(i)})^2 + \lambda_1 \left \| {w} \right \|_1 + \lambda_2\left \| {w} \right \|_2^2$
ElasticNet回归在具有多个特征，并且在特征之间具有一定关联的数据中比较有用。

回归任务的评价指标

1. 平均绝对误差(MAE)

平均绝对误差也叫 $L_1$ 范数损失，公式为：
$\frac{1}{n}\sum^{n}_{i=1} | (y^{(i)} - \hat y^{(i)} |$
其中n为样本的个数， $\hat y^{(i)}$ 表示第i个样本的预测值。MAE能很好的刻画预测值和真实值的偏差，因为偏差有正有负，为了防止正负误差抵消，MAE计算的是误差绝对值的平均值。MAE 也可以作为损失函数，但是有些模型(如XGboost)必须要求损失函数有二阶导数，所以不能使用MAE进行优化。

加权平均绝对误差(WMAE)是MAE的变形，比如考虑时间因素，离当前时间越久的样本权重越低。公式为：
$\frac{1}{n}\sum^{n}_{i=1} w^{(i)}| (y^{(i)} - \hat y^{(i)} |$
其中， $w^{(i)}$ 为第i个样本的权重。

2. 均方误差(MSE)

MSE 计算的是误差平方和的均值，公式如下：
$\frac{1}{n}\sum^{n}_{i=1} (y^{(i)} - \hat y^{(i)} )^2$
MSE 它对误差有着更大的惩罚，但是他也对离群点敏感，健壮性可能不如MAE。

3. 均方根误差(RMSE)

MSE公式有一个问题是会改变量纲。因为公式平方了，比如说 y 值的单位是万元，MSE 计算出来的是万元的平方，对于这个值难以解释它的含义。RMSE 其实就是对MSE开平方根，公式如下：
$RMSE=\sqrt{\frac{1}{n}\sum^{n}_{i=1} (y^{(i)} - \hat y^{(i)} )^2}$
可以看到 MSE 和 RMSE 二者是呈正相关的，MSE 值大，RMSE 值也大，所以在评价线性回归模型效果的时候，使用 RMSE 就可以了。

4. 决定系数( $R^2$ )

当数据集不同时，或者说数据集预测目标的量纲不同时，上面三种评估方式的结果就不好比较了。 $R^2$ 把预测目标的均值作为参照，例如房价数据集的房价均值，学生成绩的成绩均值。现在我们把这个均值当成一个基准参照模型，也叫 baseline model。这个均值模型对任何数据的预测值都是一样的，可以想象该模型效果自然很差。基于此我们才会想从数据集中寻找规律，建立更好的模型。

$R^2$ 公式如下：
$R^2 = 1- \frac{\sum^{n}_{i=1} (y^{(i)} - \hat y^{(i)} )^2}{\sum^{n}_{i=1} (\bar y - \hat y^{(i)} )^2} = 1-\frac{\frac{1}{n}\sum^{n}_{i=1}(y^{(i)} - \hat y^{(i)})^2}{\frac{1}{n}\sum^{n}_{i=1}(\bar y - \hat y^{(i)})^2} = 1-\frac{MSE}{VAR}$
$R^2$ = 1，达到最大值。即分子为 0 ，意味着样本中预测值和真实值完全相等，没有任何误差。也就是说我们建立的模型完美拟合了所有真实数据，是效果最好的模型， $R^2$ 值也达到了最大。但通常模型不会这么完美，总会有误差存在，当误差很小的时候，分子小于分母，模型会趋近 1，仍然是好的模型，随着误差越来越大，$R^2 $也会离最大值 1 越来越远，直到出现下面的情况。

$R^2$ = 0，此时分子等于分母，样本的每项预测值都等于均值。也就是说我们辛苦训练出来的模型和前面说的均值模型完全一样，还不如不训练，直接让模型的预测值全去均值。当误差越来越大的时候就出现了第三种情况。

$R^2$ < 0 ，分子大于分母，训练模型产生的误差比使用均值产生的还要大，也就是训练模型反而不如直接去均值效果好。出现这种情况，通常是模型本身不是线性关系的，而我们误使用了线性模型，导致误差很大。

参考资料：

【机器学习12】线性回归算法评价指标：MSE、RMSE、R2_score
周志华《机器学习》
李航《统计学习方法第二版》

Python前沿技术：机器学习与人工智能 4.0啊 Python 人工智能 python 机器学习
Python前沿技术：机器学习与人工智能一、引言随着科技的飞速发展，机器学习和人工智能（AI）已经成为了计算机科学领域的热门话题。Python作为一门易学易用且功能强大的编程语言，已经成为了这两个领域的首选语言之一。本文将深入探讨Python在机器学习和人工智能领域的应用，以及一些前沿技术和工具。二、Python机器学习基础2.1机器学习概述机器学习是人工智能（AI）的一个关键子集，它的核心在于让
如何有效的学习AI大模型？ Python程序员罗宾学习人工智能语言模型自然语言处理架构
学习AI大模型是一个系统性的过程，涉及到多个学科的知识。以下是一些建议，帮助你更有效地学习AI大模型：基础知识储备：数学基础：学习线性代数、概率论、统计学和微积分等，这些是理解机器学习算法的数学基础。编程技能：掌握至少一种编程语言，如Python，因为大多数AI模型都是用Python实现的。理论学习：机器学习基础：了解监督学习、非监督学习、强化学习等基本概念。深度学习：学习神经网络的基本结构，如卷
深度学习算法，该如何深入，举例说明 liyy614 深度学习
深度学习算法的深入学习可以从理论和实践两个方面进行。理论上，深入理解深度学习需要掌握数学基础（如线性代数、概率论、微积分）、机器学习基础和深度学习框架原理。实践上，可以通过实现和优化深度学习模型来提升技能。理论深入数学基础线性代数：理解向量、矩阵、特征值和特征向量等，对于理解神经网络的权重和偏置矩阵至关重要。概率论：用于理解模型的不确定性，如Dropout等正则化技术。微积分：理解梯度下降等优化算
Python 机器学习基础之数据表示与特征工程【分箱、离散化、线性模型与树 / 交互特征与多项式特征】的简单说明仙魁XAN Python 机器学习基础+实战案例机器学习 python 分箱离散化线性模型与树交互特征与多项式特征
Python机器学习基础之数据表示与特征工程【分箱、离散化、线性模型与树/交互特征与多项式特征】的简单说明目录Python机器学习基础之数据表示与特征工程【分箱、离散化、线性模型与树/交互特征与多项式特征】的简单说明一、简单介绍二、分箱、离散化、线性模型与树三、交互特征与多项式特征附录一、参考文献一、简单介绍Python是一种跨平台的计算机程序设计语言。是一种面向对象的动态类型语言，最初被设计用于
机器学习基础（四）——决策树与随机森林 Bayesian小孙机器学习基础决策树机器学习随机森林
决策树与随机森林文章目录决策树与随机森林一、知识概要（一）二、决策树使用的算法三、sklearn决策树API四、决策树的案例1.数据清洗2.特征工程3.调用决策树API五、集成学习方法-随机森林1.知识概要（二）2.集成学习API3.随机森林的案例importpandasaspdfromsklearn.feature_extractionimportDictVectorizerfromsklear
【机器学习基础】Anaconda与Pycharm使用叫我东方小巴黎机器学习基础人工智能
这里写目录标题指定py版本安装包指定py版本安装包condaenvlistactivatexxxcondalistpipinstallxxx
Datawhale X 李宏毅苹果书 AI夏令营｜机器学习基础之案例学习 Monyan 人工智能机器学习学习李宏毅深度学习
机器学习（MachineLearning,ML）：机器具有学习的能力，即让机器具备找一个函数的能力函数不同，机器学习的类别不同：回归（regression）：找到的函数的输出是一个数值或标量（scalar）。例如：机器学习预测某一个时间段内的PM2.5，机器要找到一个函数f，输入是跟PM2.5有关的的指数，输出是明天中午的PM2.5的值。分类（classification）：让机器做选择题，先准备
应用数学与机器学习基础 - 线性代数篇绎岚科技机器学习深度学习机器学习线性代数
线性代数1.标量、向量、矩阵、张量学习线性代数，会涉及以下几个数学概念：标量（scalar）：定义：一个标量就是一个单数的数，不同于线性代数中大多数概念会涉及到多个数。表示法：我们用斜体表示标量。标量通常赋予小写的变量名称。当我们介绍标量时，会明确它们是哪种类型的数。比如，在定义实数标量时，我们可能会说”让s∈Rs\in\mathbb{R}s∈R表示一条线的斜率“；在定义自然数标量时，我们可能会说
机器学习基础篇（八）——逻辑回归柚子味的羊数据分析机器学习机器学习算法逻辑回归
机器学习基础篇（八）——逻辑回归一、简介分类问题是机器学习中常见的一种问题，而逻辑回归则是非常适合二分类问题的一种算法。逻辑回归可以将数据集中的点划分成为两个类别。例如，我们可以将数据分成A类和B类。模型将给出特定数据点属于B类的概率，如果它低于0.5，那么就属于A类。如果高于0.5，那么该数据点属于B类。（大部分情况下阈值设为0.5，特定情况下也可以设置为其他值）举个栗子如图所示，学生考试是否成
深度学习如何入门？ nanshaws yolov5 深度学习
深度学习是机器学习的一个子领域，它基于人工神经网络的研究。入门深度学习可以分为以下几个步骤：基础知识准备：（1）掌握基础数学知识，特别是线性代数、概率论和统计学、微积分。（2）学习编程语言，Python是目前最流行的深度学习语言，因其简洁易学且有大量的库支持。（3）了解机器学习基础，包括监督学习和非监督学习的概念、模型评估与选择等。学习深度学习理论：（1）理解神经网络的基本组成，如神经元、激活函数
【机器学习基础】正则化为梦而生~ 机器学习机器学习人工智能
个人主页：为梦而生~关注我一起学习吧！专栏：机器学习欢迎订阅！后面的内容会越来越有意思~⭐特别提醒：针对机器学习，特别开始专栏：机器学习python实战欢迎订阅！本专栏针对机器学习基础专栏的理论知识，利用python代码进行实际展示，真正做到从基础到实战！往期推荐：【机器学习基础】机器学习入门（1）【机器学习基础】机器学习入门（2）【机器学习基础】机器学习的基本术语【机器学习基础】机器学习的模型评
机器学习基础（一）理解机器学习的本质昊昊该干饭了人工智能 python 机器学习人工智能 python
导读：在本文中，将深入探索机器学习的根本原理，包括基本概念、分类及如何通过构建预测模型来应用这些理论。目录机器学习机器学习概念相关概念机器学习根本：模型数据的语言：特征与标签训练与测试：模型评估机器学习的分类监督学习：有指导的学习过程非监督学习：自我探索的过程强化学习：通过试错学习构建与分析鸢尾花数据模型鸢尾花数据集简介加载数据集创建和训练模型进行预测与评估模型机器学习机器学习概念机器学习是人工智
【深度学习】讲透深度学习第3篇：TensorFlow张量操作（代码文档已分享）
本系列文章md笔记（已分享）主要讨论深度学习相关知识。可以让大家熟练掌握机器学习基础,如分类、回归（含代码），熟练掌握numpy,pandas,sklearn等框架使用。在算法上，掌握神经网络的数学原理，手动实现简单的神经网络结构，在应用上熟练掌握TensorFlow框架使用，掌握神经网络图像相关案例。具体包括：TensorFlow的数据流图结构，神经网络与tf.keras，卷积神经网络(CNN)
四、机器学习基础概念介绍 ITS_Oaij 脑电机器学习机器学习人工智能
四、机器学习基础概念介绍1_机器学习基础概念机器学习分类1.1有监督学习1.2无监督学习2_有监督机器学习—常见评估方法数据集的划分2.1留出法2.2校验验证法（重点方法）简单交叉验证K折交叉验证（单独流出测试集）（常用方法/Sklearn的默认方法）k折交叉验证（不单独留出测试集）留一法交叉验证Subject-wise交叉验证2.3bootstrap自助法3_有监督机器学习—学习评价指标3.1准
【机器学习 & 深度学习】开发工具Anaconda的安装与使用为梦而生~ 机器学习python实战机器学习深度学习 python conda pycharm 人工智能
个人主页：为梦而生~关注我一起学习吧！专栏：机器学习：相对完整的机器学习基础教学！机器学习python实战：用python带你感受真实的机器学习深度学习：现代人工智能的主流技术介绍往期推荐：【机器学习&深度学习】神经网络简述【机器学习&深度学习】卷积神经网络学习笔记【Python基础&机器学习】Python环境搭建（适合新手阅读的超详细教程）文章目录前言安装Anaconda关于Anaconda的介
跨模态行人重识别都需要学什么 ALGORITHM LOL 人工智能
跨模态行人重识别（Cross-ModalityPersonRe-identification,简称Cross-ModalityRe-ID）是计算机视觉领域的一项挑战性任务，旨在跨越不同模态之间（例如，可见光与红外线图像）识别同一行人。该任务涉及图像处理、特征提取、模态转换、深度学习等多个方面。1.基础知识计算机视觉与图像处理：理解图像基础（如像素、色彩空间）、图像变换、图像增强技术。机器学习基础：
ChatGPT学习大纲冷暖从容 ChatGPT chatgpt 学习人工智能
引言在2023年2月份左右开始使用ChatGPT时，就被它强大的理解能力和应答效果所折服，这期间一直在断断续续的学习和使用，也没形成一个完整的学习过程，最近刚好有空，就寻思着好好再学习总结一下，故写出了ChatGPT学习系列的文章，供与大家学习交流。第1周-ChatGPT基础知识ChatGPT简介了解ChatGPT的基本功能和应用场景。人工智能与机器学习基础学习AI和机器学习的基本概念，为理解
机器学习概述及流程机智的冷露机器学习人工智能机器学习 python
概述一、目标1、掌握机器学习基础环境安装2、掌握常用的科学计算库对数据进行展示、分析二、人工智能三要素1、数据2、算法2、算力：CPU适合I/O密集型程序，GPU适合计算密集型和易于并行的程序。三、人工智能主要分支1、计算机视觉（CV）2、自然语言处理（NLP）：文本挖掘/分类、机器翻译、语音识别3、机器人四、机器学习工作流程简介从数据中自动分析获得模型，再利用模型对未知数据进行预测。1、获取数据
机器学习基础——matplotlib.pyplot和seaborn的使用小螳螂
importmatplotlib.pyplotaspltimportnumpyasnp第一步生成数据集x=np.linspace(-3,3,50)#平均采样,[-3,3]采样50个x.shape(50,)y1=2*x+1y1.shape(50,)y2=x**2y2array([9.00000000e+00,8.28029988e+00,7.59058726e+00,6.93086214e+00,6
【深度学习】讲透深度学习第3篇：TensorFlow张量操作（代码文档已分享）程序员一诺 python笔记人工智能深度学习深度学习 tensorflow 人工智能
本系列文章md笔记（已分享）主要讨论深度学习相关知识。可以让大家熟练掌握机器学习基础,如分类、回归（含代码），熟练掌握numpy,pandas,sklearn等框架使用。在算法上，掌握神经网络的数学原理，手动实现简单的神经网络结构，在应用上熟练掌握TensorFlow框架使用，掌握神经网络图像相关案例。具体包括：TensorFlow的数据流图结构，神经网络与tf.keras，卷积神经网络(CNN)
机器学习入门-----sklearn 辣椒酱. python 机器学习 sklearn 人工智能
机器学习基础了解概念机器学习是人工智能的一个实现途径深度学习是机器学习的一个方法发展而来定义：从数据中自动分析获得模型，并利用模型对特征数据【数据集：特征值+目标值构成】进行预测算法数据集的目标值是类别的话叫做分类问题；目标值是连续的数值的话叫做回归问题；统称监督学习；另一类是无监督学习，这一类的数据集没有目标值，典型：聚类；做什么可以进行传统预测、图像识别、自然语言处理传统预测店铺销量预测、量化
【机器学习】科学库使用手册第2篇：机器学习任务和工作流程（已分享，附代码）程序员一诺 python笔记机器学习人工智能机器学习人工智能
本系列文章md笔记（已分享）主要讨论人工智能相关知识。主要内容包括，了解机器学习定义以及应用场景，掌握机器学习基础环境的安装和使用，掌握利用常用的科学计算库对数据进行展示、分析，学会使用jupyternotebook平台完成代码编写运行，应用Matplotlib的基本功能实现图形显示，应用Matplotlib实现多图显示，应用Matplotlib实现不同画图种类，学习Numpy运算速度上的优势，知
【深度学习】从0完整讲透深度学习第2篇：TensorFlow介绍和基本操作（代码文档已分享）程序员一诺 python笔记深度学习人工智能深度学习 tensorflow 人工智能
本系列文章md笔记（已分享）主要讨论深度学习相关知识。可以让大家熟练掌握机器学习基础,如分类、回归（含代码），熟练掌握numpy,pandas,sklearn等框架使用。在算法上，掌握神经网络的数学原理，手动实现简单的神经网络结构，在应用上熟练掌握TensorFlow框架使用，掌握神经网络图像相关案例。具体包括：TensorFlow的数据流图结构，神经网络与tf.keras，卷积神经网络(CNN)
2024-01-06-AI 大模型全栈工程师 - 机器学习基础流雨声人工智能机器学习
摘要2024-01-06阴杭州晴本节简介:a.数学模型&算法名词相关概念;b.学会数学建模相关知识；c.学会自我思考，提升认知，不要只会模仿；课程内容1.Fine-Tuning有什么作用？a.什么是模型训练（Training）b.什么是模型预训练（Pre-Training）c.微调（Fine-Tuning）d.轻量化微调（ParameterEfficientFine-Tuning,PEFT）2.什
机器学习基础、数学统计学概念、模型基础技术名词及相关代码个人举例是lethe先生机器学习人工智能
1.机器学习基础（1）机器学习概述机器学习是一种人工智能（AI）的分支，通过使用统计学和计算机科学的技术，使计算机能够从数据中学习并自动改进性能，而无需进行明确的编程。它涉及构建和训练机器学习模型，以便能够对未见过的数据进行预测或做出决策。机器学习的基本目标是通过从数据中发现模式和规律，自动提取和学习数据中的特征，并用这些特征构建预测模型或分类模型。（2）数学统计学概念1、概率论：概率论是研究随机
2024-01-06-AI 大模型全栈工程师 - 机器学习基础流雨声人工智能机器学习
摘要2024-01-06阴杭州晴本节简介:a.数学模型&算法名词相关概念;b.学会数学建模相关知识；c.学会自我思考，提升认知，不要只会模仿；课程内容1.Fine-Tuning有什么作用？a.什么是模型训练（Training）b.什么是模型预训练（Pre-Training）c.微调（Fine-Tuning）d.轻量化微调（ParameterEfficientFine-Tuning,PEFT）2.什
【机器学习 & 深度学习】卷积神经网络简述为梦而生~ 机器学习深度学习机器学习人工智能深度学习神经网络 cnn 计算机视觉自然语言处理
个人主页：为梦而生~关注我一起学习吧！专栏：机器学习欢迎订阅！相对完整的机器学习基础教学！⭐特别提醒：针对机器学习，特别开始专栏：机器学习python实战欢迎订阅！本专栏针对机器学习基础专栏的理论知识，利用python代码进行实际展示，真正做到从基础到实战！往期推荐：【机器学习基础】一元线性回归（适合初学者的保姆级文章）【机器学习基础】多元线性回归（适合初学者的保姆级文章）【机器学习基础】决策树（
【Python基础 & 机器学习】Python环境搭建（适合新手阅读的超详细教程）为梦而生~ 机器学习python实战 python 机器学习开发语言人工智能数据挖掘 pycharm
个人主页：为梦而生~关注我一起学习吧！重要专栏：机器学习：相对完整的机器学习基础教学！机器学习python实战：用python带你感受真实的机器学习深度学习：现代人工智能的主流技术介绍python网络爬虫从基础到实战：Python的主流应用领域之一，也可以与人工智能领域相结合的技术往期推荐：【机器学习&深度学习】神经网络简述【机器学习&深度学习】卷积神经网络简述【python爬虫开发实战&情感分析
深度学习知识点汇总-机器学习基础（5）深度学习模型优化
2.5分类算法的评估指标有哪些？图1混淆矩阵上图中术语解释：TP（Truepositives）。表示被正确地划分为正例的个数，即实际为正例且被分类器划分为正例的实例数；FP（Falsepositives）。表示被错误地划分为正例的个数，即实际为负例但被分类器划分为正例的实例数；FN（Falsenegatives）。表示被错误地划分为负例的个数，即实际为正例但被分类器划分为负例的实例数；TN（Tru
机器学习基础2 qingxi_ran 机器学习人工智能
提示：MachneLearning机器学习吴恩达目录一、JupyterNotebooks（数据分析神器）二、回归模型（线性回归）三、分类模型（离散）四、术语一、JupyterNotebooks（数据分析神器）机器学习和数据科学从业者使用最广泛的工具在命令行输入pipinstalljupyter在命令行输入jupyternotework熟练使用jupyternotebook（三天）二、回归模型（线性
JVM StackMapTable 属性的作用及理解 lijingyao8206 jvm 字节码 Class文件 StackMapTable
在Java 6版本之后JVM引入了栈图(Stack Map Table)概念。为了提高验证过程的效率，在字节码规范中添加了Stack Map Table属性，以下简称栈图，其方法的code属性中存储了局部变量和操作数的类型验证以及字节码的偏移量。也就是一个method需要且仅对应一个Stack Map Table。在Java 7版
回调函数调用方法百合不是茶 java
最近在看大神写的代码时,.发现其中使用了很多的回调 ,以前只是在学习的时候经常用到 ,现在写个笔记记录一下代码很简单: MainDemo :调用方法得到方法的返回结果
[时间机器]制造时间机器需要一些材料 comsci 制造
根据我的计算和推测,要完全实现制造一台时间机器,需要某些我们这个世界不存在的物质和材料... 甚至可以这样说,这种材料和物质,我们在反应堆中也无法获得......
开口埋怨不如闭口做事邓集海邓集海做人做事工作
“开口埋怨，不如闭口做事。”不是名人名言，而是一个普通父亲对儿子的训导。但是，因为这句训导，这位普通父亲却造就了一个名人儿子。这位普通父亲造就的名人儿子，叫张明正。　　　　张明正出身贫寒，读书时成绩差，常挨老师批评。高中毕业，张明正连普通大学的分数线都没上。高考成绩出来后，平时开口怨这怨那的张明正，不从自身找原因，而是不停地埋怨自己家庭条件不好、埋怨父母没有给他创造良好的学习环境。　　　　
jQuery插件开发全解析，类级别与对象级别开发 IT独行者 jquery 开发插件　函数
jQuery插件的开发包括两种：一种是类级别的插件开发，即给 jQuery添加新的全局函数，相当于给 jQuery类本身添加方法。 jQuery的全局函数就是属于 jQuery命名空间的函数，另一种是对象级别的插件开发，即给 jQuery对象添加方法。下面就两种函数的开发做详细的说明。 1 、类级别的插件开发类级别的插件开发最直接的理解就是给jQuer
Rome解析Rss 413277409 Rome解析Rss
import java.net.URL; import java.util.List; import org.junit.Test; import com.sun.syndication.feed.synd.SyndCategory; import com.sun.syndication.feed.synd.S
RSA加密解密无量加密解密 rsa
RSA加密解密代码代码有待整理 package com.tongbanjie.commons.util; import java.security.Key; import java.security.KeyFactory; import java.security.KeyPair; import java.security.KeyPairGenerat
linux 软件安装遇到的问题 aichenglong linux 遇到的问题 ftp
1 ftp配置中遇到的问题 500 OOPS: cannot change directory 出现该问题的原因:是SELinux安装机制的问题.只要disable SELinux就可以了修改方法:1 修改/etc/selinux/config 中SELINUX=disabled 2 source /etc
面试心得 alafqq 面试
最近面试了好几家公司。记录下；支付宝，面试我的人胖胖的，看着人挺好的；博彦外包的职位，面试失败；阿里金融，面试官人也挺和善，只不过我让他吐血了。。。由于印象比较深，记录下； 1，自我介绍 2，说下八种基本类型；（算上string。楼主才答了3种，哈哈，string其实不是基本类型，是引用类型） 3，什么是包装类，包装类的优点； 4，平时看过什么书？NND，什么书都没看过。。照样
java的多态性探讨百合不是茶 java
java的多态性是指main方法在调用属性的时候类可以对这一属性做出反应的情况 //package 1; class A{ public void test(){ System.out.println("A"); } } class D extends A{ public void test(){ S
网络编程基础篇之JavaScript-学习笔记 bijian1013 JavaScript
1.documentWrite <html> <head> <script language="JavaScript"> document.write("这是电脑网络学校"); document.close(); </script> </h
探索JUnit4扩展：深入Rule bijian1013 JUnit Rule 单元测试
本文将进一步探究Rule的应用，展示如何使用Rule来替代@BeforeClass，@AfterClass，@Before和@After的功能。在上一篇中提到，可以使用Rule替代现有的大部分Runner扩展，而且也不提倡对Runner中的withBefores()，withAfte
[CSS]CSS浮动十五条规则 bit1129 css
这些浮动规则，主要是参考CSS权威指南关于浮动规则的总结，然后添加一些简单的例子以验证和理解这些规则。 1. 所有的页面元素都可以浮动 2. 一个元素浮动后，会成为块级元素，比如<span>,a, strong等都会变成块级元素 3.一个元素左浮动，会向最近的块级父元素的左上角移动，直到浮动元素的左外边界碰到块级父元素的左内边界；如果这个块级父元素已经有浮动元素停靠了
【Kafka六】Kafka Producer和Consumer多Broker、多Partition场景 bit1129 partition
0.Kafka服务器配置 3个broker 1个topic，6个partition，副本因子是2 2个consumer，每个consumer三个线程并发读取 1. Producer package kafka.examples.multibrokers.producers; import java.util.Properties; import java.util.
zabbix_agentd.conf配置文件详解 ronin47 zabbix 配置文件
Aliaskey的别名，例如 Alias=ttlsa.userid:vfs.file.regexp[/etc/passwd,^ttlsa:.:([0-9]+),,,,\1]，或者ttlsa的用户ID。你可以使用key：vfs.file.regexp[/etc/passwd,^ttlsa:.: ([0-9]+),,,,\1]，也可以使用ttlsa.userid。备注: 别名不能重复，但是可以有多个
java--19.用矩阵求Fibonacci数列的第N项 bylijinnan fibonacci
参考了网上的思路，写了个Java版的： public class Fibonacci { final static int[] A={1,1,1,0}; public static void main(String[] args) { int n=7; for(int i=0;i<=n;i++){ int f=fibonac
Netty源码学习-LengthFieldBasedFrameDecoder bylijinnan java netty
先看看LengthFieldBasedFrameDecoder的官方API http://docs.jboss.org/netty/3.1/api/org/jboss/netty/handler/codec/frame/LengthFieldBasedFrameDecoder.html API举例说明了LengthFieldBasedFrameDecoder的解析机制，如下：实
AES加密解密 chicony 加密解密
AES加解密算法，使用Base64做转码以及辅助加密： package com.wintv.common; import javax.crypto.Cipher; import javax.crypto.spec.IvParameterSpec; import javax.crypto.spec.SecretKeySpec; import sun.misc.BASE64Decod
文件编码格式转换 ctrain 编码格式
package com.test; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; import java.io.OutputStream;
mysql 在linux客户端插入数据中文乱码 daizj mysql 中文乱码
1、查看系统客户端，数据库，连接层的编码查看方法： http://daizj.iteye.com/blog/2174993 进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+------
好代码是廉价的代码 dcj3sjt126com 程序员读书
长久以来我一直主张：好代码是廉价的代码。当我跟做开发的同事说出这话时，他们的第一反应是一种惊愕，然后是将近一个星期的嘲笑，把它当作一个笑话来讲。当他们走近看我的表情、知道我是认真的时，才收敛一点。当最初的惊愕消退后，他们会用一些这样的话来反驳： “好代码不廉价，好代码是采用经过数十年计算机科学研究和积累得出的最佳实践设计模式和方法论建立起来的精心制作的程序代码。” 我只
Android网络请求库——android-async-http dcj3sjt126com android
在iOS开发中有大名鼎鼎的ASIHttpRequest库，用来处理网络请求操作，今天要介绍的是一个在Android上同样强大的网络请求库android-async-http，目前非常火的应用Instagram和Pinterest的Android版就是用的这个网络请求库。这个网络请求库是基于Apache HttpClient库之上的一个异步网络请求处理库，网络处理均基于Android的非UI线程，通
ORACLE 复习笔记之SQL语句的优化 eksliang SQL优化 Oracle sql语句优化 SQL语句的优化
转载请出自出处：http://eksliang.iteye.com/blog/2097999 SQL语句的优化总结如下 sql语句的优化可以按照如下六个步骤进行：合理使用索引避免或者简化排序消除对大表的扫描避免复杂的通配符匹配调整子查询的性能 EXISTS和IN运算符下面我就按照上面这六个步骤分别进行总结：
浅析：Android 嵌套滑动机制（NestedScrolling） gg163 android 移动开发滑动机制嵌套
谷歌在发布安卓 Lollipop版本之后，为了更好的用户体验，Google为Android的滑动机制提供了NestedScrolling特性 NestedScrolling的特性可以体现在哪里呢？ 比如你使用了Toolbar，下面一个ScrollView，向上滚
使用hovertree菜单作为后台导航 hvt JavaScript jquery .net hovertree asp.net
hovertree是一个jquery菜单插件，官方网址：http://keleyi.com/jq/hovertree/ ，可以登录该网址体验效果。 0.1.3版本：http://keleyi.com/jq/hovertree/demo/demo.0.1.3.htm hovertree插件包含文件： http://keleyi.com/jq/hovertree/css
SVG 教程（二）矩形天梯梦 svg
SVG <rect> SVG Shapes SVG有一些预定义的形状元素，可被开发者使用和操作：矩形 <rect> 圆形 <circle> 椭圆 <ellipse> 线 <line> 折线 <polyline> 多边形 <polygon> 路径 <path>
一个简单的队列 luyulong java 数据结构队列
public class MyQueue { private long[] arr; private int front; private int end; // 有效数据的大小 private int elements; public MyQueue() { arr = new long[10]; elements = 0; front
基础数据结构和算法九：Binary Search Tree sunwinner Algorithm
A binary search tree (BST) is a binary tree where each node has a Comparable key (and an associated value) and satisfies the restriction that the key in any node is larger than the keys in all
项目出现的一些问题和体会 Steven-Walker DAO Web servlet
第一篇博客不知道要写点什么，就先来点近阶段的感悟吧。这几天学了servlet和数据库等知识，就参照老方的视频写了一个简单的增删改查的，完成了最简单的一些功能，使用了三层架构。 dao层完成的是对数据库具体的功能实现，service层调用了dao层的实现方法，具体对servlet提供支持。 &
高手问答：Java老A带你全面提升Java单兵作战能力！ ITeye管理员 java
本期特邀《Java特种兵》作者：谢宇，CSDN论坛ID: xieyuooo 针对JAVA问题给予大家解答，欢迎网友积极提问，与专家一起讨论! 作者简介：淘宝网资深Java工程师，CSDN超人气博主，人称“胖哥”。 CSDN博客地址： http://blog.csdn.net/xieyuooo 作者在进入大学前是一个不折不扣的计算机白痴，曾经被人笑话过不懂鼠标是什么，