不牌不改

【机器学习】线性分类【上】广义线性模型

主要参考了B站UP主“shuhuai008”，包含自己的理解。
有任何的书写错误、排版错误、概念错误等，希望大家包含指正。

由于字数限制，分成两篇博客。
【机器学习】线性分类【上】广义线性模型
【机器学习】线性分类【下】经典线性分类算法

1. 线性模型

线性模型不仅包括线性回归模型，还包括方差分析模型等，但这里我们仅讨论线性回归，所以统一认为线性模型就是线性回归模型。

在《线性回归》中提到，线性回归模型的定义为
$w_0+w_1x_1+\dots+w_px_p\tag{1}$
但其实，式 $(1)$ 只是线性回归中的一个特例。总结 Wikipedia 的解释，只要模型参数满足线性组合，那么就认为是线性回归。比如
$f(x)=w_0+w_1x_1^2x_2+w_2\log(x_2)\tag{2}$
也属于线性回归。因为我们完全可以认为自变量并非 $x$ ，而是 $t=\{t_1,t_2\}$ ，其中 $t_1=x_1^2x_2$ ， $t_2=\log(x_2)$ ，因此式 $(2)$ 可以重新表示为
$w_0+w_1t_1+w_2t_2\tag{3}$
所以说，Wikipedia 也提到多项式回归也是线性回归的特例。根据自变量的个数和次数，多项式回归又可以称为 $n$ 元 $m$ 次多项式回归，不作为重点讲解。

要想与机器学习领域融合，我们不得不先区分一下“线性函数”与“线性回归”。对线性函数而言，我们是视角是自变量，如果函数是自变量的线性组合，则为线性函数；而对于线性回归而言，我们的视角是模型参数，如果是关于模型参数的线性组合，则为线性回归。这就是式 $(2)$ 仍被称为线性回归的原因。

在机器学习中， $x$ 是样本的直接特征，是已知信息。在训练模型参数前，我们就可以将直接特征 $x$ 转换为 $t$ ，再将 $t$ 作为样本特征进行训练。对于式 $(2)$ 和 $(3)$ ，在二维平面中直接绘制关于 $x$ 的回归曲线肯定非线性，但是如果绘制关于 $t$ 的回归曲线则是线性的。

当然，也可以认为式 $(1)$ 是标准的线性回归，式 $(2)$ 为线性回归的简单推广。从式 $(2)$ 的角度来看，确实具有了非线性的特点，但是在机器学习中，其本质还是式 $(3)$ ，满足线性的特点。

2. 广义线性模型

广义线性模型（Generalized Linear Model，GLM）是对（狭义）线性模型的推广，表示一类线性模型。由于线性回归只能解决非常简单的问题，而且对于分类和计数问题是无法处理的。很自然的一个思路是，对线性函数中的因变量 $y$ 值找一个非线性函数上的映射 $g (y)$ ，将线性函数的取值从连续值映射到想要的范围内。我们不再直接对 $y$ 进行线性预测，而是对 $g (y)$ 进行线性预测，即
$g(y)=w_0+w_1x_1+\dots+w_px_p$
或
$y=g^{-1}(w_0+w_1x_1+\dots+w_px_p)$
其中， $g (\cdot)$ 在 GLM 中被称为连接函数（link function）。

特别地，当 $g (y) = y$ 时，该模型为线性回归模型；当 $g(y)=\ln y$ 时，该模型为对数线性模型；当 $g(y)=\ln \frac{y}{1-y}$ 时，该模型为对数几率模型，也就是我们熟知的逻辑回归模型，对数几率模型扩展后可以得到 softmax 回归模型。

并不是任何函数都可以作为连接函数，连接函数究竟有哪些选择？以及，在机器学习中，模型最终要用于预测，如何利用训练好的模型参数根据输入 $x$ 预测得到 $y$ ，也就是预测函数是什么，这又是一个问题？

2.1. 指数分布族

介绍 GLM 之前，先将会用到的指数分布族的相关概念简单介绍一下。

指数分布族代表一类分布，统一的公式表示为
$f(y;\eta)=b(y)\exp\big(\eta^T T(y)-a(\eta)\big) \tag{4}$
确定了 $a (\cdot)$ 、 $b (\cdot)$ 和 $T (\cdot)$ ，那么 $y$ 只与 $\eta$ 有关，就定义了一个以 $\eta$ 为参数的分布。属于指数分布族的常见分布有，伯努利分布、泊松分布、多种类分布、多项分布、正态分布等等。

详细学习“指数分布族”的相关知识请移步：REF [11] 。

2.2. 广义线性模型

广义线性模型基于三个假设，也可以理解为三个设计决策，这三个决策帮助我们构建广义线性模型：

① $y\mid x;\theta \sim {\rm ExpFamily(\eta)}$ ： $y$ 的先验分布属于指数分布族中的某一个分布。

② $h(x)=E\big(T(y)\mid x\big)$ ：预测函数 $h (x)$ 为 $T (y)$ 的条件期望，亦将 $T (y)$ 的条件期望作为模型预测值。

③ $\eta=\theta^Tx$ ：线性关系。

获取连接函数 $g (\cdot)$ 与预测函数 $h (\cdot)$ 的过程重合，获取到了 $g$ 也就相当于确定了 $h$ 。获取两个函数的过程大致如下：

已知 $y$ 服从均值为 $\mu$ 的确定分布 $D$ ， $D$ 属于指数分布族。将分布的概率质量函数（离散）或概率密度函数（连续）转化为指数形式后，与式 $(4)$ 中的对应项建立等式关系即可确定 $a (\cdot)$ 关于 $\eta$ 的表达式以及 $b (\cdot)$ 关于 $y$ 的表达式。同时式 $(4)$ 中的 $\eta^T$ 项也会有对应项，由此可以确定 $\eta$ 与分布 $D$ 参数 $\lambda$ 的关系，不妨记为 $\lambda = f_1(\eta)$ ；而分布 $D$ 的均值 $\mu$ 可以由分布参数 $\lambda$ 表示（比如伯努利分布 $B (1, p)$ 的均值为 $p$ ，泊松分布 $P(\lambda)$ 的均值为 $\lambda$ ，高斯分布 $N(\mu,\sigma)$ 的均值为 $\mu$ ），不妨记为 $\mu= f_2(\lambda)$ ，合并得到 $\mu=f_2(f_1(\eta))$ ，重新记为 $\mu = f(\eta)$ 。GLM 中一般取 $T (y) = y$ ，根据假设 ② 可得预测函数 $h(x)=E(y\mid x)$ 。前面提到 $\mu$ 为均值，那么 $h(x)=E(y\mid x)=\mu$ ，所以 $h(x)=f(\eta)=f(\theta^Tx)$ 。由于关系 $f_1$ 和 $f_2$ 均已知，所以 $f$ 也已知，故预测函数 $h$ 可求，且 $f^{-1}$ 就是连接函数 $g$ 。

当然，即使 $T(y)\ne y$ ，我们也是可以根据期望的定义计算出期望的。

关于伯努利分布、二项分布、多类别分布和多项分布：

抛一次硬币，正面朝上的概率，这是伯努利分布；抛 $n$ 次硬币，正面朝上出现了 $m$ 次的概率，这是二项分布。

伯努利分布（Bernoulli Distribution） $\to$ 二项分布（Binomial Distribution）

抛一次骰子，第 k 面朝上的概率，这是多类别分布；抛 $n$ 次骰子，第 $\rm 1$ 面朝上出现了 $m_1$ 次，第 $\rm 2$ 面朝上出现了 $m_2$ 次 … 第 $K$ 面朝上出现了 $m_K$ 次的概率，这是多项分布。

多类别分布（Categorical Distribution） $\to$ 多项分布（Multinomial Distribution）

概率质量函数（Probability Mass Function，PMF）如下。

伯努利分布：
$P(X=x\mid \theta)=\theta^{x}(1-\theta)^{1-x} \\ x\in \{0,1\}$
二项分布：
$P(X=m\mid \theta,n)=\left(\begin{matrix} n \\ m\end{matrix}\right) \theta ^ m(1-\theta)^{n-m}\\ m\in \{0,1,2,\dots, n\} \\ \left(\begin{matrix} n \\ m\end{matrix}\right)=\frac{n!}{m!(n-m)!}$
多类别分布：
$P(X=x_k\mid \theta_1,\theta_2,\dots, \theta_K)=\prod _{k=1}^K \theta_k^{x_k} \\ \sum_{k=1}^K \theta_k=1\\ x_k\in \{0,1\},\space\space\sum_{k=1}^Kx_k=1$
多项分布：
$P(X_1=m_1,X_2=m_2,\dots,X_K=m_K\mid \theta_1,\theta_2,\dots,\theta_K,n)=\frac{n!}{m_1!m_2!\dots m_K!}\prod_{k=1}^K \theta_k^{m_k} \\ \sum_{k=1}^K\theta_k=1 \\ \sum_{k=1}^K m_k=n$

单纯描述过程还是过于抽象，下面将对我们最熟悉的逻辑回归和 softmax 回归推导连接函数（或预测函数）。

2.2.1. logistics

逻辑回归的 sigmoid 函数是符合 GLM 的伯努利分布的连接函数的反函数，即 sigmoid 函数将线性函数映射到伯努利分布的期望。

伯努利分布的概率质量函数可以写为

$P(y;\phi)=\phi^y(1-\phi)^{1-y}$

其中， $y\in\{0,1\}$ ， $\phi$ 表示 $y = 1$ 的概率。转化成指数形式为

$\begin{aligned} P(y;\phi)&=\phi^y(1-\phi)^{1-y} \\ &=\exp\big(\log\phi^y(1-\phi)^{1-y} \big) \\ &= \exp\big( y\log\phi + (1-y)\log (1-\phi) \big) \\ &= \exp\big(y\log\frac{\phi}{1-\phi} + \log (1-\phi)\big) \end{aligned}$

与式 $(4)$ 相对应可得
$\begin{aligned} b(y)&=1 \\ T(y)&=y \\ a(\eta)&=-\log(1-\phi) \\ \eta &= \log \frac{\phi}{1-\phi} \\ \end{aligned}$
伯努利分布的期望为 $E(y\mid x) = 0\times P(0)+1\times P(1)=\phi$ ，所以预测函数 $h(x)=E(T(y)\mid x)=\phi$ 。根据上面 $\eta=\log \frac{\phi}{1-\phi}$ 可得 $\phi=\frac{1}{1+\exp({-\eta})}$ ，因此 $h(x)=\frac{1}{1+\exp({-\eta})}=\frac{1}{1+\exp({\theta^Tx})}$ ，对应的连接函数为 $g(x)=\log\frac{x}{1-x}$ 。可见，此时的预测函数 $h$ 就是熟知的逻辑回归函数。

2.2.2. softmax

多种类分布的概率质量函数可以写为
$P(y;\phi)=\prod_{i=1}^k\phi_i^{1\{y=i\}}\tag{5}$
其中， $1\{y=·\}$ 的作用类似于艾弗森括号，即括号内为真返回 $1$ ，否则返回 $0$ 。对于式 $(5)$ 满足 $1\{y=i\} \in \{0,1\}$ 且 $\sum_{i=1}^k 1\{y=i\}=1$ 。

为了处理方便，将式 $(5)$ 第 $k$ 类与前 $k - 1$ 类分开处理，得
$\begin{aligned} P(y;\phi)&=\prod_{i=1}^{k-1}\phi_i^{1\{y=i\}}·\phi^{1\{y=k\}}_k \\ &= \prod_{i=1}^{k-1}\phi_i^{1\{y=i\}}·\phi^{1-\sum_{j=1}^{k-1}1\{y=j\}}_k \tag{6} \end{aligned}$
将式 $(6)$ 转换为指数形式为
$\begin{aligned} P(y;\phi)&= \prod_{i=1}^{k-1}\phi_i^{1\{y=i\}}·\phi^{1-\sum_{j=1}^{k-1}1\{y=j\}}_k \\ &= \exp\big( \sum_{i=1}^{k-1}1\{y=i\}\log \phi_i+(1-\sum_{i=1}^{k-1}1\{y=i\})\log \phi_k \big) \\ &= \exp\big( \sum_{i=1}^{k-1}1\{y=i\}\log\frac{\phi_i}{\phi_k} +\sum_{i=1}^{k-1}\log\phi_k \big) \tag{7} \end{aligned}$
式 $(7)$ 中的求和项 $\sum_{i=1}^{k-1}1\{y=i\}\log\frac{\phi_i}{\phi_k}$ 可以表示为内积的形式。不妨假设与式 $(4)$ 相对应的 $\eta$ 和 $T (y)$ 应该均为第 $k$ 维为 $0$ 的 $k$ 维列向量，即
$\begin{aligned} b(y)&=1 \\ T(y)&=\left(\begin{matrix} 1\{y=1\} \\ 1\{y=2\} \\ \vdots \\ 1\{y=k-1\} \\ 0 \end{matrix}\right) \\ a(\eta)&=-\log(\phi_k) \\ \eta &= \left(\begin{matrix} \log\frac{\phi_1}{\phi_k} \\ \log\frac{\phi_2}{\phi_k} \\ \vdots \\ \log\frac{\phi_{k-1}}{\phi_k} \\ 0 \end{matrix}\right) \\ \end{aligned}$
因此 $\eta_i=\log \frac{\phi_i}{\phi_k}$ ，特别地， $\eta_k=\log \frac{\phi_k}{\phi_k}=0$ 。所以有 $\frac{\phi_i}{\phi_k} = \exp(\eta_i)$ ，对等式两侧同时求和，得
$\sum_{i=1}^k \frac{\phi_i}{\phi_k}=\frac{1}{\phi_k}=\sum_{i=1}^k \exp(\eta_i)$
因此 $\phi_k=\frac{1}{\sum_{i=1}^k\exp(\eta_i)}=\frac{\exp(\eta_k)}{\sum_{i=1}^k\exp(\eta_i)}$ 。对于 $i\ne k$ 的情况，根据等式 $\frac{\phi_i}{\phi_k}=\exp(\eta_i)$ ，可得 $\phi_i=\frac{\exp(\eta_i)}{\sum_{j=1}^k\exp(\eta_j)}$ 。故统一表示为 $\phi_i=\frac{\exp(\eta_i)}{\sum_{j=1}^k\exp(\eta_j)}$ ，记 $\phi = (\begin{matrix} \phi_1&\phi_2&\dots \phi_k \end{matrix})^T$ 。

根据 $h(x)=E\big(T(y)\mid x\big)$ 可得预测为第 $t\space(t\in\{1,2,\dots,k\})$ 类的期望为
$h(x)=E\big(T(y)\mid x\big) = T(y)^T\phi=\phi_t=\frac{\exp(\theta_t^Tx)}{\sum_{i=1}^k\exp(\theta_i^Tx)}$
这与我们熟悉的 softmax 函数一致。

连接函数与预测函数的关系：

连接函数的反函数 $g^{-1}$ 是关于 $\eta$ 的函数，而预测函数 $h$ 是关于 $x$ 的函数，所以可以认为 $h$ 是内函数为 $\eta=\theta^Tx$ ，外函数为 $g^{-1}$ 的复合函数。

2.3. 特点

如何理解广义线性模型的“线性”？

我认为从其假设可以看到 $\eta = \theta^Tx$ 表达了线性信息，但是不够直观。不妨从分类角度更加直观地理解线性，我们知道 GLM 预测到的是被分为某一类的概率，最高概率对应的类为预测确定的类。通过查看 Wikipedia 中各个指数分布族中的分布对应的连接函数发现，这些连接函数的反函数都是单调函数，这说明要么选最大 $\eta=\theta^Tx$ 对应的类，要么选最小 $\eta$ 对应的类，可见本质依然是根据线性组合值进行分类。更直观地表示在二维平面上，判断每个点的类别就会发现，类与类之间由直线（线性超平面）隔开，这无疑是 GLM 线性特点最直观的体现。

但是需要注意，模型参数 $\theta_i$ 对应的超平面并非类间超平面。对于多分类而言，往往二者之间没有直观上能理解的关系；对于二分类而言，二者平行。

我们可以尝试在二维平面中绘制 logistics 二分类图像和 softmax 多分类图像，也可以说明我们的观点是合理的。

很多同学会感性地认为，模型参数对应的超平面之间区域的样本为相同类别，其实这种理解是错误的。出现这个问题的原因在于，我们无法保证 $\theta_1$ 和 $\theta_2$ 对应的超平面之间区域的全部样本都满足 $\theta_1^Tx>\theta_2^Tx$ 或者 $\theta_1^Tx<\theta_2^Tx$ 。仅对于两个相交的模型参数超平面而言，往往类间超平面更可能被夹在两个超平面之间，比如图 $1$ softmax 子图中右侧红、蓝两线之间的类间分界线。注意，这是在没有其他模型参数超平面影响的前提下，大致有这样的规律，超平面一多，影响因素过多，不好讨论。

图 1 二分类(左)和多分类(右)的权重对应超平面(直线)和类间超平面(区域边界)
我当时不禁思考，本质上 GLM 比较的是 $\theta^Tx$ 的大小，如果 $\theta$ 相同，那么无论采用哪种 GLM 都会将样本分到相同的类别，选用不同的 GLM 的意义在哪？
确实，在 $\theta$ 相同的前提下，每种具体的 GLM 对应的分类结果是完全相同的；但问题就出在，每种 GLM 训练出的参数 $\theta$ 几乎不可能完全相同，因为它们采用了不同的联系函数，也正是因为联系函数的不同，使得模型更加多样、能更加适应不同的场景。模型参数 $\theta$ 的不同保证了每个模型对应的类间边界不是完全相同的，但都是线性。

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
高端密码学院笔记285 柚子_b4b4
高端幸福密码学院（高级班）幸福使者：李华第（598）期《幸福》之回归内在深层生命原动力基础篇——揭秘“激励”成长的喜悦心理案例分析主讲：刘莉一，知识扩充:成功=艰苦劳动+正确方法+少说空话。贪图省力的船夫，目标永远下游。智者的梦再美，也不如愚人实干的脚印。幸福早课堂2020.10.16星期五一笔记:1，重视和珍惜的前提是知道它的价值非常重要，当你珍惜了，你就真正定下来，真正的学到身上。2，大家需要
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
做事一定要认真地上的垚
大脑突然被惊醒，我猛然起身，接着发了下呆，灵魂回归后意识到：啊，今天上班要迟到了！我按了按手机发现手机已关机，略微一看，原来是昨晚充电器没插上。一件微不足道的事折射出我的粗心大意，反映了我对待事情漠不关心，草草了事的态度。许许多多的事情都需要认认真真的对待才能做好，认真是自我努力的表现。工作中，我总是不停的犯错误，我谴责自己：连这点小事都要犯错，你有什么用啊。同时也安慰自己：不过是一点小错误而已，
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
神经网络-损失函数红米煮粥神经网络人工智能深度学习
文章目录一、回归问题的损失函数1.均方误差（MeanSquaredError,MSE）2.平均绝对误差（MeanAbsoluteError,MAE）二、分类问题的损失函数1.0-1损失函数（Zero-OneLossFunction）2.交叉熵损失（Cross-EntropyLoss）3.合页损失（HingeLoss）三、总结在神经网络中，损失函数（LossFunction）扮演着至关重要的角色，它
【中国国际航空-注册_登录安全分析报告】风控牛验证码接口安全评测系列安全行为验证极验网易易盾智能手机
前言由于网站注册入口容易被黑客攻击，存在如下安全问题：1.暴力破解密码，造成用户信息泄露2.短信盗刷的安全问题，影响业务及导致用户投诉3.带来经济损失，尤其是后付费客户，风险巨大，造成亏损无底洞所以大部分网站及App都采取图形验证码或滑动验证码等交互解决方案，但在机器学习能力提高的当下，连百度这样的大厂都遭受攻击导致点名批评，图形验证及交互验证方式的安全性到底如何？请看具体分析一、中国国际航空PC
无人值守模式，自习室创业，真的那么赚钱吗？森屿旅人
“创业是一条不归路，不要拿自己亏不起的钱当赌注！”在和大家分享无人自习室创业经历前，先和大家强调上面这一句话，创过业的朋友，应该深有体会。因为，我们要深刻的认知市场规律，一个行业，如果利润很高，那必然趋之若鹜得涌入，所以在市场充分博弈以后，市场会回归价值本身，这个是市场的客观规律。因此，不要抓风口，抓风口，说实在的，和赌博无异，那些和你鼓吹风口的人，永远是把你当成一根韭菜，诚然，真正赚钱的项目，不
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
七.正则化愿风去了
吴恩达机器学习之正则化（Regularization）http://www.cnblogs.com/jianxinzhou/p/4083921.html从数学公式上理解L1和L2https://blog.csdn.net/b876144622/article/details/81276818虽然在线性回归中加入基函数会使模型更加灵活，但是很容易引起数据的过拟合。例如将数据投影到30维的基函数上，模
机器学习-------数据标准化罔闻_spider 数据分析算法机器学习人工智能
什么是归一化，它与标准化的区别是什么？一作用在做训练时，需要先将特征值与标签标准化，可以防止梯度防炸和过拟合；将标签标准化后，网络预测出的数据是符合标准正态分布的—StandarScaler()，与真实值有很大差别。因为StandarScaler()对数据的处理是（真实值-平均值）/标准差。同时在做预测时需要将输出数据逆标准化提升模型精度：标准化/归一化使不同维度的特征在数值上更具比较性，提高分类
只生欢喜不生愁花间星事
《只生欢喜不生愁》是我很喜欢的一本书，挺适合当下的环境阅读。作者林曦老师是位水墨画家，设计师。她1983年生于重庆，毕业于中央美术学院，年少成名，以手艺人自居。在她的这本艺术生活随笔集里，用自己的切身实践解析艺术美育的本质内涵。分享了艺术学习，写字的乐趣，专注心力的法门与修炼，用中式文人的视角观照当代生活的审美情趣及路径，讨论艺术之道与无用之美，让传统美学回归到现实生活践行中。林曦少年时办过不少画
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
Python和R均方根误差平均绝对误差算法模型亚图跨际 Python 交叉知识 R 回归模型误差指标归一化均方根误差生态状态指标神经网络成本误差气体排放气候模型多项式拟合
要点回归模型误差评估指标归一化均方根误差生态状态指标神经网络成本误差计算气体排放气候算法模型Python误差指标均方根误差和平均绝对误差均方根偏差或均方根误差是两个密切相关且经常使用的度量值之一，用于衡量真实值或预测值与观测值或估计值之间的差异。估计器θ^\hat{\theta}θ^相对于估计参数θ\thetaθ的RMSD定义为均方误差的平方根：RMSD⁡(θ^)=MSE⁡(θ^)=E((θ^−θ
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性 aehrutktrjk 人工智能 easyui 前端 python
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性引言在机器学习和自然语言处理领域，选择合适的训练示例对模型性能至关重要。最大边际相关性(MaximalMarginalRelevance,MMR)是一种优秀的示例选择方法，它不仅考虑了示例与输入的相关性，还注重保持所选示例之间的多样性。本文将深入探讨如何使用MMR来选择示例，以提高AI模型的性能和泛化能力。什么是最大边际相关性(MM
LangChain集成指南:如何利用多样化的AI提供商 aehrutktrjk 人工智能 langchain python
LangChain集成指南:如何利用多样化的AI提供商引言在人工智能和机器学习领域,LangChain已成为一个强大而灵活的框架,允许开发者轻松集成各种AI服务提供商。本文将深入探讨LangChain的集成能力,介绍如何利用不同的AI提供商来增强你的应用程序,并提供实用的代码示例。LangChain集成概览LangChain支持多种AI提供商的集成,这些集成可以分为两类:独立包集成:这些提供商有独
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
jquery实现的jsonp掉java后台知了ing java jsonp jquery
什么是JSONP？先说说JSONP是怎么产生的：其实网上关于JSONP的讲解有很多，但却千篇一律，而且云里雾里，对于很多刚接触的人来讲理解起来有些困难，小可不才，试着用自己的方式来阐释一下这个问题，看看是否有帮助。 1、一个众所周知的问题，Ajax直接请求普通文件存在跨域无权限访问的问题，甭管你是静态页面、动态网页、web服务、WCF，只要是跨域请求，一律不准； 2、
Struts2学习笔记 caoyong struts2
SSH : Spring + Struts2 + Hibernate 三层架构(表示层,业务逻辑层,数据访问层) MVC模式 (Model View Controller) 分层原则:单向依赖，接口耦合 1、Struts2 = Struts + Webwork 2、搭建struts2开发环境 a>、到www.apac
SpringMVC学习之后台往前台传值方法满城风雨近重阳 springMVC
springMVC控制器往前台传值的方法有以下几种： 1.ModelAndView 通过往ModelAndView中存放viewName：目标地址和attribute参数来实现传参： ModelAndView mv=new ModelAndView(); mv.setViewName="success
WebService存在的必要性？一炮送你回车库 webservice
做Java的经常在选择Webservice框架上徘徊很久，Axis Xfire Axis2 CXF ，他们只有一个功能，发布HTTP服务然后用XML做数据传输。是的，他们就做了两个功能，发布一个http服务让客户端或者浏览器连接，接收xml参数并发送xml结果。当在不同的平台间传输数据时，就需要一个都能解析的数据格式。但是为什么要使用xml呢？不能使json或者其他通用数据
js年份下拉框 3213213333332132 java web ee
<div id="divValue">test...</div>测试 //年份 <select id="year"></select> <script type="text/javascript"> window.onload =
简单链式调用的实现技术归来朝歌方法调用链式反应编程思想
在编程中，我们可以经常遇到这样一种场景：一个实例不断调用它自身的方法，像一条链条一样进行调用这样的调用你可能在Ajax中，在页面中添加标签： $("<p>").append($("<span>").text(list[i].name)).appendTo("#result"); 也可能在HQ
JAVA调用.net 发布的webservice 接口 darkranger webservice
/** * @Title: callInvoke * @Description: TODO(调用接口公共方法) * @param @param url 地址 * @param @param method 方法 * @param @param pama 参数 * @param @return * @param @throws BusinessException
Javascript模糊查找 | 第一章循环不能不重视。 aijuans Way
最近受我的朋友委托用js+HTML做一个像手册一样的程序，里面要有可展开的大纲，模糊查找等功能。我这个人说实在的懒，本来是不愿意的，但想起了父亲以前教我要给朋友搞好关系，再加上这也可以巩固自己的js技术，于是就开始开发这个程序，没想到却出了点小问题，我做的查找只能绝对查找。具体的js代码如下： function search(){ var arr=new Array("my
狼和羊，该怎么抉择 atongyeye 工作
狼和羊，该怎么抉择在做一个链家的小项目，只有我和另外一个同事两个人负责，各负责一部分接口，我的接口写完，并全部测联调试通过。所以工作就剩下一下细枝末节的，工作就轻松很多。每天会帮另一个同事测试一些功能点，协助他完成一些业务型不强的工作。今天早上到公司没多久，领导就在QQ上给我发信息，让我多协助同事测试，让我积极主动些，有点责任心等等，我听了这话，心里面立马凉半截，首先一个领导轻易说
读取android系统的联系人拨号百合不是茶 android sqlite数据库内容提供者系统服务的使用
联系人的姓名和号码是保存在不同的表中,不要一下子把号码查询来,我开始就是把姓名和电话同时查询出来的,导致系统非常的慢关键代码: 1, 使用javabean操作存储读取到的数据 package com.example.bean; /** * * @author Admini
ORACLE自定义异常 bijian1013 数据库自定义异常
实例： CREATE OR REPLACE PROCEDURE test_Exception ( ParameterA IN varchar2, ParameterB IN varchar2, ErrorCode OUT varchar2 --返回值,错误编码 ) AS /*以下是一些变量的定义*/ V1 NUMBER; V2 nvarc
查看端号使用情况征客丶 windows
一、查看端口在windows命令行窗口下执行： >netstat -aon|findstr "8080" 显示结果： TCP 127.0.0.1:80 0.0.0.0:0 &
【Spark二十】运行Spark Streaming的NetworkWordCount实例 bit1129 wordcount
Spark Streaming简介 NetworkWordCount代码 /* * Licensed to the Apache Software Foundation (ASF) under one or more * contributor license agreements. See the NOTICE file distributed with
Struts2 与 SpringMVC的比较 BlueSkator struts2 spring mvc
1. 机制：spring mvc的入口是servlet，而struts2是filter，这样就导致了二者的机制不同。 2. 性能：spring会稍微比struts快。spring mvc是基于方法的设计，而sturts是基于类，每次发一次请求都会实例一个action，每个action都会被注入属性，而spring基于方法，粒度更细，但要小心把握像在servlet控制数据一样。spring
Hibernate在更新时，是可以不用session的update方法的(转帖） BreakingBad Hibernate update
地址：http://blog.csdn.net/plpblue/article/details/9304459 public void synDevNameWithItil() {Session session = null;Transaction tr = null;try{session = HibernateUtil.getSession();tr = session.beginTran
读《研磨设计模式》-代码笔记-观察者模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; import java.util.Observable; import java.util.Observer; /** * “观
重置MySQL密码 chenhbc mysql 重置密码忘记密码
如果你也像我这么健忘，把MySQL的密码搞忘记了，经过下面几个步骤就可以重置了（以Windows为例，Linux/Unix类似）： 1、关闭MySQL服务 2、打开CMD，进入MySQL安装目录的bin目录下，以跳过权限检查的方式启动MySQL mysqld --skip-grant-tables 3、新开一个CMD窗口，进入MySQL mysql -uroot
再谈系统论，控制论和信息论 comsci 设计模式生物能源企业应用领域模型
再谈系统论，控制论和信息论偶然看
oracle moving window size与 AWR retention period关系 daizj oracle
转自： http://tomszrp.itpub.net/post/11835/494147 晚上在做11gR1的一个awrrpt报告时,顺便想调整一下AWR snapshot的保留时间,结果遇到了ORA-13541这样的错误.下面是这个问题的发生和解决过程. SQL> select * from v$version; BANNER -------------------
Python版B树 dieslrae python
话说以前的树都用java写的,最近发现python有点生疏了,于是用python写了个B树实现,B树在索引领域用得还是蛮多了,如果没记错mysql的默认索引好像就是B树... 首先是数据实体对象,很简单,只存放key,value class Entity(object): '''数据实体''' def __init__(self,key,value)
C语言冒泡排序 dcj3sjt126com 算法
代码示例： # include <stdio.h> //冒泡排序 void sort(int * a, int len) { int i, j, t; for (i=0; i<len-1; i++) { for (j=0; j<len-1-i; j++) { if (a[j] > a[j+1]) // >表示升序
自定义导航栏样式 dcj3sjt126com 自定义
-(void)setupAppAppearance { [[UILabel appearance] setFont:[UIFont fontWithName:@"FZLTHK—GBK1-0" size:20]]; [UIButton appearance].titleLabel.font =[UIFont fontWithName:@"FZLTH
11.性能优化-优化-JVM参数总结 frank1234 jvm参数性能优化
1.堆 -Xms --初始堆大小 -Xmx --最大堆大小 -Xmn --新生代大小 -Xss --线程栈大小 -XX:PermSize --永久代初始大小 -XX:MaxPermSize --永久代最大值 -XX:SurvivorRatio --新生代和suvivor比例,默认为8 -XX:TargetSurvivorRatio --survivor可使用
nginx日志分割 for linux HarborChung nginx linux 脚本
nginx日志分割 for linux 默认情况下，nginx是不分割访问日志的，久而久之，网站的日志文件将会越来越大，占用空间不说，如果有问题要查看网站的日志的话，庞大的文件也将很难打开，于是便有了下面的脚本使用方法，先将以下脚本保存为 cutlog.sh，放在/root 目录下，然后给予此脚本执行的权限复制代码代码如下: chmo
Spring4新特性——泛型限定式依赖注入 jinnianshilongnian spring spring4 泛型式依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
centOS安装GCC和G++ liuxihope centos gcc
Centos支持yum安装，安装软件一般格式为yum install .......，注意安装时要先成为root用户。按照这个思路，我想安装过程如下：安装gcc：yum install gcc 安装g++： yum install g++ 实际操作过程发现，只能有gcc安装成功，而g++安装失败，提示g++ command not found。上网查了一下，正确安装应该
第13章 Ajax进阶（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
How to determine BusinessObjects service pack and fix pack blueoxygen BO
http://bukhantsov.org/2011/08/how-to-determine-businessobjects-service-pack-and-fix-pack/ The table below is helpful. Reference BOE XI 3.x 12.0.0. y BOE XI 3.0 12.0. x. y BO
Oracle里的自增字段设置 tomcat_oracle oracle
　大家都知道吧，这很坑，尤其是用惯了mysql里的自增字段设置，结果oracle里面没有的。oh，no 　　我用的是12c版本的，它有一个新特性，可以这样设置自增序列，在创建表是，把id设置为自增序列 create table t ( id 　　　　 number generated by default as identity (start with 1 increment b
Spring Security（01）——初体验 yang_winnie spring Security
Spring Security（01）——初体验博客分类： spring Security Spring Security入门安全认证首先我们为Spring Security专门建立一个Spring的配置文件，该文件就专门用来作为Spring Security的配置