hfutdog

机器学习中常用范数与距离

前言
范数
- 向量范数
- 矩阵范数
距离
- 曼哈顿距离
- 欧氏距离
- 切比雪夫距离
- 闵可夫斯基距离
- 标准化欧氏距离
- 马氏距离
- 余弦距离
- 相关系数与相关距离
- 汉明距离
- 杰卡德类似系数
参考文章

前言

在机器学习中经常会涉及到范数和距离的概念，有时候优化的目标函数就是常用范数和距离的变化。关于范数和距离其实已经有很多人写过文章了，我之所以还要再写一遍，是因为读别人的文章我老是记不住，干脆好记性不如烂键盘，自己敲一遍吧。

范数

向量范数

向量范数表示向量空间中向量的大小。
将 $n$ 维实空间 $R^n$ 中的向量 $\mathbf X = (x_1, x_2, ..., x_n)^T$ 的范数记作 $\Vert \mathbf X \Vert$ ，该范数是一个实数，且满足以下三条性质：
(1) 非负性： $\Vert \mathbf X \Vert \geq 0$ ，当且仅当 $\mathbf X = \mathbf 0$ 时 $\Vert \mathbf X \Vert = 0$ ；
(2) 齐次性：对任意实数 $\lambda$ ， $\Vert \lambda \mathbf X\Vert$ = $|\lambda| \Vert \mathbf X \Vert$ ；
(3) 三角不等式：对任意向量 $\mathbf Y \in R^n$ ， $\Vert \mathbf X + \mathbf Y \Vert \leq \Vert \mathbf X \Vert + \Vert \mathbf Y \Vert$ 。

1范数
${\Vert \mathbf X \Vert}_1 = \sum_{i=1}^n {|x_i|} = |x_1| + |x_2| + ... +|x_n|$
2范数
${\Vert \mathbf X \Vert}_2 = \sqrt {\sum_{i=1}^n {x_i}^2} = \sqrt {{x_1}^2 + {x_2}^2 + ... +{x_n}^2}$
$\infty范数$
${\Vert \mathbf X \Vert}_\infty = \max_{1\leq i \leq n} |x_i|$
$p$ 范数
${\Vert \mathbf X \Vert}_p = \sqrt[p] {\sum_{i=1}^n |x_i|^p}$
其中，前三种范数都是 $p$ 范数的特殊情况，或者可以说 $p$ 范数不是一个单纯的范数，而是一组范数的表示。
需要注意的是，当 $\geq 1$ 时，各个范数是满足三角不等式的，而当 $\leq p \lt 1$ 时，范数是不满足三角不等式的，此时的范数只是一种概念表示。
比如0范数用 $p$ 范数的计算公式表示为如下形式：
${\Vert \mathbf X \Vert}_0 = \sqrt[0] {\sum_{i=1}^n |x_i|^0}$
这样表示的问题在于，当 $x_i = 0$ 时， $0^0$ 是没有意义的，同样开零次方也是没有意义的。一般我们实际使用的0范数指向量中的非零元素个数。
另外，对于 $\infty$ 范数，它实际是通过以下公式计算得来的：
${\Vert \mathbf X \Vert}_\infty = \lim_{p \rightarrow \infty} {\Vert \mathbf X \Vert}_p$
在实际应用中，1范数可以实现特征的稀疏，去掉一些无用信息；2范数通常用作目标函数的正则化项，防止过拟合，提高模型的泛化能力。1范数和2范数可以度量两个向量之间的差异，而 $\infty$ 范数用来度量向量元素的最大值。

矩阵范数

矩阵范数表示矩阵变换引起的变化大小。
若有 $\times n$ 的矩阵 $\mathbf A$ （ $\mathbf A \in R^{n \times n}$ ）以及 $n$ 维实空间 $R^n$ 中的向量 $\mathbf X$ ，称
$\Vert \mathbf A \Vert = \max_{\mathbf X \in R^n, {\Vert \mathbf X \Vert} = \not 0} \frac{\Vert \mathbf {AX} \Vert}{\Vert \mathbf X \Vert} = \max_{\Vert \mathbf X \Vert = 1, \mathbf X \in R^n} \Vert \mathbf {AX} \Vert$
为矩阵 $\mathbf A$ 的从属于该向量范数的范数，即矩阵 $\mathbf A$ 的范数。
常用的矩阵范数如下所示：

1范数
${\Vert \mathbf A \Vert}_1 = \max_{\mathbf X \in R^n, {\Vert \mathbf X \Vert} = \not 0} \frac{{\Vert \mathbf {AX} \Vert}_1} {{\Vert \mathbf X \Vert}_1} = \max_{1 \leq j \leq n} \sum_{i=1}^n |a_{ij}|$
即 $\mathbf A$ 的列元素绝对值之和的最大值，又称为 $\mathbf A$ 的列范数。
2范数
${\Vert \mathbf A \Vert}_2 = \max_{\mathbf X \in R^n, {\Vert \mathbf X \Vert} = \not 0} \frac{{\Vert \mathbf {AX} \Vert}_2} {{\Vert \mathbf X \Vert}_2} = \sqrt {\lambda_{max}}$
其中 $\lambda_{max}$ 为 $\mathbf A^T \mathbf A$ 的特征值中绝对值最大者的绝对值。
$\infty$ 范数
${\Vert \mathbf A \Vert}_\infty = \max_{\mathbf X \in R^n, {\Vert \mathbf X \Vert} = \not 0} \frac{{\Vert \mathbf {AX} \Vert}_\infty} {{\Vert \mathbf X \Vert}_\infty} = \max_{1 \leq i \leq n} \sum_{j=1}^n |a_{ij}|$
即 $\mathbf A$ 的行元素绝对值之和的最大值，又称为 $\mathbf A$ 的行范数。
$F$ 范数
${\Vert \mathbf A \Vert}_F = \sqrt {\sum_{i=1}^n \sum_{j=1}^n {a_{ij}}^2}$
$F$ 范数的全称为 $F r o b e n i u s$ 范数或者弗罗贝尼乌斯范数。
关于矩阵范数，我们还需要了解的一个概念是谱半径。因为矩阵 $\mathbf A$ 的每一个特征值的绝对值，都不超过矩阵 $\mathbf A$ 的范数 $\Vert \mathbf A \Vert$ ，即 $|\lambda_i| \leq \Vert \mathbf A \Vert$ 。
而谱半径表示的是矩阵 $\mathbf A$ 的所有特征值绝对值的最大值，即 $\rho(\mathbf A) = \max_{1 \leq i \leq n} |\lambda_i|$ ，则有结论 $\rho(\mathbf A) \leq \Vert \mathbf A \Vert$ 。

距离

距离一般用来度量样本之间的相似性，下面我们以向量 $\mathbf a = (x_{11}, x_{12}, ..., x_{1n})^T$ 和 $\mathbf b = (x_{21}, x_{22}, ..., x_{2n})^T$ 为例，一起看一下几个常用的距离。

曼哈顿距离

曼哈顿距离又称作城市街区距离（City Block distance）。这样称呼的原因在于曼哈顿距离的计算方式和从城市的一个十字路口到另外一个十字路口的距离的计算方式是一样的。
假设 $\mathbf a$ 和 $\mathbf b$ 是二维向量，那么它们之间的距离就可以表示成:
$D_{Manhattan} = |x_1 - x_2| + |y_1 - y_2|$
将其扩展到 $n$ 维则可以表示为:
$D_{Manhattan} = \sum_{i=1}^n |x_{1i} - x_{2i}|$
细心的朋友可能已经发现了，曼哈顿距离其实就是上面提到的1范数，有时它也叫做最小绝对误差。

欧氏距离

欧氏距离其实就是我们平时说的两点间的距离：
$D_{Euclid} = \sqrt {\sum_{i=1}^n {(x_{1i} - x_{2i})}^2}$
或者可以用向量的形式表示如下：
$D_{Euclid} = \sqrt {{(\mathbf a - \mathbf b)} {(\mathbf a - \mathbf b)}^T}$
欧氏距离其实就是一种2范数。

切比雪夫距离

切比雪夫距离的计算方式类似于国际象棋中的国王的走法，国王从棋盘上格子 $x_1, y_1)$ 到 $x_2, y_2)$ 走的最少步数总是 $max(|x_2 - x_1|, |y_2 - y_1|)$ 步，具体的计算公式为：
$D_{Chebyshev} = \max_{i} |x_{1i} - x_{2i}|$

闵可夫斯基距离

闵可夫斯基距离类似于 $p$ 范数，它表示的是一组距离的定义，上面提到的几种距离其实都是闵可夫斯基距离的特殊形式。它的计算公式为：
$D_{Minkowski} = \sqrt[p] {\sum_{i=1}^n {|x_{1i} - x_{2i}|}^p}$
当上式的 $p = 1$ 时，就是曼哈顿距离；当 $p = 2$ 时，就是欧氏距离；当 $p=\infty$ 时，就是切比雪夫距离。
闵可夫斯基距离的缺点在于：
(1) 将向量各个维度（样本点各个特征）的量纲当做相同的去计算，比如第一个特征为身高，第二个特征为体重，闵可夫斯基距离计算的时候是无法考虑上它们的单位的，只是把它们当做统一的数值，这难免就会差生偏差；
(2) 没有考虑各个维度的分布（期望、方差等）。

标准化欧氏距离

标准化欧氏距离是针对欧氏距离的缺点（即闵可夫斯基距离的缺点）做出的一种改进方案。
标准化欧氏距离利用数据的期望（ $m e a n$ ）和标准差（ $s t a n d a r d$ $d e v i a t i o n$ ）对数据进行标准化，比如向量 $\mathbf X$ 就可以被标准化为 $\frac{\mathbf X - m} {s}$ 。
标准化后的数据的期望为0，方差为1。
经过标准化后的欧氏距离可以表示为：
$D_{std\_euc} = \sqrt {\sum_{i=1}^n ({\frac{x_{1i} - x_{2i}} {s_i})}^2}$

马氏距离

假设有 $m$ 个样本，每个样本有 $n$ 个特征，协方差矩阵为 $C o v$ ，均值为 $\mu$ ，那么其中一个样本向量 $\mathbf X$ 到均值 $\mu$ 的马氏距离为：
$D_{Mahalanobis} = \sqrt {{(\mathbf X - \mu)}^TCov^{-1}(\mathbf X - \mu)}$
如果是其中的两个向量 $\mathbf X_i$ 与 $\mathbf X_j$ ，它们的距离计算方式就为：
$D_{Mahalanobis} = \sqrt {{(\mathbf X_i - \mathbf X_j)}^TCov^{-1}(\mathbf X_i - \mathbf X_j)}$
若协方差矩阵是单位矩阵（各个样本之间独立同分布），那么计算公式就变为：
$D_{Mahalanobis} = \sqrt {{(\mathbf X_i - \mathbf X_j)}^T(\mathbf X_i - \mathbf X_j)}$
如果协方差矩阵是对角矩阵，那么公式就变为了标准化欧氏距离。
马氏距离与量纲是无关的，能够排除变量之间的相关性干扰。

余弦距离

首先，两个向量的余弦相似度可以表示为：
$cos(\theta) = \frac{\mathbf a \cdot \mathbf b} {{\Vert \mathbf a\Vert}_2 {\Vert \mathbf b \Vert}_2}$
余弦相似度就是两个特征向量夹角的余弦，关注的是向量之间的角度关系，并不关心它们的绝对大小，其取值范围是[-1, 1]。
余弦距离是用1减去余弦相似度得来的，其取值范围为[0, 2]，相同的两个向量余弦距离为0。
需要注意的是，余弦距离并不是严格定义的距离，它不满足距离公理（正定性，对称性，三角不等式）中的三角不等式。
三条距离公理和范数的三条性质是类似的，这里给出具体定义：
假设有任意的三个向量 $\mathbf X = (x_1, x_2, ..., x_n)^T$ 、 $\mathbf Y = (y_1, y_2, ...., y_n)^T$ 和 $\mathbf Z = (z_1, z_2, ..., z_n)^T$
（1）正定性： $D(\mathbf X, \mathbf Y) \ge 0$ ，当且仅当 $\mathbf X = \mathbf Y$ 时， $D(\mathbf X, \mathbf Y) = 0$ ；
（2）对称性： $D(\mathbf X, \mathbf Y) = D(\mathbf Y, \mathbf X)$ ；
（3）三角不等式： $D(\mathbf X, \mathbf Z) \le D(\mathbf X, \mathbf Y) + D(\mathbf Y, \mathbf Z)$
针对余弦距离，我们给出三条距离公理的证明：
（1）正定性
$D(\mathbf X, \mathbf Y) = 1 - cos(\theta) = 1 - \frac{\mathbf X \cdot \mathbf Y} {{\Vert \mathbf X \Vert}_2 {\Vert \mathbf Y \Vert}_2} = \frac{{\Vert \mathbf X \Vert}_2 {\Vert \mathbf Y \Vert}_2 -\mathbf X \cdot \mathbf Y} {{\Vert \mathbf X \Vert}_2 {\Vert \mathbf Y \Vert}_2}$
因为 ${\Vert \mathbf X \Vert}_2 {\Vert \mathbf Y \Vert}_2 -\mathbf X \cdot \mathbf Y = {\Vert \mathbf X \Vert}_2 {\Vert \mathbf Y \Vert}_2 - {\Vert \mathbf X \Vert}_2 {\Vert \mathbf Y \Vert}_2 cos(\theta) \ge 0$ ，则 $D(\mathbf X, \mathbf Y) \ge 0$ 。
当且仅当 $\mathbf X = \mathbf Y$ 时， ${\Vert \mathbf X \Vert}_2 {\Vert \mathbf Y \Vert}_2 = \mathbf X \cdot \mathbf Y$ ，即 $D(\mathbf X, \mathbf Y) = 0$ 。
（2）对称性
$D(\mathbf X, \mathbf Y) = \frac{{\Vert \mathbf X \Vert}_2 {\Vert \mathbf Y \Vert}_2 -\mathbf X \cdot \mathbf Y} {{\Vert \mathbf X \Vert}_2 {\Vert \mathbf Y \Vert}_2} = \frac{{\Vert \mathbf Y \Vert}_2 {\Vert \mathbf X \Vert}_2 -\mathbf Y \cdot \mathbf X} {{\Vert \mathbf Y \Vert}_2 {\Vert \mathbf X \Vert}_2} = D(\mathbf Y, \mathbf X)$
（3）三角不等式
本条我们直接使用反例证明，假设 $\mathbf X = (1, 0)^T$ ， $\mathbf Y = (1, 1)^T$ ， $\mathbf Z = (0, 1)^T$ ，则 $D(\mathbf X, \mathbf Y) = 1 - \frac {\sqrt 2} {2}$ ， $D(\mathbf Y, \mathbf Z) = 1 - \frac {\sqrt 2} {2}$ ， $D(\mathbf X, \mathbf Z) = 1$
则 $D(\mathbf X, \mathbf Z) \gt D(\mathbf X, \mathbf Y) + D(\mathbf Y, \mathbf Z)$
综上，余弦距离满足正定性、对称性，但是不满足三角不等式。
关于余弦距离还需要提的是，它与欧氏距离的关系。
首先，欧氏距离体现数值上的绝对差异，而余弦距离体现方向上的相对差异。比如，当一对文本长度差距很大、但内容相近时，如果使用词频或词向量作为特征，它们在特征空间中的欧氏距离通常很大；而如果使用余弦相似度的话，它们之间的夹角可能很小，因而相似度高。此外，在文本、图像、视频等领域，研究对象的特征维度往往很高，余弦相似度在高维情况下依然保持“相同时为1，正交时为0，相反时为-1”的性质，而欧氏距离的数值则受维度的影响，范围不固定，并且含义也比较模糊。
在一些场景下，例如Word2Vec中，其向量的模长是经过归一化的，此时欧氏距离与余弦距离有着单调的关系，即 ${\Vert \mathbf X - \mathbf Y \Vert}_2 = \sqrt {2 (1 - cos(\mathbf X, \mathbf Y)}$ 。其中 ${\Vert \mathbf X - \mathbf Y \Vert}_2$ 表示欧氏距离， $cos(\mathbf X, \mathbf Y)$ 表示余弦相似度， $cos(\mathbf X, \mathbf Y)$ 表示余弦距离。在此场景下，如果选择距离最小（相似度最大）的近邻，那么使用余弦相似度和欧氏距离的结果是相同的。
最后，再看几个例子。当统计两部剧的用户观看行为，用户A的观看向量为(0, 1)，用户B为(1, 0)；此时二者的余弦距离很大，而欧氏距离很小。我们分析两个用户对于不同视频的偏好，更关注相对差异，显然应当使用余弦距离。而当我们分析用户活跃度，以登录次数（单位：次）和平均观看时长（单位：分钟）作为特征时，余弦距离认为(1, 10)、(10, 100)两个用户距离很近，但显然这两个用户活跃度是有着极大差异的，此时我们更关注数值绝对差异，应当使用欧氏距离。

汉明距离

两个等长字符串s1与s2之间的汉明距离定义为将其中一个变为另外一个所需要做的最小替换次数。比如字符串"1100"与"1111"之间的汉明距离为2。
汉明距离在信息编码方面应用的比较多，比如为了增强容错性，应使得编码间的最小汉明距离尽可能大。

杰卡德类似系数

两个集合A和B中的交集元素在A和B的并集中所占的比例，称为两个集合的杰卡德类似系数。用符号 $J (A, B)$ 表示。
$\frac {|A \bigcap B|} {|A \bigcup B|}$
杰卡德类似系数是衡量两个集合的类似度的一种指标。
杰卡德距离是与杰卡德类似系数相反的概念，它的计算公式为：
$D_{Jaccard} = 1 - J(A, B) = \frac {|A \bigcup B| - |A \bigcap B|} {|A \bigcup B|}$
杰卡德距离用两个集合中不同元素占全部元素的比例来衡量两个集合的区分度。

参考文章

[1] 范数
[2] 范数（norm）几种范数的简单介绍
[3] 范数_百度百科
[4] 向量与矩阵的范数
[5] 数学中几种经常使用的距离
[6] 相关系数_百度百科
[7] 《百面机器学习算法工程师带你去面试》（诸葛越主编）. 第二章模型评估 . 03 余弦距离的应用

车辆云端威胁情报共享系统的多维解析与发展路径百态老人大数据人工智能
第一部分：内容本质提取原始内容描述了一个闭环网络安全体系：“车辆实时上传异常行为日志至安全运营中心（VSOC），云端通过机器学习分析攻击模式并下发全局防御策略”。其核心架构包含：数据采集层：车辆端持续收集异常行为日志数据，包含CAN总线通信模式、网络流量特征及驾驶行为数据传输层：通过V2X通信协议和OTA更新通道实现车云双向通信分析层：安全运营中心(VSOC)采用CNN-BiSRU等深度学习模型进
爱情手记 41 | 元旦小画面剪辑此昵称被征用
亲爱的女朋友，元旦快乐！送上一抹亮色的鲜花，我们路过的街头巷尾，美景风光一一同时过目。樟木头市场的小花店你说要一起看市井的生活，拿着手机到处去拍特写，我看着你像个孩子一样好奇，也不买菜，也不问水果价钱，只是专注地拍，我真害怕摊主呵斥你，或者干脆上来拍你一脸。好在我的担心是多余的，他们似乎习以为常了，也随你去了。瓶瓶罐罐的花草我跟在你身后，像一个家长跟着自己的孩子，离着一段距离，却随时能够追上去，我
“解读《文化自信和民族复兴》”（89）“基业长青的的八个要点"之“暗合道妙”】（2042）周安柱
一位事业蒸蒸日上的朋友，其业绩增长的秘诀就是不断的给敬老院捐赠，在日行一善群发红包，在各种群推广正能量……他说：“既然积善之家必有余庆，一有空就做点好事，应该就会越来越好。”于是，他老老实实为客户提供更有营养、口感更好的产品与更为体贴的服务，专注于让客户、供方、员工及合作伙伴都持续受益……真正在心上用功，必可迎来积善成德的回馈。如稻盛和夫总是致力于创造高附加值的客户价值及社会价值那样，距离暗合道妙
过拟合、欠拟合及其解决方案；梯度消失、梯度爆炸；循环神经网络进阶 Ryan_sz1
1、过拟合、欠拟合及其解决方案过拟合、欠拟合机器学习或者训练深度神经网络的时候经常会出现欠拟合和过拟合这两个问题，但是，一开始我们的模型往往是欠拟合的，也正是因为如此才有了优化的空间，我们需要不断的调整算法来使得模型的表达能拿更强。但是优化到了一定程度就需要解决过拟合的问题了。也就是说欠拟合是模型表达能力不够，达不到很好的表达效果。而过拟合是在训练集的范围内表达能力过强，导致完全拟合了训练集。解决
身体知道答案～深入你的潜意识之井（3） JYEW
心靈感應：超越距離的心靈共振量子纠缠，即指不论两个同源的粒子间距离有多远，一个粒子的变化都会影响另一个粒子的现象，即两个粒子间不论相距多远，从根本上讲他们还是相互联系的。两个相爱的人，看似是两个人的相遇，其实都是两个系统的相遇，而我自己的和我所看到的无数爱情故事显示，两个相爱的人的家庭系统有着惊人的相似之处，再加上彼此心力的投注，使得爱人间的心灵感应也更容易出现。
Leetcode658. 找到 K 个最接近的元素 -春招冲刺 meeiuliuus #leetcode ---medium 算法
题目：代码(首刷自解2024年4月8日）：classSolution{public:vectorfindClosestElements(vector&arr,intk,intx){//数组两边指针向中intleft=0,right=arr.size()-1;//k=right+1-leftwhile(right+1-left>k){//比较距离，距离大的移动if(x-arr[left]>arr[r
2021-09-12 姗姗_52f9
《对来访者对咨询师真的重要起来》刘姗姗中原焦点团队坚持分享第1504天第167次咨询约练观察员不管是心理咨询还是心理治疗，终究是围绕“人”进行工作的，与来访者建立良好的关系，不是简单几句空话就能成立的，咨询师需要展现出人情味，真正地与来访者站在一起。一个懂很多技术的咨询师，并不一定能切实地帮到来访者。如果咨询师永远与对面的人保持距离，能够完全地隔离自己的情绪感受，不受来访者的分毫影响，我觉得这不叫
数字人系统：AI界的超级巨星，你准备好了吗？优秘智能UMI 数字人人工智能深度学习计算机视觉机器学习自然语言处理语言模型图像处理
在这个日新月异的科技时代，每一个创新的火花都可能点燃一场变革的燎原之火。今天，我们要聊的，正是那颗在AI领域熠熠生辉的璀璨新星——优秘数字人系统。它不仅仅是技术的飞跃，更是对未来生活方式的深刻重塑，一场关于人机交互、智能共生的美好预演。技术原理：深度解析与智能构建的奥秘1.深度学习：智能的基石数字人系统的核心技术之一在于深度学习。深度学习是一种模仿人脑神经网络结构和功能的机器学习技术，通过构建多层
408考研逐题详解：2010年第35题——RIP协议
2010年第35题某自治系统内采用RIP协议，若该自治系统内的路由器R1收到其邻居路由器R2的距离矢量，距离矢量中包含信息，则能得出的结论是（）A.R2可以经过R1到达net1，跳数为17B.R2可以到达net1，跳数为16C.R1可以经过R2到达net1，跳数为17D.R1不能经过R2到达net1解析本题主要考查RIP（RoutingInformationProtocol）协议，相关内容如下：R
【考研日记】11.25 吉野佳
今天距离考研还有27天。学习学到晕头转向，我觉得我可能真的不太是学习的料啊……今天晚上去吃饭，买了一根烤肠，阿姨喜笑颜开地对我说：“喏，最大的一根给你！”接过烤肠我端详了一下，忽然觉得没有那么难受了，考不上就考不上吧，我没有停止努力吖，虽然我现在眼前需要做的事很明朗，很多，或许是做不完的。不过没关系，慢慢做，总会有结果。
聚焦基础研究突破，北电数智联合复旦大学等团队提出“AI安全”DDPA方法入选ICML CSDN资讯人工智能安全数据要素大数据
近日，由北电数智首席科学家窦德景教授牵头，联合复旦大学和美国奥本大学等科研团队共同研发，提出一种DDPA（DynamicDelayedPoisoningAttack）新型对抗性攻击方法，为机器学习领域的安全研究提供新视角与工具，相关论文已被国际机器学习大会（ICML2025）收录。ICML由国际机器学习学会（IMLS）主办，聚焦深度学习、强化学习、自然语言处理等机器学习前沿方向，是机器学习与人工智
日常散记（30）艺味深藏
1他还没进店门，就先朝着我笑。那不是陌生人礼貌而有距离的笑，而是遇见熟人，亲切又欢喜的笑。我也只好回他一笑。“你不记得我了？”买好烟后，他终于忍不住问了一句，可能看我不够热情吧。最怕别人问这句。好在我已经应付自如：“记得的呀，怎么这么久没见过你了？”“我不在这边做事了呗，一起走的好几个呢，今天过来看看。”其实我哪里记得他，半点印象都没有。我好讨厌自己的健忘症和脸盲症，因为很多时候遇到一些人和事，自
阿里云态势感知和安骑士有什么区别？阿腾云
阿里云态势感知和安骑士均是阿里云云盾安全产品，态势感知属于安全管理类的产品，安骑士数据服务器安全类产品，阿里云百科网来详细说下阿里云态势感知和安骑士之间的区别：态势感知和安骑士的区别简单来说，安骑士是检测云服务器漏洞的，态势感知提供安全类的大数据分析服务。态势感知：安全大数据分析平台，通过机器学习和结合全网威胁情报，发现传统防御软件无法覆盖的网络威胁，溯源攻击手段、并且提供可行动的解决方案。安骑士
在线免费小说浪漫时光徐斌赵雨妍_浪漫时光徐斌赵雨妍已完结小说大叔书楼
《浪漫时光》主角：徐斌赵雨妍，简介：徐斌最近魔塄似得迷上了自己30岁的小妈赵雨妍！关注微信公众号【春分文馆】去回复个书号【1193】即可阅读小说【浪漫时光】全文内容！！！“婉婷姐，你没事吧！”徐斌是第一次和刘婉婷这样近距离的接触，她幽幽的体香从鼻腔，直窜徐斌的天灵盖..“我没事，就是刚才脚麻了一下！”刘婉婷心里忐忑慌乱不已，准备挣脱徐斌。可徐斌死死的拉住她的手，没有松开的意思。刘婉婷想逃离这里，可
《通灵术士》原创＃珘珘安安_b0d6
《通灵术士》序世上并无妖魔鬼怪之谈，但人精神之延伸，塑造了一个又一个鬼神的存在。从目前科学解释来讲，地球是一个巨大的磁场，人脑是一个微型的可以产生生物电流的神奇电磁场。而地球某些地域有着较强的磁场，会干扰和收录人的脑电波。当一个人将死之时，或因意外或因不甘，他的情绪会突然距离起伏，脑电流剧烈波动，而这时，如果这一块地方磁场较强，便会收录这个死者生前所表达的臆想。而活着的人生病或体弱或难过或悲伤或恐
「日拱一码」035 机器学习——调参过程可视化胖达不服输「日拱一码」机器学习人工智能调参过程可视化神经网络 python 模型可解释性
目录超参数搜索的3D曲面可视化交互式3D可视化神经网络学习率的3D可视化SVM超参数的3D决策边界可视化超参数优化的3D动画超参数搜索的3D曲面可视化##超参数搜索的3D曲面可视化importnumpyasnpimportmatplotlib.pyplotaspltfrommpl_toolkits.mplot3dimportAxes3Dfromsklearn.datasetsimportmake_
2021-03-26 小仙女丽丽2020
赵红丽持续分享第308天20210326中原焦点团队约练本周0总67读书第141天早睡第29天（10点30）锻炼第32（3次）天，晒太阳第21天感觉到自己的，稳定生活里还会出现各种各样的事情，可是我已经没有那么焦虑了，我会跟事情有那么一点距离，不着急，不管怎么样？都不着急，很少卷入事情，卷入情绪，会带着一点觉察，来观察一下自己，观察一下这件事情虽然我还没有那么锐利的眼睛，能够看到事情后面有什么，但
劳动节快乐鸭！赵小六June
1.记得有人说过一句话：“无论你遇见谁，他都是你生命该出现的人，绝非偶然，他一定会教会你一些什么。”所以我也相信：“无论我走到哪里，那都是我该去的地方，经历一些我该经历的事，遇见我该遇见的人。“2.许久不联系的人不用再联系各自辛苦各自生活也再无交集该停留在过去的就让它停留在过去如果有缘会再见若无缘不如不见就是这样3.我始终相信那些该相遇的人会再次重逢的在一起短暂的离开只是为了诠释更好的自己距离不会
数据质量是机器学习项目的核心痛点，AI技术能提供智能化解决方案。 zzywxc787 python pandas numpy 人工智能自动化运维 AI编程
一、数据质量诊断系统（Python实现）importpandasaspdimportnumpyasnpimportmatplotlib.pyplotaspltfromsklearn.clusterimportKMeansfromsklearn.ensembleimportIsolationForestfromtensorflow.keras.modelsimportSequentialfromte
7.机器学习-十大算法之一拉索回归（Lasso）算法原理讲解以山河作礼。 #机器学习算法机器学习算法回归
7.机器学习-十大算法之一拉索回归（Lasso）算法原理讲解一·摘要二·个人简介三·前言四·原理讲解五·算法流程六·代码实现6.1坐标下降法6.2最小角回归法七·第三方库实现7.1scikit-learn实现（坐标下降法）：7.2scikit-learn实现（最小角回归法）：一·摘要拉索回归（LassoRegression）是一种线性回归的正则化形式，它通过引入L1范数惩罚项来实现模型的稀疏性，从
机器学习算法之回归算法福葫芦机器学习回归算法
一、回归算法思维导图二、算法概念、原理、应用场景和实例代码1、线性回归1.1、概念‌‌线性回归算法是一种统计分析方法，用于确定两种或两种以上变量之间的定量关系。‌线性回归算法通过建立线性方程来预测因变量（y）和一个或多个自变量（x）之间的关系。其基本形式为y=wx+e，其中w是权重，x是自变量，e是误差项。1.2、算法原理线性回归算法的核心在于找到最佳的拟合直线，使得预测值与实际值之间的误差最小。
7篇1章7节：机器学习算法解读，与数值预测回归模型构建 MD分析用R探索医药数据科学机器学习算法回归 r语言数据挖掘
机器学习是当今数据分析和人工智能的核心工具之一，其算法广泛应用于分类、回归、排序和推荐等领域。本篇将详细讲解机器学习的四大经典算法类型，并以回归问题为例深入探讨数值预测的关键步骤，包括数据准备、线性回归模型构建、模型预测及误差评估，帮助读者更系统地理解和掌握机器学习的基础知识及实际应用。一、机器学习的算法在数据科学和人工智能的浪潮中，机器学习算法成为了解决各种数据问题的关键工具。机器学习主要处理四
【嵌入式】CAN 总线技术介绍晴雨日记串行通信嵌入式硬件
CAN总线技术详解，从物理层到应用层：一、基础架构层1.物理拓扑要素规范说明线缆类型双绞线（CAN_H+CAN_L），阻抗120Ω终端电阻总线首尾两端各接120Ω电阻（消除信号反射）电平逻辑-显性电平(0)：CAN_H-CAN_L≈2V-隐性电平(1)：CAN_H-CAN_L≈0V最大节点数110个（受收发器驱动能力限制）2.电气特性波特率最大距离应用场景1Mbps40m汽车动力总成（ECU间高速
日精进第156天魏光付
敬爱的老师，智慧的班主任，亲爱的学兄们：大家好！我是枣庄庆源汽修魏光付。今天2019.02.07.是我的日精进行动第156天，我的预期寿命还有9976天。给大家分享我今天的进步，我们互相勉励，携手前行。每天进步一点点，距离成功便不远。1.比学习：读《营销的十六个关键词》学到∶市场营销中最本质、最核心的也是最关键的工作就是产品创新。创新的产品，一定要去匹配消费者现有或将有的需求，否则就是无意义的创新
python学智能算法（二十四）|SVM-最优化几何距离的理解
引言前序学习过程中，已经对几何距离的概念有了认知，学习链接为：几何距离这里先来回忆几何距离δ的定义：δ=min⁡i=1...myi(w∥w∥⋅xi+b∥w∥)\delta=\min_{i=1...m}y_{i}(\frac{w}{\left\|w\right\|}\cdotx_{i}+\frac{b}{\left\|w\right\|})δ=i=1...mminyi(∥w∥w⋅xi+∥w∥b)对上
支持向量机SVM 李昊哲小课 sklearn 人工智能机器学习支持向量机算法机器学习 sklearn 人工智能数据挖掘
支持向量机SVM一、支持向量机算法支持向量机（SupportVectorMachine，SVM）是一种用于分类和回归分析的机器学习算法。分类场景举例（更容易理解）假设现在有一个二维平面上散落着一些点，这些点分为两类，一类是红色的圆形点，另一类是蓝色的方形点。我们的任务就是找到一条直线，能够把这两类点尽可能准确地分开。支持向量机算法做的事情就和这个类似。算法核心思想它不是随便找一条能分开两类数据的直
STM32与树莓派通信 bing_feilong 硬件嵌入式硬件
STM32与树莓派（RaspberryPi）的通信常见方案及实现步骤：1.UART串口通信（最简单）适用场景：短距离、低速数据交换（如传感器数据、调试信息）。硬件连接：STM32引脚树莓派引脚备注TXRX(GPIO15)交叉连接RXTX(GPIO14)交叉连接GNDGND共地软件配置：STM32端（使用HAL库）：UART_HandleTypeDefhuart1;huart1.Instance=U
mtime参数 xiaodaiwang linux
-mtimen按照文件的更改时间来找文件，n为整数。n表示文件更改时间距离为n天，-n表示文件更改时间距离在n天以内，+n表示文件更改时间距离在n天以前。例如：-mtime0表示文件修改时间距离当前为0天的文件，即距离当前时间不到1天（24小时）以内的文件。-mtime1表示文件修改时间距离当前为1天的文件，即距离当前时间1天（24小时－48小时）的文件。-mtime＋1表示文件修改时间为大于1天
高斯混合模型（GMM）中的协方差矩阵类型与聚类形状关系详解码字的字节机器学习机器学习人工智能高斯混合模型 GMM
高斯混合模型（GMM）简介高斯混合模型（GaussianMixtureModel,GMM）是概率统计与机器学习交叉领域的重要模型，其核心思想是通过多个高斯分布的线性组合来描述复杂数据分布。与单一高斯分布不同，GMM能够捕捉数据中的多模态特性，这使得它在处理真实世界非均匀分布数据时展现出独特优势。从数学形式上看，一个包含K个分量的GMM可表示为：其中(\pi_k)是第k个高斯分量的混合系数（满足(\
餐厅的那些事儿-大佬叫二月的猫
因为身处服务行业，所以会遇到各式各样的人，在工作中，也会有一些大佬，我们要用本子特意记下来，她们喜欢什么菜式，有什么忌口，喜欢什么饮品，咖啡是多奶还是少奶，比例是多少？爱坐哪个的位置，一点儿都不能出错，伺候周全，贴心服务，保持距离，还得适当惊喜。我们餐厅原则上是不可以订位的，可是如果有大佬要来，就会把最好的位置留给她们，台面都要用消毒水擦好几遍，餐具的摆放都是经理亲自布置的。就像今天一大早开会，就
书其实只有三类西蜀石兰类
一个人一辈子其实只读三种书，知识类、技能类、修心类。知识类的书可以让我们活得更明白。类似十万个为什么这种书籍，我一直不太乐意去读，因为单纯的知识是没法做事的，就像知道地球转速是多少一样（我肯定不知道），这种所谓的知识，除非用到，普通人掌握了完全是一种负担，维基百科能找到的东西，为什么去记忆？知识类的书，每个方面都涉及些，让自己显得不那么没文化，仅此而已。社会认为的学识渊博，肯定不是站在
《TCP/IP 详解，卷1：协议》学习笔记、吐槽及其他 bylijinnan tcp
《TCP/IP 详解，卷1：协议》是经典，但不适合初学者。它更像是一本字典，适合学过网络的人温习和查阅一些记不清的概念。这本书，我看的版本是机械工业出版社、范建华等译的。这本书在我看来，翻译得一般，甚至有明显的错误。如果英文熟练，看原版更好： http://pcvr.nl/tcpip/ 下面是我的一些笔记，包括我看书时有疑问的地方，也有对该书的吐槽，有不对的地方请指正： 1.
Linux—— 静态IP跟动态IP设置 eksliang linux IP
一.在终端输入 vi /etc/sysconfig/network-scripts/ifcfg-eth0 静态ip模板如下： DEVICE="eth0" #网卡名称 BOOTPROTO="static" #静态IP（必须） HWADDR="00:0C:29:B5:65:CA" #网卡mac地址 IPV6INIT=&q
Informatica update strategy transformation 18289753290
更新策略组件：标记你的数据进入target里面做什么操作，一般会和lookup配合使用，有时候用0,1,1代表 forward rejected rows被选中，rejected row是输出在错误文件里，不想看到reject输出，将错误输出到文件，因为有时候数据库原因导致某些column不能update，reject就会output到错误文件里面供查看，在workflow的
使用Scrapy时出现虽然队列里有很多Request但是却不下载，造成假死状态酷的飞上天空 request
现象就是：程序运行一段时间，可能是几十分钟或者几个小时，然后后台日志里面就不出现下载页面的信息，一直显示上一分钟抓取了0个网页的信息。刚开始已经猜到是某些下载线程没有正常执行回调方法引起程序一直以为线程还未下载完成，但是水平有限研究源码未果。经过不停的google终于发现一个有价值的信息，是给twisted提出的一个bugfix 连接地址如下http://twistedmatrix.
利用预测分析技术来进行辅助医疗蓝儿唯美医疗
2014年，克利夫兰诊所（Cleveland Clinic）想要更有效地控制其手术中心做膝关节置换手术的费用。整个系统每年大约进行2600例此类手术，所以，即使降低很少一部分成本，都可以为诊所和病人节约大量的资金。为了找到适合的解决方案，供应商将视野投向了预测分析技术和工具，但其分析团队还必须花时间向医生解释基于数据的治疗方案意味着什么。克利夫兰诊所负责企业信息管理和分析的医疗
java 线程(一)：基础篇 DavidIsOK java 多线程线程
&nbs
Tomcat服务器框架之Servlet开发分析 aijuans servlet
最近使用Tomcat做web服务器，使用Servlet技术做开发时，对Tomcat的框架的简易分析：疑问：为什么我们在继承HttpServlet类之后，覆盖doGet(HttpServletRequest req, HttpServetResponse rep)方法后，该方法会自动被Tomcat服务器调用，doGet方法的参数有谁传递过来？怎样传递？分析之我见： doGet方法的
揭秘玖富的粉丝营销之谜与小米粉丝社区类似 aoyouzi 揭秘玖富的粉丝营销之谜
玖富旗下悟空理财凭借着一个微信公众号上线当天成交量即破百万，第七天成交量单日破了1000万;第23天时，累计成交量超1个亿……至今成立不到10个月，粉丝已经超过500万，月交易额突破10亿，而玖富平台目前的总用户数也已经超过了1800万，位居P2P平台第一位。很多互联网金融创业者慕名前来学习效仿，但是却鲜有成功者，玖富的粉丝营销对外至今仍然是个谜。　　近日，一直坚持微信粉丝营销
Java web的会话跟踪技术百合不是茶 url会话 Cookie会话 Seession会话 Java Web 隐藏域会话
会话跟踪主要是用在用户页面点击不同的页面时,需要用到的技术点会话:多次请求与响应的过程 1,url地址传递参数,实现页面跟踪技术格式:传一个参数的 url?名=值传两个参数的 url?名=值 &名=值关键代码
web.xml之Servlet配置 bijian1013 java web.xml Servlet配置
定义： <servlet> <servlet-name>myservlet</servlet-name> <servlet-class>com.myapp.controller.MyFirstServlet</servlet-class> <init-param> <param-name>
利用svnsync实现SVN同步备份 sunjing SVN 同步 E000022 svnsync 镜像
1. 在备份SVN服务器上建立版本库 svnadmin create test 2. 创建pre-revprop-change文件 cd test/hooks/ cp pre-revprop-change.tmpl pre-revprop-change 3. 修改pre-revprop-
【分布式数据一致性三】MongoDB读写一致性 bit1129 mongodb
本系列文章结合MongoDB，探讨分布式数据库的数据一致性，这个系列文章包括：数据一致性概述与CAP 最终一致性(Eventually Consistency) 网络分裂(Network Partition)问题多数据中心(Multi Data Center) 多个写者(Multi Writer)最终一致性一致性图表(Consistency Chart) 数据
Anychart图表组件-Flash图转IMG普通图的方法白糖_ Flash
问题背景：项目使用的是Anychart图表组件，渲染出来的图是Flash的，往往一个页面有时候会有多个flash图，而需求是让我们做一个打印预览和打印功能，让多个Flash图在一个页面上打印出来。那么我们打印预览的思路是获取页面的body元素，然后在打印预览界面通过$("body").append(html)的形式显示预览效果，结果让人大跌眼镜：Flash是
Window 80端口被占用 WHY? bozch 端口占用 window
平时在启动一些可能使用80端口软件的时候，会提示80端口已经被其他软件占用，那一般又会有那些软件占用这些端口呢？下面坐下总结： 1、web服务器是最经常见的占用80端口的，例如：tomcat , apache , IIS , Php等等； 2
编程之美-数组的最大值和最小值-分治法（两种形式） bylijinnan 编程之美
import java.util.Arrays; public class MinMaxInArray { /** * 编程之美数组的最大值和最小值分治法 * 两种形式 */ public static void main(String[] args) { int[] t={11,23,34,4,6,7,8,1,2,23}; int[]
Perl正则表达式 chenbowen00 正则表达式 perl
首先我们应该知道 Perl 程序中，正则表达式有三种存在形式，他们分别是：匹配：m/<regexp>;/ （还可以简写为 /<regexp>;/ ，略去 m）替换：s/<pattern>;/<replacement>;/ 转化：tr/<pattern>;/<replacemnt>;
[宇宙与天文]行星议会是否具有本行星大气层以外的权力呢? comsci
举个例子: 地球,地球上由200多个国家选举出一个代表地球联合体的议会,那么现在地球联合体遇到一个问题,地球这颗星球上面的矿产资源快要采掘完了....那么地球议会全体投票,一致通过一项带有法律性质的议案,既批准地球上的国家用各种技术手段在地球以外开采矿产资源和其它资源........ &
Oracle Profile 使用详解 daizj oracle profile 资源限制
Oracle Profile 使用详解转一、目的： Oracle系统中的profile可以用来对用户所能使用的数据库资源进行限制，使用Create Profile命令创建一个Profile，用它来实现对数据库资源的限制使用，如果把该profile分配给用户，则该用户所能使用的数据库资源都在该profile的限制之内。二、条件：创建profile必须要有CREATE PROFIL
How HipChat Stores And Indexes Billions Of Messages Using ElasticSearch & Redis dengkane elasticsearch Lucene
This article is from an interview with Zuhaib Siddique, a production engineer at HipChat, makers of group chat and IM for teams. HipChat started in an unusual space, one you might not
循环小示例，菲波拉契序列，循环解一元二次方程以及switch示例程序 dcj3sjt126com c 算法
# include <stdio.h> int main(void) { int n; int i; int f1, f2, f3; f1 = 1; f2 = 1; printf("请输入您需要求的想的序列："); scanf("%d", &n); for (i=3; i<n; i
macbook的lamp环境 dcj3sjt126com lamp
sudo vim /etc/apache2/httpd.conf /Library/WebServer/Documents 是默认的网站根目录重启Mac上的Apache服务这个命令很早以前就查过了，但是每次使用的时候还是要在网上查：停止服务：sudo /usr/sbin/apachectl stop 开启服务：s
java ArrayList源码下 shuizhaosi888 ArrayList源码
版本 jdk-7u71-windows-x64 JavaSE7 ArrayList源码上：http://flyouwith.iteye.com/blog/2166890 /** * 从这个列表中移除所有c中包含元素 */ public boolean removeAll(Collection<?> c) {
Spring Security（08）——intercept-url配置 234390216 Spring Security intercept-url 访问权限访问协议请求方法
intercept-url配置目录 1.1 指定拦截的url 1.2 指定访问权限 1.3 指定访问协议 1.4 指定请求方法 1.1 &n
Linux环境下的oracle安装 jayung oracle
linux系统下的oracle安装本文档是Linux(redhat6.x、centos6.x、redhat7.x) 64位操作系统安装Oracle 11g(Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64bit Production)，本文基于各种网络资料精心整理而成，共享给有需要的朋友。如有问题可联系：QQ：52-7
hotspot虚拟机 leichenlei java HotSpot jvm 虚拟机文档
JVM参数 http://docs.oracle.com/javase/6/docs/technotes/guides/vm/index.html JVM工具 http://docs.oracle.com/javase/6/docs/technotes/tools/index.html JVM垃圾回收 http://www.oracle.com
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” noaighost Web node.js
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” 眼里的Node.JS 初初接触node是一年前的事，那时候年少不更事。还在纠结什么语言可以编写出牛逼的程序，想必每个码农都会经历这个月经性的问题：微信用什么语言写的？facebook为什么推荐系统这么智能，用什么语言写的？dota2的外挂这么牛逼，用什么语言写的？……用什么语言写这句话，困扰人也是阻碍
快速开发Android应用 rensanning android
Android应用开发过程中，经常会遇到很多常见的类似问题，解决这些问题需要花时间，其实很多问题已经有了成熟的解决方案，比如很多第三方的开源lib，参考 Android Libraries 和 Android UI/UX Libraries。编码越少，Bug越少，效率自然会高。但可能由于根本没听说过、听说过但没用过、特殊原因不能用、自己已经有了解决方案等等原因，这些成熟的解决
理解Java中的弱引用 tomcat_oracle java 工作面试
　不久之前，我面试了一些求职Java高级开发工程师的应聘者。我常常会面试他们说，“你能给我介绍一些Java中得弱引用吗？”，如果面试者这样说，“嗯，是不是垃圾回收有关的？”，我就会基本满意了，我并不期待回答是一篇诘究本末的论文描述。　　然而事与愿违，我很吃惊的发现，在将近20多个有着平均5年开发经验和高学历背景的应聘者中，居然只有两个人知道弱引用的存在，但是在这两个人之中只有一个人真正了
标签输出html标签" target="_blank">关于标签输出html标签 xshdch jsp
http://back-888888.iteye.com/blog/1181202 关于<c:out value=""/>标签的使用，其中有一个属性是escapeXml默认是true(将html标签当做转移字符，直接显示不在浏览器上面进行解析)，当设置escapeXml属性值为false的时候就是不过滤xml，这样就能在浏览器上解析html标签， &nb

机器学习中常用范数与距离