详解机器学习中的熵、条件熵、相对熵和交叉熵

https://www.cnblogs.com/kyrieng/p/8694705.html

文章目录

1、信息熵 (information entropy)
2、条件熵 (Conditional entropy)
3、相对熵 (Relative entropy)，也称KL散度 (Kullback–Leibler divergence)
4、交叉熵 (Cross entropy)
5、总结
6、参考
7、后记

1、信息熵 (information entropy)

熵 (entropy) 一词最初来源于热力学。1948年，香农将热力学中的熵引入信息论，所以也称香农熵 (Shannon entropy)或信息熵 (information entropy)。本文只讨论信息熵。首先，我们来理解一下信息这个概念。信息是一个很抽象的概念，百度百科将它定义为：指音讯、消息、通讯系统传输和处理的对象，泛指人类社会传播的一切内容。那么，信息可以被量化么？可以！香农提出的“信息熵”解决了这一问题。

一条信息的信息量大小和它的不确定性有直接的关系。我们需要搞清楚一件非常非常不确定的事，或者是我们一无所知的事，就需要了解大量的信息。相反，如果我们对某件事已经有了较多的了解，我们就不需要太多的信息就能把它搞清楚。所以，从这个角度，我们可以认为，信息量的度量就等于不确定性的多少。比如，有人说广东下雪了。对于这句话，我们是十分不确定的。因为广东几十年来下雪的次数寥寥无几。为了搞清楚，我们就要去看天气预报，新闻，询问在广东的朋友，而这就需要大量的信息，信息熵很高。再比如，中国男足进军2022年卡塔尔世界杯决赛圈。对于这句话，因为确定性很高，几乎不需要引入信息，信息熵很低。

考虑一个离散的随机变量 $x$ ，由上面两个例子可知，信息的量度应该依赖于概率分布 $p (x)$ ，因此我们想要寻找一个函数 $I (x)$ ，它是概率 $p (x)$ 的单调函数，表达了信息的内容。怎么寻找呢？如果我们有两个不相关的事件 $x$ 和 $y$ ，那么观察两个事件同时发生时获得的信息量应该等于观察到事件各自发生时获得的信息之和，即： $I (x, y) = I (x) + I (y)$ 。

因为两个事件是独立不相关的，因此 $p (x, y) = p (x) p (y)$ 。根据这两个关系，很容易看出 $I (x)$ 一定与 $p (x)$ 的对数有关(因为对数的运算法则是 $log_a{(mn)}=\log_a{m}+\log_a{n}$ )。因此，我们有 $I(x)=−\log{p(x)}$ ，其中负号是用来保证信息量是正数或者零。而 log函数基的选择是任意的（信息论中基常常选择为2，因此信息的单位为比特bits；而机器学习中基常常选择为自然常数，因此单位常常被称为奈特nats）。 $I (x)$ 也被称为随机变量 $x$ 的自信息 (self-information)，描述的是随机变量的某个事件发生所带来的信息量。如图：

最后，我们正式引出信息熵。现在假设一个发送者想传送一个随机变量的值给接收者。那么在这个过程中，他们传输的平均信息量可以通过求 $I(x)=−\log{p(x)}$ 关于概率分布 $p (x)$ 的期望得到，即：

$H(X)=−\sum\limits_x{p(x)\log{p(x)}}=−\sum_{i=1}^n{p(x_i)\log{p(x_i)}}$

$H (X)$ 就被称为随机变量 $x$ 的熵，它是表示随机变量不确定的度量，是对所有可能发生的事件产生的信息量的期望。

从公式可得，随机变量的取值个数越多，状态数也就越多，信息熵就越大，混乱程度就越大。当随机分布为均匀分布时，熵最大，且 $0≤H(X)≤\log{n}$ 。稍后证明。将一维随机变量分布推广到多维随机变量分布，则其联合熵 (Joint entropy) 为：

$H(X,Y)=−∑_{x,y}p(x,y)\log{p(x,y)}=−∑_{i=1}^{n}∑_{j=1}^{m}p(x_i,y_i)\log{p(x_i,y_i)}$

注意点：

熵只依赖于随机变量的分布，与随机变量取值无关，也可以将 $X$ 的熵记作 $H (p)$ 。
令 $0\log{0}=0$ (因为某个取值概率可能为0)。

那么，这些定义有什么样的性质呢？考虑一个随机变量 $x$ 。这个随机变量有4种可能的状态，每个状态都是等可能的。为了把 $x$ 的值传给接收者，我们需要传输2比特的消息。

$H(X)=−4×\frac{1}{4}×log_{2}{\frac{1}{4}}$ = 2 bits

现在考虑一个具有4种可能的状态 {a,b,c,d}的随机变量，每个状态各自的概率为 (1/2,1/4,1/8,1/8)

这种情形下的熵为：

$H(X)=−1/2\log_2{1/2}−1/4\log_2{1/4}−1/8\log_2{1/8}−1/8\log_2{1/8}$ =1.75 bits

我们可以看到，非均匀分布比均匀分布的熵要小。现在让我们考虑如何把变量状态的类别传递给接收者。与之前一样，我们可以使用一个2比特的数字来完成这件事情。然而，我们可以利用非均匀分布这个特点，使用更短的编码来描述更可能的事件，使用更长的编码来描述不太可能的事件。我们希望这样做能够得到一个更短的平均编码长度。我们可以使用下面的编码串（哈夫曼编码）：0、10、110、111来表示状态 {a,b,c,d}。传输的编码的平均长度就是：

average code length = $\frac{1}{2}×1+\frac{1}{4}×2+2×\frac{1}{8}×3$ =1.75 bits

这个值与上方的随机变量的熵相等。熵和最短编码长度的这种关系是一种普遍的情形。

Shannon 编码定理表明熵是传输一个随机变量状态值所需的比特位下界（最短平均编码长度）。因此，信息熵可以应用在数据压缩方面。这里讲的很详细。

证明0≤H(X)≤logn

利用拉格朗日乘子法证明：

因为 p(1)+p(2)+⋯+p(n)=1

所以有

目标函数：f(p(1),p(2),…,p(n))=−(p(1)logp(1)+p(2)logp(2)+⋯+p(n)logp(n))

约束条件：g(p(1),p(2),…,p(n),λ)=p(1)+p(2)+⋯+p(n)−1=0

1、定义拉格朗日函数：

L(p(1),p(2),…,p(n),λ)=−(p(1)logp(1)+p(2)logp(2)+⋯+p(n)logp(n))+λ(p(1)+p(2)+⋯+p(n)−1)

2、L(p(1),p(2),…,p(n),λ)
分别对 p(1),p(2),p(n),λ 求偏导数，令偏导数为 0

：

λ−log(e⋅p(1))=0

λ−log(e⋅p(2))=0

……

λ−log(e⋅p(n))=0

p(1)+p(2)+⋯+p(n)−1=0

3、求出 p(1),p(2),…,p(n)

的值：

解方程得，p(1)=p(2)=⋯=p(n)=1n

代入 f(p(1),p(2),…,p(n))
中得到目标函数的极值为 f(1n,1n,…,1n)=−(1nlog1n+1nlog1n+⋯+1nlog1n)=−log(1n)=logn

由此可证 logn

为最大值。

2、条件熵 (Conditional entropy)

条件熵 H(Y|X)
表示在已知随机变量 X 的条件下随机变量 Y 的不确定性。条件熵 H(Y|X) 定义为 X 给定条件下 Y 的条件概率分布的熵对 X

的数学期望：

条件熵 H(Y|X)
相当于联合熵 H(X,Y) 减去单独的熵 H(X)

，即

H(Y|X)=H(X,Y)−H(X)

，证明如下：

举个例子，比如环境温度是低还是高，和我穿短袖还是外套这两个事件可以组成联合概率分布 H(X,Y)
，因为两个事件加起来的信息量肯定是大于单一事件的信息量的。假设 H(X) 对应着今天环境温度的信息量，由于今天环境温度和今天我穿什么衣服这两个事件并不是独立分布的，所以在已知今天环境温度的情况下，我穿什么衣服的信息量或者说不确定性是被减少了。当已知 H(X) 这个信息量的时候，H(X,Y)

剩下的信息量就是条件熵：

H(Y|X)=H(X,Y)−H(X)

因此，可以这样理解，描述 X
和 Y 所需的信息是描述 X 自己所需的信息,加上给定 X 的条件下具体化 Y

所需的额外信息。关于条件熵的例子可以看这篇文章，讲得很详细。

3、相对熵 (Relative entropy)，也称KL散度 (Kullback–Leibler divergence)

设 p(x)、q(x) 是离散随机变量 X 中取值的两个概率分布，则 p 对 q的相对熵是：

DKL(p||q)=∑xp(x)logp(x)q(x)=Ep(x)logp(x)q(x)

性质：

1、如果 p(x)
和 q(x)

两个分布相同，那么相对熵等于0

2、DKL(p||q)≠DKL(q||p)

，相对熵具有不对称性。大家可以举个简单例子算一下。

3、DKL(p||q)≥0

证明如下（利用Jensen不等式https://en.wikipedia.org/wiki/Jensen%27s_inequality）：

因为：

∑xp(x)=1

所以：

DKL(p||q)≥0

总结：相对熵可以用来衡量两个概率分布之间的差异，上面公式的意义就是求 p
与 q 之间的对数差在 p

上的期望值。

4、交叉熵 (Cross entropy)

现在有关于样本集的两个概率分布 p(x)和 q(x)，其中 p(x) 为真实分布， q(x) 非真实分布。如果用真实分布 p(x)来衡量识别别一个样本所需要编码长度的期望（平均编码长度）为:

H§=∑xp(x)log1p(x)

如果使用非真实分布 q(x)来表示来自真实分布 p(x)的平均编码长度，则是：H(p,q)=∑xp(x)log1q(x)。（因为用 q(x) 来编码的样本来自于分布 q(x) ，所以 H(p,q) 中的概率是 p(x)）。此时就将 H(p,q) 称之为交叉熵。举个例子。考虑一个随机变量 x，真实分布p(x)=(12,14,18,18)，非真实分布 q(x)=(14,14,14,14)，则H§=1.75 bits（最短平均码长），交叉熵 H(p,q)=12log24+14log24+18log24+18log24=2 bits。由此可以看出根据非真实分布 q(x) 得到的平均码长大于根据真实分布 p(x)得到的平均码长。

我们再化简一下相对熵的公式。DKL(p||q)=∑xp(x)logp(x)q(x)=∑xp(x)logp(x)−p(x)logq(x)

有没有发现什么？

熵的公式 $H(p)=−\sum\limits_{x}p(x)\log{p(x)}$

交叉熵的公式 $H (p, q) = \sum x p (x) l o g 1 q (x) = - \sum x p (x) l o g q (x)$

所以有：

DKL(p||q)=H(p,q)−H§
（当用非真实分布 q(x) 得到的平均码长比真实分布 p(x)

得到的平均码长多出的比特数就是相对熵）

又因为 DKL(p||q)≥0

所以 H(p,q)≥H§
（当 p(x)=q(x)

时取等号，此时交叉熵等于信息熵）

并且当 H§
为常量时（注：在机器学习中，训练数据分布是固定的），最小化相对熵 DKL(p||q) 等价于最小化交叉熵 H(p,q)

也等价于最大化似然估计（具体参考Deep Learning 5.5）。

在机器学习中，我们希望在训练数据上模型学到的分布 P(model)
和真实数据的分布 P(real) 越接近越好，所以我们可以使其相对熵最小。但是我们没有真实数据的分布，所以只能希望模型学到的分布 P(model) 和训练数据的分布 P(train)

尽量相同。假设训练数据是从总体中独立同分布采样的，那么我们可以通过最小化训练数据的经验误差来降低模型的泛化误差。即：

希望学到的模型的分布和真实分布一致，P(model)≃P(real)

但是真实分布不可知，假设训练数据是从真实数据中独立同分布采样的，P(train)≃P(real)
因此，我们希望学到的模型分布至少和训练数据的分布一致，P(train)≃P(model)

根据之前的描述，最小化训练数据上的分布 P(train)
与最小化模型分布 P(model) 的差异等价于最小化相对熵，即 DKL(P(train)||P(model))。此时， P(train) 就是DKL(p||q) 中的 p，即真实分布，P(model) 就是 q。又因为训练数据的分布 p 是给定的，所以求 DKL(p||q) 等价于求 H(p,q)

。得证，交叉熵可以用来计算学习模型分布与训练分布之间的差异。交叉熵广泛用于逻辑回归的Sigmoid和Softmax函数中作为损失函数使用。这篇文章先不说了。

5、总结

信息熵是衡量随机变量分布的混乱程度，是随机分布各事件发生的信息量的期望值。随机变量的取值个数越多，状态数也就越多，信息熵就越大，混乱程度就越大。当随机分布为均匀分布时，熵最大；信息熵推广到多维领域，则可得到联合信息熵；条件熵表示的是在 X给定条件下，Y 的条件概率分布的熵对 X的期望。
相对熵可以用来衡量两个概率分布之间的差异。
交叉熵可以来衡量在给定的真实分布下，使用非真实分布所指定的策略消除系统的不确定性所需要付出的努力的大小。

或者：

信息熵是传输一个随机变量状态值所需的比特位下界（最短平均编码长度）。
相对熵是指用 q 来表示分布 p 额外需要的编码长度。
交叉熵是指用分布 q 来表示本来表示分布 p 的平均编码长度。

6、参考

1、吴军《数学之美》

2、李航《统计学习方法》

3、马春鹏《模式识别与机器学习》

3、https://www.zhihu.com/question/41252833 如何通俗的解释交叉熵与相对熵

4、https://www.zhihu.com/question/65288314/answer/244557337为什么交叉熵（cross-entropy）可以用于计算代价？

5、https://baike.baidu.com/item/交叉熵/8983241?fr=aladdin 交叉熵的百度百科解释

6、https://blog.csdn.net/saltriver/article/details/53056816信息熵到底是什么

7、后记

本人不是大神，大牛。目前写博客是为了让我自己更深刻地记忆学过的知识和对知识进行梳理。这篇博客是我的第一篇，其中借鉴了不少其他博主的博客里的分享，都有标注来源，如有遗忘，劳烦提醒，衷心感谢他们对自己所掌握的知识的分享。这篇博客可能还存在着一些错误，如有发现，请求斧正，谢谢。

Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
100天持续行动—Day01 Richard_DL
今天开始站着学习，发现效率大幅提升。把fast.ai的Lesson1的后半部分和Lesson2看完了。由于Keras版本和视频中的不一致，运行notebook时经常出现莫名其妙的错误，导致自己只动手实践了视频中的一小部分内容。为了赶时间，我打算先把与CNN相关的视频过一遍。然后尽快开始做自己的项目。明天继续加油，争取把Lesson3和Lesson4看完。
yolov5＞onnx＞ncnn＞apk 图像处理大大大大大牛啊 opencv实战代码讲解 yolo onnx ncnn 安卓
一.yolov5pt模型转onnx条件：colabnotebookyolov51.安装环境!pipinstallonnx>=1.7.0#forONNXexport!pipinstallcoremltools==4.0#forCoreMLexport!pipinstallonnx-simplifier2.修改common.py在classFocus下面
Day_11 ROC_bird.. 算法
面试题16.15.珠玑妙算-力扣（LeetCode）/***Note:Thereturnedarraymustbemalloced,assumecallercallsfree().*///下标和对应位置的值都一样，answer[0]+1,对应位置的值猜对了，但是下标不对，answer[1]+1int*masterMind(char*solution,char*guess,int*returnSiz
html+css网页设计旅游网站首页1个页面 html+css+js网页设计 html css 旅游
html+css网页设计旅游网站首页1个页面网页作品代码简单，可使用任意HTML辑软件（如：Dreamweaver、HBuilder、Vscode、Sublime、Webstorm、Text、Notepad++等任意html编辑软件进行运行及修改编辑等操作）。获取源码1，访问该网站https://download.csdn.net/download/qq_42431718/897527112，点击
【Death Note】网吧战神之7天爆肝渗透测试死亡笔记_sqlmap在默认情况下除了使用 char() 函数防止出现单引号 2401_84561374 程序员笔记
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！特殊服务端口2181zookeeper服务未授权访问
ElasticSearch查询超过10000条（1000页）时出现Result window is too large的问题王月亮17
问题当ES数据量较大，使用分页查询超过10000条（1000页）时，出现如下错误：Cannotexecutejestaction,responsecode:500,error:{"root_cause":[{"type":"query_phase_execution_exception","reason":"Resultwindowistoolarge,from+sizemustbelesstha
sentinel 不显示项目_Sentinel相关问题记录 weixin_39840606 sentinel 不显示项目
SentinelFAQ整理Sentinel承接阿里巴巴近10年双十一大促流量的核心场景，以流量为切入点，从流量控制、熔断降级、系统负载保护等多个维度保护服务的稳定性。其提供丰富的应用场景支持、完备的监控能力、易用的拓展点。Note:中文文档请见此处。热点问题1、Q:dashboard不展示监控问题如何排查？dashboard是一个单独启动的控制台，引入sentinel的应用是一个客户端。它们各自有
在服务器计算节点中使用 jupyter Lab ranshan567 程序人生
JupyterLab是一个基于网页的交互式开发环境,用于科学计算、数据分析和机器学.jupyterlab是jupyternotebook的下一代产品,集成了更多功能,使用起来更方便.在进行数据分析及可视化时，个人电脑不能满足大数据的分析需求，就需要用到高性能计算机集群资源，然而计算机集群的计算节点往往没有联网功能，所以在计算机集群中使用jupyterLab需要进行一些配置。具体的步骤如下：
【拖拽】自定义拖拽图标风露_
一、知识点设置被拖拽的元素draggable为true(HTML5新特性)关键方法：voiddataTransfer.setDragImage(img,xOffset,yOffset);注意点：Note:Ifthe[Element]isanexisting[HTMLElement],itneedstobevisibleintheviewportinordertobeshownasadragfeed
Python 初学者入门必知： Anaconda是什么？有什么作用？怎么使用？懒大王爱吃狼 Python基础 python 开发语言 python基础 python学习 anaconda anaconda安装 python教程
初学者在学习Python时，经常看到的一个名字是Anaconda。究竟什么是Anaconda，为什么它如此受欢迎？在这篇文章中，我们将探讨Anaconda，了解Anaconda的从安装到使用的。Anaconda是一个免费开源的Python和R编程发行版，包含上千个适用于数据科学和机器学习的包。同时，配备了Spyder和Jupyternotebook等工具，初学者可以使用它们来学习Python，使用
哈希表 383.赎金信柴... 散列表算法 leetcode
统计两个字符串中，每个字母出现的次数，最后统计，当数组所有位置都>0时，就能确定。classSolution{publicbooleancanConstruct(StringransomNote,Stringmagazine){int[]record=newint[26];if(ransomNote.length()>magazine.length()){returnfalse;}for(inti
从零开始！Jupyter Notebook的安装教程 yunquantong jupyter ide python
以下是从零开始安装JupyterNotebook的教程，适用于Windows、macOS和Linux系统。1.安装PythonJupyterNotebook需要Python环境。你可以从Python官方网站下载并安装Python。Windows用户:运行安装程序时，请确保勾选“AddPythontoPATH”选项。macOS用户:使用安装程序或通过Homebrew安装(brewinstallpyt
从零开始!Jupyter Notebook的安装教程 109702008 人工智能编程 #python jupyter 人工智能
GPT-4o(OpenAI)安装JupyterNotebook是一个相对简单的过程，特别是在大多数现代操作系统（如Windows、macOS和Linux）上。以下是详细的步骤指南，从安装Python开始，到JupyterNotebook的使用。步骤1：安装PythonJupyterNotebook需要Python环境。你可以从[Python官网](https://www.python.org/do
深度学习工具：用Jupyter Notebook远程连接服务器 S.GJ 服务器 jupyter python
1.安装jupyter相关库（服务器端）pipinstalljupyterlabjupyter_contrib.nbextensions2.设置jupyter密码（服务器端）jupyter-notebookpassword3.开启jupyternotebook服务（服务器端）mkdirworkspacejupyter-notebook--no-browser--ip=0.0.0.0./worksp
LeetCode_sql_day04(1280. 学生们参加各科测试的次数) Darling_00 sql leetcode sql 数据库
描述：1280.学生们参加各科测试的次数查询出每个学生参加每一门科目测试的次数，结果按student_id和subject_name排序。查询结构格式如下所示。数据准备：CreatetableIfNotExistsStudents(student_idint,student_namevarchar(20))CreatetableIfNotExistsSubjects(subject_namevar
MySQL的DDL、DML、DQL 鱼灯几许 mysql 数据库
DDLDDL：数据定义语言查询所有数据库：showdatabases;查询当前数据库：showdatabases();使用数据库：use数据库名;创建数据库：createdatabase[ifnotexists]数据库名;删除数据库：dropdatabase[ifexists]数据库名;创建表：createtable表名(字段1字段1类型[约束][comment字段1注释],字段2字段2类型[约束
[已解决]Notepad++ 无法安装HexEditor 胡释薇编辑器
宿主版本:8.4.6插件版本:0.9.12正常在插件管理中无法安装成功.科学上网也不好用浑身难受...看了其他小伙伴的解决办法嗯.....并不好用!(可能和他们的版本不对应,未能适用)[当前版本的解决办法]插件>打开插件文件夹...在该目录下手动创建HexEditor的文件夹使用老版本的插件0.9.9解压丢进去打开宿主设置>导入>导入插件...选择刚刚导入的HexEditor.dll文件.导入后点
力扣SQL仅数据库（570-579）朵&朵数据库 leetcode sql
570.至少有5名直接下属的经理需求：编写一个解决方案，找出至少有五个直接下属的经理数据准备：CreatetableIfNotExistsEmployee(idint,namevarchar(255),departmentvarchar(255),managerIdint)TruncatetableEmployeeinsertintoEmployee(id,name,department)valu
【数据结构】快速排序与归并排序的非递归实现盐酥鸡-- 数据结构数据结构算法
个人主页：Yanni.—数据结构：DataStructure.C语言笔记：CLanguageNotesOJ题分享：TopicSharing目录前言：非递归基础思想快速排序非递归思路快速排序非递归实现归并排序的非递归思路归并排序的非递归实现前言：在之前学习了快速排序和归并排序，但算法就是用递归实现的，在企业的面试中，很多企业不会问你快速排序和归并排序递归算法的思想，而是非递归实现这两个排序，今天为大
苹果不是没有创新只不过不做PPT机型罢了？非鱼花酱
作为一年出货量两亿多而每年又只发布两三款机型的苹果来说，硬件上的创新肯定是需要克制的，如果过于激进良品率解决不了或者产品扑街那么影响无疑就是摧毁性的，因为品牌口碑这个东西一款机型的失败可能就会滑倒谷底了，三星Note7就是这个道理，去年的苹果基带门也是如此，好在信号问题还不像三星那么致命，所以现实就是大厂的旗舰机必须稳扎稳打，这也就是为什么三星现在的充电功率还停留在18W的原因…对于5G以及信号问
【早安心语】壹典心理咨询
【2021-10-22】早安春夏秋冬Lifeisnoteasy,thekeytoseehowyoulive,itissaidthateveryone'slifeshouldshedthenumberoftearsisnotthesame,somepeopleathousandtears,somepeople10,000tears,somepeoplemore,thesetearscombinedh
Jupyter notebook安装的问题大梦一场三十一
使用anaconda去安装会比较简单，而后在anaconda打开Jupyternotebookimage.png遇到的问题：（1）在anaconda打开Jupyternotebook，无法出现在浏览器上，http://localhost:8888/tree，无法使用。可以尝试使用http://127.0.0.1:8888/tree。原因是hosts中没有定义127.0.0.1为localhost，
note: This error originates from a subprocess, and is likely not a problem with pip. ERROR: Failed 哎呀——哪是啥 openmmlab pip
确保环境配置正确：检查Python版本是否与mmcv兼容（通常情况下，Python3.6-3.9是支持的）。确认安装了合适的PyTorch版本，mmcv常常需要与PyTorch版本紧密配合。更新pip，setuptools，和wheel：在运行安装命令之前，确保这些库是最新的：plaintextpipinstall--upgradepipsetuptoolswheel尝试使用预编译的轮文件：可以尝
【Python】已解决：note: This error originates from a subprocess，and is likely not a problem with pip 屿小夏 python pip 开发语言
文章目录一、分析问题背景二、可能出错的原因三、错误代码示例四、正确代码示例五、注意事项已解决：note:Thiserrororiginatesfromasubprocess，andislikelynotaproblemwithpip一、分析问题背景在Python项目的开发过程中，我们经常需要使用pip安装各种第三方库。有时候，当我们尝试安装某个库时，可能会遇到如下报错信息：note:Thiserr
linux查看jupyter运行,在Linux服务器上运行Jupyter notebook server教程天启大烁哥
在Linux服务器上运行Jupyternotebookserver教程很多deeplearning教程都推荐在jupyternotebook运行python代码，方便及时交互。但只在本地运行没有GPU环境，虽然googlecolab是个好办法，但发现保存模型后在云端找不到模型文件，且需要合理上网才能访问。于是想给实验室的服务器配置jupyternotebook，供本机远程访问。踩了不少坑，码一下教
BUUCTF 2021-10-4 Pwn Ch1lkat BUUCTF Pwn linux pwn
文章目录保持手感echo分析EXPPwnme1分析EXPwdb_2018_1st_babyheap分析EXPFSOPhouseoforange_hitcon_2016分析前置知识House_of_orangeFSOPEXPzctf_2016_note3分析EXPgyctf_2020_document分析EXP动态调试复现护网杯_gettingstart分析EXPpicoctf_2018_buffe
标题：阳光的ScalersTalk第四轮《新概念》朗读持续力训练 Day40 20181116 阳光18
Lesson40FoodandtalkLastweekatadinner-party,thehostessaskedmetositnexttoMrs.Rumbold.Mrs.Rumboldwasalarge,unsmilingladyinatightblackdress.ShedidnotevenlookupwhenItookmyseatbesideher.Hereyeswerefixedonhe
notepad++软件介绍（含安装包） LQS2020 notepad++
Notepad++是一款开源的文本编辑器，主要用于编程和代码编辑。它是一个功能强大的替代品，常常被用来替代Windows系统自带的记事本。Notepad++win系统免费下载地址以下是Notepad++的一些主要特点和功能：多语言支持：Notepad++支持多种编程语言，包括Python、JavaScript、HTML、CSS、C++、Java等。它能够根据文件类型自动高亮显示语法，使代码更加易读
一款可以替代Notepad++的免费高级文本编辑器 ITdgr notepad++
Kate文本编辑器是一款跨平台的免费高级文本编辑器，具有丰富的功能和特性。它支持标签页、代码高亮、多文件查找、垂直/水平视图、侧边栏、颜色主题等特性，类似于Notepad++。它以其多功能性和易用性广受好评。Kate支持多文档界面（MDI）和标签页，允许用户同时编辑和查看多个文件，无论是单独在一个窗口中还是在分割视图中。相较于其他文本编辑器，Kate提供了更为全面的功能和更好的跨平台支持。它的多文
java短路运算符和逻辑运算符的区别 3213213333332132 java基础
/* * 逻辑运算符——不论是什么条件都要执行左右两边代码 * 短路运算符——我认为在底层就是利用物理电路的“并联”和“串联”实现的 * 原理很简单，并联电路代表短路或（||），串联电路代表短路与（&&）。 * * 并联电路两个开关只要有一个开关闭合，电路就会通。 * 类似于短路或（||），只要有其中一个为true（开关闭合）是
Java异常那些不得不说的事白糖_ java exception
一、在finally块中做数据回收操作比如数据库连接都是很宝贵的，所以最好在finally中关闭连接。 JDBCAgent jdbc = new JDBCAgent(); try{ jdbc.excute("select * from ctp_log"); }catch(SQLException e){ ... }finally{ jdbc.close();
utf-8与utf-8(无BOM)的区别 dcj3sjt126com PHP
BOM——Byte Order Mark，就是字节序标记在UCS 编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符，它的编码是FEFF。而FFFE在UCS中是不存在的字符，所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前，先传输字符"ZERO WIDTH NO-BREAK SPACE"。这样如
JAVA Annotation之定义篇周凡杨 java 注解 annotation 入门注释
Annotation: 译为注释或注解 An annotation, in the Java computer programming language, is a form of syntactic metadata that can be added to Java source code. Classes, methods, variables, pa
tomcat的多域名、虚拟主机配置 g21121 tomcat
众所周知apache可以配置多域名和虚拟主机，而且配置起来比较简单，但是项目用到的是tomcat，配来配去总是不成功。查了些资料才总算可以，下面就跟大家分享下经验。很多朋友搜索的内容基本是告诉我们这么配置：在Engine标签下增面积Host标签，如下： <Host name="www.site1.com" appBase="webapps"
Linux SSH 错误解析（Capistrano 的cap 访问错误 Permission ） 510888780 linux capistrano
1.ssh -v [email protected] 出现 Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password). 错误运行状况如下： OpenSSH_5.3p1, OpenSSL 1.0.1e-fips 11 Feb 2013 debug1: Reading configuratio
log4j的用法 Harry642 java log4j
一、前言： log4j 是一个开放源码项目，是广泛使用的以Java编写的日志记录包。由于log4j出色的表现，当时在log4j完成时，log4j开发组织曾建议sun在jdk1.4中用log4j取代jdk1.4 的日志工具类，但当时jdk1.4已接近完成，所以sun拒绝使用log4j，当在java开发中
mysql、sqlserver、oracle分页，java分页统一接口实现 aijuans oracle jave
定义：pageStart 起始页，pageEnd 终止页,pageSize页面容量 oracle分页：　　　　select * from ( select mytable.*,rownum num from (实际传的SQL) where rownum<=pageEnd) where num>=pageStart sqlServer分页：
Hessian 简单例子 antlove java Web service hessian
hello.hessian.MyCar.java package hessian.pojo; import java.io.Serializable; public class MyCar implements Serializable { private static final long serialVersionUID = 473690540190845543
数据库对象的同义词和序列百合不是茶 sql 序列同义词 ORACLE权限
回顾简单的数据库权限等命令; 解锁用户和锁定用户 alter user scott account lock/unlock; //system下查看系统中的用户 select * dba_users; //创建用户名和密码 create user wj identified by wj; identified by //授予连接权和建表权 grant connect to
使用Powermock和mockito测试静态方法 bijian1013 持续集成单元测试 mockito Powermock
实例： package com.bijian.study; import static org.junit.Assert.assertEquals; import java.io.IOException; import org.junit.Before; import org.junit.Test; import or
精通Oracle10编程SQL(6)访问ORACLE bijian1013 oracle 数据库 plsql
/* *访问ORACLE */ --检索单行数据 --使用标量变量接收数据 DECLARE v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; BEGIN select ename,sal into v_ename,v_sal from emp where empno=&no; dbms_output.pu
【Nginx四】Nginx作为HTTP负载均衡服务器 bit1129 nginx
Nginx的另一个常用的功能是作为负载均衡服务器。一个典型的web应用系统，通过负载均衡服务器，可以使得应用有多台后端服务器来响应客户端的请求。一个应用配置多台后端服务器，可以带来很多好处：负载均衡的好处增加可用资源增加吞吐量加快响应速度，降低延时出错的重试验机制 Nginx主要支持三种均衡算法： round-robin l
jquery-validation备忘白糖_ jquery css F#Firebug
留点学习jquery validation总结的代码： function checkForm(){ validator = $("#commentForm").validate({// #formId为需要进行验证的表单ID errorElement :"span",// 使用"div"标签标记错误，默认:&
solr限制admin界面访问（端口限制和http授权限制） ronin47 限定Ip访问
solr的管理界面可以帮助我们做很多事情，但是把solr程序放到公网之后就要限制对admin的访问了。可以通过tomcat的http基本授权来做限制，也可以通过iptables防火墙来限制。我们先看如何通过tomcat配置http授权限制。第一步：在tomcat的conf/tomcat-users.xml文件中添加管理用户，比如： <userusername="ad
多线程-用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 bylijinnan java 多线程
public class IncDecThread { private int j=10; /* * 题目:用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 * 两个问题： * 1、线程同步--synchronized * 2、线程之间如何共享同一个j变量--内部类 */ public static
买房历程 cfyme
2015-06-21: 万科未来城，看房子 2015-06-26: 办理贷款手续，贷款73万，贷款利率5.65=5.3675 2015-06-27: 房子首付,签完合同 2015-06-28，央行宣布降息 0.25，就2天的时间差啊，没赶上。首付，老婆找他的小姐妹接了5万，另外几个朋友借了1-
[军事与科技]制造大型太空战舰的前奏 comsci 制造
天气热了........空调和电扇要准备好.......... 最近,世界形势日趋复杂化,战争的阴影开始覆盖全世界.......... 所以,我们不得不关
dateformat dai_lm DateFormat
"Symbol Meaning Presentation Ex." "------ ------- ------------ ----" "G era designator (Text) AD" "y year
Hadoop如何实现关联计算 datamachine mapreduce hadoop 关联计算
选择Hadoop，低成本和高扩展性是主要原因，但但它的开发效率实在无法让人满意。以关联计算为例。假设：HDFS上有2个文件，分别是客户信息和订单信息，customerID是它们之间的关联字段。如何进行关联计算，以便将客户名称添加到订单列表中？ &nbs
用户模型中修改用户信息时，密码是如何处理的 dcj3sjt126com yii
当我添加或修改用户记录的时候对于处理确认密码我遇到了一些麻烦，所有我想分享一下我是怎么处理的。场景是使用的基本的那些(系统自带)，你需要有一个数据表(user)并且表中有一个密码字段(password),它使用 sha1、md5或其他加密方式加密用户密码。面是它的工作流程: 当创建用户的时候密码需要加密并且保存，但当修改用户记录时如果使用同样的场景我们最终就会把用户加密过的密码再次加密，这
中文 iOS/Mac 开发博客列表 dcj3sjt126com Blog
本博客列表会不断更新维护，如果有推荐的博客，请到此处提交博客信息。本博客列表涉及的文章内容支持定制化Google搜索，特别感谢 JeOam 提供并帮助更新。本博客列表也提供同步更新的OPML文件（下载OPML文件），可供导入到例如feedly等第三方定阅工具中，特别感谢 lcepy 提供自动转换脚本。这里有导入教程。
js去除空格，去除左右两端的空格蕃薯耀去除左右两端的空格 js去掉所有空格 js去除空格
js去除空格，去除左右两端的空格 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>&g
SpringMVC4零配置--web.xml hanqunfeng springmvc4
servlet3.0+规范后，允许servlet，filter，listener不必声明在web.xml中，而是以硬编码的方式存在，实现容器的零配置。 ServletContainerInitializer：启动容器时负责加载相关配置 package javax.servlet; import java.util.Set; public interface ServletContainer
《开源框架那些事儿21》：巧借力与借巧力 j2eetop 框架 UI
同样做前端UI，为什么有人花了一点力气，就可以做好？而有的人费尽全力，仍然错误百出？我们可以先看看几个故事。故事1：巧借力，乌鸦也可以吃核桃有一个盛产核桃的村子，每年秋末冬初，成群的乌鸦总会来到这里，到果园里捡拾那些被果农们遗落的核桃。核桃仁虽然美味，但是外壳那么坚硬，乌鸦怎么才能吃到呢？原来乌鸦先把核桃叼起，然后飞到高高的树枝上，再将核桃摔下去，核桃落到坚硬的地面上，被撞破了，于是，
JQuery EasyUI 验证扩展可怜的猫 jquery easyui 验证
最近项目中用到了前端框架-- EasyUI，在做校验的时候会涉及到很多需要自定义的内容，现把常用的验证方式总结出来，留待后用。以下内容只需要在公用js中添加即可。使用类似于如下： <input class="easyui-textbox" name="mobile" id="mobile&
架构师之httpurlconnection----------读取和发送(流读取效率通用类) nannan408
1.前言. 如题. 2.代码. /* * Copyright (c) 2015, S.F. Express Inc. All rights reserved. */ package com.test.test.test.send; import java.io.IOException; import java.io.InputStream
Jquery性能优化 r361251 JavaScript jquery
一、注意定义jQuery变量的时候添加var关键字这个不仅仅是jQuery，所有javascript开发过程中，都需要注意，请一定不要定义成如下： $loading = $('#loading'); //这个是全局定义，不知道哪里位置倒霉引用了相同的变量名，就会郁闷至死的二、请使用一个var来定义变量如果你使用多个变量的话，请如下方式定义： . 代码如下: var page
在eclipse项目中使用maven管理依赖 tjj006 eclipse maven
概览: 如何导入maven项目至eclipse中建立自有Maven Java类库服务器建立符合maven代码库标准的自定义类库 Maven在管理Java类库方面有巨大的优势，像白衣所说就是非常“环保”。我们平时用IDE开发都是把所需要的类库一股脑的全丢到项目目录下，然后全部添加到ide的构建路径中，如果用了SVN/CVS，这样会很容易就把
中国天气网省市级联页面 x125858805 级联
1、页面及级联js <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> &l