pipisorry

熵与互信息

http://blog.csdn.net/pipisorry/article/details/51695283

这篇文章主要讲：熵, 联合熵(joint entropy),条件熵(conditional entropy),相对熵(relative entropy,KL 距离),交叉熵(cross entropy),困惑度(perplexity),互信息(mutual information)。

熵 (信息论)/信息熵

在信息论中，熵是接收的每条消息中包含的信息的平均量，又被称为信息熵、信源熵、平均自信息量。这里，消息代表来自分布或数据流中的事件、样本或特征。（熵最好理解为不确定性的量度而不是确定性的量度，因为越随机的信源的熵越大。）

来自信源的另一个特征是样本的概率分布。这里的想法是，比较不可能发生的事情，当它发生了，会提供更多的信息。在信息世界，熵越高，则能传输越多的信息，熵越低，则意味着传输的信息越少。由于一些其他的原因（下面会有解释），把信息（熵）定义为概率分布的对数的相反数是有道理的。

事件的概率分布和每个事件的信息量构成了一个随机变量，这个随机变量的均值（即期望）就是这个分布产生的信息量的平均值（即熵）。采用概率分布的对数作为信息的量度的原因是其可加性。例如，投掷一次硬币提供了1 Sh的信息，而掷 m 次就为 m 位。更一般地，你需要用 log2(n) 位来表示一个可以取 n 个值的变量。

在1948年，克劳德·艾尔伍德·香农将热力学的熵，引入到信息论，因此它又被称为香农熵。

信息熵公式的来源

假设一篇文章的标题叫做“黑洞到底吃什么”，包含词语分别是 {黑洞, 到底, 吃什么}, 我们现在要根据一个词语推测这篇文章的类别。哪个词语给予我们的信息最多？很容易就知道是“黑洞”，因为“黑洞”这个词语在所有的文档中出现的概率太低啦，一旦出现，就表明这篇文章很可能是在讲科普知识。而其他两个词语“到底”和“吃什么”出现的概率很高，给予我们的信息反而越少。

如何用一个函数 h(x) 表示词语给予的信息量呢？第一，肯定是与 p(x) 相关，并且是负相关。第二，假设 x 和 y 是独立的（黑洞和宇宙不相互独立，谈到黑洞必然会说宇宙）,即 p(x,y) = p(x)p(y), 那么获得的信息也是叠加的，即 h(x, y) = h(x) + h(y)。满足这两个条件的函数肯定是负对数形式：

对假设一个发送者要将随机变量 X 产生的一长串随机值传送给接收者，接受者获得的平均信息量就是求它的数学期望：

这就是熵的概念。另外一个重要特点是，熵的大小与字符平均最短编码长度是一样的（shannon）。设有一个未知的分布 p(x), 而 q(x) 是我们所获得的一个对 p(x) 的近似，按照 q(x) 对该随机变量的各个值进行编码，平均长度比按照真实分布的 p(x) 进行编码要额外长一些，多出来的长度这就是 KL 散度（之所以不说距离，是因为不满足对称性和三角形法则），即：

熵与互信息_第1张图片

熵的计算

如果有一枚理想的硬币，其出现正面和反面的机会相等，则抛硬币事件的熵等于其能够达到的最大值。我们无法知道下一个硬币抛掷的结果是什么，因此每一次抛硬币都是不可预测的。

因此，使用一枚正常硬币进行若干次抛掷，这个事件的熵是一比特，因为结果不外乎两个——正面或者反面，可以表示为0, 1编码，而且两个结果彼此之间相互独立。若进行n次独立实验，则熵为n，因为可以用长度为n的比特流表示。

但是如果一枚硬币的两面完全相同，那个这个系列抛硬币事件的熵等于零，因为结果能被准确预测。现实世界里，我们收集到的数据的熵介于上面两种情况之间。

另一个稍微复杂的例子是假设一个随机变量X，取三种可能值，概率分别为，那么编码平均比特长度是：。其熵为3/2。

因此熵实际是对随机变量的比特量和顺次发生概率相乘再总和的数学期望。

皮皮blog

熵

熵的定义

熵又称为自信息(self-information),表示信源 X 每发一个符号(不论发什么符号)所提供的平均信息量。熵也可以被视为描述一个随机变量的不确定性的数量。一个随机变量的熵越大,它的不确定性越大。那么,正确估计其值的可能性就越小。越不确定的随机变量越需要大的信息量用以确定其值。

依据Boltzmann's H-theorem，香农把随机变量 X 的熵值 Η（希腊字母Eta）定义如下，其值域为 {x₁, ...,x_n}：

其中， P 为 X 的概率质量函数（probability mass function），E 为期望函数，而 I(X) 是X 的信息量（又称为自信息）。I(X) 本身是个随机变数。

当取自有限的样本时，熵的公式可以表示为：

Note: 熵的单位通常为比特，但也用Sh、nat、Hart计量，取决于定义用到对数的底。在这里 b 是对数所使用的底，通常是 2, 自然常数 e，或是10。当b = 2，熵的单位是bit；当b = e，熵的单位是nat；而当b = 10,熵的单位是 Hart。

p_i = 0时，对于一些i值，对应的被加数0 log_b 0的值将会是0，这与极限一致。

联合熵(joint entropy)

联合熵实际上就是描述一对随机变量平均所需要的信息量。

条件熵(conditional entropy)

定义事件 X 与 Y 分别取 xi 和 yj 时的条件熵为

{lz：公式中分母和分子应该写反了}

其中 p(x_i, y_j) 为 X = x_i 且 Y = y_j 时的概率。这个量应当理解为你知道Y 的值前提下随机变量 X 的随机性的量。

Note: 条件熵的计算要按照上图框框中的来。

皮皮blog

相对熵(relative entropy, 或称 Kullback-Leiblerdivergence, KL 距离)

相对熵常被用以衡量两个随机分布的差距。当两个随机分布相同时,其相对熵为0。当两个随机分布的差别增加时,其相对熵也增加。

交叉熵(cross entropy)

如果一个随机变量 X ~ p(x),q(x)为用于近似 p(x)的概率分布,那么,随机变量 X 和模型 q 之间的交叉熵定义为:

交叉熵的概念用以衡量估计模型与真实概率分布之间的差异。

困惑度(perplexity)

在设计语言模型时,我们通常用困惑度来代替交叉熵衡量语言模型的好坏。给定语言L的样本

语言模型设计的任务就是寻找困惑度最小的模型,使其最接近真实的语言。

互信息(mutual information)

如果 (X, Y) ~ p(x, y),X, Y 之间的互信息 I(X; Y)定义为：
I (X; Y) = H(X) – H(X | Y) (11)

根据H(X) 和 H(X|Y) 的定义:

互信息 I (X; Y) 是在知道了 Y 的值以后 X 的不确定性的减少量,即Y的值透露了多少关于X 的信息量。互信息 I (X; Y)可为正、负或0。

在汉语分词问题中，互信息值越大,表示两个汉字之间的结合越紧密，越可能成词。反之,断开的可能性越大。当两个汉字 x 和 y 关联度较强时,其互信息值I(x, y)>0;x 与y 关系弱时,I(x, y)≈0;而当I(x, y)<0时,x 与 y 称为 “互补分布”。

双字耦合度couple

在汉语分词研究中,有学者用双字耦合度的概念代替互信息:
设 c i ,c i+1 是两个连续出现的汉字,统计样本中c i ,c i+1 连续出现在一个词中的次数和连续出现的总次数,二者之比就是c i ,c i+1 的双字耦合度:

其中,c i ,c i+1 是一个有序字对,表示两个连续汉字,且 c i c i+1 不等于c i+1 c i 。N(c i c i+1 )表示字符串c i c i+1 构成的词出现的频率,N(...c i |c i+1 ...) 表示c i 作为上一个词的词尾且c i+1 作为相邻下一个词的词头出现的频率。例如:“为人”出现5次,“为人民”出现 20次,那么,Couple(为, 人)=0.2。（注意:此处“|”不表示条件概率!）

理由:互信息是计算两个汉字连续出现在一个词中的概率,而两个汉字在实际应用中出现的概率情况共有三种:
(1) 两个汉字连续出现,并且在一个词中;
(2) 两个汉字连续出现,但分属于两个不同的词;
(3) 非连续出现。
有些汉字在实际应用中出现虽然比较频繁,但是连续在一起出现的情况比较少,一旦连在一起出现,就很可能是一个词。这种情况下计算出来的互信息会比较小,而实际上两者的结合度应该是比较高的。而双字耦合度恰恰计算的是两个连续汉字出现在一个词中的概率,并不考虑两个汉字非连续出现的情况。

例如:“教务”以连续字符串形式在统计样本中共出现了16次,而“教”字出现了14 945次,“务”字出现了6 015次。(教, 务) 的互信息只有 -0.5119。如果用互信息来判断该字对之间位置的切分,是要断开的。但实际上,字对 (教, 务) 在文本集中出现的16次全部都是“教务”、“教务长”、“教务处”这几个词。连续字对 (教, 务) 的双字耦合度是1。因此,在判断两个连续汉字之间的结合强度方面,双字耦合度要比互信息更合适一些。

互信息、条件熵与联合熵的区别与联系

Note: 这张图应该只是不同熵之间的转换和包含关系，并不能说明其它。

由于 H(X|X) = 0, 所以, H(X) = H(X) – H(X|X) = I(X; X)

这一方面说明了为什么熵又称自信息,另一方面说明了两个完全相互依赖的变量之间的互信息并不是一个常量,而是取决于它们的熵。

和热力学熵的联系

物理学家和化学家对一个系统自发地从初始状态向前演进过程中，遵循热力学第二定律而发生的熵的变化更感兴趣。在传统热力学中，熵被定义为对系统的宏观测定，并没有涉及概率分布，而概率分布是信息熵的核心定义。

皮皮blog

熵求解示例

熵计算示例1

熵计算示例2

注意,这里的边缘概率是基于每个音节的,其值是基于每个字符的概率的两倍,因此,每个字符的概率值应该为相应边缘概率的1/2,即：p: 1/16 t: 3/8 k: 1/16 a: 1/4 i: 1/8 u: 1/8

求联合熵可以有几种方法,以下我们采用连锁规则方法可以得到：

from: http://blog.csdn.net/pipisorry/article/details/51695283

ref: [http://zh.wikipedia.org]

你可能感兴趣的:(熵,互信息,条件熵,相对熵,联合熵)

东方之珠·数链未来：香港回归28周年RWA革命赋能全球金融 TechubNews 区块链稳定币
2025年7月1日，值此香港回归28周年之际，由Web3Labs、TechubNews与金色财经联合主办的“东方之珠·数链未来：香港Web3新维度赋能全球金融”Space活动于19:30（UTC+8）成功举办。本次活动聚焦香港在Web3与全球金融领域的创新实践，围绕“RWA革命--万亿级资产上链的香港”主题，汇聚行业专家，探讨现实世界资产（RWA）上链的机遇与挑战。主持人TechubNews创始人
金融系统中常用的FIX协议 William一直在路上职业重启计划工作心得金融
一、FIX协议的产生背景与行业驱动力FIX（FinancialInformationeXchange）协议诞生于20世纪90年代初，是金融市场电子化转型的直接产物。1987年美股崩盘后，行业迫切需要减少人工交易错误，提高处理效率。1992年，由摩根士丹利、高盛等13家金融机构联合发起，旨在通过标准化电子通信协议替代传统电话和纸质单据。其核心目标包括：降低交易成本：消除人工录入和电话确认的时间与错误
《ONNX推理部署全解析：从基础到进阶的实用指南》空云风语人工智能深度学习神经网络人工智能深度学习神经网络 YOLO ONNX
ONNX基础入门ONNX是什么ONNX，即OpenNeuralNetworkExchange（开放神经网络交换），是一种用于表示深度学习模型的开放标准文件格式。它由Facebook和Microsoft在2017年联合开发，后来得到了NVIDIA、Intel、AWS、Google、OpenAI等众多公司的支持，旨在解决不同深度学习框架之间模型格式不兼容的问题，为模型的存储、交换和部署提供统一标准，使
水利水库大坝结构安全自动化监测主要测哪些内容？深圳安锐科技有限公司自动化运维
在大坝安全自动化监测系统建设中，应根据坝型、坝体结构和地质条件等因素选定监测项目；主要监测对象包括坝体、坝基及有关的各种主要水工建筑物、大坝附近的不稳定岸坡和大坝周边的气象环境。深圳安锐科技建议参考下列表格适当调整。（一）变形监测大坝的变形监测包括水平位移（横向和纵向）、垂直位移（竖向位移）坝体及坝基倾斜、表面接缝和裂缝监测。对于土石坝除设有上述的表面变形监测项目外，还设有内部变形监测。内部变形包
【无需编程即可创建交易机器人】
打造交易机器人通常需要一定的编程知识，但也有一些无需编程的工具和平台可以帮助用户实现这一目标。以下是几种无需编程即可创建交易机器人的方法：使用可视化交易平台许多交易平台提供了可视化工具，允许用户通过拖放组件来创建交易策略。例如，TradingView和MetaTrader都提供了这样的功能。用户可以通过选择不同的技术指标、设置条件规则来构建交易策略，而无需编写代码。利用第三方机器人服务一些第三方服
微信小程序实现路由拦截的方法半点寒12W javascript 前端
微信小程序路由拦截实现方法微信小程序本身没有提供直接的路由拦截功能，但可以通过以下几种方式实现类似的效果：1.使用页面跳转前的拦截方法一：封装路由跳转方法//utils/router.jsconstrouteInterceptor={navigateTo:function(params){if(checkAuth()){//你的拦截条件wx.navigateTo(params)}else{wx.r
新互联经济时代企业营销模式变革研讨会召开 xvgpjnhc 企业美团网用友软件解决方案京东
据悉，北京大学和用友公司联合成立的营销模式变革研究课题组于2014年6月17日，在用友软件(600588,股吧)园成功举办了“新互联经济时代企业营销模式变革研讨会”。此次研讨会聚集了业内专家、学者、行业媒体专家20余人，共同探讨新互联网经济时代，企业营销模式变革的话题。本次研讨会嘉宾阵容强大，有来自北京大学专家教授、京东、京客隆、易果生鲜、IT经理世界、光明网、美团网、第三方研究机构专家代表，以及
Zephyr MCUBoot 咕咚.萌西 Zephyr 单片机物联网嵌入式硬件
文章目录MCUBoot简介组成前提条件构建Bootloader为Bootloader构建APP签名密钥创建公钥提取程序烧录APP中使用MCUBootMCUBoot简介MCUBoot是可配置的安全引导加载程序，由多个行业领导者维护。它可以作为第一或第二阶段的引导加载程序运行，支持软件映像的加密验证，支持的加密方式如下：ECDSA-P256RSA-2048RSA-3072默认情况下，它支持映像回滚，下
探索AI时代：全国启动人工智能与未来公益讲座私域合规研究人工智能百度
人工智能与未来——AI赋能中小企业数字化升级公益讲座一、讲座背景随着科技的飞速发展，人工智能（AI）已经深入到了各行各业，为了推动AI技术在中小企业的广泛应用，助力企业拥抱新技术，迎接新机遇，拟申请联合组织AI赋能中小企业数字化升级公益讲座。讲座内容涵盖包括AI新媒体矩阵营销、AI智能跨境获客平台、AI+直播电商认证，AI+数字展厅、中检AI报关风险诊断及合规AI制单系统、AI+商品追溯、AI个人
Flink MongoDB CDC 环境配置与验证 Edingbrugh.南空运维大数据 flink flink mongodb 大数据
一、MongoDB数据库核心配置1.环境准备与集群要求MongoDBCDC依赖ChangeStreams特性，需满足以下条件：版本要求：MongoDB≥3.6集群模式：副本集（ReplicaSet）或分片集群（ShardedCluster）存储引擎：WiredTiger（默认自3.2版本起）副本集协议：pv1（MongoDB4.0+默认）验证集群配置：#连接MongoDBshellmongo--h
MATLAB基础应用精讲-【人工智能】数据空间（概念篇）林聪木算法分类
目录前言算法原理发展历程什么是数据空间数据空间基本规律？数据共存方法Pay-as-you-go的进化方式跨域和异构数据源的需求技术实现服务提供数据空间的特点多元主体的开放参与多元角色的中间服务全面覆盖的认证机制丰富的数据联合利用机制数据空间技术框架国际数据空间组成部分使用控制数据场数据场的作用下，三种典型的数据要素价值释放模式数据空间的发展现状国内发展现状：国外发展现状：数据空间的基础设施数据空间
Python 海象运算符详细介绍 ys.journey Python python
海象运算符定义：一个变量名跟一个表达式或者一个值，这个是一种新的赋值运算符。下面看看它的三种用法：一、用于ifelse条件表达式基础写法：x=5ifx10]print(num2)运行结果：海象运算符写法：num1=[1,2,3,4,5]count=1deff(x):globalcountprint(f"f(x)函数运行了{count}次")count+=1returnx**2num2=[nforx
python : 海象运算符 := 愚戏师 python基础与机器学习 python 前端
海象运算符:=在Python3.8中引入的海象运算符（:=，WalrusOperator）是一个语法特性，允许在表达式内部进行变量赋值。它得名于符号:=形似海象的眼睛和獠牙。这一特性旨在简化代码，减少重复计算，同时提升可读性。核心概念语法：变量:=表达式作用：将表达式的值赋给变量，并返回该值。特点：在条件判断、循环、推导式等场景中直接使用赋值结果。避免重复计算同一表达式，提升代码效率。典型使用场景
构建互联互通的IP网络——（实验一：IPv4编址及IPv4路由基础实验）夺命美羊羊网络 tcp/ip 服务器运维 windows
实验介绍关于本实验IPv4（InternetProtocolVersion4）是TCP/IP协议族中最为核心的协议之一。它工作在TCP/IP参考模型的网际互联层，该层与OSI参考模型的网络层相对应。网络层提供了无连接数据传输服务，即网络在发送分组时不需要先建立连接，每一个分组（也就是IP数据报文）独立发送。路由是数据通信网络中最基本的要素。路由信息就是指导IP报文发送的路径信息，路由的过程就是报文
算法第16天|继续二叉树：二叉搜索树的最小绝对差、二叉搜索树中的众数、二叉树的最近公共祖先孟大本事要学习算法学习算法数据结构
今日总结：1、遇到二叉搜索树就要想到中序遍历是一个有序数组。2、递归的时候如果递归有返回值，一定要思考截止条件返回什么3、最近公共祖先问题：如果当前节点是要寻找的某个节点，可以直接返回：如果二叉树右边没有另一个节点，本身就是最近公共祖先；如果有另一个节点，再往下递归也找不到另一个节点。二叉搜索树的最小绝对差：题目链接：530.二叉搜索树的最小绝对差-力扣（LeetCode）整体思路：1、看到二叉搜
详细说说线程的同步和互斥牛马baby 多线程面试资料
面试资料大全｜各种技术资料-2000GJava中线程的同步（Synchronization）和互斥（MutualExclusion）这两个核心并发概念。它们是确保多线程程序正确性、避免竞态条件（RaceCondition）和维持数据一致性的基石。核心目标：协调多个线程对共享资源（变量、对象、文件、数据库连接等）的访问，防止它们同时进行可能导致数据损坏或逻辑错误的操作。1.互斥（MutualExcl
同步（Synchronization）和互斥（Mutual Exclusion）关系 LS_learner 嵌入式嵌入式硬件
同步（Synchronization）和互斥（MutualExclusion）是多线程/多进程编程中两个核心概念，它们的核心区别如下：1.定义与目标同步协调多个线程/进程的执行顺序，确保它们按预期顺序访问共享资源或协作完成任务。目标：避免竞争条件（RaceCondition），保证程序逻辑正确性。示例：线程A写入数据后，线程B才能读取。互斥保护共享资源在同一时刻仅被一个线程/进程访问，防止数据损坏
MATLAB蚁群算法完整教程与代码实现 Emmamkq~~
本文还有配套的精品资源，点击获取简介：蚁群算法是一种模拟蚂蚁寻找食物路径行为的全局优化方法，具有强大的数值优化能力。本资源详细介绍了在MATLAB中实现蚁群算法的关键步骤，包括初始化、规则迭代、信息素更新和停止条件等，并通过实例代码展示了算法的实用应用。这为工程师和科研人员提供了一个学习和应用蚁群算法的平台，特别是在解决旅行商问题、网络路由、生产调度等优化问题方面。1.蚁群算法简介蚁群算法，灵感来
Flink CDC支持Oracle RAC架构CDB+PDB模式的实时数据同步吗，可以上生产环境吗智海观潮 Flink flink cdc oracle flink 数据同步大数据
众所周知，FlinkCDC是一个流数据集成工具，支持多种数据源的实时数据同步，包括大家所熟知的MySQL，MongoDB等。原本是作为Flink的子项目运行，后来捐献给Apache基金会，底层实现比较依赖于Flink生态。具体到数据同步底层实现则相对比较依赖于Debezium。对于Oracle实时数据同步有需求的用户来说，经常会有疑问，比如FlinkCDC支持Oracle实时数据同步吗，可以应用到
【Python打卡Day48】随机张量与广播机制@浙大疏锦行可能是猫猫人 Python打卡训练营内容 python 开发语言
在继续讲解模块消融前，先补充几个之前没提的基础概念尤其需要搞懂张量的维度、以及计算后的维度，这对于你未来理解复杂的网络至关重要一、随机张量的生成在深度学习中经常需要随机生成一些张量，比如权重的初始化，或者计算输入纬度经过模块后输出的维度，都可以用一个随机函数来实现需要的张量格式，而无需像之前一样必须加载一张真实的图片。“张量”概念它听起来可能有点抽象，但在数学和物理学（尤其是广义相对论、连续介质力
PostgreSQL配置
14.10日志#使用logratate日志轮转#启用日志收集器（csvlog必须开启）logging_collector=on#日志输出目标log_destination='stderr,csvlog'#设置日志目录（相对$PGDATA）log_directory='/var/log/pg_log'#按天分割日志文件（YYYY-MM-DD格式）#log_filename='postgresql-%
基础算法枚举，贪心
1.枚举穷举所有可能的解：算法枚举通过尝试所有可能的组合或排列来解决问题，确保不会错过任何潜在的解。并进行验证和比较，找到最优解。或者所有解。解空间的类型：可以是一个范围的所有数字（或二元组，字符串），或者满足某个条件的所有数字。蓝桥杯一题枚举问题小明对数位中含有2、0、1、9的数字很感兴趣（不包括前导0），在1到40中这样的数包括1、2、9、10至32、39和40，共28个，他们的和是574。请
Vue从入门到精通：前端开发的基石之旅奔跑吧邓邓子必备核心技能 vue.js 前端 javascript 从入门到精通
目录一、Vue简介1.1渐进式框架的含义1.2Vue在前端开发中的优势二、Vue环境搭建2.1安装Node.js和npm2.2全局安装VueCLI2.3使用VueCLI创建Vue项目三、Vue基础语法3.1数据绑定3.1.1插值语法3.1.2指令语法3.2计算属性和侦听器3.2.1计算属性3.2.2侦听器3.3条件渲染与列表渲染3.3.1v-if、v-else-if、v-else3.3.2v-sh
《go 语言圣经》笔记流左沙 go 笔记 go golang 编程语言
最近看了《go语言圣经》这本书，发现go语言很有趣，对于语法就不必关注，主要记录了一些语言特性(相对于其他语言而言)的笔记。Go（又称Golang）是Google开发的一种静态强类型、编译型、并发型，并具有垃圾回收功能的编程语言。packageGo语言的代码通过包（package）组织，包类似于其它语言里的库（libraries）或者模块（modules）。Go语言中的包和其他语言的库或模块的概念
Odoo 中国特色高级工作流审批模块研发源力祁老师 odoo最佳业务实践学习方法人工智能自动化开发语言
本文旨在为基于Odoo18平台开发一款符合中国用户习惯的、功能强大的通用工作流审批模块提供一份全面的技术实现与产品设计方案。该模块的核心特性包括：为最终用户设计的图形化流程设计器、对任意Odoo模型的普适性、复杂的审批节点逻辑（如会签、条件分支、汇报线查找）、流程中动态操作（如加签、转签），以及与钉钉、企业微信的深度无缝集成。将从系统总体架构出发，深入探讨工作流引擎核心、图形化设计器实现、高级审批
STM32F1 基于普通定时器TIM3--PWM输出驱动无源蜂鸣器。（HAL库）学海无涯_come on 单片机ARM开发
STM32F1基于普通定时器TIM3–PWM输出驱动无源蜂鸣器。（HAL库）这里的话重点是是将PWM输出模式驱动蜂鸣器，至于PWM是什么和有源and无源蜂鸣器的区别，CSDN上有许多将的很好的文章，这里不重复了。无源蜂鸣器的驱动接上VCC和GND，外加一个驱动的IO口即可。这个IO口负责输出的相对应的频率（即你输入1000hz频率的信号它就发出对应1000hz频率的声音），所以现在的目标是用stm
Deepoc光电研发垂直大模型的技术实现突破与核心模块 Deepoch 无人机人工智能科技 ai
一、模型架构与算法创新领域专用混合架构设计多模态Transformer扩展：在标准Transformer架构基础上，引入光子器件特性感知模块（如非线性光学参数编码器），支持光路拓扑结构与电磁场分布的联合建模，解决传统电芯片架构无法模拟光子干涉效应的难题。量子-光电混合计算层：通过量子线路模拟光子量子态演化，结合经典计算层优化参数搜索空间，实现NP难问题（如光子芯片布线优化）的指数级加速。物理约束的
深度探索：机器学习中的条件生成对抗网络（Conditional GAN, CGAN）算法原理及其应用
目录1.引言与背景2.CGAN定理3.算法原理4.算法实现5.优缺点分析优点：缺点：6.案例应用7.对比与其他算法8.结论与展望1.引言与背景生成对抗网络（GenerativeAdversarialNetworks,GANs）作为一种深度学习框架，在无监督学习领域展现出强大的能力，特别在图像、音频、文本等复杂数据的生成任务中取得了显著成果。然而，原始GAN模型在生成过程中缺乏对生成样本特定属性的直
1990-2024年上市公司市场获利能力数据+stata代码经管数据库大数据数据分析
企业市场获利能力是指企业在特定市场环境中，通过一系列经营活动获取利润的能力，它反映了企业在市场竞争中实现盈利的效率和水平，是企业综合竞争力的重要体现。获利能力是投资者评估企业风险的重要指标。盈利能力稳定的企业通常具有更强的抗风险能力，能够在市场波动和经济衰退时保持相对稳定的经营状况。本数据包含原始数据、参考文献、代码do文件（参考陶锋《数量经济技术经济研究》的计算过程）、最终结果数据名称：企业市场
Rust实现科幻FPS游戏：相对论渲染效果探秘 KENYCHEN奉孝 Rust rust 服务器开发语言
基于Rust语言的时间移民科幻游戏以下是基于Rust语言的时间移民科幻游戏引擎开发实例的分类整理，涵盖核心模块、渲染、物理模拟、存档系统等方向，提供可直接参考的代码片段或设计模式：时间系统引擎//示例1：相对论时间流速模拟structTimeDilation{base_time:f64,dilation_factor:f64,//基于速度/重力场的系数}implTimeDilation{fncal
jQuery 键盘事件keydown ,keypress ,keyup介绍 107x js jquery keydown keypress keyup
本文章总结了下些关于jQuery 键盘事件keydown ,keypress ,keyup介绍，有需要了解的朋友可参考。一、首先需要知道的是： 1、keydown() keydown事件会在键盘按下时触发. 2、keyup() 代码如下复制代码 $('input').keyup(funciton(){
AngularJS中的Promise bijian1013 JavaScript AngularJS Promise
一.Promise Promise是一个接口，它用来处理的对象具有这样的特点：在未来某一时刻（主要是异步调用）会从服务端返回或者被填充属性。其核心是，promise是一个带有then()函数的对象。为了展示它的优点，下面来看一个例子，其中需要获取用户当前的配置文件： var cu
c++ 用数组实现栈类 CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T, int SIZE = 50> class Stack{ private: T list[SIZE];//数组存放栈的元素 int top;//栈顶位置 public: Stack(
java和c语言的雷同麦田的设计者 java 递归 scaner
软件启动时的初始化代码，加载用户信息2015年5月27号从头学java二 1、语言的三种基本结构：顺序、选择、循环。废话不多说，需要指出一下几点： a、return语句的功能除了作为函数返回值以外，还起到结束本函数的功能，return后的语句不会再继续执行。 b、for循环相比于whi
LINUX环境并发服务器的三种实现模型被触发 linux
服务器设计技术有很多，按使用的协议来分有TCP服务器和UDP服务器。按处理方式来分有循环服务器和并发服务器。 1 循环服务器与并发服务器模型在网络程序里面，一般来说都是许多客户对应一个服务器，为了处理客户的请求，对服务端的程序就提出了特殊的要求。目前最常用的服务器模型有： ·循环服务器：服务器在同一时刻只能响应一个客户端的请求 ·并发服务器：服
Oracle数据库查询指令肆无忌惮_ oracle数据库
20140920 单表查询 -- 查询************************************************************************************************************ -- 使用scott用户登录 -- 查看emp表 desc emp
ext右下角浮动窗口知了ing JavaScript ext
第一种 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/
浅谈REDIS数据库的键值设计矮蛋蛋 redis
http://www.cnblogs.com/aidandan/ 原文地址：http://www.hoterran.info/redis_kv_design 丰富的数据结构使得redis的设计非常的有趣。不像关系型数据库那样，DEV和DBA需要深度沟通，review每行sql语句，也不像memcached那样，不需要DBA的参与。redis的DBA需要熟悉数据结构，并能了解使用场景。
maven编译可执行jar包 alleni123 maven
http://stackoverflow.com/questions/574594/how-can-i-create-an-executable-jar-with-dependencies-using-maven <build> <plugins> <plugin> <artifactId>maven-asse
人力资源在现代企业中的作用百合不是茶 HR 企业管理
//人力资源在在企业中的作用人力资源为什么会存在，人力资源究竟是干什么的人力资源管理是对管理模式一次大的创新，人力资源兴起的原因有以下点：工业时代的国际化竞争，现代市场的风险管控等等。所以人力资源在现代经济竞争中的优势明显的存在，人力资源在集团类公司中存在着明显的优势(鸿海集团)，有一次笔者亲自去体验过红海集团的招聘，只知道人力资源是管理企业招聘的当时我被招聘上了，当时给我们培训的人
Linux自启动设置详解 bijian1013 linux
linux有自己一套完整的启动体系，抓住了linux启动的脉络，linux的启动过程将不再神秘。阅读之前建议先看一下附图。本文中假设inittab中设置的init tree为： /etc/rc.d/rc0.d /etc/rc.d/rc1.d /etc/rc.d/rc2.d /etc/rc.d/rc3.d /etc/rc.d/rc4.d /etc/rc.d/rc5.d /etc
Spring Aop Schema实现 bijian1013 java spring AOP
本例使用的是Spring2.5 1.Aop配置文件spring-aop.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmln
【Gson七】Gson预定义类型适配器 bit1129 gson
Gson提供了丰富的预定义类型适配器，在对象和JSON串之间进行序列化和反序列化时，指定对象和字符串之间的转换方式， DateTypeAdapter public final class DateTypeAdapter extends TypeAdapter<Date> { public static final TypeAdapterFacto
【Spark八十八】Spark Streaming累加器操作（updateStateByKey) bit1129 update
在实时计算的实际应用中，有时除了需要关心一个时间间隔内的数据，有时还可能会对整个实时计算的所有时间间隔内产生的相关数据进行统计。比如：对Nginx的access.log实时监控请求404时，有时除了需要统计某个时间间隔内出现的次数，有时还需要统计一整天出现了多少次404，也就是说404监控横跨多个时间间隔。 Spark Streaming的解决方案是累加器，工作原理是，定义
linux系统下通过shell脚本快速找到哪个进程在写文件 ronin47
一个文件正在被进程写我想查看这个进程文件一直在增大找不到谁在写使用lsof也没找到这个问题挺有普遍性的，解决方法应该很多，这里我给大家提个比较直观的方法。 linux下每个文件都会在某个块设备上存放，当然也都有相应的inode, 那么透过vfs.write我们就可以知道谁在不停的写入特定的设备上的inode。幸运的是systemtap的安装包里带了inodewatch.stp，位
java-两种方法求第一个最长的可重复子串 bylijinnan java 算法
import java.util.Arrays; import java.util.Collections; import java.util.List; public class MaxPrefix { public static void main(String[] args) { String str="abbdabcdabcx";
Netty源码学习-ServerBootstrap启动及事件处理过程 bylijinnan java netty
Netty是采用了Reactor模式的多线程版本，建议先看下面这篇文章了解一下Reactor模式： http://bylijinnan.iteye.com/blog/1992325 Netty的启动及事件处理的流程，基本上是按照上面这篇文章来走的文章里面提到的操作，每一步都能在Netty里面找到对应的代码其中Reactor里面的Acceptor就对应Netty的ServerBo
servelt filter listener 的生命周期 cngolon filter listener servelt 生命周期
1. servlet 当第一次请求一个servlet资源时，servlet容器创建这个servlet实例，并调用他的 init(ServletConfig config)做一些初始化的工作，然后调用它的service方法处理请求。当第二次请求这个servlet资源时，servlet容器就不在创建实例，而是直接调用它的service方法处理请求，也就是说
jmpopups获取input元素值 ctrain JavaScript
jmpopups 获取弹出层form表单首先，我有一个div，里面包含了一个表单，默认是隐藏的，使用jmpopups时，会弹出这个隐藏的div，其实jmpopups是将我们的代码生成一份拷贝。当我直接获取这个form表单中的文本框时，使用方法：$('#form input[name=test1]').val()；这样是获取不到的。我们必须到jmpopups生成的代码中去查找这个值，$(
vi查找替换命令详解 daizj linux 正则表达式替换查找 vim
一、查找查找命令 /pattern<Enter> ：向下查找pattern匹配字符串 ?pattern<Enter>：向上查找pattern匹配字符串使用了查找命令之后，使用如下两个键快速查找： n：按照同一方向继续查找 N：按照反方向查找字符串匹配 pattern是需要匹配的字符串，例如： 1: /abc<En
对网站中的js,css文件进行打包 dcj3sjt126com PHP 打包
一，为什么要用smarty进行打包 apache中也有给js,css这样的静态文件进行打包压缩的模块，但是本文所说的不是以这种方式进行的打包，而是和smarty结合的方式来把网站中的js,css文件进行打包。为什么要进行打包呢，主要目的是为了合理的管理自己的代码。现在有好多网站，你查看一下网站的源码的话，你会发现网站的头部有大量的JS文件和CSS文件，网站的尾部也有可能有大量的J
php Yii: 出现undefined offset 或者 undefined index解决方案 dcj3sjt126com undefined
在开发Yii 时，在程序中定义了如下方式： if($this->menuoption[2] === 'test')，那么在运行程序时会报：undefined offset:2，这样的错误主要是由于php.ini 里的错误等级太高了，在windows下错误等级
linux 文件格式（1） sed工具 eksliang linux linux sed工具 sed工具 linux sed详解
转载请出自出处： http://eksliang.iteye.com/blog/2106082 简介 sed 是一种在线编辑器，它一次处理一行内容。处理时，把当前处理的行存储在临时缓冲区中，称为“模式空间”（pattern space），接着用sed命令处理缓冲区中的内容，处理完成后，把缓冲区的内容送往屏幕。接着处理下一行，这样不断重复，直到文件末尾
Android应用程序获取系统权限 gqdy365 android
引用如何使Android应用程序获取系统权限第一个方法简单点，不过需要在Android系统源码的环境下用make来编译： 1. 在应用程序的AndroidManifest.xml中的manifest节点
HoverTree开发日志之验证码 hvt .net C#asp.net hovertree webform
HoverTree是一个ASP.NET的开源CMS，目前包含文章系统，图库和留言板功能。代码完全开放，文章内容页生成了静态的HTM页面，留言板提供留言审核功能，文章可以发布HTML源代码，图片上传同时生成高品质缩略图。推出之后得到许多网友的支持，再此表示感谢！留言板不断收到许多有益留言，但同时也有不少广告，因此决定在提交留言页面增加验证码功能。ASP.NET验证码在网上找，如果不是很多，就是特别多
JSON API：用 JSON 构建 API 的标准指南中文版 justjavac json
译文地址：https://github.com/justjavac/json-api-zh_CN 如果你和你的团队曾经争论过使用什么方式构建合理 JSON 响应格式，那么 JSON API 就是你的 anti-bikeshedding 武器。通过遵循共同的约定，可以提高开发效率，利用更普遍的工具，可以是你更加专注于开发重点：你的程序。基于 JSON API 的客户端还能够充分利用缓存，
数据结构随记_2 lx.asymmetric 数据结构笔记
第三章栈与队列一．简答题 1. 在一个循环队列中，队首指针指向队首元素的前一个位置。 2.在具有n个单元的循环队列中，队满时共有 n-1 个元素。 3. 向栈中压入元素的操作是先移动栈顶指针&n
Linux下的监控工具dstat 网络接口 linux
1) 工具说明dstat是一个用来替换 vmstat,iostat netstat,nfsstat和ifstat这些命令的工具, 是一个全能系统信息统计工具. 与sysstat相比, dstat拥有一个彩色的界面, 在手动观察性能状况时, 数据比较显眼容易观察; 而且dstat支持即时刷新, 譬如输入dstat 3, 即每三秒收集一次, 但最新的数据都会每秒刷新显示. 和sysstat相同的是,
C 语言初级入门--二维数组和指针 1140566087 二维数组 c/c++指针
/* 二维数组的定义和二维数组元素的引用二维数组的定义：当数组中的每个元素带有两个下标时，称这样的数组为二维数组； (逻辑上把数组看成一个具有行和列的表格或一个矩阵); 语法：类型名数组名[常量表达式1][常量表达式2] 二维数组的引用：引用二维数组元素时必须带有两个下标，引用形式如下：例如： int a[3][4]; 引用：
10点睛Spring4.1-Application Event wiselyman application
10.1 Application Event Spring使用Application Event给bean之间的消息通讯提供了手段应按照如下部分实现bean之间的消息通讯继承ApplicationEvent类实现自己的事件实现继承ApplicationListener接口实现监听事件使用ApplicationContext发布消息

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他