AI知识图谱大本营

AAAI 2024 | 中科院信工所提出结构化概率编码框架，有效增强预训练语言模型泛化能力

论文题目：

Structured Probabilistic Coding

论文录用：

AAAI 2024 Main Technical Track

论文链接：

https://arxiv.org/abs/2312.13933

代码链接：

https://github.com/zerohd4869/SPC

作者主页：

https://hudou95.github.io/

摘要

本文介绍了一种新的监督表示学习框架，名为结构化概率编码 SPC，用于从输入中学习与目标任务相关的紧凑且有信息量的概率表示。SPC 是一种仅含编码器的概率编码技术，并结合了来自目标任务空间的结构化正则。它能够增强预训练语言模型的泛化能力，实现更好的语言理解。

具体而言，所提出的概率编码技术在一个模块中同时进行信息编码和任务预测，以更充分地利用来自输入数据中的有效信息。它在输出空间中使用变分推断以减少随机性和不确定性。

同时，为了更好地控制潜在空间中的概率分布，引入了一种结构化正则方法，以促进潜在空间中类别级别的均匀性。在结合正则项的概率编码框架下，SPC 可以保留潜在编码的高斯分布结构，并更好地实现潜在空间的类均匀覆盖。

在 12 个自然语言理解任务上的实验结果表明，提出的 SPC 框架有效地提高了预训练语言模型在分类和回归任务上的性能。扩展实验表明，SPC 可以增强模型的泛化能力，对标签噪声的鲁棒性，以及输出表示的聚类质量。

引言

概率嵌入（Probabilistic Embedding）是一种新兴的表示学习技术，其目的在于学习数据的潜在概率分布。相比确定性嵌入（Deterministic Embedding），概率嵌入更加适合描述数据的不确定性和复杂性，能够更好地处理冗余信息，提供更准确的表示。这种方法已经广泛应用于计算机视觉和自然语言处理等领域。

大部分概率嵌入方法建立在信息瓶颈（Information Bottleneck，IB）原理的基础上，其目的是找到关于输入的最大压缩表示，同时保留与目标任务尽可能多的信息，从而在压缩和预测之间取得平衡。

这些基于信息瓶颈的方法通常涉及两个参数模块，即编码器和解码器。通常，编码器将输入映射到潜在空间中的概率分布，而解码器将概率分布映射到目标任务空间中的输出表示。

然而，在编码器-解码器架构下，编码器将输入数据映射到概率分布的过程可能会丢失一些与任务相关的信息，这些信息对于解码器在学习过程中至关重要。

这是因为概率分布固有地包含随机性和不确定性，这些随机因子可能与任务无关并干扰解码器的任务预测过程。为了解决该问题，本文提出了一种仅包含编码器的概率编码（Probabilistic Coding）技术，将信息编码和任务预测结合到一个模块中。

通过在输出空间中使用变分推断，可以更好地控制和利用数据的随机性和不确定性。该方法学习到的紧凑表示可以充分捕获数据的潜在结构，并保留与目标任务相关的有效信息。这有助于提高模型的泛化性能，特别是在面对有限数据或带噪标签时。

此外，尽管概率嵌入方法能够捕获数据的不确定性和复杂性，但它们通常受约束于训练数据的有限性和有偏性。这些数据难以充分代表目标任务的真实分布。在编码器将输入数据映射到概率分布的过程中，可能会丢失一些与任务相关的重要信息。任务信息量的不足会导致模型泛化能力不足以及在新数据上的性能不佳。

为了提高潜在表示的任务预测能力，本文利用目标任务空间的结构信息来约束潜在空间概率分布的学习过程。在概率编码框架内，潜在空间的结构化正则（Structured Regularization）可以帮助模型学习与目标任务相关的更多信息，从而提高模型在新数据上的预测准确性。

本文提出的结构化概率编码（Structured Probabilistic Coding, SPC）是一种新的监督表示学习框架。该框架是一种仅含编码器的概率编码技术，并结合来自目标标签空间的结构化正则。通过从输入中提取紧凑且任务信息丰富的概率表示，SPC 可以增强预训练语言模型的泛化能力，以实现更好的语言理解。

其中，概率编码技术通过变分近似，将输入编码为高斯分布空间下的随机输出表示，同时最小化给定表示下目标标签的条件熵。同时，结构化正则项鼓励多元高斯分布下潜在空间内的类级均匀性，使潜在空间分布更好地反映目标任务空间的结构信息，这有利于任务预测。

在结合正则项的概率编码框架下，SPC 可以保持输入空间中邻域的高斯结构，同时在潜在空间实现保持类级均匀性的最佳覆盖。

我们在 12 个自然语言理解任务上进行了实验，包括 10 个分类任务（如表情预测、仇恨言论检测、讽刺检测、攻击性语言检测、情感分析、立场检测、不同领域的情绪检测等）和 2 个回归任务（包括语义相似度预测和合理澄清排序）。

结果表明，提出的 SPC 方法有效地提高了预训练语言模型在分类和回归任务上的性能。以使用 RoBERTa 作为网络骨架为例，与传统的 CE/MSE 学习目标相比，SPC 将分类和回归任务的平均性能分别提高了约 +4.0％ 和 +1.5％。

与对比方法相比，包括确定性嵌入技术（即 CE/MSE、CE/MSE+CP、CE+AT 和 CE+SCL）和概率嵌入技术（即 VIB、MINE-IB 和 MEIB），SPC 框架在不同的基础骨架（如 BERT 和 RoBERTa）下始终取得了最佳的平均性能。广泛的实验表明，SPC 可以增强模型的泛化能力（包括数据受限和分布外场景），对标签噪声的鲁棒性，以及输出表示的聚类质量。

主要贡献：

我们提出了一种仅含编码器的概率编码方法，将信息编码和任务预测集成到一个模块中，从输入中最大限度地保留了与目标任务相关的有效信息。
我们设计了一个结构化正则项来促进潜在空间中类级的一致性，以获得更好的概率嵌入的任务预测能力。
我们提出了一个监督表示学习框架 SPC，从输入中学习紧凑且任务信息丰富的概率表示。它可以增强预训练语言模型的泛化能力，以实现更好的语言理解。
12个基准测试的实验表明，在不同的网络骨架下，SPC 在分类和回归任务上均实现了最先进的性能。扩展实验表明 SPC 可以增强预训练模型的泛化能力、对标签噪声的鲁棒性，以及输出表示的聚类质量。

方法

结构化概率编码（Structured Probabilistic Coding, SPC）是一种监督式表示学习框架，旨在从输入中学习紧凑且任务信息丰富的概率表示。如图1(c)所示，SPC 是一种只包含编码器的结构化概率编码技术，并结合了来自目标任务空间的结构化正则。

▲ 图1 SPC 与两类主流监督表示学习框架的编码方式比较

3.1 概率编码

概率编码（Probabilistic Coding）将信息编码和任务预测整合到一个模块中。与现有的应用编码器-解码器架构的概率嵌入方法不同，我们的编码器模型可以有效地保留与任务相关的特征，并避免概率化编码过程中的随机性和不确定性带来的负面影响。

在假设，对应于马尔可夫链的前提下，我们的目标是最小化输入和潜在表示之间的互信息，同时最大化表示与目标标签之间的信息。具体而言，我们使用变分近似将每个输入编码成输出空间中的高斯分布表示，即。

此外，我们通过估计表示给定目标标签的条件熵，最大化的下限。概率编码的目标函数可以表示为：

这里是一个非参数操作，即 argmax 函数。是的先验的估计。是的后验概率的变分估计，并由随机编码器学习。表示 KL 散度，用作正则化项，迫使的后验概率近似于先验。是控制对预测能力和从中的压缩程度之间的权衡超参数。

在我们的概率编码方法中，先验是各向同性高斯分布。变分近似后验是一个具有对角协方差结构的多元高斯分布，即，其中和分别代表均值和对角协方差，它们的参数都是依赖于输入的，并由一个多层感知机（MLP，具有单隐藏层的全连接神经网络）预测。

由于的采样是一个随机过程，我们应用重参数化技巧来确保模型的梯度无偏。

在现有基于信息瓶颈原理的方法中，其解码器可以是的参数近似，即压缩表示可以从分布中采样，这意味着噪声的特定模式被添加到的输入中。这种噪声可能会削弱传达的信息，并可能导致解码器在学习过程中丢失关键的任务相关信息。

不同于它们，我们的概率编码应用非参数操作来进行预测，并将概率编码和任务预测整合到了一个编码器模块中。它可以有效地避免概率编码中随机性和不确定性带来的负面影响。

3.2 结构化正则

上述提到的马尔可夫假设限制了表示不能直接依赖于目标标签，这意味着对的学习未能充分利用任务空间的信息。因此，所学得的表示不能充分代表目标任务的真实分布，在从有限或有偏数据中学习时导致泛化能力差。因此，我们设计了一种新的结构化正则（Structured Regularization）来探索标签空间的潜在模式。

具体而言，我们在目标函数中添加了一个关于潜在分布的附加项，以最大化在标签空间上的先验熵：

在实现中，我们利用每个采样批次的数据估计，并应用 Jensen 不等式和蒙特卡洛方法估计其下界：

这里表示第个目标标签变量的平均预测概率。这样，我们可以通过计算批次熵估计，其度量了在标签空间中预测概率分布的不确定性或多样性。

这种正则化项促进了潜在空间中不同类别之间的均匀性学习过程，防止模型过度强调训练数据中某些不准确代表真实数据分布的主要特征或标签。

3.3 结构化概率编码

我们将来自目标任务空间的结构化正则项融入到了概率编码框架中，称为结构化概率编码（SPC）。SPC 的总目标可以表示为

这里是控制正则化强度的超参数。前两项将概率编码和任务预测整合到了一个编码器模块中。第三项是结构化正则项，促进了潜在空间中的类别均匀性。SPC 的目标是在输入空间中保持邻域的高斯结构，并在潜在空间中实现类均匀性的最佳覆盖。

3.4 应用于下游任务

我们将 SPC 框架应用于各种自然语言理解（NLU）任务，以增强预训练语言模型在任务中的泛化能力。由于其学习信息丰富而又紧凑的表示能力，SPC 框架非常适用于分类和回归任务。对于分类任务，的下限可以相当于经典的交叉熵损失。

同样地，对于回归任务，的下限可以等同于经典的均方误差损失。

实验

4.1 任务测评

表 1 汇报了在 10 个分类基准任务上的总体结果。与比较方法相比，我们的 SPC 始终获得最佳平均性能。当使用 BERT 和 RoBERTa 网络骨架时，与 CE 相比，SPC 可以分别将所有分类任务的平均性能提高 +3.1% 和 **+4.0%**。

结果表明我们的方法对未见过的测试集具有良好的泛化能力，并显示出在分类任务上的优越性。

▲ 表1 在 10 个分类基准任务上的性能评估。汇报结果采取了在 5 个 seed 下训练的模型在测试集上的平均表现，下同。

表 2 汇报了在两个回归基准任务上的总体结果。SPC 在两个数据集上都获得了更好的回归结果。此外，当使用 RoBERTa 网络骨架时，与 MSE 相比，SPC 在平均性能方面实现了 +1.5% 的绝对提升。这证明了 SPC 对于回归任务中未见过的测试集的优越性和泛化性。

▲ 表2 在 2 个回归基准任务上的性能评估。网络架构以 RoBERTa 为例，下同。

4.2 消融分析

我们通过移除结构化正则（w/o Structured）和概率编码（w/o Probabilistic）来进行消融研究。对于分类，表3显示了所有任务的消融结果。当去掉结构化正则项时，SPC w/o Structured 在所有分类指标方面获得较差的性能。

当进一步移除概率编码时，结果显着下降。它揭示了结构化正则和概率编码的有效性。对于回归，由于其标签空间是一维实数，因此 SPC 退化为概率编码，去掉概率编码的 SPC w/o Probabilistic 相当于标准 MSE。

从表 2 可以看出，回归指标的平均性能下降了 1.5%，这证实了概率编码回归的有效性。

▲ 表3 消融实验结果

4.3 泛化评估

我们在以下两种设置下进一步评估 SPC 的泛化能力：使用有限数据进行训练和在分布外（OOD）场景中进行测试。

4.3.1 不同训练数据规模下的性能评估

我们在不同比例的训练集下进行实验，以评估有限数据训练时的泛化能力。图2显示了 CE、VIB、MEIB 和 SPC 在 RoBERTa 网络骨架下的不同训练集大小的结果。

与 CE、VIB 和 MEIB 相比，SPC 在大多数数据集上针对不同比例的训练集都取得了优异的性能。这表明即使在训练数据受限的条件下，SPC也可以增强预训练语言模型的泛化能力。

▲ 图2 在不同训练集大小下的泛化性评估

4.3.2 分布外泛化性评估

我们选择与情绪相关的基准，包括 EmotionEval、ISEAR、MELD 和 GoEmotions，这些基准旨在预测情绪状态，但收集自不同的领域。

表4展示了分布外场景下的性能。我们的 SPC 在所有分布外设置下都获得了最佳结果。这一事实表明，SPC 在处理跨不同领域转移的分布外场景时具有更好的泛化能力。

一方面，SPC 利用输出空间的变分推理，可以更好地控制和利用数据的随机性和不确定性。另一方面，SPC 引入了目标任务空间的结构信息，使得潜在空间概率分布更好地反映任务相关信息，并将模型推广到新数据。

▲ 表4 在OOD场景下的泛化性评估

4.4 鲁棒性评估

我们通过评估模型处理噪声标签的能力来进行实验来证明鲁棒性。如表5所示，在所有设置下，SPC 始终优于 CE、VIB 和 MEIB。

这表明 SPC 在噪声训练数据上表现更稳健。此外，与 CE 相比，SPC 在噪声比为 10%、20% 和 30% 的情况下，在分类任务上的平均性能分别提高了 +2.0%、+2.1% 和 +1.7%。

结果证明 SPC 能够更好地控制和利用数据的随机性和不确定性。

▲ 表5 不同标签噪声下的鲁棒性评估

4.5 表示质量评估

为了评估表示的质量，我们评估了通过不同优化目标获得的输出表示的聚类性能。我们应用轮廓系数（silhouette coefficient, SC）和调整兰德指数（adjusted rand index, ARI）分别衡量获得的表示与输入数据和目标标签相关的聚类能力。

如图3所示，与大多数数据集中的其他目标（CE、VIB 和 MEIB）相比，SPC 实现了更高的 ARI 或 SC 值。这表明 SPC 有效地实现了数据编码和任务预测之间的平衡，从而促进了预训练语言模型在下游任务中的泛化性。

▲ 图3 输出表示的聚类质量评估

总结

本文提出了一种新的结构化概率编码（SPC）框架，用于从输入中提取紧凑且有任务信息量的概率表示。它可以增强预训练语言模型的泛化能力，以实现更好的语言理解。具体而言，仅含编码器的概率编码技术同时进行信息编码和任务预测。此外，引入结构化正则来控制概率分布并促进潜在空间中的类级均匀性。

结合该正则项，SPC 可以保持输入空间中邻域的高斯结构，同时在潜在空间实现保持类别均匀性的最佳覆盖。12 个基准测试的实验表明，SPC 在多种分类和回归任务上均取得了最佳性能。扩展实验表明，SPC 可以增强预训练语言模型的泛化能力、对标签噪声的鲁棒性，以及输出表示的聚类质量。

大模型-FlashAttention 算法分析清风lsq 大模型推理算法算法大模型推理 LLM flashattention
一、FlashAttention的概述FlashAttention是一种IO感知精确注意力算法。通过感知显存读取/写入，FlashAttention的运行速度比PyTorch标准Attention快了2-4倍，所需内存也仅是其5%-20%。随着Transformer变得越来越大、越来越深，但它在长序列上仍然处理的很慢、且耗费内存。（自注意力时间和显存复杂度与序列长度成二次方），现有近似注意力方法，
Red Bull红牛携手Fortinet，全球能量饮料巨头筑牢网安防线 Fortinet_CHINA 网络安全 web安全
作为全球知名的能量饮料品牌，在网络安全威胁日趋严峻的当下，RedBull（红牛）面临着诸多网络安全挑战。为应对这些挑战，RedBull选择了Fortinet的网络安全解决方案，通过部署FortiEDR和FortiGuardMDR服务等，成功提升了公司的安全防护能力。客户简介全球能量饮料领军者RedBull作为全球能量饮料领域的巨头，其品牌影响力遍及五大洲，产品畅销175个国家和地区。RedBull
用Rust写平衡三进制除法器 qq_39858654 三进制平衡三进制三进制运维服务器
1、除法的本质除法的本质是减法，也就是一个大的数减去一个小的数，比如:10/2，也就是10-2-2-2-2-2=0，所以商5余0，10/3，也就是10-3-3-3=1，所以商3余1，这也是很常见的方法，但如果引入负数，情况又会有些变化，分成4种总结为2种:10/2=10-(2*1)-2-2-2-2=0商5余0，-10/-2=-10-(-2*1)+2+2+2+2=0商5余0，10/-2=10-(-2
【Game】Powerful——Pet Skin（13）苏堤春不晓 Travel /Life 幻唐志皮肤回合制
文章目录特殊65~105115~125135~145特殊重炮小熊灵石护卫mini版蒲牢，不过饰物要m天篷岩浆造型不错65~105蒲牢海螺套装幽灵虎帅，感觉当坐骑也不错，6技能YYDS幽灵虎这个皮肤感觉一般，有点鸟化了，羽毛的感觉第二个皮肤，足见其在105的地位妙音死亡骑士我佛慈悲，胸前的法珠拉风死亡骑士折纸版本差点意思，模型变小了感觉，不够大气芙蓉仙子清凉一夏，柠檬雪舞月跃龙门，鲤鱼很好看，个人认
LangChain4j在Java企业应用中的实战指南-2 在未来等你大模型应用开发 AI 技术编程 Java Spring
LangChain4j在Java企业应用中的实战指南文章标签langchain4j,JavaAI,RAG系统,智能应用开发,LangChain4j实战,企业级AI应用,Java微服务,检索增强生成文章简述随着大语言模型（LLM）的广泛应用，企业对智能应用的需求日益增长。LangChain4j作为一款专为Java生态打造的LLM集成框架，正在成为构建RAG（检索增强生成）系统和智能应用的重要工具。本
嵌入式AI模型压缩技术：让大模型变小 AI智能探索者 AI Agent 智能体开发实战人工智能 ai
嵌入式AI模型压缩技术：让大模型变小关键词：嵌入式AI、模型压缩、剪枝、量化、知识蒸馏、轻量化网络、端侧部署摘要：当我们用手机拍照时，AI能瞬间识别出“这是一只猫”；智能摄像头能在0.1秒内检测到“有人闯入”。这些“快如闪电”的AI功能背后，藏着一项关键技术——嵌入式AI模型压缩。本文将用“给盆栽修剪枝叶”“用简笔画代替油画”等生活类比，带您一步步理解模型压缩的核心技术（剪枝、量化、知识蒸馏、轻量
Android学习笔记 LXR小朋友 android 学习笔记
一、Android四大组件精要1.Activity生命周期：onCreate()→onStart()→onResume()→onPause()→onStop()→onDestroy()重点场景：屏幕旋转：onSaveInstanceState()保存临时数据返回栈管理：launchMode（standard/singleTop/singleTask/singleInstance）页面跳转：Inte
基于大模型的地中海贫血全流程预测与治疗管理研究报告 LCG元围术期危险因子预测模型研究人工智能
目录一、引言1.1研究背景与意义1.2研究目的与目标1.3研究方法与数据来源二、地中海贫血概述2.1疾病定义与分类2.2病因与发病机制2.3流行病学特征2.4临床表现与诊断方法三、大模型技术原理与应用现状3.1大模型基本原理3.2在医疗领域的应用案例3.3应用于地中海贫血预测的优势四、术前风险预测与手术方案制定4.1术前风险因素分析4.2大模型预测模型构建与验证4.3根据预测制定个性化手术方案五、
基于大模型的胆囊结石全流程预测与诊疗系统技术方案
目录一、系统架构设计1.1数据采集与预处理模块1.2大模型核心算法模块二、全流程系统流程图三、系统集成方案3.1模块交互流程3.2数据流示意图四、系统部署拓扑图五、核心模块实现细节5.1术前风险预测算法5.2术中监测算法5.3术后并发症预测模型六、关键技术验证方案6.1模型验证流程6.2临床试验设计框架七、典型应用场景流程7.1腹腔镜手术决策流程一、系统架构设计1.1数据采集与预处理模块#数据采集
基于大模型的胆囊结石全流程预测与诊疗系统技术方案大纲 LCG元大模型医疗研究-方案大纲人工智能机器学习深度学习方案大纲
目录一、引言二、系统架构设计（一）数据采集与预处理模块（二）大模型核心算法模块（三）应用层功能模块三、全流程系统流程图四、术前阶段详细方案（一）患者信息采集与整合（二）胆囊结石风险预测（三）手术方案制定辅助（四）麻醉方案规划五、术中阶段详细方案（一）实时数据监测与传输（二）手术进程智能辅助六、术后阶段详细方案（一）术后恢复情况预测（二）并发症风险预测（三）护理方案调整（四）康复指导七、并发症风险预
成为高级Python开发人员的完整学习路线与核心知识体系
引言Python已成为全球最受欢迎的编程语言之一，其简洁的语法和强大的生态系统使其在数据科学、Web开发、自动化、人工智能等领域占据重要地位。然而，从初级Python程序员到真正的高级开发人员，需要掌握一系列深入的知识点和实践经验。本文将详细介绍成为高级Python开发人员必备的核心知识体系，并提供系统化的学习资源，帮助你规划专业发展路径。第一部分：Python语言基础进阶1.Python语言特性
【AI】闭环反馈：构建从用户处学习的人工智能秋说 AI广延人工智能 AI
文章目录前言AI产品性能的双重视角：模型指标vs用户信号模型指标：AI系统的“内部视角”用户信号：AI产品的“外部视角”用户信号类型用户信号的价值模型指标为何难以独立支撑产品成功如何设计AI产品的全面反馈闭环一、统一成功标准：模型指标+用户价值二、用户信号的数据采集策略三、整合多源数据流四、分析与洞察从反馈到改进：迭代驱动的闭环循环一、识别并优先解决核心问题二、将用户信号转化为模型改进方向三、产品
【MongoDB】基础知识全面解析：从入门到核心概念韩悸桉数据库 mongodb 数据库
一、MongoDB是什么？MongoDB是一种开源文档型NoSQL数据库，以灵活的JSON格式（BSON）存储数据，无需固定表结构，适合处理半结构化和非结构化数据。与传统关系型数据库（如MySQL）相比，它具有以下特点：灵活的数据模型：文档结构可动态调整，适应业务需求变化。水平扩展性：支持分片集群，轻松应对海量数据存储。高性能读写：通过索引优化和内存缓存提升查询效率。二、核心概念与术语对比Mong
C语言控制结构深度解析：从底层原理到高效实战技巧 Bryan Ding c语言开发语言
一、程序逻辑的核心密码程序设计的本质是对现实问题的抽象和逻辑表达。C语言作为结构化编程语言的典范，其控制结构构成了程序逻辑的骨架。三大基本结构构成所有程序的逻辑基础：顺序结构：代码的自然执行顺序选择结构：if/else语句实现分支判断循环结构：for/while实现重复操作二、选择结构的底层实现1.if语句的机器级实现if (condition){ //代码块}编译后的汇编代码示例： cmp
Golang Channel 详细原理和使用技巧
1.简介Channel(一般简写为chan)管道提供了一种机制:它在两个并发执行的协程之间进行同步，并通过传递与该管道元素类型相符的值来进行通信,它是Golang在语言层面提供的goroutine间的通信方式.通过Channel在不同的goroutine中交换数据，在goroutine之间发送和接收消息,并且可以通过Channel实现Go依赖的CSP的并发模型这种同步模式chan可以理解为一个管道
【Go-策略模式】告别if/else hell，拥抱 Go 语言策略模式 c无序 Go golang 策略模式开发语言
引言：为什么你的代码像一棵巨大的圣诞树？想象一下，你正在为你的电商平台开发一个订单价格计算模块。最初，需求很简单：商品原价就是最终价格。但很快，业务部门提出了新的需求：新用户享受9折优惠。VIP用户享受8折优惠。大促活动期间，全场7折。你很自然地写出了这样的代码：funcCalculatePrice(userTypestring,isPromotionbool,pricefloat64)float
云原生 CAD 让制造业设计协同更便捷大腾智能工业软件 CAD 数字化
随着互联网、云计算技术的突飞猛进，CAD向着网络化、协同化的方向快速发展，云CAD软件逐渐映入人们的眼帘。云原生CAD不仅打破了传统CAD软件对硬件配置的依赖，更以数据驱动的协同创新模式，重塑了制造业的产品研发流程与组织协作形态。云CAD的特征快速灵活部署云CAD的一大优势就是软件部署的灵活性。基于Web浏览器的SaaS化架构，使设计师无需经历冗长的软件安装与版本适配过程。云端统一维护机制确保所有
【数据标注师】关键词标注试着数据标注师数据标注师关键词标注
目录一、**理解关键词标注的核心逻辑**1.**三大标注原则**2.**关键词类型体系**二、**四阶训练体系**▶**阶段1：基础规则内化**▶**阶段2：语义浓缩训练**▶**阶段3：场景化标注策略**▶**阶段4：工具效率提升**三、**五大高频错误防御指南**四、**复杂场景突破策略**1.**隐喻处理方案**2.**多义词消歧流程**3.**跨语言混合标注**五、**持续进阶体系**1.
【数据标注师】事件标注2 试着数据标注师数据标注师事件标注
目录一、**深入理解事件标注的核心架构**1.**事件五要素（标注核心对象）**2.**三大项目特性**二、**四阶段系统学习法**▶**阶段1：掌握标注指南（20%理论+80%案例）**▶**阶段2：触发词精准识别训练**▶**阶段3：要素抽取实战技巧**▶**阶段4：复杂场景突破三、**高效标注工具使用指南**1.**快捷键流操作（以主流工具为例）**2.**颜色编码法**四、**错误防御体系
告别“血腥”！VR小鼠解剖虚拟仿真开启实验新潮流广州华锐视点 vr
VR小鼠解剖虚拟仿真技术融合多种先进科技。核心是3D建模技术，专业人员用高精度扫描设备扫描小鼠获取数据，在虚拟空间构建近乎真实的三维模型，包含小鼠外部形态与内部细微结构。传感器交互技术实现用户与虚拟环境互动。用户戴VR设备持手柄解剖时，手柄传感器捕捉动作数据传输至计算机，精准控制虚拟工具;VR设备位置追踪传感器监测用户头部位置和转动方向，用户转动头部观察虚拟小鼠，虚拟场景同步变化，带来沉浸式体验。
VPS云服务器自动化运维：Ansible+Puppet实现批量配置管理与监控 cpsvps_net 运维服务器自动化
在云计算时代，VPS云服务器的自动化运维已成为企业提升效率的关键技术。本文将深入解析如何通过Ansible和Puppet两大主流工具实现批量配置管理，构建完整的监控体系，帮助运维团队从重复劳动中解放，确保服务器集群的高可用性。我们将从基础架构设计到实战案例，系统讲解自动化运维的最佳实践路径。VPS云服务器自动化运维：Ansible+Puppet实现批量配置管理与监控一、VPS云服务器自动化运维的核
(论文总结)思维链激发LLM推理能力靈镌sama 论文解读人工智能
研究背景&动机背景:扩大模型规模已被证实具有提升模型性能和模型效率的功效，但是LLM对于完成推理、算术任务仍有较大不足。动机:从之前的应用和研究中得知，可以用生成自然语言解释、使用神经符号等形式语言的方法来提高大模型的算术推理能力，当时采用了从头预训练和微调模型的方法，耗费的成本较多；而且大模型具有根据少量文本提示进行上下文少样本学习的能力，使用少量输入输出示例即可提高LLM的推理性能，而不必对单
树莓派上基于Opencv 实现人脸检测与人脸识别土拨鼠不是老鼠 C++opencv 人工智能计算机视觉
一，需求基于树莓派4b，usb1080p摄像头，实现人脸检测与人脸识别。尝试了海陵科的模组和百度的sdk。海陵科的模组无法录入人脸，浪费了100多块钱。百度的sdk在树莓派上也无法录入人脸，官方解决不了。最后只能用opencv自己实现，因为只要实现最简单检测和识别就行，不在乎准确率。经测试opencv能满足基本要求，这里整理下思路。二，（1），加载模型并实例化Ptr和Ptr对象。树莓派4bopen
MySQL对CPU的占用率很高怎么处理半桶水专家 mysql mysql 数据库
一、确认与定位确认整体CPU使用情况top-b-n1|head-n15观察MySQL(mysqld)进程所占的%CPU。如果是多核系统，关注总和以及单核是否满载。查看系统负载uptimeLoadAverage长期高于CPU核数，说明系统压力大。查看其它进程情况psaux--sort=-%cpu|head-n10确认是否仅MySQL占用高，或与其它进程有关。二、操作系统层面排查磁盘I/O瓶颈iost
从x86到ARM64：CPU架构的进化与未来小俊学长架构
从x86到ARM64：CPU架构的进化与未来在计算机发展的历史长河中，CPU架构的演变是推动计算技术不断前进的重要动力。从早期的x86架构，到现代的x64和ARM64架构，每一次变革都带来了计算性能、能效比以及应用领域的显著提升。本文将深入探讨x86、x64和ARM64这三大主流CPU架构的历史背景、技术特点、市场应用以及未来发展趋势，以期为读者提供一个全面的视角，理解CPU架构的进化路径及其对未
LangChain4j在Java企业应用中的实战指南-3 在未来等你大模型应用开发 AI 技术编程 Java Spring
【LangChain4j在Java企业应用中的实战指南】文章标签langchain4j,JavaAI,RAG系统,智能应用开发,LangChain4j实战,企业级AI应用,Java微服务,检索增强生成文章简述随着大语言模型（LLM）的广泛应用，企业对智能应用的需求日益增长。LangChain4j作为一款专为Java生态打造的LLM集成框架，正在成为构建RAG（检索增强生成）系统和智能应用的重要工具
tauri v2 开源项目学习（二）
前言:tauri2编程，前端部分和electron差不多，框架部分差别大，资料少，官网乱，AI又骗我所以在gitee上，寻找tauriv2开源项目，通过记录框架部分与rust部分的写法，对照确定编程方式tarui2插件，可以查看：https://github.com/tauri-apps/plugins-workspace1.EcoPastehttps://gitee.com/ayangweb/E
UE 有意思的功能教程链接笔记 RunInto丶 UE笔记 UE教程视频笔记虚幻引擎
油管砍伐任何树砍伐任何树：虚幻引擎教程https://www.youtube.com/watch?v=JtXYJKTsf9QAI图像转变为简单的3D模型使用AI平台将2D图像转换为3D角色https://www.youtube.com/watch?v=Z-acdzKASZ4在几秒钟内将您的AI图像转变为简单的3D模型|教程UE5https://www.youtube.com/watch?v=tt9
tauri v2 开源项目学习（一）
前言:tauri2编程，前端部分和electron差不多，框架部分差别大，资料少，官网乱，AI又骗我所以在gitee上，寻找tauriv2开源项目，通过记录框架部分与rust部分的写法，对照确定编程方式提示：不要在VSCode里自动运行Cargo，在powershell里运行Cargobuild，不会卡住1.tauri-desktophttps://gitee.com/MapleKing/taur
推荐文章：探索深度学习的不确定性边界 —— SDE-Net 开源项目解析史多苹Thomas
推荐文章：探索深度学习的不确定性边界——SDE-Net开源项目解析SDE-NetCodeforpaper:SDE-Net:EquippingDeepNeuralnetworkwithUncertaintyEstimates项目地址:https://gitcode.com/gh_mirrors/sd/SDE-Net在当今的人工智能领域，深度神经网络(DNN)已经成为推动技术创新的基石。然而，其预测的
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 ([email protected]), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu