sliderSun

解读《SenseBERT: Driving Some Sense into BERT》

SenseBERT 能理解中文的“没什么意思，意思意思。”这个系列的梗不。。。。

Abstract

自我监督技术使神经语言模型能够推进自然语言理解。然而，现有的自我监督技术在单词形式级别上运行，其作为底层语义内容的替代。本文提出了一种在词义上直接采用自我监督的方法水平。我们的模型名为SenseBERT，经过预先训练，不仅可以预测被掩盖的单词，还可以预测他们的WordNet超能。因此，我们在不使用人类注释的情况下获得词汇语义水平语言模型。SenseBERT实现了显着改进的词汇理解，正如我们通过在SemEval上进行实验以及在上下文中的任务（WiC）任务中获得最新结果所证明的那样。我们的方法可以扩展到其他语言信号，这些信号可以类似地集成到预训练过程中，从而产生越来越语义化的语言模型。

Introduction

神经语言模型最近经历了质的飞跃，推动了各种NLP任务的最新技术水平。随着网络架构的进步，自我监督的使用已被证明是这些成就的核心，因为它允许网络在预训练阶段从大量未注释的文本中学习。

BERT中采用的自我监督策略涉及掩盖输入句子中的一些单词，然后训练模型以根据其上下文预测它们。其他提出的自我监督目标方法，包括单向，置换或基于单词插入方法，在词语上的运作方式相似。但是，由于给定的单词形式可以具有多种含义（例如，“贝斯”这个词可以指鱼，吉他，一种歌手等等，这个词本身仅仅是其在给定语境中的实际意义的代名词，被称为它的意义。事实上，从词汇语义的角度来看，词形层面可以被视为一个表面层面，经常引入具有挑战性的歧义。

在本文中，我们提出了一种新的方法，直接在一个词的意义层面上应用自我监督。通过将明确的词义信息注入到BERT的自我监督信号中，我们在对大型无注释语料库进行预训练时将模型暴露给词汇语义。我们将结果称为感知模型SenseBERT。

具体来说，我们在BERT的预训练中添加一个掩蔽词义预测任务作为辅助任务。因此，我们与标准的单词形式语言模型一起训练一个语义级语言模型，预测缺失单词的含义。为了保留在未注释文本上进行自我训练的能力，我们使用了WordNet，这是一个专家构建的本体，提供了词义的清单。这种外部语言知识库的整合固有地改善了网络对词汇语义的归纳偏见。

我们专注于一个字的意义上的粗粒度的变体，被称为其的WordNet 的SuperSense，为了减轻细粒度字义系统的所识别脆性，引起任意的检测粒度，模糊性，和一般的主观。WordNet词典编纂者将所有词义组织成45个超感类别，其中26个用于名词，15个用于动词，3个用于形容词，1个用于副词（参见附录中的完整超感表）。消除单词的超感知已被广泛研究为基本的词汇分类任务。

我们将来自WordNet的掩蔽词允许的超级列表列表用作感知预测任务的一组可能标签。用单一标记标记单词（例如，'剑'只有超标，名词。文物）是直截了当的：我们训练网络在给定被掩盖的单词的上下文的情况下预测这种超模。至于具有多个超级犯罪的单词（例如，'bass'可以是：noun.food，noun.animal，noun.artifact，noun.person 等），我们训练模型来预测任何这些意义，从而导致一个简单的但有效的软标签计划。

语境化嵌入的引入，其中给定单词的嵌入是依赖于上下文而不是预先计算的，为感知嵌入提供了一个很有希望的前景。直觉上，单词的意义及其上下文是高度相关的，因此增加上下文变化的能力应该使嵌入更自然地携带感知信息。的确， Coenen 等人已经证明BERT在某种程度上捕获了词义信息。

尽管如此，我们还是确定了这个有罪的明显差距。我们表明，用当前的单词级别自我监督训练的BERT模型，承担着消除词义意义的隐含任务，往往无法掌握词汇语义，表现出高超的错误分类率。我们进一步证明，在预训练时插入的自监督字感信号允许SenseBERT显着弥合这一差距。

Incorporating Word-Supersense Information at Pre-training

输入到BERT是字序列，其中15 ％的话是由[MASK]令牌代替。这里N是输入句子长度，D W是单词词汇量大小，并且是对应于第j 个输入词的one-hot向量。对于每一个字掩蔽，输出是一个字得分矢量包含每个单词的分数。BERT的体系结构可以分解为（1）内部Transformer编码器体系结构，包括（2）外部映射到单词词汇空间，用W表示。Transformer编码器工作在字的嵌入序列，其中d是Transformer编码器的隐藏维度。它们通过多个基于注意力的Transformer层传递，在每一层产生一系列新的上下文嵌入。变压器编码器输出是情境化的嵌入字的最后序列。

外部映射是有效的外部词的词汇尺寸和内部Transformer尺寸之间的转换。在输入语句原始字被通过应用该映射（以及添加位置编码矢量转换成Transformer块：

在下面的小节中，我们构建我们上述方法贡献作为附加并行外部映射的话supersenses空间的，表示为，其中D S是超越词汇量的大小。具体来说，在2.1节中，我们描述了用于与W并行学习S的损失函数，在无人监督的预训练阶段有效地实现了单词形式和词义多任务学习。然后，在2.2节中，我们描述了在S中添加超感知信息的方法最初的Transformer嵌入，与W添加的字级信息并行。最后，在2.3节中，我们描述了我们对BERT掩蔽策略的修改，优先考虑带有更强语义信号的单超语音单词。

图1： SenseBERT包括一个掩蔽字超感预测任务，与BERT的原始掩蔽字预测任务一起预先训练（Devlin 等，2018）（见2.1节）。与原始BERT一样，从Transformer维度到外部维度的映射在输入和输出处都是相同的（W表示单词，S表示替换），其中M表示单词形式之间的固定映射及其允许的WordNet超级（见2.2节）。向量p （j ）表示位置嵌入。为清楚起见，我们省略了对与上述联合训练的句子级下一句子预测任务的引用。

Self-Supervised Supersense Prediction Task

给定在位置上掩蔽的字Ĵ，BERT的原始掩码字预测训练前的任务是有字得分向量输出得到尽可能接近与屏蔽词对应的1-hot向量。这是通过最小化单词得分向量的softmax和对应于被屏蔽单词的1-hot向量之间的交叉熵损失来完成的：

其中w是掩码字，上下文由输入序列的其余部分组成，概率由下式计算

其中y个单词 w表示单词分数向量的第 w 个条目。

图2： SenseBERT在预训练时学习的超感矢量（分类器S的行）的UMAP可视化。（a）通过超能部分的词性聚类。（b）在名词上的罪行中，语义相似的罪行聚集在一起（详见附录 A）。

我们按照上述程序训练SenseBERT的单词级语言模型。共同地对每一个屏蔽字，我们训练模型来预测它的SuperSense，即，目的是使感测得分向量输出得到尽可能接近到1-hot vector对应于单词的正确supersense。

具体来说，我们对超能级语言模型使用两个损失项的组合。以下允许感知术语最大化预测感觉在被掩盖词w的允许超集的集合中的概率：

其中A （w ）是被掩盖的单词允许的超级犯罪组，超级s的概率由下式给出：

上面提出的自我监督方案，对所有被允许的被掩盖的词的同等对待，对超级标签引入了噪声。我们期望在足够大的语料库中聚合许多上下文将强化正确的标签，而嘈杂的标签将平均。为了说明这一点，请考虑以下食物背景的例子。

“这种低音很美味”
（超感：名词。食物，名词，文物等）
“这种巧克力很美味”
（超感：名词。食物，名词，属性等）
“这种泡菜味道鲜美”
（超感：名词。食物，名词。状态等）

在每个示例中屏蔽标记的单词导致三个相同的输入序列，每个输入序列具有不同的标签集。地面实况标签，名词食品，出现在所有情况下，增加其概率，而支持其他标签的信号抵消。

虽然L 允许SLM在正确的方向上推动网络，但是最小化这种损失可能导致网络在预测严格的感官子集（即预测分布的崩溃）时变得过于自信。这在训练过程的早期阶段尤其严重，此时网络可以收敛到软标签方案的噪声信号。

为了缓解这个问题，将以下正则化术语添加到损失中，这样可以鼓励对允许的违规行为进行统一的预测分配：

即，在允许的违规上具有均匀分布的交叉熵损失。

图3：（a） SenseBERT的单词 - 超级语义语言模型（上限为5 ％）给出了在上下文中分配给掩盖位置的超感概率的演示。对应于每个超联代的示例词在括号中给出。（b） SenseBERT对原始文本的自我预测的示例，当给模型提供未屏蔽的输入句子时。这超出了单词形式的抽象能力，有助于在训练前更自然地引出语义内容。

后，为了训练语义级语言模型，我们利用表单的组合损失：

Supersense Aware Input Embeddings

虽然在原理上两个不同的矩阵可能已被用于转换和移出Transformer编码器，所述BERT体系结构采用相同的映射w 。Press和Wolf（2016）证明了这种方法能够减少困惑的模型。直观地，从计算分数的相同映射构造变换器编码器的输入嵌入改善了它们的质量，因为它使输入对训练信号更敏感。

我们遵循这种方法，并且除了W之外，在输入中插入我们新提出的语义级语言模型矩阵S [如图2所示。 1（b） ]，使变压器编码器的输入矢量服从：

用于构造的上述策略允许S中的语义级向量起作用并且甚至对于在训练语料库中很少观察到的单词来形成输入嵌入。对于这样一个词，W中相应的行可能信息量较少，因为由于词频率低，模型没有足够的机会充分学习它。然而，由于模型学习了其超感知的表示，因此S中的相应行是该单词的语义类别的信息。因此，输入嵌入在eq。 8 即使掩盖的词很少，也可以帮助模型获取有意义的信息，从而可以更好地利用训练语料库。其中是如BERT中使用的常规的嵌入位置，并是一个静态0/1矩阵单词和及其允许的WordNet supersenses。

Single-Supersensed Word Masking

具有单一超感知的词是用于获得明确的语义信号的良好锚。这些单词有助于将上下文映射到超级犯罪，以允许模型进行正确的基于上下文的预测，即使被掩盖的单词具有多个超级犯罪。因此，我们赞成掩蔽策略中的这些单词，选择每个输入序列中50 ％的单超级单词被掩盖。如果整个15 ％的掩蔽预算中有40 ％被单一的超级单词填充（这种情况很少发生），我们会停止，并且无论如何我们会随机选择其余的单词来完成这个预算。在实践中，1个总分10 选择用于掩蔽的单词显示为自身而不是[掩模]，并且预测任务按原样执行。

Conclusion

我们将词汇语义信息引入神经语言模型的预训练目标。这导致结果模型的词级语义感知提升，名为SenseBERT，在基于SemEval的Supersense Disambiguation任务上显着优于常规BERT，并在Context in Context任务中实现最先进的结果。这种改进是在没有人类注释的情况下获得的，而是通过利用外部语言知识来源来获得归纳偏差。我们的工作表明，可以类似地引入超出词汇水平的额外语义信号，允许网络在预训练阶段无需人工监督即可获得进一步的洞察力。

03每日简报20250705 Alvin_YD 每日简报人工智能娱乐社交电子媒体传媒
每日简报新闻简报：AI行业信任危机浮现标题：知名科技作者AlbertoRomero发文《我对AI行业正在失去所有信任》来源：TheAlgorithmicBridge（算法之桥）核心内容：作者立场：长期支持AI技术的作者AlbertoRomero公开表达对行业信任的崩塌，称"作为一个支持者，我本不愿有这种感受"。行业痛点：未具体说明的行业乱象导致公众信任度下降暗示AI发展过程中存在伦理或透明度问题传
发起请求并处理响应：`XHR` 与 `axios` 使用指南来啦[特殊字符]~
又又又要长脑子呐~了解到通过发起HTTP请求并在不刷新页面的情况下更新页面内容是一种常见的需求。学习使用XMLHttpRequest或axios来实现，现在进行对比两者，比较项目使用时候的优缺点，文末使用表格进行对比学习1.使用XHR实现下面是一个使用XMLHttpRequest发起GET请求并处理服务器响应的示例：html体验AI代码助手代码解读复制代码//创建一个新的XMLHttpReques
模型微调方法Prefix-Tuning ballball~~ 大模型人工智能算法大数据
简介：个人学习分享，如有错误，欢迎批评指正。随着大规模预训练语言模型（如GPT系列、BERT等）的广泛应用，如何高效、经济地针对特定任务对这些模型进行微调（Fine-Tuning）成为研究热点。传统的微调方法通常需要调整模型的大量参数，导致计算资源消耗大、适应新任务的速度慢。为了解决这一问题，Prefix-Tuning（前缀调优）作为一种高效的微调技术被提出，旨在通过引入少量可训练的前缀参数，达到
推荐与广告区别 ActionReaction
TheDifferencebetweenaRecommendationandanAdAquickthoughtregardingFacebook’snewSocialAdsplatform.Arecommendationissomethingyougetfromsomeonewhoknowssomethingaboutyou.Theyhaveseenanitemofinterestandthoug
知识图谱的个性化智能教学推荐系统(论文+源码) 毕设工作室_wlzytw python论文项目知识图谱人工智能
目录摘要Abstract目录第1章绪论1.1研究背景及意义1.2国内外研究现状1.2.1知识图谱1.2.2个性化推荐系统1.3本文研究内容及创新点1.4全文组织结构第2章相关理论与技术概述2.1知识图谱2.1.1知识图谱的介绍与发展2.1.2知识图谱的构建2.3协同过滤推荐算法2.2.1推荐算法概述2.2.2Pearson相关系数2.2.3Spearman相关系数2.4Bert模型和Albert模
告别合规“人海战术”，奇富科技Lumo AI合规助手让效率狂飙20倍！ CSDN资讯人工智能科技 Lumo AI
6月20日，国家金融监督管理总局发布《商业银行市场风险管理办法》，银行业随即掀起了一场监管解读与内部宣导的热潮，对照新规，企业内部逐一梳理，再逐一落实。面对不断更新的政策要求和堆积如山的协议审查，传统人工筛查方式显得力不从心，效率低下且漏洞百出，企业合规人力匮乏，全流程合规SOP执行难、合规自查覆盖率低、员工与客户异常行为发现滞后等问题如同高悬的“达摩克利斯之剑”，让机构们喘不过气来。奇富科技精准
STM32（X）精简库解读CMSIS
概述CMSIS全称为CommonMicrocontrollerSoftwareInterfaceStandard（通用微控制器软件接口标准），点此参考官方解读精简库CMSIS文件夹结构core：CMSISCortex-M3核心外设访问层源文件startup：启动文件stm32f10x.h：CMSISCortex-M3设备外设访问层头文件。这个文件包含了所有外设寄存器的定义，位定义和内存映射的STM
go-carbon v2.6.10发布，轻量级、语义化、对开发者友好的 golang 时间处理库 gocarbontime
carbon是一个轻量级、语义化、对开发者友好的Golang时间处理库，提供了对时间穿越、时间差值、时间极值、时间判断、星座、星座、农历、儒略日/简化儒略日、波斯历/伊朗历的支持。carbon目前已捐赠给dromara开源组织，已被awesome-go收录，并获得gitee2024年最有价值项目（GVP）和gitcode2024年度G-Star项目，如果您觉得不错，请给个star吧官网:carbo
大语言模型应用指南：ReAct 框架 AI大模型应用实战 java python javascript kotlin golang 架构人工智能
大语言模型应用指南：ReAct框架关键词：大语言模型,ReAct框架,自然语言处理(NLP),模型融合,多模态学习,深度学习,深度学习框架1.背景介绍1.1问题由来近年来，深度学习技术在自然语言处理(NLP)领域取得了显著进展。尤其是大语言模型(LargeLanguageModels,LLMs)，如BERT、GPT系列等，通过在大规模无标签数据上进行预训练，获得了强大的语言理解和生成能力。然而，预
大语言模型原理基础与前沿基于语言反馈进行微调 AI天才研究院计算 AI大模型企业级应用开发实战 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大语言模型原理基础与前沿基于语言反馈进行微调作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着深度学习技术的飞速发展，自然语言处理（NLP）领域取得了显著的进展。大语言模型（LargeLanguageModels，LLMs）如GPT-3、BERT等在各项NLP任务上取得了令人瞩目的成绩。然而，如何进一步提高大语言模型的理
《北京市加快推动“人工智能+医药健康“创新发展行动计划（2025-2027年）》深度解读
引言随着新一轮科技革命和产业变革的深入推进，人工智能技术与医药健康的深度融合已成为全球科技创新的重要方向。北京市于2025年7月正式发布《北京市加快推动"人工智能+医药健康"创新发展行动计划（2025-2027年）》，旨在充分发挥北京在人工智能技术策源、头部医疗资源汇聚、健康数据高度富集等方面的突出优势，构建形成"人工智能+医药健康"创新和应用并举的产业生态体系，打造具有国际影响力的创新策源地、应
Spring Boot 循环依赖问题解决方案笔记（基于电商系统示例） Chen-Edward SpringBoot spring boot 笔记后端 java ide intellij-idea spring
1.问题背景以一个电商系统为例子，SpringBoot应用启动时抛出了循环依赖（CircularDependency）异常，错误信息如下：***************************APPLICATIONFAILEDTOSTART***************************Description:Thedependenciesofsomeofthebeansintheappli
四种微调技术详解：SFT 监督微调、LoRA 微调、P-tuning v2、Freeze 监督微调方法
当谈到人工智能大语言模型的微调技术时，我们进入了一个令人兴奋的领域。这些大型预训练模型，如GPT-3、BERT和T5，拥有卓越的自然语言处理能力，但要使它们在特定任务上表现出色，就需要进行微调，以使其适应特定的数据和任务需求。在这篇文章中，我们将深入探讨四种不同的人工智能大语言模型微调技术：SFT监督微调、LoRA微调方法、P-tuningv2微调方法和Freeze监督微调方法。第一部分：SFT监
Longformer: The Long-Document Transformer（2020-4-10）不负韶华ღ 深度学习（NLP）transformer 深度学习人工智能
模型介绍目前基于Transformer的预训练模型在各项NLP任务纷纷取得更好的效果，这些成功的部分原因在于Self-Attention机制，它运行模型能够快速便捷地从整个文本序列中捕获重要信息。然而传统的Self-Attention机制的时空复杂度与文本的序列长度呈平方的关系，这在很大程度上限制了模型的输入不能太长，因此需要将过长的文档进行截断传入模型进行处理，例如BERT中能够接受的最大序列长
主流 3D 感知技术对比-iTOF、dTOF、结构光、激光雷达 moonsims 数码相机
主流3D感知技术对比-iTOF、dTOF、结构光、激光雷达四类主流3D感知技术对比表对比维度iToF相机dToF相机固态LiDAR+可见光融合结构光相机测距原理连续调制光→相位差计算激光脉冲→飞行时间测距激光扫描点云+图像纹理融合投射编码光图案+视差三角测量代表设备IntelD435i,AzureKinectSTVL53L5CX,SonyIMX611L3CAM,RoboSenseM1+RGBRea
深入理解数据库领域的 SQL 索引失效问题数据库管理艺术数据库 sql ai
深入理解数据库领域的SQL索引失效问题关键词：SQL索引、索引失效、查询优化、执行计划、数据库性能、B+树、索引选择性摘要：本文深入探讨SQL索引失效的核心问题，分析导致索引失效的8种典型场景及其背后的原理机制。通过B+树索引结构解析、执行计划解读和实际案例演示，帮助开发者全面理解索引失效的本质原因。文章提供详细的优化方案和最佳实践，包括索引设计原则、SQL编写规范以及性能调优技巧，并附有MySQ
搜索架构中的NLP技术：提升搜索准确性的关键搜索引擎技术架构自然语言处理人工智能 ai
搜索架构中的NLP技术：提升搜索准确性的关键关键词：搜索架构、NLP技术、查询理解、语义搜索、相关性排序、意图识别、BERT模型摘要：本文将深入探讨现代搜索架构中NLP技术的核心应用，从查询理解到结果排序的全流程，揭示NLP如何提升搜索准确性。我们将通过生动的比喻解释复杂概念，分析关键技术原理，并提供实际代码示例，帮助读者全面理解搜索系统背后的NLP魔法。背景介绍目的和范围本文旨在解析NLP技术在
Python标准库The Python Standard Library GarfieldEr007 Python Python 标准库 Standard Library
WhileThePythonLanguageReferencedescribestheexactsyntaxandsemanticsofthePythonlanguage,thislibraryreferencemanualdescribesthestandardlibrarythatisdistributedwithPython.Italsodescribessomeoftheoptionalc
Python 库包 sentence-transformers 音程机器学习人工智能 python 开发语言
sentence-transformers是一个非常流行的Python库，专门用于将文本（句子、段落、文档）转换为高质量的语义向量（嵌入）。它基于Transformer架构（如BERT、RoBERTa、DistilBERT等）的预训练模型，并在大量语义相似性数据上进行了微调，能够捕捉句子之间的深层语义关系。什么是sentence-transformers？项目地址：https://www.sber
解读国密非对称加密算法SM2 云水木石详解国密算法数据安全
本文先介绍非对称加密算法，然后聊一聊椭圆曲线密码算法（EllipticCurveCryptography，ECC），最后才是本文的主题国密非对称加密算法SM2。因为我的数学知识有限，对于算法涉及的一些复杂的理论知识，也是不懂，所以本文不会涉及理论，仅仅从编程的角度解读一下SM2。在进行国密算法开发的这段时间，我主要参考的书籍是《深入浅出HTTPS：从原理到实战》，微信读书上也有电子版，如果你也是进
鸿蒙设备开发OpenHarmony深度解读之设备认证：HiChain机制部分源码解析1（推荐模块之外）
往期推文全新看点（文中附带最新·鸿蒙全栈学习笔记）鸿蒙（HarmonyOS）北向开发知识点记录~鸿蒙（OpenHarmony）南向开发保姆级知识点汇总~鸿蒙应用开发与鸿蒙系统开发哪个更有前景？嵌入式开发适不适合做鸿蒙南向开发？看完这篇你就了解了~对于大前端开发来说，转鸿蒙开发究竟是福还是祸？鸿蒙岗位需求突增！移动端、PC端、IoT到底该怎么选？记录一场鸿蒙开发岗位面试经历~持续更新中……一、概述H
提到交换机堆叠大家就害怕，其实堆叠很简单！ wljslmz 网络技术交换机堆叠
一提到“交换机堆叠”这四个字，很多网络工程师眉头就皱了起来，仿佛堆叠就等于配置复杂、故障难查、升级噩梦。其实真不是！交换机堆叠（Stacking）说白了，就是“多台交换机一起干活，还装得像一台”。如果你认真了解过堆叠背后的逻辑和原理，掌握了几个关键细节，这项技术其实相当香，无论是运维、扩展，还是冗余能力，都是妥妥加分项！今天我们就来一次不装神弄鬼、不炫术语、不堆RFC的通透解读，把“交换机堆叠”这
解析大数据领域结构化数据的管理模式大数据洞察大数据 ai
解码结构化数据：大数据时代的高效管理模式与实践指南关键词结构化数据、大数据管理、数据建模、分布式数据库、数据仓库、数据治理、性能优化摘要在大数据的洪流中，结构化数据犹如隐藏在波涛之下的磐石，虽然不如非结构化数据那般引人注目，却是企业决策的基石。本文深入剖析了大数据环境下结构化数据的管理模式，从传统关系型数据库到现代分布式系统，从数据建模到存储架构，全面解读了结构化数据管理的核心技术与实践方法。通过
巅峰对话在线研讨 Q&A：Oracle Database 21c vs openGauss 2.0新特性解读和架构演进小兰 � 国产数据库技术文章数据库 oracle 华为
2021年11月11日，墨天轮《巅峰对话》栏目邀请到了两位数据库领域的巅峰人物：云和恩墨创始人盖国强老师，和来自清华大学计算机与技术系的李国良教授，为大家带来了在线研讨《OracleDatabase21cvsopenGauss2.0新特性解读和架构演进》，并对数据库技术演进和生态发展进行深入探讨。两位老师一共围绕10个特性作了深入、独到的解读，强强联手、共创了一场精彩的技术盛宴。当天的直播间吸引了
英语学习：H开头 only-lucky 英语学习学习
habit习惯hair头发haircut理发half一半hall大厅ham火腿hamburger汉堡包hammer锤子hand手，指针handbag手提包handful少量，少数handkerchief手帕handle柄handsome英俊的handwriting书法handy便利的，顺手的hang悬挂happen偶然发生happiness幸福hard努力的hardly几乎不hardship困难的
物联网零售领域AI算力网络与通信的应用探索 AI算力网络与通信物联网零售人工智能 ai
物联网零售领域AI算力网络与通信的应用探索关键词：物联网、零售领域、AI算力网络、通信、应用探索摘要：本文聚焦于物联网零售领域，深入探讨了AI算力网络与通信的应用。首先介绍了相关背景，包括目的、预期读者等。接着对核心概念进行解释，阐述它们之间的关系并给出原理架构示意图和流程图。然后详细讲解核心算法原理、数学模型与公式，通过项目实战展示代码案例及解读。还介绍了实际应用场景、推荐相关工具资源，分析未来
剖析AI人工智能领域Whisper的性能指标 AI大模型应用实战人工智能 whisper xcode ai
剖析AI人工智能领域Whisper的性能指标关键词：Whisper、语音识别、性能指标、ASR、AI模型评估、基准测试、语音转文本摘要：本文深入剖析OpenAI开发的Whisper语音识别系统的性能指标。我们将从技术原理、架构设计、性能基准测试等多个维度，全面分析Whisper在不同场景下的表现。文章将详细讲解Whisper的评估方法、关键性能指标解读、实际应用中的性能表现，以及与其他主流语音识别
OCCT AIS(交互) 核心基类 AIS_InteractiveObject
我们来详细解读一下AIS_InteractiveObject这个类。AIS_InteractiveObject是OpenCASCADETechnology(OCCT)中AIS(ApplicationInteractiveServices)模块的核心基类。简单来说，你在OCCT查看器中看到的、能与之交互（如点击选择、高亮、移动）的任何三维对象，几乎都是从AIS_InteractiveObject派生
并发编程原理与实战（十五）线程安全实现方法深度解析
上一篇讲解了线程安全问题与JMM的核心原理以及8大原子操作，本文继续学习JMM中的Happens-before8大规则‌，8大原子操作从文字上理解可能不够深刻，我们从代码的角度直观的解读8大原子操作，进一步深入剖析其中的的运作机制，分析JMM是如何保证线程安全的。Happens-before8大规则‌在分析之前，我们先来了解下JMM中的Happens-before规则‌，字面意思即先行发生规则。T
一句话讲明什么是衡石 HQL？【衡石文档干货】
衡石系统中自定义的计算过程描述语言为HengshiSENSEQueryLanguage(HQL)，用于衡石系统的前后端交互、API数据请求中。语法规定使用统一的JSON来描述各个计算过程.HQL由多层调用的HE(HengshiExpression)组成。下面是单个HE的语法结构。HE节点名类型是否必须描述uidSTRING否本节点的全局唯一标识符kindSTRING是节点类型，见HE状态说明opO
linux系统服务器下jsp传参数乱码 3213213333332132 java jsp linux windows xml
在一次解决乱码问题中，发现jsp在windows下用js原生的方法进行编码没有问题，但是到了linux下就有问题， escape,encodeURI,encodeURIComponent等都解决不了问题但是我想了下既然原生的方法不行，我用el标签的方式对中文参数进行加密解密总该可以吧。于是用了java的java.net.URLDecoder,结果还是乱码，最后在绝望之际，用了下面的方法解决了
Spring 注解区别以及应用 BlueSkator spring
1. @Autowired @Autowired是根据类型进行自动装配的。如果当Spring上下文中存在不止一个UserDao类型的bean，或者不存在UserDao类型的bean，会抛出 BeanCreationException异常，这时可以通过在该属性上再加一个@Qualifier注解来声明唯一的id解决问题。 2. @Qualifier 当spring中存在至少一个匹
printf和sprintf的应用 dcj3sjt126com PHP sprintf printf
<?php printf('b: %b c: %c d: %d <bf>f: %f', 80,80, 80, 80); echo ' '; printf('%0.2f %+d %0.2f ', 8, 8, 1235.456); printf('th
config.getInitParameter 171815164 parameter
web.xml <servlet> <servlet-name>servlet1</servlet-name> <jsp-file>/index.jsp</jsp-file> <init-param> <param-name>str</param-name>
Ant标签详解--基础操作 g21121 ant
Ant的一些核心概念： build.xml：构建文件是以XML 文件来描述的，默认构建文件名为build.xml。 project：每个构建文
[简单]代码片段_数据合并 53873039oycg 代码
合并规则:删除家长phone为空的记录,若一个家长对应多个孩子,保留一条家长记录,家长id修改为phone,对应关系也要修改。代码如下:
java 通信技术云端月影 Java 远程通信技术
在分布式服务框架中，一个最基础的问题就是远程服务是怎么通讯的，在Java领域中有很多可实现远程通讯的技术，例如：RMI、MINA、ESB、Burlap、Hessian、SOAP、EJB和JMS等，这些名词之间到底是些什么关系呢，它们背后到底是基于什么原理实现的呢，了解这些是实现分布式服务框架的基础知识，而如果在性能上有高的要求的话，那深入了解这些技术背后的机制就是必须的了，在这篇blog中我们将来
string与StringBuilder 性能差距到底有多大 aijuans
之前也看过一些对string与StringBuilder的性能分析，总感觉这个应该对整体性能不会产生多大的影响，所以就一直没有关注这块！由于学程序初期最先接触的string拼接，所以就一直没改变过自己的习惯！
今天碰到 java.util.ConcurrentModificationException 异常 antonyup_2006 java 多线程工作 IBM
今天改bug，其中有个实现是要对map进行循环，然后有删除操作，代码如下： Iterator<ListItem> iter = ItemMap.keySet.iterator(); while(iter.hasNext()){ ListItem it = iter.next(); //...一些逻辑操作 ItemMap.remove(it); } 结果运行报Con
PL/SQL的类型和JDBC操作数据库百合不是茶 PL/SQL表标量类型游标 PL/SQL记录
PL/SQL的标量类型: 字符,数字,时间,布尔,%type五中类型的 --标量：数据库中预定义类型的变量 --定义一个变长字符串 v_ename varchar2(10); --定义一个小数,范围 -9999.99~9999.99 v_sal number(6,2); --定义一个小数并给一个初始值为5.4 :=是pl/sql的赋值号
Mockito：一个强大的用于 Java 开发的模拟测试框架实例 bijian1013 mockito 单元测试
Mockito框架： Mockito是一个基于MIT协议的开源java测试框架。 Mockito区别于其他模拟框架的地方主要是允许开发者在没有建立“预期”时验证被测系统的行为。对于mock对象的一个评价是测试系统的测
精通Oracle10编程SQL(10)处理例外 bijian1013 oracle 数据库 plsql
/* *处理例外 */ --例外简介 --处理例外-传递例外 declare v_ename emp.ename%TYPE; begin SELECT ename INTO v_ename FROM emp where empno=&no; dbms_output.put_line('雇员名：'||v_ename); exceptio
【Java】Java执行远程机器上Linux命令 bit1129 linux命令
Java使用ethz通过ssh2执行远程机器Linux上命令，封装定义Linux机器的环境信息 package com.tom; import java.io.File; public class Env { private String hostaddr; //Linux机器的IP地址 private Integer po
java通信之Socket通信基础白糖_ java socket 网络协议
正处于网络环境下的两个程序，它们之间通过一个交互的连接来实现数据通信。每一个连接的通信端叫做一个Socket。一个完整的Socket通信程序应该包含以下几个步骤： ①创建Socket； ②打开连接到Socket的输入输出流； ④按照一定的协议对Socket进行读写操作； ④关闭Socket。 Socket通信分两部分：服务器端和客户端。服务器端必须优先启动，然后等待soc
angular.bind boyitech AngularJS angular.bind AngularJS API bind
angular.bind 描述：上下文，函数以及参数动态绑定，返回值为绑定之后的函数. 其中args是可选的动态参数，self在fn中使用this调用。使用方法： angular.bind(se
java-13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 bylijinnan java
import java.util.ArrayList; import java.util.List; public class KickOutBadGuys { /** * 题目：13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 * Maybe you can find out
Redis.conf配置文件及相关项说明（自查备用） Kai_Ge redis
Redis.conf配置文件及相关项说明 # Redis configuration file example # Note on units: when memory size is needed, it is possible to specifiy # it in the usual form of 1k 5GB 4M and so forth: #
[强人工智能]实现大规模拓扑分析是实现强人工智能的前奏 comsci 人工智能
真不好意思,各位朋友...博客再次更新... 节点数量太少,网络的分析和处理能力肯定不足,在面对机器人控制的需求方面,显得力不从心.... 但是,节点数太多,对拓扑数据处理的要求又很高,设计目标也很高,实现起来难度颇大...
记录一些常用的函数 dai_lm java
public static String convertInputStreamToString(InputStream is) { StringBuilder result = new StringBuilder(); if (is != null) try { InputStreamReader inputReader = new InputStreamRead
Hadoop中小规模集群的并行计算缺陷 datamachine mapreduce hadoop 并行计算
注：写这篇文章的初衷是因为Hadoop炒得有点太热，很多用户现有数据规模并不适用于Hadoop，但迫于扩容压力和去IOE（Hadoop的廉价扩展的确非常有吸引力）而尝试。尝试永远是件正确的事儿，但有时候不用太突进，可以调优或调需求，发挥现有系统的最大效用为上策。 -----------------------------------------------------------------
小学4年级英语单词背诵第二课 dcj3sjt126com english word
egg 蛋 twenty 二十 any 任何 well 健康的，好 twelve 十二 farm 农场 every 每一个 back 向后，回 fast 快速的 whose 谁的 much 许多 flower 花 watch 手表 very 非常，很 sport 运动 Chinese 中国的
自己实践了github的webhooks, linux上面的权限需要注意 dcj3sjt126com github webhook
环境, 阿里云服务器 1. 本地创建项目, push到github服务器上面 2. 生成www用户的密钥 sudo -u www ssh-keygen -t rsa -C "[email protected]" 3. 将密钥添加到github帐号的SSH_KEYS里面 3. 用www用户执行克隆, 源使
Java冒泡排序蕃薯耀冒泡排序 Java冒泡排序 Java排序
冒泡排序 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 10:40:14 星期二 http://fanshuyao.iteye.com/
Excle读取数据转换为实体List【基于apache-poi】 hanqunfeng apache
1.依赖apache-poi 2.支持xls和xlsx 3.支持按属性名称绑定数据值 4.支持从指定行、列开始读取 5.支持同时读取多个sheet 6.具体使用方式参见org.cpframework.utils.excelreader.CP_ExcelReaderUtilTest.java 比如： Str
3个处于草稿阶段的Javascript API介绍 jackyrong JavaScript
原文： http://www.sitepoint.com/3-new-javascript-apis-may-want-follow/?utm_source=html5weekly&utm_medium=email 本文中，介绍3个仍然处于草稿阶段，但应该值得关注的Javascript API. 1) Web Alarm API &
6个创建Web应用程序的高效PHP框架 lampcy Web 框架 PHP
以下是创建Web应用程序的PHP框架，有coder bay网站整理推荐： 1. CakePHP CakePHP是一个PHP快速开发框架，它提供了一个用于开发、维护和部署应用程序的可扩展体系。CakePHP使用了众所周知的设计模式，如MVC和ORM，降低了开发成本，并减少了开发人员写代码的工作量。 2. CodeIgniter CodeIgniter是一个非常小且功能强大的PHP框架，适合需
评"救市后中国股市新乱象泛起"谣言 nannan408
首先来看百度百家一位易姓作者的新闻：三个多星期来股市持续暴跌，跌得投资者及上市公司都处于极度的恐慌和焦虑中，都要寻找自保及规避风险的方式。面对股市之危机，政府突然进入市场救市，希望以此来重建市场信心，以此来扭转股市持续暴跌的预期。而政府进入市场后，由于市场运作方式发生了巨大变化，投资者及上市公司为了自保及为了应对这种变化，中国股市新的乱象也自然产生。首先，中国股市这两天
页面全屏遮罩的实现方式 Rainbow702 html css 遮罩 mask
之前做了一个页面，在点击了某个按钮之后，要求页面出现一个全屏遮罩，一开始使用了position:absolute来实现的。当时因为画面大小是固定的，不可以resize的，所以，没有发现问题。最近用了同样的做法做了一个遮罩，但是画面是可以进行resize的，所以就发现了一个问题，当画面被reisze到浏览器出现了滚动条的时候，就发现，用absolute 的做法是有问题的。后来改成fixed定位就
关于angularjs的点滴 tntxia AngularJS
angular是一个新兴的JS框架，和以往的框架不同的事，Angularjs更注重于js的建模，管理，同时也提供大量的组件帮助用户组建商业化程序，是一种值得研究的JS框架。 Angularjs使我们可以使用MVC的模式来写JS。Angularjs现在由谷歌来维护。这里我们来简单的探讨一下它的应用。首先使用Angularjs我
Nutz--->>反复新建ioc容器的后果 xiaoxiao1992428 DAO mvc IOC nutz
问题： public class DaoZ { public static Dao dao() { // 每当需要使用dao的时候就取一次 Ioc ioc = new NutIoc(new JsonLoader("dao.js")); return ioc.get(