Yanqiang_CS

【讲座】清华刘知远：自然语言理解难在哪儿？

文章作者：刘知远 (原载于知乎：NLP日知录)课件来自于学堂在线直播：

在微博和知乎上关注自然语言处理(NLP)技术的朋友，应该都对#NLP太难了#、#自然语言理解太难了#两个话题标签不陌生，其下汇集了各种不仅难煞计算机、甚至让人也发懵的费解句子或歧义引起的笑话。然而，这些例子只是让人直觉计算机理解人类语言太难了，NLP到底难在哪里，还缺少通俗易懂的介绍。最近刚做完会议投稿，这里花些时间总结下我对这个问题的认识，期望对那些感兴趣NLP的同学有些帮助。欢迎批评意见和建议，未来争取不断更新。

此小号非彼小号

自然语言理解本质是结构预测

要搞清楚自然语言理解难在哪儿，先看自然语言理解任务的本质是什么。作为人工智能关注的三大信息类型(语音、视觉、语言)之一，自然语言文本是典型的无结构数据，由语言符号(如汉字)序列构成。要实现对自然语言的表意的理解，需要建立对该无结构文本背后的语义结构的预测。因此，自然语言理解的众多任务，包括并不限于中文分词、词性标注、命名实体识别、共指消解、句法分析、语义角色标注等，都是在对文本序列背后特定语义结构进行预测。例如，中文分词就是在原本没有空格分隔的句子中增加空格或其他标识，将句子中每个词的边界标记出来，相当于添加了某些结构化语义信息到这个文本序列上。

NLP典型任务：词性标注、命名实体识别、共指消解、句法分析 [1]
面向不同NLP任务，人们制定不同的待预测的语义结构空间：文本分类是最简单的情形，即预定义的类别体系，最常见的如情感分类是postive、neutral、negative三类；中文分词是词边界的标记；词性标注是句子中每个词的词性标签(如名词、动词、形容词、副词、连词、介词等)；命名实体识别是标记哪些词(或多词)是实体名及其实体类型(如人名、地名、机构名等)；共指消解是标记哪些词在做指代以及指代的是前面出现的哪个概念或实体；句法分析则是将句子背后的句法树结构或依存结构预测出来。

自然语言理解的关键是语义表示

不过，以上NLP任务都只是在不断“逼近”对文本的理解，是对文本语义的局部表示。要实现对文本的完整理解，需要建立更完备的语义结构表示空间，这种更完备的语义表示经常成为上述NLP任务进行结构预测的依据。

在统计学习时代，一般采用符号表示(Symbol-based Representation)方案，即每个词都看做互相独立的符号。例如，词袋模型(Bag-of-Words，BOW)是最常用的文本表示方案，忽略文本中词的出现顺序信息，广泛用于文本分类、信息检索等任务。N-Gram也是基于符号表示的语言模型，与BOW模型相比，将句子中词的出现顺序考虑了进来，曾在机器翻译、文本生成、信息检索等任务中广泛使用。

到深度学习时代，一般采用分布式表示(Distributed Representation或Embeddings)方案，每个语言单元(包括但不限于字、词、短语、句子、文档)都用一个低维稠密向量来表示它们的语义信息。分布式表示是深度学习和神经网络的关键技术。分布式表示方案是受到了人脑神经机制的启发，基本思想是[2]：

Each entity is represented by a pattern of activity distributed over many computing elements , and each computing element is involved in representing many different entities.

很大程度上，这种表示方案与索绪尔对语言符号的任意性和结构主义的观点不谋而合。从计算角度来看，NLP很多应用任务就是在判定两个语言单元间的语义相似度，如信息检索是在短语(查询词)和文档之间，文档摘要是在句子和文档之间，分布式表示也为在不同语言单元之间计算语义相似度提供了统一的语义表示基础。

由于忽略了对词语内部语义或词序信息的考量，基于符号表示的词袋模型或N-Gram失之粗略，也受到数据稀疏问题的影响；基于分布式表示的深度学习虽然极大提升NLP性能，却更多只能作为NLP内部表示，可解释性不够。实际上，也有很多学者提出Semantic Parsing任务，探索各类对文本语义更完整的表示和建模方案，仍未得到令人满意的结果。

总之，自然语言理解任务的本质是结构预测，关键则是对语言单元的语义表示能力。那么，自然语言理解为什么难呢，这需要我们先看一下，自然语言都有哪些特点。

自然语言有哪些特点

自然语言是人类在认识世界和改造世界的过程中产生的，归根到底是自然界的产物，因此被称为自然语言。自然语言本身受到人脑语言能力的支配，伴随着人类社会而演化，作为人类使用的最庞杂的符号系统，有很多特点。

创新性

作为人类信息交流的工具，自然语言需要具有强大的创新活力，随时引入对最新概念、表述和意义的表达能力。这方面最常见的就是新词以及旧词新意的出现。例如，有个笑话就是母女二人对“潮”和“晒”产生的不同理解，女儿本意是让母亲帮忙在太阳下晒发潮的被子；而母亲却理解为在朋友圈“晒”女儿的被子让大家看是不是很“潮”。可见，这位母亲大人本人还是很“潮”的，熟练掌握了两个词的的最新意思。

潮和晒
人类语言的创新活力伴随着互联网发展和在线交流的日益密切而更加明显。北京大学邵燕君等学者主编的《破壁书》应该是近年这方面的集大成之作，有兴趣的读者可以读下。我理解，这个书名“破壁书”，也算化用《三体》“破壁人”的一个新词。

解码二次元新词的《破壁书》
新词和旧词新意等都扩展了人类语言的表意空间，也扩展了自然语言理解进行结构预测的语义空间。而这种扩展，带有较强的随意性，缺少严格的描述信息或足够的数据支持，从而为自然语言理解带来挑战。

递归性

以语言学巨擘乔姆斯基为代表的学者认为，递归性(recursion)是人类语言的最重要的特性[4]，这也是乔姆斯基提出转换生成文法的内在动机。虽然，递归性是否为人脑先天具备的语言能力有很多争论，至少从汉语英语两大语言来看，语言表现出的递归性特点不言而喻。

例如最近中美之间出现的这则有意思的表述，就集中反映了语言递归性：S1=”美国干涉中国内政“是一个拥有完整主谓宾结构的句子，被作为另外一个句子S2=”中国抗议 x的法案“中”法案“的定语x；而S2又被作为了S3=”美国抗议 y 是在干涉内政“中”抗议“的宾语y。

递归性带来的语言套娃现象-1: 抗议

递归性带来的语言套娃现象-2：吉尼斯世界纪录
正是这种递归性，为语言带来精准而强大的表述信息和思想的能力，随便翻翻那些著名的哲学著作，充满着带有复杂递归结构的长句。不过，这种精确表达能力是以理解更加费力为代价的，而且递归性也为一句话带来更多的语义理解的可能性，例如”咬死猎人的狗“，到底是咬死了猎人，还是咬死了狗，至少有两种可能的理解。

也可以看到，一旦句子包含了多层嵌套，对人而言理解起来就变得十分困难，很少有人会用这么复杂的结构说话。例如，政府部门层层转发通知导致的”通知的通知的通知“的标题，读起来就非常费力。所以，在自然语言理解实践中，单纯由于递归性造成的困难并不是那么大。

红头文件的语言套娃现象

多义性

自然语言是一个信息传递系统，需要兼顾信号发出者(说话人、作者)和信号接收者(听话人、读者)的效率。如果人类大脑中每个事物都要对应一个独一无二的字词符号，无疑会大幅提高人们的学习、记忆和使用语言的成本。因此，语言中存在大量同音字和一词多义的现象，即一个字或词往往兼顾多个词义，当然，也对应地需要人们根据话语或文本的语境进行消歧处理，才能正确理解其语义。这种多义性，也成为各类语言幽默的主要来源。

自然语言有不同粒度的语言单元，如字、词、短语、句子、语篇，乃至文档互联形成的万维网。多义性普遍存在于各粒度的语言单元上。例如，上面例子中的”潮“和”晒“两字就有两种意思，”小号“则是典型的一词多义，短语层面如”metal fan“也至少有两个意思。

Metal Fan
句子层面的多义性也不少见，如”能穿多少穿多少“，在夏天和冬天各有截然相反的意思。类似形式的语言笑话还不少：

单身的原因有两个，一是谁都看不上，二是谁都看不上。
女孩给男朋友打电话：如果你到了，我还没到，你就等着吧；如果我到了，你还没到，你就等着吧。
单身的原因：原来是喜欢一个人，现在是喜欢一个人。

字面意思的”我想开了“。
自然语言作为人们日常交流的主要方式，相信每个人都有在交流中出现误会闹出笑话甚至冲突的经历，很多时候就是由于歧义造成双方理解产生误差导致的。

“你好不好意思啊“还是”你好，不好意思啊”

主观性

即使语言的多义性得到了正确消歧，语言的字面意思得到了准确理解，同样的话语或文本，仍然会导致人们产生不同的理解，引发不同的思绪。这是因为，每个人都是在认识世界和与外界交互的具体过程中习得语言的，所以人们对语言的理解不可避免受到个人经历和认知水平的影响，带有强烈的主观性。

这种主观性反映在很多方面，以作者与读者间的理解差异为例，常说”一千个读者就有一千个哈姆雷特“，莎士比亚在写这个剧本时，他心目中恐怕有一个确切的哈姆雷特形象以及他希望表达的思想；但读者在阅读时，则不可避免会受到自身经历和认知的影响，而产生不同的理解。这有如一个正态分布，也许作者要传递的信息就在均值附近，而读者的理解则会各有偏差。这也是为什么，同样一部世界名著，有的人就会引起共鸣，有的人觉得索然无味。

中文世界也常说，言有尽而意无穷，特别是在诗歌中，往往寥寥数字，作者也许本意有限，而不同读者会产生不同层次的解读。这也是为什么。再如下面融合多种元素的诗歌：无人机系荔枝来，字面意思正如图所画，而读者如果了解杜牧原诗以及广东人容易将ZHI、SHI发音为JI、XI的特点，则更能会心一笑。

在人们日常对话交流中，这种主观性比比皆是。例如，同样是说”今天好冷啊”，字面意思没有任何难解之处，但如果是女朋友刚进屋说的，那就得赶紧打开空调；如果是宿舍同学说的，恐怕就要嘲笑他为啥穿这么少了。所以，恋爱关系、外交辞令、商务谈判都是需要清醒洞悉对方“言外之意”的危险地区呀。

这都是什么意思？
心理语言学等领域的很多研究表明，人的心理状态(如性格等)会反映在语言表达的蛛丝马迹中。对此有兴趣可以阅读美国学者James Pennebaker的相关成果，他甚至构建了一个词典Linguistic Inquiry and Word Count(LIWC)尝试建立人们使用词语与心理状态的对应关系 [5]。

社会性

人类是社会动物，社会性既是人类的特性，也深刻反映在人类语言中。语言并非固定不变，而是经历了漫长演化。人类的集体生产和生活，对信息交流和记录产生的需求，不断改造着人类语言。全世界的人类早期聚居于不同大洲和地区，互相隔绝，各自的社会形态和生活特点，深刻地影响了不同语言的产生和演化，产生了现在形态各异的人类语言，例如英语等是典型的拼音语言，而汉语则是音义兼顾语言的代表。现代语言学也是从研究总结不同语言体系的特点而发展起来的。作为语言学的分支，演化语言学就在研究人类语言在发音、字形、词法、句法等多个方面的演化过程，而社会语言学则重在研究社会形态与人类语言之间的互相影响的规律。

语言系统受到社会发展的塑造。随着互联网和移动设备的广泛应用，人类之间的交流和联系，比以往任何一个时代都更加紧密，这也反映在人类语言的高速演化，新词和旧词新意层出不穷。不同学科的高速发展，也为语言注入大量专业术语。使用不同语言的人们紧密联系，也为语言引入大量音译等形式的外来词。

语言使用也深刻反映社会形态。人们在不同的社交场合会切换不同的语言风格，如在做公开报告时和在朋友聚会时，语言风格明显不同，庄谐相异。在社交场合，人们也会将有些让人恐惧厌恶或者不雅晦气的概念作为禁忌或避讳词语，进而使用委婉曲折的说法，例如大便改叫出恭或解手，死亡改叫作古归西或见马克思等，中外皆同。

社会语言学还有一个有趣的话题，是探究语言使用与社会地位之间的关系，曾提出语言协调理论(Language coordination)，即不同社会地位的人在相互交流时，地位低的人会从语言风格上适应地位高的人，而地位高的人则不会主动调整自己的语言风格适应别人，这个理论在2012年得到了定量验证 [6]。

最近的定量研究也表明，大规模文本中含有人类社会存在的刻板印象、政治偏见等问题，侧面反映了人类社会对语言的影响 [7]。美国著名认知语言学家莱考夫甚至认为，不同党派的政治家甚至会通过语言使用来影响政治议题的设置 [8]。

自然语言理解难在哪

正是由于其创造性、递归性、多义性、主观性和社会性等特点，既让人类语言具备强大的表达力和生命力，同时呈现出非常复杂而难以捉摸的图景。单从让计算机理解人类语言的角度来考虑，问题难点也许可以归结为如下几个方面。

结构语义表示空间构建

很多学者通过世界、心智和语言的三角形来表述语言的地位，这在索绪尔提出的能指和所指的概念中已初见端倪，哲学中的认识论和语言哲学也是探讨这三者的关系。自然语言理解还没有能力考虑哲学关心的这些问题，不过也能看出，语言作为人类认识世界的产物和工具，必然不是对客观世界的简单映射，而带有人类主观认识的色彩，也受到人脑机能的影响和约束。

各种语义三角
让计算机理解人类语言，需要建构结构化的语义表示空间，只有这个空间的语义表示能力能够与人类心智相媲美，才有可能将人类通过语言要表达的意义进行完美表示和解读。同时，这个语义表示空间还要接受客观世界的校正，消除人类认知中存在的偏见和缺陷，让人工智能更好地服务人类社会。

现在的语义表示方案中，符号表示过于粗略，无法考虑语言符号背后反映的丰富语义信息；而分布式表示虽然具有更强大的表示能力和自由度，但目前只能通过特定任务下的数据学习，只能建立满足特定需求的语义表示，一方面缺少可解释性，鲁棒性差，另一方面通用性和迁移性不足。这些与人脑展现的语义表示能力相比，还有千里之遥。

未来，需要探索更强大的结构化语义表示空间。例如，是否可以将分布式表示与符号表示相结合，既保留分布式表示的泛化能力，又兼顾模块化和层次化符号表示带来的抽象能力。也许这是下一轮自然语言理解取得革命进展的突破口之一。

我们课题组正在致力于构建和利用各类型知识图谱的研究，也算是在这个方向上的努力。通过构建常识知识、语言知识、世界知识、认知知识、领域知识等各类型知识图谱，希望建立起更强大的结构化语义表示空间。

不同类型知识是理解人类语言的钥匙

多模态复杂语境的理解

人类并非孤立地使用语言，语言使用需要考虑其复杂的语境。以语言的多义性为例，存在多义的语言单元，总需要其外部的复杂语境信息进行消歧：字的多义性至少需要所组成的词来消歧；词的歧义性至少需要所在的句子来消歧；句子的意思至少要放在语篇或对话语境中，甚至需要复杂的世界知识来帮助理解。

语言单元的多义性需要其外部复杂语境信息进行消歧
这种语境往往是开放的，也是多模态的，如上下文句子的文本信号、对话者的语气等语音信号、所处环境的视觉信号、甚至其他无法名状的各类信息。实际上，很多歧义产生的笑话，在实际语境下并不会让人产生错误理解。例如下图”三餐二楼欢迎新老师生前来就餐“，虽然从句意上有”欢迎新老师生前来就餐“这种理解的可能性，但在这个场景下其实不可能是这个意思。

三餐二楼欢迎新老师生前来就餐
再如”无线电法国别研究“，虽然从句意上有”无线电法国别研究“这种理解的可能性，但作为一本专著的书名，只可能是”无线电法国别研究“这种理解。

无线电法国别研究
只是对于计算机而言，如何有效理解语言所处的开放复杂语境，从而实现对语言语义的准确理解，仍是挑战性难题。这既与尚未建立有效的结构语义表示空间有关，也与计算机还不能像人那样进行跨模态的高效学习和理解有关。如何有效识别语言理解所需的语境信息，并建立跨模态多通道的建模，依然任重道远。

小结

这里总结了我对自然语言理解到底难在哪儿的看法。自然语言理解作为人工智能的核心问题，正引起越来越多研究者的兴趣，在各类任务上努力探索，自然语言处理最重要的国际学术年会ACL 2020共有3000多篇投稿，受关注程度可见一斑。

自然语言理解大致有不同的层次，我总结研究路径可以大致为：字斟句酌，实现句级消歧和精准理解；瞻前顾后，初步实现文本内的复杂语境建模，建立篇章或对话理解；博学多识，引入更多外部知识，实现跨模态更复杂语境的理解；善解人意，考虑语言的社会性和主观性因素，实现更有”人性“的自然语言理解；冥思苦想，将语言作为思想工具，实现从语言理解到语言使用的跨越，实现创作和规划的能力。

语言是人类文明的象征，是人类智能的集中体现，因此得到非常多学科从不同角度的思考和关注，如语言学中对句法、语义等问题建立的理论，心理语言学对人类语言习得的探讨，语言哲学对语言与世界关系的探讨，认知语言学对隐喻和范畴等问题的探讨，神经语言学对人脑的语言功能的研究，汉语言学界对于汉语流水句、”王冕七岁上死了父亲“等语言现象的研究，等等。这些，都对人类语言不同侧面的特点进行了卓有成效的考察。

自然语言理解的目标是让计算机掌握人类语言能力，需要充分了解和融合这些对人类语言的已有探索成果，以逼近人类语言的本质，才能更好地设计结构化语义表示空间，实现多模态复杂语境的理解，像人那样智能地理解和使用语言。希望有朝一日，计算机也能读懂#NLP太难了#、#自然语言理解太难了#两个话题标签下的那些话。

自然语言理解也不会

参考文献
[1] Julia Hirschberg and Christopher D. Manning. Advances in Natural Language Processing. Science, 2015.

[2] Hinton, Geoffrey E., James L. McClelland, and David E. Rumelhart. Distributed Representations. Pittsburgh, PA: Carnegie-Mellon University, 1984.

[3] 索绪尔[瑞士]. 普通语言学教程. 北京: 商务印书馆, 1980.

[4] Marc D. Hauser, Noam Chomsky, and W. Tecumseh Fitch. The Faculty of Language: What Is It, Who Has It, and How Did It Evolve?. Science, 2002: 1569-1579.

[5] James W. Pennebaker. The Secret Life of Pronouns: What Our Words Say About Us. NY: Bloomsbury, 2011.

[6] Cristian Danescu-Niculescu-Mizil, Lillian Lee, Bo Pang, Jon Kleinberg. Echoes of power: Language effects and power differences in social interaction. WWW, 2012.

[7] Aylin Caliskan, Joanna J. Bryson, and Arvind Narayanan. Semantics Derived Automatically from Language Corpora Contain Human-like Biases. Science, 2017.

[8] 乔治.莱考夫[美]. 别想那只大象. 浙江人民出版社, 2013.####

算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
Python多版本管理与pip升级全攻略：解决冲突与高效实践码界奇点 Python python pip 开发语言 python3.11 源代码管理虚拟现实依赖倒置原则
引言Python作为最流行的编程语言之一，其版本迭代速度与生态碎片化给开发者带来了巨大挑战。据统计，超过60%的Python开发者需要同时维护基于Python3.6+和Python2.7的项目。本文将系统解决以下核心痛点：如何安全地在同一台机器上管理多个Python版本pip依赖冲突的根治方案符合PEP标准的生产环境最佳实践第一部分：Python多版本管理核心方案1.1系统级多版本共存方案Wind
数字孪生技术为UI前端注入新活力：实现产品设计的沉浸式体验 ui设计前端开发老司机 ui
hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年+经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩!一、引言：从“平面交互”到“沉浸体验”的UI革命当用户在电商APP中翻看3D家具模型却无法感知其与自家客厅的匹配度，当设计师在2D屏幕上绘制汽车内饰却难以预判实际乘坐体验——传统UI设计的“平面化、静态化、割裂感”
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
提升企业级数据处理效率！TDengine 四个集群优化点详解 TDengine （老段） TDengine 运维大数据数据库物联网时序数据库服务器运维 tdengine
为了帮助企业更好地进行大数据处理，我们在此前TDengine3.x系列版本中进行了几项与集群相关的优化和新功能开发，以提升集群的稳定性和在异常情况下的恢复能力。这些优化包括clusterID隔离、leaderrebalance、raftlearner和restorednode。本文将对这几项重要优化进行详细阐述，以解答企业在此领域的疑问，并帮助大家更好地应对相关挑战。clusterID隔离问题fi
视频分析：让AI看懂动态画面随机森林404 计算机视觉音视频人工智能 microsoft
引言：动态视觉理解的革命在数字信息爆炸的时代，视频已成为最主要的媒介形式。据统计，每分钟有超过500小时的视频内容被上传到YouTube平台，而全球互联网流量的82%来自视频数据传输。面对如此海量的视频内容，传统的人工处理方式已无法满足需求，这正是人工智能视频分析技术大显身手的舞台。视频分析技术赋予机器"看懂"动态画面的能力，使其能够自动理解、解释甚至预测视频中的内容，这一突破正在彻底改变我们与视
Tomcat：Java Web应用的幕后英雄互联网动态分析 tomcat
在当今数字化浪潮中，Java作为一门成熟且广泛应用的编程语言，支撑着无数企业级应用和互联网服务的稳定运行。而在JavaWeb开发领域，Tomcat无疑是一个举足轻重的存在，它宛如一位默默耕耘的幕后英雄，为众多Web应用提供了可靠的运行环境。Tomcat的起源与发展Tomcat的故事始于1999年，当时SunMicrosystems（后被Oracle收购）与Apache软件基金会合作，旨在为Java
Python的科学计算库NumPy（一） linlin_1998 python numpy 开发语言
NumPy(NumericalPython)是Python中最基础、最重要的科学计算库之一，提供了高性能的多维数组（ndarray）对象和大量数学函数，是许多数据科学、机器学习库（如Pandas、SciPy、TensorFlow等）的基础依赖。1.创建一个numpy里面的一维数组importnumpyasnp###通过array方法创建一个ndarrayarray1=np.array([1,2,3
法律科技领域人工智能代理构建的十个经验教训，一位人工智能工程师通过构建、部署和维护智能代理的经验教训来优化法律工作流程的历程。知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 ai
目录介绍什么是代理人？为什么它对法律如此重要？法律技术中代理用例示例-合同审查代理-法律研究代理在LegalTech中使用代理的十个教训-教训1：即使代理很酷，它们也不能解决所有问题-教训2：选择最适合您用例的框架-教训3：能够快速迭代不同的模型-教训4：从简单开始，必要时扩展-教训5：使用跟踪解决方案；您将需要它-教训6：确保跟踪成本，代理循环可能很昂贵-教训7：将控制权交给最终用户（人在环路中
Llama-Omni会说话的人工智能“语音到语音LLM” 利用低延迟、高质量语音转语音 AI 彻底改变对话方式（教程含源码）知识大胖 NVIDIA GPU和大语言模型开发教程 llama 人工智能 nvidia llm
介绍“单靠技术是不够的——技术与文科、人文学科的结合，才能产生让我们心花怒放的成果。”——史蒂夫·乔布斯近年来，人机交互领域发生了重大变化，尤其是随着ChatGPT、GPT-4等大型语言模型(LLM)的出现。虽然这些模型主要基于文本，但人们对语音交互的兴趣日益浓厚，以使人机对话更加无缝和自然。然而，实现语音交互而不受语音转文本处理中常见的延迟和错误的影响仍然是一个挑战。关键字：Llama-Omni
什么是热力学计算？它如何帮助人工智能发展？知识大胖 NVIDIA GPU和大语言模型开发教程人工智能量子计算
现代计算的基础是晶体管，这是一种微型电子开关，可以用它构建逻辑门，从而创建CPU或GPU等复杂的数字电路。随着技术的进步，晶体管变得越来越小。根据摩尔定律，集成电路中晶体管的数量大约每两年增加一倍。这种指数级增长使得计算技术呈指数级发展。然而，晶体管尺寸的缩小是有限度的。我们很快就会达到晶体管无法工作的阈值。此外，人工智能的进步使得对计算能力的需求比以往任何时候都更加迫切。根本问题是自然是随机的（
上海交大：工具增强推理agent
标题：SciMaster:TowardsGeneral-PurposeScientificAIAgentsPartI.X-MasterasFoundation-CanWeLeadonHumanity’sLastExam?来源：arXiv,2507.05241摘要人工智能代理的快速发展激发了利用它们加速科学发现的长期雄心。实现这一目标需要深入了解人类知识的前沿。因此，人类的最后一次考试（HLE）为评
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
中国银联豪掷1亿采购海光C86架构服务器信创新态势海光芯片 C86 国产芯片海光信息
近日，中国银联国产服务器采购大单正式敲定，基于海光C86架构的服务器产品中标，项目金额超过1亿元。接下来，C86服务器将用于支撑中国银联的虚拟化、大数据、人工智能、研发测试等技术场景，进一步提升其业务处理能力、用户服务效率和信息安全水平。作为我国重要的银行卡组织和金融基础设施，中国银联在全球183个国家和地区设有银联受理网络，境内外成员机构超过2600家，是世界三大银行卡品牌之一。此次中国银联发力
【亲测免费】 Mamba：快速跨平台的包管理器林梦雅
Mamba：快速跨平台的包管理器项目基础介绍和主要编程语言Mamba是一个用C++重新实现的Conda包管理器。它旨在提供比传统Conda更快的包管理和依赖解析速度。Mamba的核心部分使用C++编写，以确保高效性和性能。同时，Mamba也使用了Python和其他一些辅助语言来实现其功能。项目核心功能Mamba的核心功能包括：快速依赖解析：利用libsolv库进行高效的依赖解析，这是RedHat、
AI人工智能浪潮中文心一言的独特优势
AI人工智能浪潮中文心一言的独特优势：为什么它是中国市场的“AI主力军”？关键词：文心一言,AI大模型,中文处理,多模态融合,产业落地,安全可控,百度ERNIE摘要：在全球AI大模型浪潮中，百度文心一言（ERNIEBot）凭借“懂中文、会多模态、能落地、守规矩”的四大核心优势，成为中国市场最具竞争力的AI产品之一。本文将用“超级大脑”的比喻，从中文理解、多模态能力、产业生态融合、安全可控性四个维度
全面探索Kafka：架构、应用与流处理
Kafka：企业级消息系统与流处理平台的深度解析ApacheKafka作为分布式流处理平台，广泛应用于大数据处理和实时分析领域。本文将基于其官方文档，详细探讨Kafka的核心功能、应用场景以及如何进行有效管理。背景简介Kafka作为高吞吐量的消息系统，支持企业级的发布-订阅模式。它能够处理大量实时数据，并支持高并发读写操作。本文将依据Kafka官方文档的内容，逐层深入，从入门到高级应用，帮助读者全
Flink时间窗口详解 bxlj_jcj Flink flink 大数据
一、引言在大数据流处理的领域中，Flink的时间窗口是一项极为关键的技术，想象一下，你要统计一个电商网站每小时的订单数量。由于订单数据是持续不断产生的，这就形成了一个无界数据流。如果没有时间窗口的概念，你就需要处理无穷无尽的数据，难以进行有效的统计分析。而时间窗口的作用，就是将这无界的数据流按照时间维度切割成一个个有限的“数据块”，方便我们对这些数据进行处理和分析。比如，我们可以定义一个1小时的时
什么是ORM？它如何简化后端开发？破碎的天堂鸟学习教程数据库
什么是ORM？ORM（对象关系映射，Object-RelationalMapping）是一种编程技术，用于解决面向对象编程语言与关系型数据库之间的数据转换问题。其核心是将数据库中的表结构映射为程序中的类和对象，使开发者能够以操作对象的方式操作数据库，而非直接编写SQL语句。具体而言：映射机制：数据库表→编程语言中的类（如User类对应users表）表字段→类的属性（如username字段对应Use
正义的算法迷宫—人工智能重构司法体系的技术悖论与文明试炼
一、法庭的数字化迁徙当美国威斯康星州法院采纳COMPAS算法评估被告再犯风险，当中国"智慧法院"系统年处理1.2亿件案件，司法体系正经历从石柱法典到代码裁判的范式革命。这场转型的核心驱动力是司法效率与公正的永恒张力：美国重罪案件平均审理周期达18个月，中国基层法官年人均结案357件（是德国同行的6倍），而算法能在0.3秒内完成百万份文书比对。人工智能渗透司法引发三重裂变：证据分析从经验推断转向数据
2023高薪前端面试题（二、前端核心——Ajax）
原生AjaxAjax简介Ajax全程为AsynchronousJavaScript+XML，就是异步的JS和XML通过AJAX可以在浏览器中向服务器发送异步请求，最大的优势是：无刷新获取数据，实现局部刷新Ajax是一种用于创建快速动态网页的技术AJAX不是新的编程语言，而是一种将现有的标准组合在一起使用的新方式Ajax的应用场景页面上拉加载更多数据列表数据无刷新分页表单项离开焦点数据验证搜索框提示
探索实时流处理的未来：Kafka Streams 深度指南秋或依
探索实时流处理的未来：KafkaStreams深度指南项目介绍欢迎进入KafkaStreams：实时流处理的世界！这不仅仅是一本书，更是一个通往流处理领域深层奥秘的门户。由PrashantPandey编著，这本书以ApacheKafka2.1中的KafkaStreams库为核心，为读者铺就了一条从理解基础概念到熟练掌握KafkaStreams编程的路径。无论是软件工程师、数据架构师，还是对大数据处
Elasticsearch搜索引擎存储：从原理到实践的全景解析 Python×CATIA工业智造搜索引擎 elasticsearch 大数据
引言在大数据时代，数据规模呈指数级增长，传统数据库的模糊查询、实时分析能力逐渐成为瓶颈。Elasticsearch（简称ES）凭借其分布式架构、实时搜索和灵活的数据分析能力，成为企业级搜索与存储的核心引擎。截至2025年，ES在全球日志分析、电商搜索、实时监控等场景的市场占有率超过60%。本文将从存储架构、核心技术、应用场景及优化策略四个维度，深入解析Elasticsearch的设计哲学与实践价值
【python实战】不玩微博，一封邮件就能知道实时热榜，天秀吃瓜一条coding 从实战学python 人工智能 python linux 爬虫
❤️欢迎订阅《从实战学python》专栏，用python实现办公自动化、数据可视化、人工智能等各个方向的实战案例，有趣又有用！❤️更多精品专栏简介点这里有的人金玉其表败絮其中，有的人却若彩虹般绚烂，怦然心动前言哈喽，大家好，我是一条。在生活中我是一个不太喜欢逛娱乐平台的人，抖音、快手、微博我手机里都没装，甚至微信朋友圈都不看，但是自从开始写博客，有些热度不得不蹭。所以就有了这样一个需求，能不能让微
【Kafka专栏 13】Kafka的消息确认机制：不是所有的“收到”都叫“确认”！
作者名称：夏之以寒作者简介：专注于Java和大数据领域，致力于探索技术的边界，分享前沿的实践和洞见文章专栏：夏之以寒-kafka专栏专栏介绍：本专栏旨在以浅显易懂的方式介绍Kafka的基本概念、核心组件和使用场景，一步步构建起消息队列和流处理的知识体系，无论是对分布式系统感兴趣，还是准备在大数据领域迈出第一步，本专栏都提供所需的一切资源、指导，以及相关面试题，立刻免费订阅，开启Kafka学习之旅！
在mac m1基于llama.cpp运行deepseek
lama.cpp是一个高效的机器学习推理库，目标是在各种硬件上实现LLM推断，保持最小设置和最先进性能。llama.cpp支持1.5位、2位、3位、4位、5位、6位和8位整数量化，通过ARMNEON、Accelerate和Metal支持Apple芯片，使得在MACM1处理器上运行Deepseek大模型成为可能。1下载llama.cppgitclonehttps://github.com/ggerg
MCP协议：AI时代的“万能插座”如何重构IT生态与未来
MCP协议：AI时代的“万能插座”如何重构IT生态与未来在人工智能技术爆炸式发展的浪潮中，一个名为ModelContextProtocol（MCP）的技术协议正以惊人的速度重塑IT行业的底层逻辑。2024年11月由Anthropic首次发布，MCP在短短半年内获得OpenAI、谷歌、亚马逊、阿里、腾讯等全球科技巨头的支持，被业内誉为AI时代的HTTP协议或USB-C接口，正在成为连接大模型与现实世
《算法备案全攻略：规范与流程引领数字时代新秩序》算法及大模型备案顾问刘老师算法备案深度学习 AIGC 语言模型算法人工智能
一、算法备案：开启合规新征程（一）备案规定的起源与发展2022年国家互联网信息办公室、工业和信息化部、公安部、国家市场监督管理总局联合发布《互联网信息服务算法推荐管理规定》，自2022年3月1日起施行。此后，相关规定不断完善和演进。如国家网信办于2022年8月、10月及2023年1月先后三次公布了《境内互联网信息服务算法备案清单》。同时，2022年发布的最高人民法院《关于规范和加强人工智能司法应用
【机器学习笔记Ⅰ】9 特征缩放巴伦是只猫机器学习机器学习笔记人工智能
特征缩放（FeatureScaling）详解特征缩放是机器学习数据预处理的关键步骤，旨在将不同特征的数值范围统一到相近的尺度，从而加速模型训练、提升性能并避免某些特征主导模型。1.为什么需要特征缩放？(1)问题背景量纲不一致：例如：特征1：年龄（范围0-100）特征2：收入（范围0-1,000,000）梯度下降的困境：量纲大的特征（如收入）会导致梯度更新方向偏离最优路径，收敛缓慢。量纲小的特征（如
统一思想认识永夜-极光思想
1.统一思想认识的基础,才能有的放矢原因: 总有一种描述事物的方式最贴近本质,最容易让人理解. 如何让教育更轻松,在于找到最适合学生的方式. 难点在于,如何模拟对方的思维基础选择合适的方式. &
Joda Time使用笔记 bylijinnan java joda time
Joda Time的介绍可以参考这篇文章： http://www.ibm.com/developerworks/cn/java/j-jodatime.html 工作中也常常用到Joda Time，为了避免每次使用都查API，记录一下常用的用法： /** * DateTime变化（增减） */ @Tes
FileUtils API eksliang FileUtils FileUtils API
转载请出自出处：http://eksliang.iteye.com/blog/2217374 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
各种新兴技术不懂事的小屁孩技术
1:gradle Gradle 是以 Groovy 语言为基础，面向Java应用为主。基于DSL（领域特定语言）语法的自动化构建工具。现在构建系统常用到maven工具，现在有更容易上手的gradle，搭建java环境: http://www.ibm.com/developerworks/cn/opensource/os-cn-gradle/ 搭建android环境： http://m
tomcat6的https双向认证酷的飞上天空 tomcat6
1.生成服务器端证书 keytool -genkey -keyalg RSA -dname "cn=localhost,ou=sango,o=none,l=china,st=beijing,c=cn" -alias server -keypass password -keystore server.jks -storepass password -validity 36
托管虚拟桌面市场势不可挡蓝儿唯美
用户还需要冗余的数据中心，dinCloud的高级副总裁兼首席营销官Ali Din指出。该公司转售一个MSP可以让用户登录并管理和提供服务的用于DaaS的云自动化控制台，提供服务或者MSP也可以自己来控制。在某些情况下，MSP会在dinCloud的云服务上进行服务分层，如监控和补丁管理。 MSP的利润空间将根据其参与的程度而有所不同，Din说。 “我们有一些合作伙伴负责将我们推荐给客户作为个
spring学习——xml文件的配置 a-john spring
在Spring的学习中，对于其xml文件的配置是必不可少的。在Spring的多种装配Bean的方式中，采用XML配置也是最常见的。以下是一个简单的XML配置文件： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.or
HDU 4342 History repeat itself 模拟 aijuans 模拟
来源：http://acm.hdu.edu.cn/showproblem.php?pid=4342 题意：首先让求第几个非平方数，然后求从1到该数之间的每个sqrt(i)的下取整的和。思路：一个简单的模拟题目，但是由于数据范围大，需要用__int64。我们可以首先把平方数筛选出来，假如让求第n个非平方数的话，看n前面有多少个平方数，假设有x个，则第n个非平方数就是n+x。注意两种特殊情况，即
java中最常用jar包的用途 asia007 java
java中最常用jar包的用途 jar包用途axis.jarSOAP引擎包commons-discovery-0.2.jar用来发现、查找和实现可插入式接口，提供一些一般类实例化、单件的生命周期管理的常用方法.jaxrpc.jarAxis运行所需要的组件包saaj.jar创建到端点的点到点连接的方法、创建并处理SOAP消息和附件的方法，以及接收和处理SOAP错误的方法. w
ajax获取Struts框架中的json编码异常和Struts中的主控制器异常的解决办法百合不是茶 js json编码返回异常
一:ajax获取自定义Struts框架中的json编码出现以下问题: 1,强制flush输出 json编码打印在首页 2, 不强制flush js会解析json 打印出来的是错误的jsp页面却没有跳转到错误页面 3, ajax中的dataType的json 改为text 会
JUnit使用的设计模式 bijian1013 java 设计模式 JUnit
JUnit源代码涉及使用了大量设计模式 1、模板方法模式（Template Method）定义一个操作中的算法骨架，而将一些步骤延伸到子类中去，使得子类可以不改变一个算法的结构，即可重新定义该算法的某些特定步骤。这里需要复用的是算法的结构，也就是步骤，而步骤的实现可以在子类中完成。
Linux常用命令（摘录） sunjing crond chkconfig
chkconfig --list 查看linux所有服务 chkconfig --add servicename 添加linux服务 netstat -apn | grep 8080 查看端口占用 env 查看所有环境变量 echo $JAVA_HOME 查看JAVA_HOME环境变量安装编译器 yum install -y gcc
【Hadoop一】Hadoop伪集群环境搭建 bit1129 hadoop
结合网上多份文档，不断反复的修正hadoop启动和运行过程中出现的问题，终于把Hadoop2.5.2伪分布式安装起来，跑通了wordcount例子。Hadoop的安装复杂性的体现之一是，Hadoop的安装文档非常多，但是能一个文档走下来的少之又少，尤其是Hadoop不同版本的配置差异非常的大。Hadoop2.5.2于前两天发布，但是它的配置跟2.5.0，2.5.1没有分别。 &nb
Anychart图表系列五之事件监听白糖_ chart
创建图表事件监听非常简单：首先是通过addEventListener('监听类型',js监听方法)添加事件监听，然后在js监听方法中定义具体监听逻辑。以钻取操作为例，当用户点击图表某一个point的时候弹出point的name和value，代码如下： <script> //创建AnyChart var chart = new AnyChart(); //添加钻取操作&quo
Web前端相关段子 braveCS web前端
Web标准：结构、样式和行为分离使用语义化标签 0）标签的语义：使用有良好语义的标签，能够很好地实现自我解释，方便搜索引擎理解网页结构，抓取重要内容。去样式后也会根据浏览器的默认样式很好的组织网页内容，具有很好的可读性，从而实现对特殊终端的兼容。 1）div和span是没有语义的：只是分别用作块级元素和行内元素的区域分隔符。当页面内标签无法满足设计需求时，才会适当添加div
编程之美-24点游戏 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Arrays; import java.util.HashSet; import java.util.List; import java.util.Random; import java.util.Set; public class PointGame { /**编程之美
主页面子页面传值总结 chengxuyuancsdn 总结
1、showModalDialog returnValue是javascript中html的window对象的属性,目的是返回窗口值,当用window.showModalDialog函数打开一个IE的模式窗口时,用于返回窗口的值主界面 var sonValue=window.showModalDialog("son.jsp"); 子界面 window.retu
[网络与经济]互联网+的含义 comsci 互联网+
互联网+后面是一个人的名字 = 网络控制系统互联网+你的名字 = 网络个人数据库每日提示:如果人觉得不舒服,千万不要外出到处走动,就呆在床上,玩玩手游,更不能够去开车,现在交通状况不
oracle 创建视图 with check option daizj 视图 view oralce
我们来看下面的例子： create or replace view testview as select empno,ename from emp where ename like ‘M%’ with check option; 这里我们创建了一个视图，并使用了with check option来限制了视图。然后我们来看一下视图包含的结果： select * from testv
ToastPlugin插件在cordova3.3下使用 dibov Cordova
自己开发的Todos应用，想实现“ 再按一次返回键退出程序 ”的功能，采用网上的ToastPlugins插件，发现代码或文章基本都是老版本，运行问题比较多。折腾了好久才弄好。下面吧基于cordova3.3下的ToastPlugins相关代码共享。 ToastPlugin.java package&nbs
C语言22个系统函数 dcj3sjt126com c function
C语言系统函数一、数学函数下列函数存放在math.h头文件中Double floor(double num) 求出不大于num的最大数。Double fmod(x, y) 求整数x/y的余数。Double frexp(num, exp); double num; int *exp; 将num分为数字部分（尾数）x和以2位的指数部分n，即num=x*2n，指数n存放在exp指向的变量中，返回x。D
开发一个类的流程 dcj3sjt126com 开发
本人近日根据自己的开发经验总结了一个类的开发流程。这个流程适用于单独开发的构件，并不适用于对一个项目中的系统对象开发。开发出的类可以存入私人类库，供以后复用。以下是开发流程： 1. 明确类的功能，抽象出类的大概结构 2. 初步设想类的接口 3. 类名设计（驼峰式命名） 4. 属性设置(权限设置) 判断某些变量是否有必要作为成员属
java 并发 shuizhaosi888 java 并发
能够写出高伸缩性的并发是一门艺术在JAVA SE5中新增了3个包 java.util.concurrent java.util.concurrent.atomic java.util.concurrent.locks 在java的内存模型中，类的实例字段、静态字段和构成数组的对象元素都会被多个线程所共享，局部变量与方法参数都是线程私有的，不会被共享。
Spring Security（11）——匿名认证 234390216 Spring Security ROLE_ANNOYMOUS 匿名
匿名认证目录 1.1 配置 1.2 AuthenticationTrustResolver 对于匿名访问的用户，Spring Security支持为其建立一个匿名的AnonymousAuthenticat
NODEJS项目实践0.2[ express,ajax通信...] 逐行分析JS源代码 Ajax nodejs express
一、前言通过上节学习，我们已经 ubuntu系统搭建了一个可以访问的nodejs系统，并做了nginx转发。本节原要做web端服务及 mongodb的存取，但写着写着，web端就
在Struts2 的Action中怎样获取表单提交上来的多个checkbox的值 lhbthanks java html struts checkbox
第一种方法：获取结果String类型在 Action 中获得的是一个 String 型数据，每一个被选中的 checkbox 的 value 被拼接在一起，每个值之间以逗号隔开(,)。所以在 Action 中定义一个跟 checkbox 的 name 同名的属性来接收这些被选中的 checkbox 的 value 即可。以下是实现的代码：前台 HTML 代码：
003.Kafka基本概念 nweiren hadoop kafka
Kafka基本概念：Topic、Partition、Message、Producer、Broker、Consumer。 Topic：消息源（Message）的分类。 Partition： Topic物理上的分组，一
Linux环境下安装JDK roadrunners jdk linux
1、准备工作创建JDK的安装目录： mkdir -p /usr/java/ 下载JDK，找到适合自己系统的JDK版本进行下载： http://www.oracle.com/technetwork/java/javase/downloads/index.html 把JDK安装包下载到/usr/java/目录，然后进行解压： tar -zxvf jre-7
Linux忘记root密码的解决思路 tomcat_oracle linux
1：使用同版本的linux启动系统，chroot到忘记密码的根分区passwd改密码　　2：grub启动菜单中加入init=/bin/bash进入系统，不过这时挂载的是只读分区。根据系统的分区情况进一步判断. 　　3: grub启动菜单中加入 single以单用户进入系统. 　　4:用以上方法mount到根分区把/etc/passwd中的root密码去除　　例如: 　　ro
跨浏览器 HTML5 postMessage 方法以及 message 事件模拟实现 xueyou jsonp jquery 框架 UI html5
postMessage 是 HTML5 新方法，它可以实现跨域窗口之间通讯。到目前为止，只有 IE8+, Firefox 3, Opera 9, Chrome 3和 Safari 4 支持，而本篇文章主要讲述 postMessage 方法与 message 事件跨浏览器实现。postMessage 方法 JSONP 技术不一样，前者是前端擅长跨域文档数据即时通讯，后者擅长针对跨域服务端数据通讯，p