captain_hwz

ChatGPT研究分享：机器第一次开始理解人类世界

0、为什么会对ChatGPT感兴趣

一开始，我对ChatGPT是没什么关注的，无非就是有更大的数据集，完成了更大规模的计算，所以能够回答更多的问题。

但后来了解到几个案例，开始觉得这个事情并不简单。我先分别列举出来，具体解读在文末说明。

1）ChatGPT能够进行数学运算，但大数运算和复杂运算，基本都会出错。

2）ChatGPT能够解读出最新的网站内容。（已知训练集停留在了2021年）

认识算法原理

个人认为，“算法的研究，本质上是在还原人类的思维”。将算法原理和人类思维过程进行对比，能够更好的理解ChatGPT是什么，以及为什么能够做到现在的效果。

1.1 Encoder-Decoder：解决特征工程问题

受到造物者的馈赠，大脑能够完成复杂的思维运算。但不幸的是，这个思维过程仍然是黑盒的。

给出一张图片，如果问题是这张图片是什么色调，你能够通过统计像素点色度的分布，给出准确答案；如果问题是这张图片是谁，你同样能够给出答案，但无法描述过程。

你工作中处理的各类问题，属于那种类型？

Anyway，不论思维过程多么复杂，它的框架是通用的：

传统机器学习，是在学习人脑是如何进行“运算”的。比如：“1”，“3”，“5”是单数，“2”，“4”，“6”是双数；算法可以帮你得出 x/2=1 是单数，x/2=0是双数。

（个人认为）深度学习，则开始学习“从编码特征到运算”这一整个过程。

显然，解决的问题越复杂，需要的数据量越多。但人脑并不需要这么多数据，我认为核心差距是，算法目前并不善于“总结归纳”中间过程。

于是，Encoder-Decoder结构就诞生了：

传统机器学习的训练模式是，人工对输入数据进行清洗，转化为特征向量（中间编码），然后基于特征和标签，训练模型（Decoder）。

但在复杂问题中，特征工程也变成了一个“不可描述”的过程。于是开始弱化特征工程的作用，直接用最原始的数据去进行训练，企图让算法解决整个黑盒过程。也因此开始强调数据量的大小，因为过渡黑盒，需要足够多的数据训练，大力出奇迹。

而Encoder-Decoder则是做了一层提炼，同时训练两个模型，一个用于学习编码过程，一个用于学习运算过程。各司其职，大幅提升了整体的效率和可控性。

1.2 RNN和Attention：解决序列化的问题

和常见的分类、打标任务不同，语言是有序的。需要相应的上下文和描述语句，才能正确理解。比如，高考经典病句“三个学校的老师”，到底是来自三个不同学校的老师，还是同一个学校的三个老师，是会产生歧义的。

因此，基于Encoder-Decoder，设计了如下的RNN结构：

从信息流的层面理解，所有信息通过编码，逐单元向前传递。解码过程，也是逐单元进行信息提取，同时把已提取的信息也作为补充输入。

跟背课文的过程很像。先背第一段，再带着第一段的记忆，背第二段。全部背完后，先默写第一段，然后带着已默写的第一段，默写第二段。

RNN的设计模式，把语言的有序性很好的体现了出来。但同样存在一个问题，编码和解码的过程是单向的，信息会逐渐丢失，越靠前的信息丢失的越厉害。

同样以背课文为例。RNN就像是只允许你背一遍，背完第一段就不允许再看第一段。那么必然最后一段记忆清晰，第一段则记不住多少。

为了弥补这个问题，于是设计了Attention机制。相当于，尽管只允许你背一遍，但会在默写的时候，给你提示，帮助你正确的默写出来。

一种最简单的全局Attention机制如下（相当于提供了一个大纲）：

而目前最流行的Attention机制是Self-Attention（相当于给划了重点）：

上图中，之所以会将three给到school，正是因为在Attention中，明确指出了“三个”是用来修饰“学校”的。

1.3 Transformer：解决长序列的问题（并没有完全弄懂）

RNN的结构虽然非常精妙的表达出了语言的有序性，但和人脑的思维仍然存在差异：人会从全局视角去接收输入，而不是单向处理。

你在背课文的时候，显然不会局限自己只背一遍。而是通篇反复阅读，没有顺序，直到全部背下来。

因此，Transformer打破了RNN的单向传递机制，同时输入全部信息，并完全基于Attention去实现。其中涉及到了几个关键点：

Positional Encoding：虽然顺序输入不重要，但仍然需要知道每个字的位置是什么，因此设计了Positional Encoding。相当于你可以随意阅读，并且仍然知道第几段是第几段。

Multi-Head Attention：原理上仍然和Self Attention接近，但是增加了多个并行的维度。相当于用不同的角度去解读重点是什么，增加了信息传递的丰富性。相当于从多个角度去划重点。

encoder层数和decoder层数：出现神经网络中堆叠层数的效果。本质是通过全局传递的模式，增大了信息传递效率，堆层数有利于增强学习能力。（RNN中的encoder和decoder单元也存在层数的概念，但是不属于核心设计，因此通常不体现。）

个人理解的效果如下所示：

下面这个动图也比较形象

1.4 ChatGPT：解决训练效率的问题

上述的模型结构，不论怎么优化，本质过程都还是“使用大量数据进行训练，生成模型后进行预测”的过程。而问题的复杂度越高，需要的数据量越大，训练的计算成本也越高。不管结构如何精妙，仍然会存在一个效率带来的瓶颈。

而ChatGPT的核心优势，就是突破了效率瓶颈。其训练过程如下：

1）输入“问题”和“正确答案”，训练初始的NLP模型。

2）输入“问题”、“初始模型的答案”和“正确的分数”，训练奖励模型。（实际上提供的是“正确的排序”，这里用“分数”为了更好的理解。）

3）输入“问题”，不提供“正确答案”，用奖励模型去训练初始的NLP模型。

之所以能够提效，就是第三步已经剔除了“人工打标”这个成本最高的工作，两个模型自身就构成了训练体系。

传统的训练过程，相当于告诉你一堆问题和答案，你去寻找其中的规律；而ChatGPT的训练过程，相当于教你判断善恶，建立三观，你自己再基于三观，去寻找最正确的答案。

2、从结果推断具体实现

OpenAI没有完全公开其实现逻辑，但是通过一些有意思的问答表现，能够推断包含哪些细节因素。

2.1 同样的输入给予不同的结果：存在随机因素

不论算法多么复杂，它仍然是符合“因果论”的，不是“混沌”的。这就意味着，给特定输入就会返回特定的输出，具备一一对应的关系。

但在ChatGPT的问答过程中，并不符合这个效果。对于同一个问题，不论是整体内容，还是细节措辞，都会存在差异。

又基本可以断定，ChatGPT不是一个实时更新的模型，仍然依赖人工去进行周期性的迭代调优。因此，ChatGPT一定在某个环节中加入了“随机因素”，可能的位置在：

输入：假设把时间、环境等因素一并加入到输入中去，那么输出结果会发生改变。ChatGPT是否有在考虑基于这些因素，产生个性化的对话风格？

预测：在常规算法训练中，往往也会加入随机因素，以避免陷入“局部最优解”。ChatGPT目前应该是处于公测，收集训练集的阶段，是否特意加上随机因素，来扩大样本丰富性？

排序：算法本质上是在输出概率最大的解，但也可能是在TOP中选一个。应该也能实现扩大样本丰富性的效果。

我更倾向于是为了收集样本。因为从AI的商业化应用角度来说，随机性并不是个有利因素，人们更需要可靠可信的对话机器人。

2.2 对于复杂问题的响应时间会更长：存在预处理逻辑，判断问题的复杂度

问题的复杂度，会影响训练的时间，因为算法需要更多的数据和计算来推导因果关系。但一旦训练完成，模型就固定了下来，运算的过程不会因为输入的改变而改变。

但实际体验过程中，ChatGPT对于复杂性的问题，明显表现出了更长的运算时间（不论是开始响应的时间，还是逐字吐出的速度。因为还包含网络因素，不确定这个现象是否客观）

如果这个命题成立的话，有两种实现可能：

有多种模型实习：ChatGPT背后同时训练了多个不同复杂度的模型。在实际执行的时候，它会先判断问题的复杂度，再去选择用哪个模型来生成答案。

具备运算优化能力：ChatGPT模型自带的编码能力，会对运算复杂度进行优化。比如对于简单的问题，引入更多的乘0操作，从而大幅提升运算速度。

直觉判断，后者的概率更高。这也意味着ChatGPT的表现力更贴近人类的思维了：同样一个人，对复杂问题会思考的时间更长。

2.3 并不能发起测试请求，但仍然能够得到答案：不存在准确匹配关键词的逻辑，更多依赖相似性

回到一开始的漏洞分析场景。

从原理上来说，ChatGPT是不支持发起请求的。但当输入url的时候，ChatGPT仍然能够作出回答。

经过一些测试，可以很明确的发现，ChatGPT是基于domain、url中的信息去做的内容匹配。一个典型表现是，当你输入相似但并不存在的url时，ChatGPT仍然能够作出回答。

这个过程依靠的就是路径相似性。ChatGPT并不认为url是个一一对应的关键词，而是认为url中包含一定的逻辑。因此它会通过domain、path等文字，去推断网页的真实内容，并进行回答。（通过"Apache HTTP"、"2.4.0"、"2.4.49"这几个关键词，也并没有找到完全匹配的漏洞，应当是进行了一定的杜撰。）

换一句话说，ChatGPT的模型结构会让它认为万事均由潜在逻辑关系。但也有很多场景是强加的匹配规则，并没有逻辑，而ChatGPT强行计算出了一种逻辑。

3、从原理推导应用场景

总结一下，ChatGPT擅长逻辑（尤其是语言逻辑），但缺乏专业知识的积累。

基于此，可以推导一下ChatGPT适用的场景：

3.1 常规NLP任务（翻译、分类、总结等）

本质工作，不多描述

3.2 AIGC（讲故事、生成话术、串联框架等）

可以将ChatGPT视为一个“语言艺术家”，擅长基于一些关键点，去做逻辑串联，生成完整的答案。

因此，大部分只需要逻辑，不需要事实的场景，ChatGPT都能应付的来。

3.3 代码

ChatGPT在代码领域表现相当优秀，但显然没有人告诉它各种编程语言的语法。个人推测，是因为代码本身是以语言为基础的，所以ChatGPT能够很顺利的掌握。

而编写代码的过程，其本质上是一种“翻译”流程：程序员将脑海中的逻辑，编写成特定的编程语言。

“语言”和“翻译”，本就是ChatGPT的老本行，表现优异自不在话下。

3.4 逆向

逆向本质上也是一种“翻译”：将加密、编码过的汇编代码，还原为可读的代码，甚至还原为清晰的逻辑。

目前ChatGPT的训练集主要来源于互联完上搜集的信息。如果能够喂给它大量的源码和汇编代码，以及相关的分析报告，应当能够在逆向领域表现出优异的成绩。

4、一些思考点

4.1 从ChatGPT的能力看待：“科技奇异点”

我对下一个“科技奇异点”的定义是：机器具备人类的思维，并可以替代人类完成推理和研究工作，从而大幅提升生产力。

而基于上述对ChatGPT的研究，我认为已经接近这个临界点，因为这是我认知内，机器第一次开始理解人类世界。

对“理解”这个词，我再展开说明一下。过往的机器学习，都是在特定领域下完成某一项特定的工作任务（包括去年爆火的AIGC）。这也就意味着机器并不理解问题，只是执行人们给它安排好的算式。

对话式机器人其实很早就有了（Siri、小爱同学、小度小度等），但其核心是“功能库”。这些机器人的工作模式是“接受对话->提取关键词->匹配功能库->执行特定功能”，而ChatGPT是在没有“功能库”的情况下，实现的各种问答。

换言之，传统机器学习是某种工具，而ChatGPT则是一个“被灌输了大量知识的婴幼儿”（国外有测试表明ChatGPT符合9岁小孩的“心智”）。

4.2 从ChatGPT的原理看待：语言的力量

我过去没有重视过NLP领域的算法发展，觉得和传统搜广推并没有本质区别。依靠海量训练集进行总结记忆，然后回答学习过的内容，不会进行推理和创造。但在ChatGPT表现出惊人的知识储备后（回答从没见过的问题，做从未见过的运算），确实引起了一些思考。

显然，ChatGPT在特定专业领域的能力并不强，甚至经常会杜撰一些内容，你也许会嘲笑ChatGPT在一本正经的胡说八道。但我看到的却是，ChatGPT仅依靠语言能力，就推理出了很多的专业能力。

换位思考一下，假设没有人告诉你99乘法表，也没人告诉你“乘号”的含义。只告诉你“1*1=1”，“2*2=4”，你要如何计算出“9*9=81”呢？

从这个现象，可以引申出一个哲学思考：语言和知识的关系。ChatGPT本质上还是一个NLP模型，它计算的是字与字之间的概率关系。而ChatGPT正是基于这种文字之间的概率空间，总结出了各种各样的公式定理。也许，我们高估了“知识的复杂度”。

4.3 从ChatGPT的现状看待：后续迭代方向

对比人类的思维，我认为ChatGPT目前缺少两个关键能力：1）没有记忆；2）无法直接学习知识；

1）没有记忆

回顾一下ChatGPT的训练过程：先训练一个初始模型，再训练一个奖励模型。类比下来，第一个过程获得的是原始信息的积累，即记忆，第二个过程获得的是知识的迭代。

而目前对于ChatGPT的各项优化工作，都集中在后面这个过程。换而言之，ChatGPT的知识在不断完善，但记忆并没有更新。而显然，对于人类思维来说，这两者都是不可或缺的。

尽管有一些对话会让ChatGPT看起来能够记忆内容，比如“先告诉ChatGPT你的名字，然后让ChatGPT复述一遍”。但这个效果本质上是因为ChatGPT可以基于整个对话去回答问题，因此能够把对话的历史信息包含进来，并没有“记住”这个信息。

2）无法直接学习知识

ChatGPT非常擅长讲故事，处理比较纯粹的语言类问题。但专业领域的明确任务，却处理不好。我认为ChatGPT目前差的是“已知经验的输入”。

在人类的教育过程中，是有老师在告诉你，乘法应该怎么计算的。因此你不用从头开始去推导和总结，直接应用即可。这个过程大幅度提高了学习的效率。而ChatGPT需要从0开始推导这个东西，那他要经历的，是人类从远古时期至今的迭代过程，显然存在巨大的挑战。如果ChatGPT能够接受到构造好的经验输入，那就可以省略掉很多的工作，让算法也“站在巨人的肩膀上”。

不幸的是，这两项能力目前都没有解，因为其算法性质仍然是黑盒的。上面我们提到了，现有的算法框架结构已经对人类的思维方式做了粗力度的抽象，因此取得了如今的成就。但更近一步的核心（比如，信息是如何被编码和计算的）目前仍然黑盒，也就限制了对其进行更深度的交互和优化。

但随着人们对思维模式和算法的研究深入，相信能够发明出更完善的架构来。到那个时候，算法高度还原人类思维，离“科技奇异点”应该就相当接近了。

4.4 从ChatGPT的问答过程看待：如何提问

随着对话式算法的诞生，Prompt Engineering这个概念也随之而来：人们发现，有时候之所以得不到理想的答案，与其去优化模型，不如去优化提问。

这个概念是最新才了解到，在此不作展开。

我更想借这个话题，再次提一个观点，“算法的研究，本质上是在还原人类的思维”。你如何设计合理的Prompt，来得到理想的答案，和你在现实中如何提问，是同样的场景。只不过，你目前面对的是一个“心智只有9岁小孩”的AI模型，所以提问时，需要更多的引导和提示。

因此，保持对AI技术的关注，实际上也能够帮助你解读自己是如何思考问题的。

4.5 从ChatGPT的训练过程看待：如何更高效的培养人才

继续回应上面的话题，“算法的研究，本质上是在还原人类的思维”。而ChatGPT，实际上把培养人才的过程，已经进行了抽象。

将算法的演变过程，转化成现实场景，其实是如下的效果：

1）在相对简单的场景下，会直接告诉你解决方案。把对应的模型确定好，按照这个逻辑跑就行，能够快速得到想要的结果。

2）随着场景逐渐复杂，解决方案本身变得“只可意会”了。这个时候，会尝试甩给你大量的case，让你自己琢磨出解决方案来。

3）但喂case积攒经验是个很耗精力的事情。所以，为了提高效率，在喂case的同时，会告诉你方法论。只要用这个方法论，配合一定的实战case，大概率能得出想要的解决方案和结果来。

5、结语

在AIGC年爆火之后，设计从业人员就开始担忧起自己的工作。同样，ChatGPT可预见的也会对很多行业带来冲击，比如教育。AI是否会最终取代人类的话题，似乎也从“遥不可及”，变得“忧心忡忡”。

我认为，AI一定会取代部分人，但不会取代所有人，也不会凌驾于人类之上。

正如工业时代的到来，取代了体力工作者；AI时代的到来，也会取代脑力工作者。而所谓的“专业”能力，往往会在这个浪潮下，被快速取代。（想想当年的“八级技工”，技术再厉害，也比不过新的机器。）

同样的，不论工业时代，还是AI时代，对于整个人类来说，都是一种进步。它意味着生产力大幅提升，意味着有更多的精力被释放出来，可以往更深的领域去探索。而这个世界足够复杂，远没有到被穷举干净的地步。

事实上，历史上每次有这种想法的时候，都会打开一片新的天地。比如19世纪末，物理学家说“物理学的大厦已经落成”，但随之而来就出现了“相对论”和“量子力学”。

身处这个时代，我们需要考虑的，不是如何阻止AI的到来。而是从自身出发，去考虑如何发挥人类的思维优势，利用好AI，从而去造福更多的人类。

【SoC基础】单片机之寄存器解析望闻问嵌 #SoC 单片机嵌入式硬件
：如果你也对机器人、人工智能感兴趣，看来我们志同道合✨：不妨浏览一下我的博客主页【https://blog.csdn.net/weixin_51244852】：文章若有幸对你有帮助，可点赞收藏⭐不迷路：内容若有错误，敬请留言指正！原创文，转载注明出处文章目录1、寄存器位置2、寄存器种类2.1通用用途寄存器2.2CPU执行相关寄存器2.3外设控制寄存器3.寄存器在CPU访问外设过程中起到的作用1、寄
大模型时代的知识焦虑机载软件与适航机器学习-建模算法-代理模型人工智能大数据
引言：浪潮之巅，焦虑暗涌大模型时代已经浩荡而来，如同奔腾的浪潮，以令人惊叹的速度重塑着世界的面貌。从智能客服的温声细语，到AI绘画的妙笔生花，再到自动驾驶的日趋成熟，大型语言模型、图像模型等人工智能技术以前所未有的姿态，渗透进我们生活的方方面面。信息获取前所未有的便捷，知识创造空前高效，人机交互焕然一新，一个充满无限可能的智能化未来似乎触手可及。然而，在这令人眼花缭乱的技术盛景之下，一股无形的焦虑
近期计算机领域的热点技术 0dayNu1L 云计算量子计算人工智能
随着科技的飞速发展，计算机领域的新技术、新趋势层出不穷。本文将探讨近期计算机领域的几个热点技术趋势，并对它们进行简要的分析和展望。一、人工智能与机器学习人工智能（AI）和机器学习（ML）是近年来计算机领域最为热门的话题之一。AI和ML技术已经广泛应用于图像识别、自然语言处理、智能推荐等领域，并取得了显著的成果。随着技术的不断进步，AI和ML将更深入地渗透到各个行业，为人类社会带来更多便利和效益。在
谷歌准备斥资 230 亿收购网络安全初创公司 Wiz 网络研究观网络研究观谷歌
Alphabet正在就收购Wiz进行深入谈判，这将显著增强其安全能力。这将是谷歌母公司有史以来最大规模的收购。这是路透社根据匿名消息来源撰写的内容。目标收购金额为230亿美元，即211亿欧元。Wiz拥有实时检测和响应网络威胁的技术。通过实施人工智能，Wiz能够在短时间内吸引许多公司作为客户。Alphabet的收购目标定于2020年初。到2023年，Wiz的收入将达到3.5亿美元。当时，全球40%的
数学领域的跨时代进化与升级：从公理化到智能化的破茧之路夏末之花算法
作者：夏末之花|发布时间：2025-03-16|阅读量：10万+|点赞数：5.6万引言：数学的“破茧时刻”与文明跃迁人类历史上，数学的每一次重大突破都像一次“破茧时刻”，推动文明跨越式发展。从古希腊的几何公理化到牛顿的微积分，再到20世纪的计算机理论，数学始终是科学革命的基石。而在21世纪的今天，随着量子计算、人工智能、生物信息等技术的爆发，数学正迎来新一轮的进化与升级——从纯粹的逻辑工具，演变为
精准测试：软件开发中的高效质量保障利器霍格沃兹软件测试开发精准化测试测试用例安全性测试测试覆盖率模块测试 selenium 测试工具压力测试
全面解析软件测试开发：人工智能测试、自动化测试、性能测试、测试左移、测试右移到DevOps如何驱动持续交付在现代软件开发中，测试效率与测试质量直接影响产品竞争力。精准测试作为一项兼具效率与精度的创新测试方法，已经成为众多企业提升软件质量的重要手段。本篇文章围绕精准测试的落地实施、对质量指标的提升、数据统计与效果评估方法以及如何提高投入产出比进行全面解读，帮助企业掌握精准测试的价值与实践路径。精准测
提升敏感力，“工具人”破圈的唯一解！技能咖 GAI认证生成式人工智能认证人工智能
在当今这个日新月异的数字化时代，个人与组织面临着前所未有的挑战与机遇。随着科技的飞速发展，尤其是生成式人工智能（GenerativeAI）的兴起，职场生态正在发生深刻变革。如何在这场变革中提升敏感力，实现从“工具人”到行业佼佼者的跨越，成为了众多职场人士关注的焦点。本文将探讨提升敏感力的重要性，并引入生成式人工智能认证（GAI认证），为您揭示“工具人”破圈的唯一解。提升敏感力：职场竞争的关键什么是
新浪财经App喜娜AI助手通过大模型登记，已上线AI摘要和个股公告AI解读量子位
3月14日，官方发布的信息显示，新浪财经App喜娜AI助手近日已通过北京市生成式人工智能服务登记。目前，喜娜AI助手已上线两项创新功能：喜娜AI摘要和个股公告AI解读。这两项功能旨在通过先进的人工智能技术，提升用户对财经资讯和上市公司公告的理解与分析效率，这标志着AI技术在信息服务领域的又一重大突破。喜娜AI摘要：快速提炼财经资讯核心要点AI时代，资讯信息迎来爆炸性增长，用户每天都要面对海量资讯，
模型微调：让AI更懂你的魔法棒带上一无所知的我 pytorch 人工智能 python
模型微调：让AI更懂你的魔法棒✨在人工智能的世界里，模型微调（Fine-tuning）就像是一位魔法师用魔法棒对预训练模型进行“个性化改造”，让它更适应特定的任务。今天，我们就来深入探讨模型微调的技术细节，让你也能像魔法师一样，轻松驾驭AI模型！什么是模型微调？模型微调是指在预训练模型的基础上，通过少量的特定任务数据进行训练，使模型更好地适应新任务的技术。预训练模型通常是基于大规模数据集（如Ima
从 DeepSeek 到 AI 工具箱：Websoft9 应用托管平台赋能高校教学与科研人工智能deepseek
从DeepSeek到AI工具箱：Websoft9应用托管平台赋能高校教学与科研人工智能技术的快速发展正在重塑高校的教学与科研生态。从智能教学辅助到跨学科研究，AI工具的应用场景不断扩展，而技术落地的复杂性也带来新的挑战。在这一背景下，如何将大模型能力与多样化AI工具无缝整合，构建安全、易用的科研教学环境，成为高校数字化转型的关键命题。一、高校智能化转型的三大痛点技术门槛高•AI工具部署依赖专业运维
聊聊关于Python与人工智能那些事小G-biu- python 人工智能 tensorflow
Python与人工智能：介绍Python在人工智能方面的应用Python是一种广泛使用的编程语言，也是人工智能领域中最受欢迎的语言之一。Python提供了许多用于构建和训练人工智能模型的库和框架。本文将介绍一些常见的人工智能技术以及Python在这些技术中的应用。OpenAIOpenAI是一个非营利组织，旨在推动人工智能的发展并促进其对人类的利益。OpenAI通过开发人工智能技术、研究人工智能的影
当现代教育技术遇上仓颉---探秘华为仓颉编程语言与未来教育技术的接轨想成为高手499 华为服务器 php
引言随着人工智能、物联网、区块链等新兴技术的发展，编程语言的需求也在不断演化。据市场研究机构发布的数据显示，全球编程语言市场规模预计在未来五年内将以每年10%的速度增长。此外，越来越多的企业和高校正在积极推动基于分布式系统和硬件优化的新型语言开发，这进一步表明对高性能编程语言的需求日益旺盛。近年来，华为推出了自研编程语言“仓颉”，以其高效的语法设计、灵活的语义表达能力和强大的跨平台适配性能引发了编
用LangChain构建自愈式生成式AI：颠覆传统知识库的智能问答系统实战煜bart 机器人人工智能 python AI编程
引言：当生成式AI遇到自进化架构ChatGPT的惊艳表现让企业意识到生成式AI的潜力，但传统问答系统仍面临数据孤岛、知识更新滞后等痛点。本文将揭秘如何通过LangChain框架构建具有自进化能力的智能问答系统，实现企业知识库的实时动态更新与智能推理。通过本文，您将掌握一套让AI系统在运行中持续学习、自主优化的创新架构。---##一、核心技术突破###1.1自愈式数据管道（Self-healingP
Python在人工智能与机器人开发中的应用与实践一键难忘 python 人工智能机器人
Python在人工智能与机器人开发中的应用与实践Python已经成为人工智能和机器人开发的主要编程语言之一，凭借其简洁的语法、强大的库支持和广泛的社区资源，Python为开发者提供了一个高效且易于学习的平台。在这篇文章中，我们将深入探讨如何使用Python进行人工智能（AI）和机器人开发，并通过实际代码示例展示核心技术和应用。1.Python在人工智能中的应用人工智能（AI）领域的核心任务包括机器
计算机专业毕业设计题目推荐（新颖选题）本科计算机科学专业相关毕业设计选题大全✅ 会写代码的羊毕设选题课程设计计算机网络毕设选题毕设系统毕设题目计算机科学专业
文章目录前言最新毕设选题（建议收藏起来）本科计算机科学专业相关的毕业设计选题毕设作品推荐前言2025全新毕业设计项目博主介绍：✌全网粉丝10W+,CSDN全栈领域优质创作者，博客之星、掘金/华为云/阿里云等平台优质作者。技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、大数据、机器学习等设计与开发。主要内容：免费功能设计
智慧交通是什么，可以帮助我们解决什么问题? Guheyunyi 运维大数据人工智能信息可视化前端
智慧交通是什么？智慧交通（SmartTransportation）是指利用物联网（IoT）、大数据、人工智能（AI）、云计算、5G通信等先进技术，对交通系统进行智能化管理和优化，以提高交通效率、减少拥堵、降低事故率、提升出行体验，并实现交通资源的合理配置和可持续发展。智慧交通的核心是通过数据采集、分析和应用，实现交通系统的智能化、自动化和协同化，从而构建一个高效、安全、绿色、便捷的交通生态系统。智
在线视频创作平台（Vidnami） deepdata_cn 视频生成视频剪辑视频创作
Vidnami是一款功能强大的在线视频创作平台，前身为ContentSamurai，于2015年推出，2020年更名为Vidnami。它运用人工智能技术，能够分析输入的文本，自动从大量素材中选取合适的图像和视频片段，将文字快速转化为具有专业外观的视频，无需用户具备视频编辑经验。该平台提供多种视频模板、全主题定制功能以及内置的免版权媒体库，包括3000万张图片和3万首音乐，还支持自动配音，用户可以录
OpenCV第1课OpenCV 介绍及其树莓派下环境的搭建嵌入式老牛树莓派之OpenCV opencv 人工智能计算机视觉
1.机器是如何“看”的我们人类可以通过眼睛看到五颜六色的世界，是因为人眼的视觉细胞中存在分别对红、绿、蓝敏感的3种细胞。其中的光感色素根据光线的不同进行不同比例的分解，从而让我们识别到各种颜色。对人工智能而言，学会“看”也是非常关键的一步。那么机器人是如何看到这个世界的呢？这就涉及到人工智能方向重要的分支--机器视觉。机器视觉即用机器人代替人眼来做测量和判断，通过机器视觉产品（即图像摄取装置，分C
Manus详细介绍 accurater c++算法笔记深度学习人工智能神经网络
第一章Manus的技术背景与核心突破初识ManusAI1.1什么是Manus？Manus是由中国团队Monica.im于2025年3月推出的全球首款通用型AI智能体（AIAgent）。其名称源自拉丁语“MensetManus”，意为“手脑并用”，强调将大模型的逻辑推理能力转化为实际生产力。与传统的对话式AI（如ChatGPT、DeepSeek）不同，Manus的核心定位是“执行型助手”，能够自主完
Linux安装Anaconda和Jupyter 硬水果糖人工智能 Linux linux jupyter 运维
一、了解Anaconda和Jupyter引言：Anaconda是一个流行的开源数据科学平台，广泛用于数据分析、机器学习、人工智能等领域。它是一个集成了大量科学计算和数据科学工具的Python和R编程语言环境。Anaconda的主要目标是简化数据科学和机器学习的开发流程，提供一个易于安装和管理的环境。而预装了大量常用的Python和R库，这些库涵盖了数据科学的各个方面，包括：数据分析：Pandas、
ChatGPT、DeepSeek、GIS与Python机器学习强强联合！地质灾害风险评估、易发性分析、信息化建库及灾后重建 WangYan2022 DeepSeek ChatGPT 地下水地质灾害 DeepSeek ChatGPT GIS 灾后重建
在地质灾害频繁肆虐的当下，精准开展风险评价刻不容缓。如今，一门极具创新性的教程震撼登场，它将ChatGPT、DeepSeek等前沿技术与GIS、Python以及机器学习深度交融，为学员打造出前所未有的学习体验，助力大家在地质灾害风险评价领域强势突围，一路领先。前沿技术融合，铸就智能学习核心动力教程最闪耀的亮点之一，便是大胆引入了ChatGPT和DeepSeek技术。它们恰似无所不能的“数据魔法师”
Hessian 矩阵是什么 ZhangJiQun&MXP 教学 2021 AI python 2024大模型以及算力矩阵线性代数算法人工智能机器学习
Hessian矩阵是什么目录Hessian矩阵是什么Hessian矩阵的性质及举例说明**1.对称性****2.正定性决定极值类型****特征值为2（正），因此原点(0,0)(0,0)(0,0)是极小值点。****3.牛顿法中的应用****4.特征值与曲率方向****5.机器学习中的实际意义**一、定义与公式二、实例分析Hessian矩阵是多元函数二阶偏导数构成的方阵，用于分析函数局部曲率、判断极
LoRA中黑塞矩阵、Fisher信息矩阵是什么 ZhangJiQun&MXP 教学 2021 论文 2024大模型以及算力矩阵机器学习人工智能 transformer 深度学习算法线性代数
LoRA中黑塞矩阵、Fisher信息矩阵是什么1.三者的核心概念黑塞矩阵（Hessian）二阶导数矩阵，用于优化问题中判断函数的凸性（如牛顿法），或计算参数更新方向（如拟牛顿法）。Fisher信息矩阵（FisherInformationMatrix,FIM）统计学中衡量参数估计的不确定性，反映数据中包含的关于参数的信息量。在机器学习中常用于自然梯度下降（NaturalGradientDescent
神经网络基础之正则化硬水果糖人工智能神经网络人工智能机器学习
引言：正则化（Regularization）是机器学习中一种用于防止模型过拟合技术。核心思想是通过在模型损失函数中添加一个惩罚项（PenaltyTerm），对模型的复杂度进行约束，从而提升模型在新数据上的泛化能力。一、正则化目的防止过拟合：当模型过于复杂（例如神经网络层数过多、参数过多）时，容易在训练数据上“记忆”噪声或细节，导致在测试数据上表现差。简化模型：正则化通过限制模型参数的大小或数量，迫
DeepSeek 大模型落地成都高新区：科技赋能警务的创新变革 AGI大模型学习科技人工智能 DeepSeek 大模型 chatgpt 大模型应用 AI大模型
在科技飞速发展的当下，人工智能正以前所未有的速度融入各个领域，深刻改变着人们的生活与工作方式。公安领域也不例外，积极拥抱科技创新，成为提升警务效能、维护社会稳定的关键路径。全国第一例警用DeepSeek大模型落地成都高新区，这一突破性举措在警务智能化发展进程中具有里程碑意义，为公安工作带来了全方位的革新。一、警用DeepSeek大模型落地的时代背景近年来，国产AI蓬勃发展，不断涌现出令人瞩目的成果
大数据和人工智能概念全面解析就犯得上方法
一、大数据和人工智能大数据是伴随着信息数据爆炸式增长和网络计算技术迅速发展而兴起的一个新型概念。根据麦肯锡全球研究所的定义，大数据是一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合，具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。大数据能够帮助各行各业的企业从原本毫无价值的海量数据中挖掘出用户的需求，使数据能够从量变到质变，真正产生价值
DeepSeek爆火，背后模型竟藏着这些秘密！ qq_23519469 ai
DeepSeek是什么来头最近，AI圈可是被一个名字刷爆了屏，那就是DeepSeek！它就像一颗横空出世的超级新星，在全球范围掀起了一阵狂热的追捧潮，这热度，简直了！大家都在疯狂讨论它，各种测评、对比层出不穷。它到底有啥过人之处，能让这么多人都为之疯狂？今天咱就来好好唠唠。DeepSeek，全称杭州深度求索人工智能基础技术研究有限公司，是一家专注于开发先进大语言模型（LLM）和相关技术的企业。它成
决策树算法全解析：从零基础到Titanic实战，一文搞定机器学习经典模型吴师兄大模型 0基础实现机器学习入门到精通算法机器学习决策树人工智能深度学习编程开发语言
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
AI人工智能代理工作流AI Agent WorkFlow：设计智能任务处理流程 AI天才研究院计算 AI大模型企业级应用开发实战 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AI人工智能代理工作流AIAgentWorkFlow：设计智能任务处理流程作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来在当今的数字化时代，随着数据量的爆炸式增长和复杂性的提升，传统的手动任务处理方式已经无法满足高效、准确的需求。人工智能技术的发展为自动化任务处理提供了新的可能性。AI人工智能代理（AIAgent）作为一
图像处理篇---图像预处理 Ronin-Lotus 图像处理篇深度学习篇程序代码篇图像处理人工智能 opencv python 深度学习计算机视觉
文章目录前言一、通用目的1.1数据标准化目的实现1.2噪声抑制目的实现高斯滤波中值滤波双边滤波1.3尺寸统一化目的实现1.4数据增强目的实现1.5特征增强目的实现：边缘检测直方图均衡化锐化二、分领域预处理2.1传统机器学习（如SVM、随机森林）2.1.1特点2.1.2预处理重点灰度化二值化形态学操作特征工程2.2深度学习（如CNN、Transformer）2.2.1特点2.2.2预处理重点通道顺序
java类加载顺序 3213213333332132 java
package com.demo; /** * @Description 类加载顺序 * @author FuJianyong * 2015-2-6上午11:21:37 */ public class ClassLoaderSequence { String s1 = "成员属性"; static String s2 = "
Hibernate与mybitas的比较 BlueSkator sql Hibernate 框架 ibatis orm
第一章 Hibernate与MyBatis Hibernate 是当前最流行的O/R mapping框架，它出身于sf.net，现在已经成为Jboss的一部分。 Mybatis 是另外一种优秀的O/R mapping框架。目前属于apache的一个子项目。 MyBatis 参考资料官网：http:
php多维数组排序以及实际工作中的应用 dcj3sjt126com PHP usort uasort
自定义排序函数返回false或负数意味着第一个参数应该排在第二个参数的前面, 正数或true反之, 0相等usort不保存键名uasort 键名会保存下来uksort 排序是对键名进行的 <!doctype html> <html lang="en"> <head> <meta charset="utf-8&q
DOM改变字体大小周华华前端
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
c3p0的配置 g21121 c3p0
c3p0是一个开源的JDBC连接池，它实现了数据源和JNDI绑定，支持JDBC3规范和JDBC2的标准扩展。c3p0的下载地址是：http://sourceforge.net/projects/c3p0/这里可以下载到c3p0最新版本。以在spring中配置dataSource为例：  <bean name="prope
Java获取工程路径的几种方法 510888780 java
第一种： File f = new File(this.getClass().getResource("/").getPath()); System.out.println(f); 结果: C:\Documents%20and%20Settings\Administrator\workspace\projectName\bin 获取当前类的所在工程路径; 如果不加“
在类Unix系统下实现SSH免密码登录服务器 Harry642 免密 ssh
1.客户机 (1)执行ssh-keygen -t rsa -C "[email protected]"生成公钥，xxx为自定义大email地址 (2)执行scp ~/.ssh/id_rsa.pub root@xxxxxxxxx:/tmp将公钥拷贝到服务器上，xxx为服务器地址 (3)执行cat
Java新手入门的30个基本概念一 aijuans java java 入门新手
在我们学习Java的过程中,掌握其中的基本概念对我们的学习无论是J2SE,J2EE,J2ME都是很重要的,J2SE是Java的基础,所以有必要对其中的基本概念做以归纳,以便大家在以后的学习过程中更好的理解java的精髓,在此我总结了30条基本的概念。　　Java概述:　　目前Java主要应用于中间件的开发(middleware)---处理客户机于服务器之间的通信技术,早期的实践证明,Java不适合
Memcached for windows 简单介绍 antlove java Web windows cache memcached
1. 安装memcached server a. 下载memcached-1.2.6-win32-bin.zip b. 解压缩，dos 窗口切换到 memcached.exe所在目录，运行memcached.exe -d install c.启动memcached Server,直接在dos窗口键入 net start "memcached Server&quo
数据库对象的视图和索引百合不是茶索引 oeacle数据库视图
视图视图是从一个表或视图导出的表，也可以是从多个表或视图导出的表。视图是一个虚表，数据库不对视图所对应的数据进行实际存储，只存储视图的定义，对视图的数据进行操作时,只能将字段定义为视图,不能将具体的数据定义为视图为什么oracle需要视图; &
Mockito(一) --入门篇 bijian1013 持续集成 mockito 单元测试
Mockito是一个针对Java的mocking框架，它与EasyMock和jMock很相似，但是通过在执行后校验什么已经被调用，它消除了对期望行为（expectations）的需要。其它的mocking库需要你在执行前记录期望行为（expectations），而这导致了丑陋的初始化代码。 &nb
精通Oracle10编程SQL(5)SQL函数 bijian1013 oracle 数据库 plsql
/* * SQL函数 */ --数字函数 --ABS(n):返回数字n的绝对值 declare v_abs number(6,2); begin v_abs:=abs(&no); dbms_output.put_line('绝对值：'||v_abs); end; --ACOS(n):返回数字n的反余弦值，输入值的范围是-1~1，输出值的单位为弧度
【Log4j一】Log4j总体介绍 bit1129 log4j
Log4j组件：Logger、Appender、Layout Log4j核心包含三个组件：logger、appender和layout。这三个组件协作提供日志功能：日志的输出目标日志的输出格式日志的输出级别(是否抑制日志的输出) logger继承特性 A logger is said to be an ancestor of anothe
Java IO笔记白糖_ java
public static void main(String[] args) throws IOException { //输入流 InputStream in = Test.class.getResourceAsStream("/test"); InputStreamReader isr = new InputStreamReader(in); Bu
Docker 监控 ronin47 docker监控
目前项目内部署了docker，于是涉及到关于监控的事情，参考一些经典实例以及一些自己的想法，总结一下思路。 1、关于监控的内容监控宿主机本身监控宿主机本身还是比较简单的，同其他服务器监控类似，对cpu、network、io、disk等做通用的检查，这里不再细说。额外的，因为是docker的
java-顺时针打印图形 bylijinnan java
一个画图程序要求打印出： 1.int i=5; 2.1 2 3 4 5 3.16 17 18 19 6 4.15 24 25 20 7 5.14 23 22 21 8 6.13 12 11 10 9 7. 8.int i=6 9.1 2 3 4 5 6 10.20 21 22 23 24 7 11.19
关于iReport汉化版强制使用英文的配置方法 Kai_Ge iReport汉化英文版
对于那些具有强迫症的工程师来说，软件汉化固然好用，但是汉化不完整却极为头疼，本方法针对iReport汉化不完整的情况，强制使用英文版，方法如下：在 iReport 安装路径下的 etc/ireport.conf 里增加红色部分启动参数，即可变为英文版。 # ${HOME} will be replaced by user home directory accordin
[并行计算]论宇宙的可计算性 comsci 并行计算
现在我们知道,一个涡旋系统具有并行计算能力.按照自然运动理论,这个系统也同时具有存储能力,同时具备计算和存储能力的系统,在某种条件下一般都会产生意识...... 那么,这种概念让我们推论出一个结论 &nb
用OpenGL实现无限循环的coverflow dai_lm android coverflow
网上找了很久，都是用Gallery实现的，效果不是很满意，结果发现这个用OpenGL实现的，稍微修改了一下源码，实现了无限循环功能源码地址： https://github.com/jackfengji/glcoverflow public class CoverFlowOpenGL extends GLSurfaceView implements GLSurfaceV
JAVA数据计算的几个解决方案1 datamachine java Hibernate 计算
老大丢过来的软件跑了10天，摸到点门道，正好跟以前攒的私房有关联，整理存档。 -----------------------------华丽的分割线------------------------------------- 数据计算层是指介于数据存储和应用程序之间，负责计算数据存储层的数据，并将计算结果返回应用程序的层次。J &nbs
简单的用户授权系统,利用给user表添加一个字段标识管理员的方式 dcj3sjt126com yii
怎么创建一个简单的(非 RBAC)用户授权系统通过查看论坛，我发现这是一个常见的问题，所以我决定写这篇文章。本文只包括授权系统.假设你已经知道怎么创建身份验证系统(登录)。数据库首先在 user 表创建一个新的字段(integer 类型),字段名 'accessLevel',它定义了用户的访问权限扩展 CWebUser 类在配置文件(一般为 protecte
未选之路 dcj3sjt126com 诗
作者:罗伯特*费罗斯特黄色的树林里分出两条路, 可惜我不能同时去涉足, 我在那路口久久伫立, 我向着一条路极目望去, 直到它消失在丛林深处. 但我却选了另外一条路, 它荒草萋萋,十分幽寂; 显得更诱人,更美丽, 虽然在这两条小路上, 都很少留下旅人的足迹. 那天清晨落叶满地, 两条路都未见脚印痕迹. 呵,留下一条路等改日再
Java处理15位身份证变18位蕃薯耀 18位身份证变15位 15位身份证变18位身份证转换
15位身份证变18位，18位身份证变15位 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--应用上下文配置【AppConfig】 hanqunfeng springmvc4
从spring3.0开始，Spring将JavaConfig整合到核心模块，普通的POJO只需要标注@Configuration注解，就可以成为spring配置类，并通过在方法上标注@Bean注解的方式注入bean。 Xml配置和Java类配置对比如下： applicationContext-AppConfig.xml <!-- 激活自动代理功能参看：
Android中webview跟JAVASCRIPT中的交互 jackyrong JavaScript html android 脚本
在android的应用程序中,可以直接调用webview中的javascript代码,而webview中的javascript代码,也可以去调用ANDROID应用程序(也就是JAVA部分的代码).下面举例说明之: 1 JAVASCRIPT脚本调用android程序要在webview中,调用addJavascriptInterface(OBJ,int
8个最佳Web开发资源推荐 lampcy 编程 Web 程序员
Web开发对程序员来说是一项较为复杂的工作，程序员需要快速地满足用户需求。如今很多的在线资源可以给程序员提供帮助，比如指导手册、在线课程和一些参考资料，而且这些资源基本都是免费和适合初学者的。无论你是需要选择一门新的编程语言，或是了解最新的标准，还是需要从其他地方找到一些灵感，我们这里为你整理了一些很好的Web开发资源，帮助你更成功地进行Web开发。这里列出10个最佳Web开发资源，它们都是受
架构师之面试------jdk的hashMap实现 nannan408 HashMap
1.前言。如题。 2.详述。 (1)hashMap算法就是数组链表。数组存放的元素是键值对。jdk通过移位算法（其实也就是简单的加乘算法），如下代码来生成数组下标(生成后indexFor一下就成下标了）。 static int hash(int h) { h ^= (h >>> 20) ^ (h >>>
html禁止清除input文本输入缓存 Rainbow702 html 缓存 input 输入框 change
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; <input type="text" autocomplete="off" n
POJO和JavaBean的区别和联系 tjmljw POJO java beans
POJO 和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Pure Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比 POJO复杂很多， Java Bean 是可复用的组件，对 Java Bean 并没有严格的规
java中单例的五种写法 liuxiaoling java 单例
/** * 单例模式的五种写法： * 1、懒汉 * 2、恶汉 * 3、静态内部类 * 4、枚举 * 5、双重校验锁 */ /** * 五、双重校验锁，在当前的内存模型中无效 */ class LockSingleton { private volatile static LockSingleton singleton; pri