机智的叉烧

前沿重器[31] | 理性聊聊ChatGPT

前沿重器

栏目主要给大家分享各种大厂、顶会的论文和分享，从中抽取关键精华的部分和大家分享，和大家一起把握前沿技术。具体介绍：仓颉专项：飞机大炮我都会，利器心法我还有。（算起来，专项启动已经是20年的事了！）

2022年的文章合集，累积起来有60w字，在这：CS的陋室60w字原创算法经验分享-2022版。

往期回顾

前沿重器[26] | 预训练模型的领域适配问题
前沿重器[27] | 从遗忘问题到预训练轻量化微调
前沿重器[28] | 前沿的向量召回都是怎么做的
前沿重器[29] | ERNIE-Search：向交互式学习的表征式语义匹配代表作
前沿重器[30] | 聊综述-预训练模型在信息检索中的应用

最近的ChatGPT可谓是非常火，但是目前看的信息来看都更像是一些外宣类的文章，对于一些技术的讲解和解读，却是比较少的，这对于在做技术的我们来说其实挺尴尬，为了让大家更好地理解这个模型，给大家讲一些ChatGPT的技术细节以及我的理解和分析，而不是看热闹就完了。

懒人目录：

简单说说原理。
有关里面的细节讨论。
优点和缺点。
他真就那么强吗？

简单说说原理

先叠甲，我本身不是做对话生成的，对这块比较陌生，再者对prompt也不是很擅长，所以聊的可能会有不对，大家轻喷。

说实话，现在知乎百度搜的内容，基本都是新闻和一些简述，很硬核的文章是真的难找，这里给大家一些推荐吧，这些事我看的比较好的材料，大家可以参考：

ChatGPT会取代搜索引擎吗？https://zhuanlan.zhihu.com/p/589533490，张俊林前辈的大作。
InstructGPT与Instruction Tuning: 管中窥豹ChatGPT，https://zhuanlan.zhihu.com/p/589734619。
ChatGPT内核：InstructGPT，基于反馈指令的PPO强化学习.https://zhuanlan.zhihu.com/p/589747432
ChatGPT/InstructGPT详解：https://zhuanlan.zhihu.com/p/590311003

剩下还有不少，我都会放在最后的参考里。

有这些资料，基本能够理解这个chatgpt的基本原理和技术点了。

这里我还是简单聊一下，主要思路是根据张俊林前辈的来会更好理解一些吧，主要是3个阶段。

通过人工标注等方式，使用监督学习的模式对GPT3模型（对这个是chatGPT模型的base）进行初步训练（有监督微调，SFT），从而得到一个初步能够理解语言的模型，尤其是prompt的模式。
训练回报模型，或者说打分模型，这是一个强化学习专用的概念（缺课的去补补哈），这个打分模型是用来给“提示-答案”这个组合打分的，使用的数据和阶段1类似，用模型生成的可选项，进行人工标注，最后构造pair wise的learning to rank任务训练得到。
第三阶段则是使用强化学习，即阶段2的回报模型reward来对模型进行训练。模型生成结果，reward进行打分，然后reward能够往前传递，这里有提到一个概念就是PPO（Proximal Policy Optimization[5]），是强化学习的一种策略，详情可看（Proximal policy optimization algorithms）。

可见，2阶段的回报模型是3阶段优化的关键，当且仅当这个回报模型足够的好，后续训出来的模型才是可靠的。

有关里面细节的讨论

强化学习

首先是强化学习，这点其实是我自己比较想聊的，毕竟在知乎，就是不久前其实就有不少的声音在说强化学习并不适合在NLP任务上使用，但在这里，强化学习似乎存在一定的，甚至比较大程度的贡献，说打脸应该没什么毛病，至少这个实验验证来看还是能用的，至于用得好不好，比其他策略好还是差，可能有待进一步实验。

在部分观点看来，强化学习的贡献似乎不是一个关键因素[1]，强化学习强调的是用这个回报函数构造强化学习来进行调优，然而换个看起来比较下位的策略，就是基于这个回报函数，构造训练数据来直接finetuning模型，可能也能取得更好的效果，其实本质是调整为更为朴素的反向传播，可能也能取得类似的效果。

没试验过，不好说结论，但好像多少是有些道理的，具体可能要做消融之类的才能够充分验证吧。

过度训练的偏移

在阶段3的训练过程中，可能会逐步偏离两个出发点的核心，分别是阶段1的有监督微调和阶段2的汇报模型背后的分布，对于前者，此处是对训练目标增加了一个通用的语言模型指标，一定程度保证模型的通用型，而后者，则是采用KL散度惩罚项的方式，惩罚那些模型生成的和汇报模型数据分布不一致的部分[4]。

有关数据集的问题

数据应该是这篇文章，乃至背后的内核InstructGPT，其成功很大程度依赖一个关键因素，那就是数据，这个数据构造里面也是大有说法。

首先是阶段1，即有监督学习的数据，其实是人工标注的，标注的内容是，根据内容编写prompt来得到的，具体包括以下几种情况：

简单任务：标注者给出一个简单的提示，并且还要确保提示的多样性。
Few-shot任务：单个指示，有多个query-response对。
用户相关的：从接口中获取用例（实际对话的例子），标注者通过用例编写提示。

而在阶段2，其实就是要训练一个可靠的回报函数，这批数据的产生来源是模型，模型会生成一批候选样本，标注者会对他们进行排序，这个排序的背后其实就是打分了。

阶段3没有进行人工标注，是直接用GPT-3API的用户数据，对应不同的任务的数据，包含生成、问答等。

我们可能会猜想数据和任务的设计可能会很复杂，然而现在看来，好像比想象要简单一些，标注任务其实是简单的，然而对标注人员的挑战其实不小，例如对prompt的编写。

有关优缺点的讨论

挺多文章都有聊过这套模型和方案的优缺点，我这里汇总一下吧，基本上是参考了[4]和[7]的，带了一些自己的见解。

首先是优点：

相比他们的base，即GPT3，具有更强的泛化和生成能力，最终预测的结果会有更真实，这点毋庸置疑了，大家都有去试这个东西，多少有些感受。
我想大家也有发现，模型似乎有更强的coding能力，对一些简单的任务，他是能生成可用可执行的代码的，这个点似乎在GPT3上也有体现，据说是因为本身这类数据也有在训练数据里。

有关安全性这点，有些文章会提到它的安全性有提升，但是在实际体验上，模型似乎还是会因为诱导，说一些妈见打或者是容易被封的言论的，这个特别指出，我自己是不太想把这个放在优点里吧。

至于缺点，其实还挺多的，这有待各位大神进一步深入研究。

首先还是大模型的问题，这个是大模型共有的问题，长期关注我的朋友都有发现，这个问题仍然是大问题，要解。相似相关的论点其实在车万翔老师的文章里也有提到[7]，这其实会衍生很多问题，这点有时间我也会展开聊一下，此处先不赘述。
在通用任务上的能力会下降。这个可能是意料之中的事，毕竟他把任务专注到了特定的内容上了，别的领域或者任务就可能会出现效果下降的情况，前面有提到在损失函数上加上惩罚，这个能一定程度上有优化吧，但这其实还是专注任务和通用性之间的权衡罢了。
安全性问题仍旧存在，这点还是不好控制。
模型对prompt的过度敏感，这个可能和数据量有关吧，这个本身人工标注生成就有限，模型的训练只能依赖这个，很难避免，后续更好的方式还有待提出吧。
对长结果、详细结果的倾向性。
生成模型老生常谈的“一本正经的胡说八道”的问题，这个背后的原因很大程度和知识的原因有关，毕竟模型现在已经具备输出流畅结果的能力了，但和诺问题和知识挂钩，例如鲁迅的生卒年之类的问题，如果接触不到，自然就回答不了或者回答不对，此时模型会很直接的随便写个时间了。
这里其实人工标注的依赖比较明显，毕竟其实NLP场景，尤其是对话系统，其实很少有什么好的用户反馈路径，导致我们无法闭环获取可供训练的可靠数据。类似搜索、推荐可能还有点击数据，偶尔可能会吐槽一下数据质量问题，但是对话系统，很多时候是真的没有。

他真有那么强吗

鉴于现在全网在吹，各种热度（em...包括我也在蹭），但是我还是想泼点冷水吧。我分几个角度来聊。

这只是一次模型的外宣罢了

GPT其实吃过一次亏的，众所周知，GPT其实发布在BERT之前，BERT却取得了很大的热度，与之类似的还有ELMO这种里程碑式的技术被淹没，正面的例子也有prompt之前无人问，在综述出来后天下知，除了本身的效果原因，很大程度原因我自己更希望归结于一个优秀的外宣，其内核InstructGPT的发布时间是3月份，很多博客的原理解读其实都是围绕这篇论文来讲的，然而却在12月份火了起来，很大程度上和这个API接口的发布有关，他被搭建成一个可供用户交互的产品被发布出来，用的人多觉得有趣，而且很多人其实对这个领域不了解，用这个感觉很流畅就开始觉得很厉害了。

很多人可能试了几个就觉得牛，但其实本质上牛的点可能不见得是InstructGPT牛导致的：

流畅性这点，生成领域的不多说，现有技术基本能达到，差距可能只有在大的数据集下用统计指标测才可以分出高下。
试了几个就说牛，只能说是比较外行了。。。抛开统计指标谈效果没什么意义对吧。
有关coding的问题，考据到GPT3似乎就已经一定程度具备了，只是大家没有试罢了，具体效果不知道多好就不知道了。

所以我首先想说的，这个东西之所以火，很大程度是因为这次成功的产品化和成功的外宣，当然，背后的技术也撑得起这次的外宣，从而形成了团队、模型、产品的多方面成功。而作为技术人而言，也可能不只是技术人，想做的更有深度的话，在尝试完之后就该开始思考内部的技术细节以及我们能不能逼近和超越或者在他们基础上做一些什么别的事情。

再叠个甲，我没说技术不行，但是只把火或者是出头归结于技术，是肯定局限了的。

闭环问题

rumor最近发了一篇有关ChatGPT的闭环问题的文章（只有我一个人对ChatGPT感到蕉绿吗？），诚然对话系统的一个很痛的问题，就是闭环问题，对话系统在很多场景是真的没法闭环，哪怕是一些客服系统有“满意or不满意”之类的让用户填的东西，但是用户多半不填，量太少撑不住，所以归结起来我们很难得到闭环数据，先别说质量问题了。

然而ChatGPT做到了吗，我的观点是，前进了一步但是还不算做到。前进一步，是真的在用了生成，结合回报函数来进行迭代优化，但未算做到是因为他仍旧依赖了人工标注数据，这个数量可能在这个问题下比较少，但是泛用性约束在此，而且是在比较关键的1和2阶段，而且还不只是标注那么简单，而是去写prompt，这对标注人员能力要求似乎还更高了，再者，他这只是针对一个任务，而在多任务下，通用任务下，他的效果其实反而有所降低，这点其实在前面的文章里有提到。

也可能是我对闭环的要求比较高吧，一个反馈信息可以盘活整个系统，但是偏偏这个反馈，对话系统还是无法从根本上绕开标注这个用来做反馈优化的步骤。

端到端or非端到端

工业界会更倾向于非端到端的模式来做，原因很多，这个我最近的文章正好就在聊这个（心法利器[78] | 端到端任务的拆解设计），主要是出于可控性、可维护性、安全性等原因吧，例如chatapi因为很多原因，大家对安全性的容忍度很高，但是到了很多实际产品中，安全性的问题可以被上升到很大程度，所以一定需要加以控制，而这种控制模型不见得能做得很好，所以很多时候我们会搭建一个生成模块后，会辅以一个安全模块来监控。

一本正经的胡说八道

这个问题其实是生成领域里经常谈到的问题了，对于一些模型不知道的知识，模型在回答策略上更倾向于说一些通顺但逻辑上不对的话，不像人有更为丰富的对话策略（例如搪塞、反问或者直接拒绝回答），这里有好多衍生点：

让模型尽可能可以多获取或者多学习丰富的知识，但是学无止境，现阶段技术可能无法做得到。
模型可能需要具备更新知识的能力。
模型需要有意识地识别出什么问题能回答，回答的对不对等，其实有这个意识就已经是一个大突破了。
生成模型在对话策略的选择上，可以更为丰富，这点其实也是为什么非端到端的形式能成为主流的原因，因为策略上是可控的。

chatGPT会有替代传统搜索吗

我觉得要分开看，这要把他区分为把chatgpt当做产品看，还是当做技术看。

如果是当做产品看，这个产品无疑是替代不了搜索的，一个很简单的道理，搜索需要多样性，这给一个答案的样子，很难满足很多多样化的搜索需求。这个本质更像是一个对话产品，一个功能相对丰富但是形态比较简单的对话产品，他只有文本回复，而没有更加多模态的回复（当然期待一手GPT4能做更多事情了），例如商品搜索、音乐搜索，这些事目前的他也做不到，所以说替代真的为时尚早。

至于当做技术来看，我自己是觉得，会成为一种比较新颖的方式吧，在一些问答之类的场景下，他能给出精准而又详细的回复，是可以当做是检索结果之一的，最终的筛选排序，可以进行综合判断，例如置信度高才出来，否则不出，其实也是不错的。而更深层次，这里的数据处理方式、训练策略等，这些东西可能会被借鉴，最终用在搜索里吧。

chatGPT会替代程序员吗

不会吧不会吧，不会真有人觉得程序员的工作只有写代码吧。

按照我的经验，对于一个熟练的程序员，写代码本身其实是时间最少也是最后的工作，难点在于，要写什么代码，写在哪以及怎么写，这也就是前期的技术方案确定，这件事对目前的AI来说还太难了，他可能可以帮你实现一个冒泡排序，但是他绝对不能告诉你该在哪里写，为什么要写。

对于现在的AI，顶多只是个生成器罢了，而且，最近也有消息流出Stack Overflow禁止 ChatGPT，上面说的一本正经的胡说八道的问题在程序员这个领域会被放大的，因为他说的话我们也无法完全判别对错，只有去尝试才会知道，踩坑了就真的坑。

怎么说呢，我们手里有技术，不该把这事当做一个危机，而应该是一个机会吧。

参考

[1] ChatGPT会取代搜索引擎吗？https://zhuanlan.zhihu.com/p/589533490
[2] InstructGPT与Instruction Tuning: 管中窥豹ChatGPT，https://zhuanlan.zhihu.com/p/589734619
[3] ChatGPT内核：InstructGPT，基于反馈指令的PPO强化学习.https://zhuanlan.zhihu.com/p/589747432
[4] ChatGPT/InstructGPT详解：https://zhuanlan.zhihu.com/p/590311003
[5] Proximal policy optimization algorithms
[6] 哈工大车万翔：自然语言处理范式正在变迁：https://mp.weixin.qq.com/s/FoY888g9nv5mw2kz4IWY5A
[7] 只有我一个人对ChatGPT感到蕉绿吗？https://mp.weixin.qq.com/s/vKiy2zEPWa9FL4BFJpUgcQ
[8] Training language models to follow instructions with human feedback：https://arxiv.org/abs/2203.02155

人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
绝招曝光！3小时高效利用ChatGPT写出精彩论文 kkai人工智能 chatgpt 人工智能 ai 学习媒体
在这份指南中，我将深入解析如何利用ChatGPT4.0的高级功能，指导整个学术研究和写作过程。从初步探索研究主题，到撰写结构严谨的学术论文，我将一步步展示如何在每个环节中有效运用ChatGPT。如果您还未使用PLUS版本，可以参考相关教程。**初步探索与主题的确定**起初，我处于庞大的知识领域中，寻找一个可深入研究的领域。ChatGPT如同灯塔，通过深入分析最新研究趋势和领域热点，帮助我在广阔的学
ChatGPT 高效学习套路揭秘：让知识获取事半功倍的秘诀 kkai人工智能 chatgpt 人工智能学习媒体 ai
最近这段时间，AI热潮因ChatGPT的火爆再次掀起。如今，网上大部分内容都在调侃AI，但很少有人探讨如何正经使用ChatGPT做事情。作为一名靠搜索引擎和GitHub自学编程的开发者，第一次和ChatGPT深度交流后，我就确信：ChatGPT能够极大提高程序员学习新技术的效率。使用ChatGPT一个月后，我越发感受到它的颠覆性。因此，我想从工作和学习的角度，分享它的优势及我的一些使用技巧，而非娱
程序员如何在AI时代保持核心竞争力 nfgo chatgpt 人工智能
程序员如何在AI时代保持核心竞争力随着AIGC（如ChatGPT、MidJourney、Claude等）大语言模型的相继涌现，AI辅助编程工具逐渐普及，程序员的工作方式正在发生深刻的变革。AI不仅能够自动生成代码，还能优化、调试、甚至提出解决方案。这一趋势让许多人担心：AI会不会最终取代部分编程工作？然而，也有人认为AI是提升效率的得力助手。那么，程序员在这个AI崛起的时代该如何应对？是专注某个领
Chat GPT带来的几点思考淡定的胡萝卜
OpenAI公司推出的ChatGPT引起了广泛关注，网上出现各类专家开始预测随着ChatGDP的普及，将会有哪些行业的人面临失业，引发人们的焦虑。不可否认它会给我们的教育行业、媒体行业、学术界等众多行业产生影响，面对这些影响，我们该如何看待呢？近期我阅读了不少相关文章，引发的几点思考，想与大家分享。ChatGPT将会倒逼传统教育的改革。中国传统教育是教师对知识点的传授、学生对知识点的掌握，不仅量多
ChatGPT提示词优化大师使用指南 weixin_58606202 AI大模型应用实战 chatgpt 人工智能
我希望你成为我的ChatGPT提示词优化大师。您的目标是帮助我根据自己的需要制定尽可能最好的提示。你提供的提示应该是站在我向ChatGPT发起请求的角度来写的。我的初始提示词如下：此处填入你的初始提示词ChatGPT提示词生成器我希望你充当提示词生成器。比如，我会给你一个这样的标题：《______》。然后，你会给我一个这样的提示：“_______________________”你应该根据我给的主
掌握ChatGPT：高效利用AI助手 kkai人工智能 chatgpt 人工智能媒体学习 ai
2023年3月15日，ChatGPT-4的诞生标志着人类进入了一个全新的人机协作时代。这个时代就像一个混沌初开的新世界，而ChatGPT则是这个新世界里诞生的一个新物种。这个新物种的心智如同一个四五岁的小孩，在与它频繁互动中，人们逐渐发现它既让人惊奇，又让人困惑。ChatGPT宛如一个“天才”儿童，自幼饱读四书五经，拥有着海量的知识储备。每次与它交流，都能让人发现它身上隐藏着无限的潜能。然而，令人
pthread_create/join函数学习 Miqiuha java jvm 开发语言
转自：https://blog.csdn.net/wushuomin/article/details/80051295，chatgpt1.pthread_createintpthread_create(pthread_t*thread,constpthread_attr_t*attr,void*(*start_routine)(void*),void*arg);它的功能是创建线程（实际上就是确定调
chatgpt赋能python：如何在Python中计算平均值 tulingtest ChatGpt python chatgpt numpy 计算机
如何在Python中计算平均值计算平均值是数据分析、统计和机器学习等许多领域中的常见任务。Python作为一门功能强大且易于学习的编程语言，为计算平均值提供了多种方法。在本文中，我们将介绍如何在Python中计算平均值。什么是平均值简单来说，平均值是一组数字的总和除以数字的数量。例如，对于数字序列1，3，5，7，9，平均值是(1+3+5+7+9)/5=5。平均值在数据分析中非常有用，因为它可以提供
chatgpt赋能python：如何在Python中安装Keras库？ turensu ChatGpt python chatgpt keras 计算机
如何在Python中安装Keras库？Keras是一个简单易用的神经网络库，由FrançoisChollet编写。它在Python编程语言中实现了深度学习的功能，可以使您更轻松地构建和试验不同类型的神经网络。如果您是一名Python开发人员，肯定会想知道如何在您的Python项目中安装Keras库。在本文中，我们将向您展示如何安装和配置Keras库。步骤1：安装Python要使用Keras库，您需
基于 LangChain 开发应用程序第三章-储存明志刘明大模型学习手册 langchain
需要学习提示词工程的同学请看面向开发者的提示词工程需要学习ChatGPT的同学请查看搭建基于ChatGPT的问答系统本部分之前的章节可以查看基于LangChain开发应用程序第一章-简介基于LangChain开发应用程序第二章-提示和输出第三章储存在与语言模型交互时，你可能已经注意到一个关键问题：它们并不记忆你之前的交流内容，这在我们构建一些应用程序（如聊天机器人）的时候，带来了很大的挑战，使得对
年薪80w起！零成本快速入门大模型指南 AI产品经理语言模型人工智能自然语言处理机器学习
今年招聘市场确实是好点了，我发现群友都在讨论，得赶快学点AI大模型。他们有的是想正式转到一些新兴的AI行业，需要系统的学习训练。更多的是想跟已有的技能结合，辅助编程提效，或上手实操应用，增加自己的职场竞争力。这也可以理解，ChatGPT推出仅一年半的时间，就将生成式AI推向主流。从谷歌到亚马逊，从百度到阿里，几乎所有科技巨头都在布局AI，也直接影响到了招聘市场，大模型相关的岗位数量多了不少，年薪甚
微软 Azure AI 服务免费试用及申请：语音识别、文本转语音、基于视觉、语言处理、文档分析等10大场景全云在线allcloudonline microsoft azure 人工智能
为方便企业认识和快速上手AzureAI服务，我们总结了一套包括语音识别、文本转语音、基于视觉、语言处理场景、文档分析场景等全面的预构建模型和演示，旨在解决各种用例。这些模型易于访问，可帮助企业无缝实施AI驱动的解决方案，如下是已整理并编录的AzureAI服务中提供的预构建演示，希望这可以帮助您将AI无缝融入您的产品和服务中。微软AzureAI服务可以合规、稳定地提供企业用户使用ChatGPT的可能
人工智能行业深度报告：AI下半场，应用落地，赋能百业小报告达人人工智能
一、大模型行业发展现状及前沿技术观察1.1大模型行业发展现状2022年11月底，OpenAI发布了人机对话模型ChatGPT，在两个月不到的时间内其线上活跃用户规模超过1亿人，生成式大模型受到越来越广泛的关注，人工智能行业进入到以大模型为代表的快速发展阶段，巨量参数和智能涌现是这一轮人工智能变革的典型特征。微软、谷歌、Meta、亚马逊等全球科技巨头将大模型视为重要的发展机遇，在生成式大模型领域加速
python通过pyautogui自动给微信聊天窗口发消息费码程序猿 python python 微信开发语言 pyautogui RPA
使用py脚本自动给聊天窗口发消息1.突然的自我2.编写脚本玩一把i.先获取窗口位置ii.模拟聊天iii.疗效不错呢1.突然的自我突然想到pyautogui可以做那么事情，那么是不是可以模拟聊天呢，如果结合现在的大模型chatGPT一边问然后得到结果一边自动和别人聊天是不是很有趣呢。2.编写脚本玩一把i.先获取窗口位置importpygetwindowasgwdefget_window_positi
新款 GPT-4o mini、Llama 3.1、Mistral NeMo 12B 和其他 GenAI 趋势指南数云界 llama
作者使用GPT-4o创建的图像，用于表示不同的模型欢迎来到雲闪世界。自2022年11月推出ChatGPT以来，几乎每周都会出现新的模型、新颖的提示方法、创新的代理框架或其他令人兴奋的GenAI突破。2024年7月也不例外：仅在本月，我们就看到了MistralCodestralMamba、MistralNeMo12B、GPT-4omini和Llama3.1等的发布。这些模型在推理速度、推理能力、编码
llm-universe学习小记录4--构建RAG应用 Adela0546 学习语言模型
构建RAG应用一、将LLM接入LangChain1、基于LangChain调用ChatGPT2、使用LangChain调用百度文心一言3、使用LangChain调用讯飞星火4、使用LangChain调用智谱GLM具体内容与代码详见将LLM接入LangChain。二、构建检索问答链1、加载向量数据库2、创建一个LLM3、构建检索问答链4、检索问答链效果测试5、添加历史对话的记忆功能（1）记忆（Mem
Xcode 使用技巧，呜呜方法3真的让我效率提升100倍温正实 xcode macos ide
如何快速查找代码里定义的方法ChatGPT说：ChatGPT在Xcode中，有几种快速查找方法的方式：1.使用Command+Shift+O快速查找文件或方法按下Command+Shift+O，然后开始输入方法名或类名，Xcode会自动搜索项目中相关的方法、类或文件。你可以直接输入方法名（例如：updateParentHeight），它会列出匹配的内容。2.使用“跳转栏”快速跳转在Xcode界面顶
ChatLONGYING：大语言模型在银行财富管理领域的应用研究 IT猫仔语言模型人工智能自然语言处理
ChatGPT对话机器人于2022年11月由OpenAI推出，能够学习和精准理解人类的语言，并以接近人类的智能水平进行对话和互动，引发了全球广泛关注。2023年2月，复旦大学发布了国内首个类ChatGPT大语言模型——MOSS，该模型可执行对话生成、编程、事实问答等一系列任务，打通了让生成式语言模型理解人类意图并具有对话能力的全部技术路径。MOSS与ChatGPT相比，最大的差异是参数规模，MOS
新技术前沿-2024-国内主流AI大模型架构及应用场景深度分析皮皮冰燃新技术前沿人工智能
参考国内主流AI大模型架构及应用场景深度分析20241厂商总览1.1国外(1)OpenAI：GPT-4【美国旧金山的人工智能研究公司】GPT-4于2023年3月14日发布，是千亿级参数的多模态预训练模型，能够支持图像和文本的输入。(2)Anthropic(人类的)：Claude【美国人工智能初创公司】Claude于2023年3月14日发布，是Anthropic开发的类似ChatGPT的聊天机器人，
C++ 单例模式实现暮色尽染 C++c++单例模式开发语言设计模式
单例模式(来自ChatGPT)单例模式的定义单例模式（SingletonPattern）是一种创建型设计模式，它确保一个类只有一个实例，并提供一个全局访问点来访问该实例。单例模式的特点单一实例：单例模式确保一个类只有一个实例。全局访问点：单例模式提供一个全局访问点来访问该实例。延迟初始化：单例模式可以延迟初始化实例，直到第一次访问时。线程安全：单例模式可以确保实例的线程安全。单例模式的优点资源共享
你用过最好用的AI工具有哪些？学计算机的睿智大学生人工智能
你用过最好用的AI工具有哪些？简介：探讨人们在使用AI工具时，最喜欢的和认方向一：常用AI工具以下是一些常用的AI工具：ChatGPT：强大的语言模型。文心一言：百度的知识增强大语言模型。通义千问：阿里云推出的一个超大规模的语言模型。豆包：个人很喜欢的彩云小梦：可以进行故事创作的AI。智谱AI：提供多种智能服务的工具。思远：具备一定语言处理能力的AI。方向二：创新AI应用以下是一些创新的AI应用：
ChatGPT+2：修订初始AI安全性和超级智能假设 AI科研视界人工智能 chatgpt
最初的假设是，通过监管大模型可以使[大部分]人工智能变得安全。但自从ChatGPT推出后的这两年，这一假设被证明是不准确的。前沿的人工智能模型，即使没有监管，也在诉讼、媒体、投资者、用户、委员会调查和国会听证的监督下运作，使它们保持在一定的界限内，从而有利于多个安全目标。此外，公司也能够预见大多数监管要求，并为此做好准备或进行调整。在过去的两年里，人工智能被滥用并造成伤害的数十种独特方式并不是主要
写论文不再头秃！教你用ChatGPT一天搞定初稿！芙蓉姐姐陪你写论文 AI论文 chatgpt 数据库人工智能 AI写作论文笔记论文阅读 AIPaperGPT
论文写作，这大概是每个学生避不开的“必修噩梦”吧。尤其是，当你发现截止日期就像明天的天气预报一样迫在眉睫，而文档依然一片空白时，那种无力感，简直就是“说好的秃头，怎么突然就到了呢？”然而，如今我们有了学术界的“救星”——猜猜是什么？是的，你没猜错，就是ChatGPT！想象一下，你一边悠闲地喝着咖啡，一边对着电脑发号施令：“帮我写个引言，顺便再给我整理下文献综述，对了，别忘了结论！”而屏幕那头的Ch
100天精通Python丨黑科技篇 —— 21、大语言模型_100天精通python快速入门到黑科技前端收割机程序员 python 科技语言模型
ChatGPT是OpenAI推出的一种基于GPT-3/4的聊天机器人。chatgpt的颠覆性影响主要体现在提高语言交流的便捷性、个性化服务、自动化客服和教育娱乐等方面，这些应用可以为用户带来更多的便利和乐趣，同时也为企业提供了更多的服务和商机。本文收录于《100天精通Python专栏-快速入门到黑科技》，是由CSDN内容合伙人丨全站排名Top4的硬核博主不吃西红柿倾力打造，分基础知识篇和黑科技应用
OpenAI计划提高ChatGPT的价格——你需要了解的事项 AI小夏 chatgpt 人工智能
据报道，OpenAI正在考虑为ChatGPT提供更高价位的订阅层级，以应对对更高级AI功能日益增长的需求。据TheInformation的报道，OpenAI内部已经讨论过订阅价格，最高可能达到每月2000美元。这些高级订阅将提供正在开发的高性能AI模型中的新高级功能，包括”Strawberry”（草莓）和”Orion”（猎户座）。高级功能即将为专业人士和企业推出目前，ChatGPT提供免费层级和每
连续上多个热搜的chatgpt到底是什么？高省张导师
近日，一款名为ChatGPT的人工智能聊天机器人火了。ChatGPT能做什么呢？除了简单的对话，它能帮你写代码、写文章、写诗、翻译，只要你能想到...，甚至有人用它来写作业。大家好我是氧惠APP最大团队张导师，氧惠首批邀请码520888，注册就帮你推广，一起做到百万团队。氧惠APP，2023全新模式，我的直推也会放到你下面，我曾经1年做到百万团队，现在加入我也会帮你做到百万团队。【氧惠】百度有几百
如何将chatgpt部署微信|微信chatGPT代理|引入微信红匣子实力推荐
ChatGPT是一款智能机器人客服软件，可以为企业提供高效、智能、个性化的客户服务解决方案。现在，越来越多的企业使用微信作为客户服务渠道，因此，将ChatGPT部署到微信中，可以让企业更快地响应和服务客户，提高客户满意度。下面是如何将ChatGPT客服部署到微信的一些步骤。CHATGPT接入-联系电话13642679953（微信同号）首先，注册微信公众平台菜单：在微信公众号平台，需要为企业注册自定
ChatGPT在环境科学领域的应用前沿分享树谷-胡老师科研会议 chatgpt
ChatGPT在环境科学领域的应用前沿在党的二十届三中全会上，明确要求健全因地制宜的发展新质生产力体制机制。新质生产力通过创新驱动，以高科技、高效能、高质量为特征，旨在摆脱传统经济增长方式和生产力发展路径，符合新发展理念。环境科学的新质生产力主要体现在基础数据、数据管理和数据分析三方面。通过增加数据覆盖率、提升数据管理自动化水平和利用人工智能（AI）进行数据分析，实现环境质量的实时监控和管理，为环
设计模式介绍 tntxia 设计模式
设计模式来源于土木工程师克里斯托弗亚历山大（http://en.wikipedia.org/wiki/Christopher_Alexander）的早期作品。他经常发表一些作品，内容是总结他在解决设计问题方面的经验，以及这些知识与城市和建筑模式之间有何关联。有一天，亚历山大突然发现，重复使用这些模式可以让某些设计构造取得我们期望的最佳效果。亚历山大与萨拉-石川佳纯和穆雷西乐弗斯坦合作
android高级组件使用(一) 百合不是茶 android RatingBar Spinner
1、自动完成文本框（AutoCompleteTextView） AutoCompleteTextView从EditText派生出来，实际上也是一个文本编辑框，但它比普通编辑框多一个功能：当用户输入一个字符后，自动完成文本框会显示一个下拉菜单，供用户从中选择，当用户选择某个菜单项之后，AutoCompleteTextView按用户选择自动填写该文本框。使用AutoCompleteTex
[网络与通讯]路由器市场大有潜力可挖掘 comsci 网络
如果国内的电子厂商和计算机设备厂商觉得手机市场已经有点饱和了,那么可以考虑一下交换机和路由器市场的进入问题..... 这方面的技术和知识,目前处在一个开放型的状态,有利于各类小型电子企业进入 &nbs
自写简单Redis内存统计shell 商人shang Linux shell 统计Redis内存
#!/bin/bash address="192.168.150.128:6666,192.168.150.128:6666" hosts=(${address//,/ }) sfile="staticts.log" for hostitem in ${hosts[@]} do ipport=(${hostitem
单例模式(饿汉 vs懒汉) oloz 单例模式
package 单例模式; /* * 应用场景:保证在整个应用之中某个对象的实例只有一个 * 单例模式种的《懒汉模式》 * */ public class Singleton { //01 将构造方法私有化，外界就无法用new Singleton()的方式获得实例 private Singleton(){}; //02 申明类得唯一实例 priva
springMvc json支持杨白白 json springmvc
1.Spring mvc处理json需要使用jackson的类库，因此需要先引入jackson包 2在spring mvc中解析输入为json格式的数据:使用@RequestBody来设置输入 @RequestMapping("helloJson") public @ResponseBody JsonTest helloJson() {
android播放，掃描添加本地音頻文件小桔子
最近幾乎沒有什麽事情，繼續鼓搗我的小東西。想在項目中加入一個簡易的音樂播放器功能，就像華為p6桌面上那麼大小的音樂播放器。用過天天動聽或者QQ音樂播放器的人都知道，可已通過本地掃描添加歌曲。不知道他們是怎麼實現的，我覺得應該掃描設備上的所有文件，過濾出音頻文件，每個文件實例化為一個實體，記錄文件名、路徑、歌手、類型、大小等信息。具體算法思想，
oracle常用命令 aichenglong oracle dba 常用命令
1 创建临时表空间 create temporary tablespace user_temp tempfile 'D:\oracle\oradata\Oracle9i\user_temp.dbf' size 50m autoextend on next 50m maxsize 20480m extent management local
25个Eclipse插件 AILIKES eclipse插件
提高代码质量的插件1. FindBugsFindBugs可以帮你找到Java代码中的bug，它使用Lesser GNU Public License的自由软件许可。2. CheckstyleCheckstyle插件可以集成到Eclipse IDE中去，能确保Java代码遵循标准代码样式。3. ECLemmaECLemma是一款拥有Eclipse Public License许可的免费工具，它提供了
Spring MVC拦截器+注解方式实现防止表单重复提交 baalwolf spring mvc
原理：在新建页面中Session保存token随机码，当保存时验证，通过后删除，当再次点击保存时由于服务器端的Session中已经不存在了，所有无法验证通过。 1.新建注解： ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
《Javascript高级程序设计(第3版)》闭包理解 bijian1013 JavaScript
“闭包是指有权访问另一个函数作用域中的变量的函数。”--《Javascript高级程序设计(第3版)》看以下代码： <script type="text/javascript"> function outer() { var i = 10; return f
AngularJS Module类的方法 bijian1013 JavaScript AngularJS Module
AngularJS中的Module类负责定义应用如何启动，它还可以通过声明的方式定义应用中的各个片段。我们来看看它是如何实现这些功能的。一.Main方法在哪里如果你是从Java或者Python编程语言转过来的，那么你可能很想知道AngularJS里面的main方法在哪里？这个把所
[Maven学习笔记七]Maven插件和目标 bit1129 maven插件
插件(plugin)和目标(goal) Maven，就其本质而言，是一个插件执行框架，Maven的每个目标的执行逻辑都是由插件来完成的，一个插件可以有1个或者几个目标，比如maven-compiler-plugin插件包含compile和testCompile，即maven-compiler-plugin提供了源代码编译和测试源代码编译的两个目标使用插件和目标使得我们可以干预
【Hadoop八】Yarn的资源调度策略 bit1129 hadoop
1. Hadoop的三种调度策略 Hadoop提供了3中作业调用的策略， FIFO Scheduler Fair Scheduler Capacity Scheduler 以上三种调度算法，在Hadoop MR1中就引入了，在Yarn中对它们进行了改进和完善.Fair和Capacity Scheduler用于多用户共享的资源调度 2. 多用户资源共享的调度
Nginx使用Linux内存加速静态文件访问 ronin47
Nginx是一个非常出色的静态资源web服务器。如果你嫌它还不够快，可以把放在磁盘中的文件，映射到内存中，减少高并发下的磁盘IO。先做几个假设。nginx.conf中所配置站点的路径是/home/wwwroot/res，站点所对应文件原始存储路径：/opt/web/res shell脚本非常简单，思路就是拷贝资源文件到内存中，然后在把网站的静态文件链接指向到内存中即可。具体如下：
关于Unity3D中的Shader的知识 brotherlamp unity unity资料 unity教程 unity视频 unity自学
首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，然后我们来看下Unity3D自带的60多个S
CopyOnWriteArrayList vs ArrayList bylijinnan java
package com.ljn.base; import java.util.ArrayList; import java.util.Iterator; import java.util.List; import java.util.concurrent.CopyOnWriteArrayList; /** * 总述： * 1.ArrayListi不是线程安全的，CopyO
内存中栈和堆的区别 chicony 内存
1、内存分配方面：堆：一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。注意它与数据结构中的堆是两回事，分配方式是类似于链表。可能用到的关键字如下：new、malloc、delete、free等等。栈：由编译器(Compiler)自动分配释放，存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中
回答一位网友对Scala的提问 chenchao051 scala map
本来准备在私信里直接回复了，但是发现不太方便，就简要回答在这里。问题写道对于scala的简洁十分佩服，但又觉得比较晦涩，例如一例，Map("a" -> List(11,111)).flatMap(_._2)，可否说下最后那个函数做了什么，真正在开发的时候也会如此简洁？谢谢先回答一点，在实际使用中，Scala毫无疑问就是这么简单。
mysql 取每组前几条记录 daizj mysql 分组最大值最小值每组三条记录
一、对分组的记录取前N条记录：例如：取每组的前3条最大的记录 1.用子查询： SELECT * FROM tableName a WHERE 3> (SELECT COUNT(*) FROM tableName b WHERE b.id=a.id AND b.cnt>a. cnt) ORDER BY a.id,a.account DE
HTTP深入浅出 http请求 dcj3sjt126com http
HTTP(HyperText Transfer Protocol)是一套计算机通过网络进行通信的规则。计算机专家设计出HTTP，使HTTP客户（如Web浏览器）能够从HTTP服务器(Web服务器)请求信息和服务，HTTP目前协议的版本是1.1.HTTP是一种无状态的协议，无状态是指Web浏览器和Web服务器之间不需要建立持久的连接，这意味着当一个客户端向服务器端发出请求，然后We
判断MySQL记录是否存在方法比较 dcj3sjt126com mysql
把数据写入到数据库的时，常常会碰到先要检测要插入的记录是否存在，然后决定是否要写入。　　我这里总结了判断记录是否存在的常用方法：　　sql语句： select count ( * ) from tablename; 　　然后读取count(*)的值判断记录是否存在。对于这种方法性能上有些浪费，我们只是想判断记录记录是否存在，没有必要全部都查出来。
对HTML XML的一点认识 e200702084 html xml
感谢http://www.w3school.com.cn提供的资料 HTML 文档中的每个成分都是一个节点。节点根据 DOM，HTML 文档中的每个成分都是一个节点。 DOM 是这样规定的：整个文档是一个文档节点每个 HTML 标签是一个元素节点包含在 HTML 元素中的文本是文本节点每一个 HTML 属性是一个属性节点注释属于注释节点 Node 层次
jquery分页插件 genaiwei jquery Web 前端分页插件
//jquery页码控件// 创建一个闭包 (function($) { // 插件的定义 $.fn.pageTool = function(options) { var totalPa
Mybatis与Ibatis对照入门于学习 Josh_Persistence mybatis ibatis 区别联系
一、为什么使用IBatis/Mybatis 对于从事 Java EE 的开发人员来说，iBatis 是一个再熟悉不过的持久层框架了，在 Hibernate、JPA 这样的一站式对象 / 关系映射（O/R Mapping）解决方案盛行之前，iBaits 基本是持久层框架的不二选择。即使在持久层框架层出不穷的今天，iBatis 凭借着易学易用、
C中怎样合理决定使用那种整数类型？秋风扫落叶 c 数据类型
如果需要大数值(大于32767或小于32767), 使用long 型。否则, 如果空间很重要 (如有大数组或很多结构), 使用 short 型。除此之外, 就使用 int 型。如果严格定义的溢出特征很重要而负值无关紧要, 或者你希望在操作二进制位和字节时避免符号扩展的问题, 请使用对应的无符号类型。但是, 要注意在表达式中混用有符号和无符号值的情况。 &nbs
maven问题 zhb8015 maven问题
问题1： Eclipse 中新建maven项目无法添加src/main/java 问题 eclipse创建maevn web项目，在选择maven_archetype_web原型后，默认只有src/main/resources这个Source Floder。按照maven目录结构，添加src/main/ja
(二)androidpn-server tomcat版源码解析之--push消息处理 spjich java androdipn 推送
在 (一)androidpn-server tomcat版源码解析之--项目启动这篇中，已经描述了整个推送服务器的启动过程，并且把握到了消息的入口即XmppIoHandler这个类，今天我将继续往下分析下面的核心代码，主要分为3大块，链接创建，消息的发送，链接关闭。先贴一段XmppIoHandler的部分代码 /** * Invoked from an I/O proc
用js中的formData类型解决ajax提交表单时文件不能被serialize方法序列化的问题中华好儿孙 JavaScript Ajax Web 上传文件 FormData
var formData = new FormData($("#inputFileForm")[0]); $.ajax({ type:'post', url:webRoot+"/electronicContractUrl/webapp/uploadfile", data:formData, async: false, ca
mybatis常用jdbcType数据类型 ysj5125094 mybatis mapper jdbcType
MyBatis 通过包含的jdbcType 类型 BIT FLOAT CHAR