智源社区

ChatGPT 核心技术大起底——InstructGPT：研究人类反馈数据比加大模型规模更重要！...

导读

作为ChatGPT的姊妹模型，InstructGPT的核心技术和ChatGPT有很多相通之处。参透InstructGPT的核心技术细节，有助于研究者们在ChatGPT方向上走得更远。

具体来看，一味地让语言模型变大并不意味着它们能更好地遵循用户的意图。大语言模型可能会产生虚假有害的，或是对用户毫无帮助的输出。这些模型并不能匹配用户意图。去年9月，OpenAI的研究科学家Long Ouyang和Scale AI工程经理Aerin在Scale Virtual Events社区（简称Scale）发表了题为「OpenAI’s InstructGPT: Aligning Language Models With Human Intent」的演讲，他们探索了一种新的途径，通过基于人类反馈的微调，使语言模型在广泛的任务中与用户的意图保持一致。本文整理了报告中关于InstructGPT技术细节。

Long Ouyang（演讲嘉宾）

OpenAI研究科学家，斯坦福大学认知心理学博士，目前从事human-in-the-loop mechain learning。他是《Training Language models to follow instructions with human feedback》一文的主要作者，并且协助建立了GPT的变体，如InstructGPT和WebGPT，本次重点讨论了他在InstructGPT方面的工作。InstructGPT是GPT-3的一个变体，具有更好的遵循人类指令的能力，并将继续探索如何利用人类的反馈，“使GPT-3更加有用、真实和无害”。

视频链接：

https://exchange.scale.com/public/videos/openais-instructgpt-aligning-language-models-with-human-intent-2022-09-13

要点速览：

从业人员需要确保机器学习模型优化人们所关心的功能，而非与用户意图不匹配的代理函数（proxy function）
InstructGPT 旨在使 GPT-3 实现「助人、真实、无害」的目标，重点匹配人们的实际偏好
和最初GPT-3的鹦鹉学舌相比，InstructGPT模型能够感知到用户给出指令的意图，并尽力而为，更像是为我们工作的“助手”
尽管模型本身绝大多数是在英语上训练的，InstructGPT 遵循指令的能力泛化到了其它语言上
“基于人类反馈的强化学习”（RLHF）是支撑 InstructGPT 的核心技术之一
，研究人类反馈数据比加大模型规模更重要

前提：确保ML模型

优化的是用户所关心的功能

模型的能力与对齐性（Alignment）是衡量机器学习模型性能的重要维度，模型的能力可以理解为模型能做哪些任务，给定明确的目标函数，我们通过训练模型对其进行优化。对齐性则关心模型目标函数是什么？它是否真正反映用户的意图？为了开发在真实场景下使用的人工智能产品，从业人员需要确保机器学习模型优化人们所关心的功能，而非与用户意图不匹配的代理函数（proxy function）。

原始的GPT-3的模型在一些数据集上的分布是错位的，模型获取了词例序列的分布，它们可以根据一些互联网的轻型语料库预测下一个单词是什么。但是，我们要如何使用这些模型真正执行有趣的、有价值的的认知任务？尽管训练好的模型能输出某个单词，但这种「创造」出的结果仍然可能与用户的想法背道相驰，或只是模型对事实产生的「幻觉」。模型其实似乎倾向于产生似是而非的文本，而非正确、严谨的输出。甚至，模型有时会输出有害的内容。因此，虽然最初的GPT-3理论令人印象深刻，但如果想用它来做有价值的认知工作，还需要在数据分布和训练目标等方面持续改进。

图 1：用于预训练的标准目标函数并没有区分严重的错误和不严重的错误类型。比如，模型认为第二个词应该是‘tribes’而不是‘groups’，属于「不严重」的错误；但把‘across’改成‘outside’，改变了句子的意思，属于「严重」错误。

对于目标函数，我们在预训练中训练模型利用给定词例预测下一个词例。如图 1 所示，训练模型预测第1个标红的词例时，之前的所有词例与第1个词例都无关。在这种情况下，‘group’表示一个企业。这种方法可以训练模型生成下一个词，但模型并没有区分「严重」或「不严重」的错误。如果模型生成的第1处的词例是‘tribe’，并不是一个严重的问题，或多或少保留了原句的意思。但在生成第2处标红词例时，如果生成‘outside’，而不是‘across’，实际上就改变了句子的意思。我们用于预训练的标准目标函数并没有区分这些严重/不严重的错误类型。

我们进行了一些调整，尝试在输入/输出的例子上训练模型，给模型整个文本块作为输入背景，然后给定所有之前的词例，要求它继续输出每一个词例。

根据Long的观察，「我们真正想做的是把语言模型当作助手」。最初的GPT-3模型只是在「鹦鹉学舌」，而不能以有意义的方式作出反应。虽然它产生了连贯的文本，但它根本不明白它是在完成一项特定的任务。另一方面，InstructGPT理解给定的任务，尽最大努力去完成它，这更像是一个助手的行为。

图 2：用简洁的语句给一个六岁的孩子解释登陆月球。GPT-3（左）虽然产生了似乎连贯的文本，这更像是一种“合成正确”的英语，它并不理解任务，只是把问题的模式作为样本，并将话题替换成登月；而InstructGPT（右）对人类指令做出的反应则更像一个助手。

这是另一个考虑原始GPT-3模型限制的维度。我们真正想做的是像训练语言模型一样，使其完成一些给定的任务（例如，向一个六岁的孩子解释月球登陆）。如上图所示，原始的 GPT-3 模型的确产生了看似连贯的文本，似乎也与原始的提示（prompt）有关。但由于不理解任务，所以它只是将模板范式中的话题替换成登月话题。而InstructGPT模型能够感知到用户给出指令的意图，并尽力而为，更像是为我们工作的“助手”。

当我们开始这个项目时，我们还没有找到合适的方法，我们想做的是一个新版本的GPT-3，它与人类的意图对齐，我们还把对齐分解成三个维度：即助人、真实和无害。无害性是我们正在研究的一个积极领域，目前这个新项目的价值主要体现在助人性和真实性上。

方法：模仿人类的偏好，

使用强化学习来改善对齐方式

“基于人类反馈的强化学习”（RLHF）是支撑 InstructGPT 的核心技术之一。该方法在多个阶段都需要高质量的人类标记数据。为此，OpenAI启用了他们雇佣的自由职业者和Scale AI所招募的专业标注人员。

首先，这些标注人员要收集带有适当人类反应的提示（prompt）或指令的数据集。OpenAI将GPT-3做成了一个云服务，提供可以调用的API，并与用户交互，Long等人有权限利用这些交互任务的子集提供训练所需的数据标签，旨在使 GPT-3 实现「助人、真实、无害」的目标，重点匹配人们的实际偏好。他们会给人们看不同的模型的输出，问他们喜欢哪一个，这是衡量模型性能的重要方法。

在 Long 看来，与其训练能输出下一个词例的目标函数（例如，训练语言模型来模仿输入/输出的例子），不如利用特定的数据学习一个目标函数，要求模型模仿人类的偏好。这将是一个相当复杂的目标函数，一旦我们有了这个目标函数，我们将使用强化学习来优化这个目标函数。奖励模型应该给经常满足人类偏好的动作输出集分配高奖励，给不满足偏好的输出集分配低奖励。

图 3：RLHF 操作界面示意图

RLHF 操作方法如上图所示，让人类选择输出A/输出B更好，或者二者差不多。然后训练奖励模型模仿人类的选择。在这种情况下，目标函数会试图预测人类对于特定的提示喜欢什么输出。

图 4：RLHF 过程示意图

训练奖励模型或目标函数的过程如图 4 所示。第1步主要是为了获取数据并训练一个有监督策略（supervised policy）。事实上模型向人们展示了2个以上的输出，并根据与人类反馈的相似程度进行排序，以此训练目标函数；然后生成一组新的提示。我们用这个奖励模型进行强化学习，特别是针对该数据集的近段策略优化算法（PPO，Proximal Policy Optimization）来优化经过微调的语言模型的输出与奖励模型，得到的语言模型的目标函数得分很高。

“在GPT-3商业化之前，我们已经对其进行了深入研究。”Long表示。就在OpenAI即将推出API的时候，他的一个团队成员建议开发一种更方便用户的方式来与模型进行互动。“实际上，你必须做大量的工作，才能让原始模型具备符合预期的鲁棒性，可以应用于商业。”

Long和他的团队着手解决让GPT-3理解人类指令的问题，并在早期从强化学习中发现一些有希望的迹象。“一旦我们看到这些迹象，我们就会立刻决定投入更多的精力。” “我们仍然将监督学习作为一种工具，”他也补充道，“只是它不是主要的工具。”

数据：研究人类反馈数据，

比加大模型规模更重要

图 5：对比实验结果。Long的方法优于其它基线。对每一条基线而言，13亿参数的模型实际上都优于1750参数的模型，这意味着在正确类型的数据上进行训练，比单纯地将模型规模扩大的价值要高得多。

Long将他们的方法与一些基线进行了比较，如有提示工程的原始GPT-3基线、监督学习基线以及其它基线，他们比较了不同的模型，其中，PPO-ptx是RLHF方法的一个变体；SFT是监督学习有提示的GPT的基线。Y轴显示的是模型的性能，类似于国际象棋中的等级，他们把模型放到相互竞争的环境中，来得到这种类似技能等级的排序。X轴则显示了模型的大小，对于每一种类型的模型，他们分别训练了13亿，60亿和1750亿参数的模型。可以看到，PPO-ptx 和 PPO 优于其它基线。此外，对每个类型的模型，13亿参数的模型实际上优于1750亿参数的模型。这意味着在正确类型的数据上进行训练，比简单地将模型规模扩大（比如扩大100倍）的价值要大得多。所以，也许将预算分配给人类反馈数据可能比计算更有意义。

这是模型的总体性能比较，除此之外，Long还注意到了模型性能的一些子维度，比如当提示包含明确的约束，如必须使用一定数量的句子或者写一个包含电影时间的电影评论，他们的模型往往更能遵循这些额外的约束基线模型，而且语气也更像一个助理。

扩展与反思：

对齐可能解锁的模型潜力

Long和他的同事还发现了RLHF的一些有趣的作用。比如尽管模型本身绝大多数是在英语上训练的，InstructGPT 遵循指令的能力泛化到了其它语言上。即使所有数据标签员中没有一个是程序员，它甚至能够完成一些基本的编码任务。对此，Long 表示：“我怀疑这种泛化只是我们的客户对这些语言模型助手提供的不同用例的多样性所造成的。” 这种多样性反映在微调数据中。

Long 认为，模型仍然有很多改进的空间。“这个模型并不完美，我们至今仍在继续努力改进它”。当为问题假设了错误的前提时，没有什么能阻止模型遵循有害的指令，哪怕用户问它如何抢银行，它也会给出建议。它还表现出一些奇怪的行为，如不适当地对冲其答案，而且它不善于处理是/否问题。安全问题是Long和他的团队特别关注的领域——尽管InstructGPT在「助人、真实」方面显示出改进的一致性，但要提高模型的无害性，还它需要进一步的工作，而且可能需要更多的人类反馈数据。

Long等人直接将这种从人类反馈中强化学习的程序应用于一个现实世界的问题。实际上，他们在以前的一些论文中已经开发了这种方法。在这项工作中有一个新的技巧，叫做预训练混合。这种方法是有效的，能够产生一个能做很多任务的模型。它主要是针对预训练分布的改进，但同样不够安全，这也是他们继续努力的方向。

在 Long看来，更好的程序和更合理的数据分布应该能帮助解锁模型的潜能，同时，我们也必须为提升模型的安全问题作出努力。

更多内容尽在智源社区

人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
绝招曝光！3小时高效利用ChatGPT写出精彩论文 kkai人工智能 chatgpt 人工智能 ai 学习媒体
在这份指南中，我将深入解析如何利用ChatGPT4.0的高级功能，指导整个学术研究和写作过程。从初步探索研究主题，到撰写结构严谨的学术论文，我将一步步展示如何在每个环节中有效运用ChatGPT。如果您还未使用PLUS版本，可以参考相关教程。**初步探索与主题的确定**起初，我处于庞大的知识领域中，寻找一个可深入研究的领域。ChatGPT如同灯塔，通过深入分析最新研究趋势和领域热点，帮助我在广阔的学
ChatGPT 高效学习套路揭秘：让知识获取事半功倍的秘诀 kkai人工智能 chatgpt 人工智能学习媒体 ai
最近这段时间，AI热潮因ChatGPT的火爆再次掀起。如今，网上大部分内容都在调侃AI，但很少有人探讨如何正经使用ChatGPT做事情。作为一名靠搜索引擎和GitHub自学编程的开发者，第一次和ChatGPT深度交流后，我就确信：ChatGPT能够极大提高程序员学习新技术的效率。使用ChatGPT一个月后，我越发感受到它的颠覆性。因此，我想从工作和学习的角度，分享它的优势及我的一些使用技巧，而非娱
程序员如何在AI时代保持核心竞争力 nfgo chatgpt 人工智能
程序员如何在AI时代保持核心竞争力随着AIGC（如ChatGPT、MidJourney、Claude等）大语言模型的相继涌现，AI辅助编程工具逐渐普及，程序员的工作方式正在发生深刻的变革。AI不仅能够自动生成代码，还能优化、调试、甚至提出解决方案。这一趋势让许多人担心：AI会不会最终取代部分编程工作？然而，也有人认为AI是提升效率的得力助手。那么，程序员在这个AI崛起的时代该如何应对？是专注某个领
Chat GPT带来的几点思考淡定的胡萝卜
OpenAI公司推出的ChatGPT引起了广泛关注，网上出现各类专家开始预测随着ChatGDP的普及，将会有哪些行业的人面临失业，引发人们的焦虑。不可否认它会给我们的教育行业、媒体行业、学术界等众多行业产生影响，面对这些影响，我们该如何看待呢？近期我阅读了不少相关文章，引发的几点思考，想与大家分享。ChatGPT将会倒逼传统教育的改革。中国传统教育是教师对知识点的传授、学生对知识点的掌握，不仅量多
ChatGPT提示词优化大师使用指南 weixin_58606202 AI大模型应用实战 chatgpt 人工智能
我希望你成为我的ChatGPT提示词优化大师。您的目标是帮助我根据自己的需要制定尽可能最好的提示。你提供的提示应该是站在我向ChatGPT发起请求的角度来写的。我的初始提示词如下：此处填入你的初始提示词ChatGPT提示词生成器我希望你充当提示词生成器。比如，我会给你一个这样的标题：《______》。然后，你会给我一个这样的提示：“_______________________”你应该根据我给的主
掌握ChatGPT：高效利用AI助手 kkai人工智能 chatgpt 人工智能媒体学习 ai
2023年3月15日，ChatGPT-4的诞生标志着人类进入了一个全新的人机协作时代。这个时代就像一个混沌初开的新世界，而ChatGPT则是这个新世界里诞生的一个新物种。这个新物种的心智如同一个四五岁的小孩，在与它频繁互动中，人们逐渐发现它既让人惊奇，又让人困惑。ChatGPT宛如一个“天才”儿童，自幼饱读四书五经，拥有着海量的知识储备。每次与它交流，都能让人发现它身上隐藏着无限的潜能。然而，令人
pthread_create/join函数学习 Miqiuha java jvm 开发语言
转自：https://blog.csdn.net/wushuomin/article/details/80051295，chatgpt1.pthread_createintpthread_create(pthread_t*thread,constpthread_attr_t*attr,void*(*start_routine)(void*),void*arg);它的功能是创建线程（实际上就是确定调
chatgpt赋能python：如何在Python中计算平均值 tulingtest ChatGpt python chatgpt numpy 计算机
如何在Python中计算平均值计算平均值是数据分析、统计和机器学习等许多领域中的常见任务。Python作为一门功能强大且易于学习的编程语言，为计算平均值提供了多种方法。在本文中，我们将介绍如何在Python中计算平均值。什么是平均值简单来说，平均值是一组数字的总和除以数字的数量。例如，对于数字序列1，3，5，7，9，平均值是(1+3+5+7+9)/5=5。平均值在数据分析中非常有用，因为它可以提供
chatgpt赋能python：如何在Python中安装Keras库？ turensu ChatGpt python chatgpt keras 计算机
如何在Python中安装Keras库？Keras是一个简单易用的神经网络库，由FrançoisChollet编写。它在Python编程语言中实现了深度学习的功能，可以使您更轻松地构建和试验不同类型的神经网络。如果您是一名Python开发人员，肯定会想知道如何在您的Python项目中安装Keras库。在本文中，我们将向您展示如何安装和配置Keras库。步骤1：安装Python要使用Keras库，您需
基于 LangChain 开发应用程序第三章-储存明志刘明大模型学习手册 langchain
需要学习提示词工程的同学请看面向开发者的提示词工程需要学习ChatGPT的同学请查看搭建基于ChatGPT的问答系统本部分之前的章节可以查看基于LangChain开发应用程序第一章-简介基于LangChain开发应用程序第二章-提示和输出第三章储存在与语言模型交互时，你可能已经注意到一个关键问题：它们并不记忆你之前的交流内容，这在我们构建一些应用程序（如聊天机器人）的时候，带来了很大的挑战，使得对
年薪80w起！零成本快速入门大模型指南 AI产品经理语言模型人工智能自然语言处理机器学习
今年招聘市场确实是好点了，我发现群友都在讨论，得赶快学点AI大模型。他们有的是想正式转到一些新兴的AI行业，需要系统的学习训练。更多的是想跟已有的技能结合，辅助编程提效，或上手实操应用，增加自己的职场竞争力。这也可以理解，ChatGPT推出仅一年半的时间，就将生成式AI推向主流。从谷歌到亚马逊，从百度到阿里，几乎所有科技巨头都在布局AI，也直接影响到了招聘市场，大模型相关的岗位数量多了不少，年薪甚
微软 Azure AI 服务免费试用及申请：语音识别、文本转语音、基于视觉、语言处理、文档分析等10大场景全云在线allcloudonline microsoft azure 人工智能
为方便企业认识和快速上手AzureAI服务，我们总结了一套包括语音识别、文本转语音、基于视觉、语言处理场景、文档分析场景等全面的预构建模型和演示，旨在解决各种用例。这些模型易于访问，可帮助企业无缝实施AI驱动的解决方案，如下是已整理并编录的AzureAI服务中提供的预构建演示，希望这可以帮助您将AI无缝融入您的产品和服务中。微软AzureAI服务可以合规、稳定地提供企业用户使用ChatGPT的可能
人工智能行业深度报告：AI下半场，应用落地，赋能百业小报告达人人工智能
一、大模型行业发展现状及前沿技术观察1.1大模型行业发展现状2022年11月底，OpenAI发布了人机对话模型ChatGPT，在两个月不到的时间内其线上活跃用户规模超过1亿人，生成式大模型受到越来越广泛的关注，人工智能行业进入到以大模型为代表的快速发展阶段，巨量参数和智能涌现是这一轮人工智能变革的典型特征。微软、谷歌、Meta、亚马逊等全球科技巨头将大模型视为重要的发展机遇，在生成式大模型领域加速
python通过pyautogui自动给微信聊天窗口发消息费码程序猿 python python 微信开发语言 pyautogui RPA
使用py脚本自动给聊天窗口发消息1.突然的自我2.编写脚本玩一把i.先获取窗口位置ii.模拟聊天iii.疗效不错呢1.突然的自我突然想到pyautogui可以做那么事情，那么是不是可以模拟聊天呢，如果结合现在的大模型chatGPT一边问然后得到结果一边自动和别人聊天是不是很有趣呢。2.编写脚本玩一把i.先获取窗口位置importpygetwindowasgwdefget_window_positi
新款 GPT-4o mini、Llama 3.1、Mistral NeMo 12B 和其他 GenAI 趋势指南数云界 llama
作者使用GPT-4o创建的图像，用于表示不同的模型欢迎来到雲闪世界。自2022年11月推出ChatGPT以来，几乎每周都会出现新的模型、新颖的提示方法、创新的代理框架或其他令人兴奋的GenAI突破。2024年7月也不例外：仅在本月，我们就看到了MistralCodestralMamba、MistralNeMo12B、GPT-4omini和Llama3.1等的发布。这些模型在推理速度、推理能力、编码
llm-universe学习小记录4--构建RAG应用 Adela0546 学习语言模型
构建RAG应用一、将LLM接入LangChain1、基于LangChain调用ChatGPT2、使用LangChain调用百度文心一言3、使用LangChain调用讯飞星火4、使用LangChain调用智谱GLM具体内容与代码详见将LLM接入LangChain。二、构建检索问答链1、加载向量数据库2、创建一个LLM3、构建检索问答链4、检索问答链效果测试5、添加历史对话的记忆功能（1）记忆（Mem
Xcode 使用技巧，呜呜方法3真的让我效率提升100倍温正实 xcode macos ide
如何快速查找代码里定义的方法ChatGPT说：ChatGPT在Xcode中，有几种快速查找方法的方式：1.使用Command+Shift+O快速查找文件或方法按下Command+Shift+O，然后开始输入方法名或类名，Xcode会自动搜索项目中相关的方法、类或文件。你可以直接输入方法名（例如：updateParentHeight），它会列出匹配的内容。2.使用“跳转栏”快速跳转在Xcode界面顶
ChatLONGYING：大语言模型在银行财富管理领域的应用研究 IT猫仔语言模型人工智能自然语言处理
ChatGPT对话机器人于2022年11月由OpenAI推出，能够学习和精准理解人类的语言，并以接近人类的智能水平进行对话和互动，引发了全球广泛关注。2023年2月，复旦大学发布了国内首个类ChatGPT大语言模型——MOSS，该模型可执行对话生成、编程、事实问答等一系列任务，打通了让生成式语言模型理解人类意图并具有对话能力的全部技术路径。MOSS与ChatGPT相比，最大的差异是参数规模，MOS
新技术前沿-2024-国内主流AI大模型架构及应用场景深度分析皮皮冰燃新技术前沿人工智能
参考国内主流AI大模型架构及应用场景深度分析20241厂商总览1.1国外(1)OpenAI：GPT-4【美国旧金山的人工智能研究公司】GPT-4于2023年3月14日发布，是千亿级参数的多模态预训练模型，能够支持图像和文本的输入。(2)Anthropic(人类的)：Claude【美国人工智能初创公司】Claude于2023年3月14日发布，是Anthropic开发的类似ChatGPT的聊天机器人，
C++ 单例模式实现暮色尽染 C++c++单例模式开发语言设计模式
单例模式(来自ChatGPT)单例模式的定义单例模式（SingletonPattern）是一种创建型设计模式，它确保一个类只有一个实例，并提供一个全局访问点来访问该实例。单例模式的特点单一实例：单例模式确保一个类只有一个实例。全局访问点：单例模式提供一个全局访问点来访问该实例。延迟初始化：单例模式可以延迟初始化实例，直到第一次访问时。线程安全：单例模式可以确保实例的线程安全。单例模式的优点资源共享
你用过最好用的AI工具有哪些？学计算机的睿智大学生人工智能
你用过最好用的AI工具有哪些？简介：探讨人们在使用AI工具时，最喜欢的和认方向一：常用AI工具以下是一些常用的AI工具：ChatGPT：强大的语言模型。文心一言：百度的知识增强大语言模型。通义千问：阿里云推出的一个超大规模的语言模型。豆包：个人很喜欢的彩云小梦：可以进行故事创作的AI。智谱AI：提供多种智能服务的工具。思远：具备一定语言处理能力的AI。方向二：创新AI应用以下是一些创新的AI应用：
ChatGPT+2：修订初始AI安全性和超级智能假设 AI科研视界人工智能 chatgpt
最初的假设是，通过监管大模型可以使[大部分]人工智能变得安全。但自从ChatGPT推出后的这两年，这一假设被证明是不准确的。前沿的人工智能模型，即使没有监管，也在诉讼、媒体、投资者、用户、委员会调查和国会听证的监督下运作，使它们保持在一定的界限内，从而有利于多个安全目标。此外，公司也能够预见大多数监管要求，并为此做好准备或进行调整。在过去的两年里，人工智能被滥用并造成伤害的数十种独特方式并不是主要
写论文不再头秃！教你用ChatGPT一天搞定初稿！芙蓉姐姐陪你写论文 AI论文 chatgpt 数据库人工智能 AI写作论文笔记论文阅读 AIPaperGPT
论文写作，这大概是每个学生避不开的“必修噩梦”吧。尤其是，当你发现截止日期就像明天的天气预报一样迫在眉睫，而文档依然一片空白时，那种无力感，简直就是“说好的秃头，怎么突然就到了呢？”然而，如今我们有了学术界的“救星”——猜猜是什么？是的，你没猜错，就是ChatGPT！想象一下，你一边悠闲地喝着咖啡，一边对着电脑发号施令：“帮我写个引言，顺便再给我整理下文献综述，对了，别忘了结论！”而屏幕那头的Ch
100天精通Python丨黑科技篇 —— 21、大语言模型_100天精通python快速入门到黑科技前端收割机程序员 python 科技语言模型
ChatGPT是OpenAI推出的一种基于GPT-3/4的聊天机器人。chatgpt的颠覆性影响主要体现在提高语言交流的便捷性、个性化服务、自动化客服和教育娱乐等方面，这些应用可以为用户带来更多的便利和乐趣，同时也为企业提供了更多的服务和商机。本文收录于《100天精通Python专栏-快速入门到黑科技》，是由CSDN内容合伙人丨全站排名Top4的硬核博主不吃西红柿倾力打造，分基础知识篇和黑科技应用
OpenAI计划提高ChatGPT的价格——你需要了解的事项 AI小夏 chatgpt 人工智能
据报道，OpenAI正在考虑为ChatGPT提供更高价位的订阅层级，以应对对更高级AI功能日益增长的需求。据TheInformation的报道，OpenAI内部已经讨论过订阅价格，最高可能达到每月2000美元。这些高级订阅将提供正在开发的高性能AI模型中的新高级功能，包括”Strawberry”（草莓）和”Orion”（猎户座）。高级功能即将为专业人士和企业推出目前，ChatGPT提供免费层级和每
连续上多个热搜的chatgpt到底是什么？高省张导师
近日，一款名为ChatGPT的人工智能聊天机器人火了。ChatGPT能做什么呢？除了简单的对话，它能帮你写代码、写文章、写诗、翻译，只要你能想到...，甚至有人用它来写作业。大家好我是氧惠APP最大团队张导师，氧惠首批邀请码520888，注册就帮你推广，一起做到百万团队。氧惠APP，2023全新模式，我的直推也会放到你下面，我曾经1年做到百万团队，现在加入我也会帮你做到百万团队。【氧惠】百度有几百
如何将chatgpt部署微信|微信chatGPT代理|引入微信红匣子实力推荐
ChatGPT是一款智能机器人客服软件，可以为企业提供高效、智能、个性化的客户服务解决方案。现在，越来越多的企业使用微信作为客户服务渠道，因此，将ChatGPT部署到微信中，可以让企业更快地响应和服务客户，提高客户满意度。下面是如何将ChatGPT客服部署到微信的一些步骤。CHATGPT接入-联系电话13642679953（微信同号）首先，注册微信公众平台菜单：在微信公众号平台，需要为企业注册自定
ChatGPT在环境科学领域的应用前沿分享树谷-胡老师科研会议 chatgpt
ChatGPT在环境科学领域的应用前沿在党的二十届三中全会上，明确要求健全因地制宜的发展新质生产力体制机制。新质生产力通过创新驱动，以高科技、高效能、高质量为特征，旨在摆脱传统经济增长方式和生产力发展路径，符合新发展理念。环境科学的新质生产力主要体现在基础数据、数据管理和数据分析三方面。通过增加数据覆盖率、提升数据管理自动化水平和利用人工智能（AI）进行数据分析，实现环境质量的实时监控和管理，为环
辗转相处求最大公约数沐刃青蛟 C++漏洞
无言面对”江东父老“了，接触编程一年了，今天发现还不会辗转相除法求最大公约数。惭愧惭愧！为此，总结一下以方便日后忘了好查找。 1.输入要比较的两个数a,b 忽略：2.比较大小（因为后面要的是大的数对小的数做%操作） 3.辗转相除（用循环不停的取余，如a%b,直至b=0） 4.最后的a为两数的最大公约数 &
F5负载均衡会话保持技术及原理技术白皮书 bijian1013 F5 负载均衡
一.什么是会话保持？在大多数电子商务的应用系统或者需要进行用户身份认证的在线系统中，一个客户与服务器经常经过好几次的交互过程才能完成一笔交易或者是一个请求的完成。由于这几次交互过程是密切相关的，服务器在进行这些交互过程的某一个交互步骤时，往往需要了解上一次交互过程的处理结果，或者上几步的交互过程结果，服务器进行下
Object.equals方法：重载还是覆盖 Cwind java generics override overload
本文译自StackOverflow上对此问题的讨论。原问题链接在阅读Joshua Bloch的《Effective Java（第二版）》第8条“覆盖equals时请遵守通用约定”时对如下论述有疑问： “不要将equals声明中的Object对象替换为其他的类型。程序员编写出下面这样的equals方法并不鲜见，这会使程序员花上数个小时都搞不清它为什么不能正常工作：” pu
初始线程 15700786134
暑假学习的第一课是讲线程，任务是是界面上的一条线运动起来。既然是在界面上，那必定得先有一个界面，所以第一步就是，自己的类继承JAVA中的JFrame，在新建的类中写一个界面，代码如下： public class ShapeFr
Linux的tcpdump 被触发 tcpdump
用简单的话来定义tcpdump，就是：dump the traffic on a network，根据使用者的定义对网络上的数据包进行截获的包分析工具。 tcpdump可以将网络中传送的数据包的“头”完全截获下来提供分析。它支持针对网络层、协议、主机、网络或端口的过滤，并提供and、or、not等逻辑语句来帮助你去掉无用的信息。实用命令实例默认启动 tcpdump 普通情况下，直
安卓程序listview优化后还是卡顿肆无忌惮_ ListView
最近用eclipse开发一个安卓app，listview使用baseadapter，里面有一个ImageView和两个TextView。使用了Holder内部类进行优化了还是很卡顿。后来发现是图片资源的问题。把一张分辨率高的图片放在了drawable-mdpi文件夹下，当我在每个item中显示，他都要进行缩放，导致很卡顿。解决办法是把这个高分辨率图片放到drawable-xxhdpi下。 &nb
扩展easyUI tab控件，添加加载遮罩效果知了ing jquery
(function () { $.extend($.fn.tabs.methods, { //显示遮罩 loading: function (jq, msg) { return jq.each(function () { var panel = $(this).tabs(&
gradle上传jar到nexus 矮蛋蛋 gradle
原文地址： https://docs.gradle.org/current/userguide/maven_plugin.html configurations { deployerJars } dependencies { deployerJars "org.apache.maven.wagon
千万条数据外网导入数据库的解决方案。 alleni123 sql mysql
从某网上爬了数千万的数据，存在文本中。然后要导入mysql数据库。悲剧的是数据库和我存数据的服务器不在一个内网里面。。 ping了一下， 19ms的延迟。于是下面的代码是没用的。 ps = con.prepareStatement(sql); ps.setString(1, info.getYear())............; ps.exec
JAVA IO InputStreamReader和OutputStreamReader 百合不是茶 JAVA.io操作字符流
这是第三篇关于java.io的文章了，从开始对io的不了解-->熟悉--->模糊，是这几天来对文件操作中最大的感受，本来自己认为的熟悉了的，刚刚在回想起前面学的好像又不是很清晰了，模糊对我现在或许是最好的鼓励我会更加的去学加油！： JAVA的API提供了另外一种数据保存途径，使用字符流来保存的，字符流只能保存字符形式的流字节流和字符的难点：a,怎么将读到的数据
MO、MT解读 bijian1013 GSM
MO= Mobile originate，上行，即用户上发给SP的信息。MT= Mobile Terminate，下行，即SP端下发给用户的信息；上行:mo提交短信到短信中心下行:mt短信中心向特定的用户转发短信，你的短信是这样的，你所提交的短信，投递的地址是短信中心。短信中心收到你的短信后，存储转发，转发的时候就会根据你填写的接收方号码寻找路由，下发。在彩信领域是一样的道理。下行业务：由SP
五个JavaScript基础问题 bijian1013 JavaScript call apply this Hoisting
下面是五个关于前端相关的基础问题，但却很能体现JavaScript的基本功底。问题1：Scope作用范围考虑下面的代码： (function() { var a = b = 5; })(); console.log(b); 什么会被打印在控制台上？回答：上面的代码会打印 5。 &nbs
【Thrift二】Thrift Hello World bit1129 Hello world
本篇，不考虑细节问题和为什么，先照葫芦画瓢写一个Thrift版本的Hello World，了解Thrift RPC服务开发的基本流程 1. 在Intellij中创建一个Maven模块，加入对Thrift的依赖，同时还要加上slf4j依赖，如果不加slf4j依赖，在后面启动Thrift Server时会报错 <dependency>
【Avro一】Avro入门 bit1129 入门
本文的目的主要是总结下基于Avro Schema代码生成，然后进行序列化和反序列化开发的基本流程。需要指出的是，Avro并不要求一定得根据Schema文件生成代码，这对于动态类型语言很有用。 1. 添加Maven依赖 <?xml version="1.0" encoding="UTF-8"?> <proj
安装nginx+ngx_lua支持WAF防护功能 ronin47
需要的软件:LuaJIT-2.0.0.tar.gz nginx-1.4.4.tar.gz &nb
java-5.查找最小的K个元素-使用最大堆 bylijinnan java
import java.util.Arrays; import java.util.Random; public class MinKElement { /** * 5.最小的K个元素 * I would like to use MaxHeap. * using QuickSort is also OK */ public static void
TCP的TIME-WAIT bylijinnan socket
原文连接： http://vincent.bernat.im/en/blog/2014-tcp-time-wait-state-linux.html 以下为对原文的阅读笔记说明：主动关闭的一方称为local end，被动关闭的一方称为remote end 本地IP、本地端口、远端IP、远端端口这一“四元组”称为quadruplet，也称为socket 1、TIME_WA
jquery ajax 序列化表单 coder_xpf Jquery ajax 序列化
checkbox 如果不设定值，默认选中值为on；设定值之后，选中则为设定的值 <input type="checkbox" name="favor" id="favor" checked="checked"/> $("#favor&quo
Apache集群乱码和最高并发控制 cuisuqiang apache tomcat 并发集群乱码
都知道如果使用Http访问，那么在Connector中增加URIEncoding即可，其实使用AJP时也一样，增加useBodyEncodingForURI和URIEncoding即可。最大连接数也是一样的，增加maxThreads属性即可，如下，配置如下： <Connector maxThreads="300" port="8019" prot
websocket dalan_123 websocket
一、低延迟的客户端-服务器和服务器-客户端的连接很多时候所谓的http的请求、响应的模式，都是客户端加载一个网页，直到用户在进行下一次点击的时候，什么都不会发生。并且所有的http的通信都是客户端控制的，这时候就需要用户的互动或定期轮训的，以便从服务器端加载新的数据。通常采用的技术比如推送和comet（使用http长连接、无需安装浏览器安装插件的两种方式：基于ajax的长
菜鸟分析网络执法官 dcj3sjt126com 网络
最近在论坛上看到很多贴子在讨论网络执法官的问题。菜鸟我正好知道这回事情.人道"人之患好为人师" 手里忍不住,就写点东西吧. 我也很忙.又没有MM,又没有MONEY....晕倒有点跑题. OK,闲话少说,切如正题. 要了解网络执法官的原理. 就要先了解局域网的通信的原理. 前面我们看到了.在以太网上传输的都是具有以太网头的数据包.
Android相对布局属性全集 dcj3sjt126com android
RelativeLayout布局android:layout_marginTop="25dip" //顶部距离android:gravity="left" //空间布局位置android:layout_marginLeft="15dip //距离左边距 // 相对于给定ID控件android:layout_above 将该控件的底部置于给定ID的
Tomcat内存设置详解 eksliang jvm tomcat tomcat内存设置
Java内存溢出详解一、常见的Java内存溢出有以下三种： 1. java.lang.OutOfMemoryError: Java heap space ----JVM Heap（堆）溢出JVM在启动的时候会自动设置JVM Heap的值，其初始空间(即-Xms)是物理内存的1/64，最大空间(-Xmx)不可超过物理内存。可以利用JVM提
Java6 JVM参数选项 greatwqs java HotSpot jvm jvm参数 JVM Options
Java 6 JVM参数选项大全（中文版）作者：Ken Wu Email: [email protected] 转载本文档请注明原文链接 http://kenwublog.com/docs/java6-jvm-options-chinese-edition.htm！本文是基于最新的SUN官方文档Java SE 6 Hotspot VM Opt
weblogic创建JMC i5land weblogic jms
进入 weblogic控制太 1.创建持久化存储 --Services--Persistant Stores--new--Create FileStores--name随便起--target默认--Directory写入在本机建立的文件夹的路径--ok 2.创建JMS服务器 --Services--Messaging--JMS Servers--new--name随便起--Pers
基于 DHT 网络的磁力链接和BT种子的搜索引擎架构 justjavac DHT
上周开发了一个磁力链接和 BT 种子的搜索引擎 {Magnet & Torrent}，本文简单介绍一下主要的系统功能和用到的技术。系统包括几个独立的部分：使用 Python 的 Scrapy 框架开发的网络爬虫，用来爬取磁力链接和种子；使用 PHP CI 框架开发的简易网站；搜索引擎目前直接使用的 MySQL，将来可以考虑使
sql添加、删除表中的列 macroli sql
添加没有默认值：alter table Test add BazaarType char(1) 有默认值的添加列：alter table Test add BazaarType char(1) default(0) 删除没有默认值的列：alter table Test drop COLUMN BazaarType 删除有默认值的列：先删除约束（默认值）alter table Test DRO
PHP中二维数组的排序方法 abc123456789cba 排序二维数组 PHP
<?php/*** @package BugFree* @version $Id: FunctionsMain.inc.php,v 1.32 2005/09/24 11:38:37 wwccss Exp $*** Sort an two-dimension array by some level
hive优化之------控制hive任务中的map数和reduce数 superlxw1234 hive hive优化
一、控制hive任务中的map数: 1. 通常情况下，作业会通过input的目录产生一个或者多个map任务。主要的决定因素有： input的文件总个数，input的文件大小，集群设置的文件块大小(目前为128M, 可在hive中通过set dfs.block.size;命令查看到，该参数不能自定义修改)；2.
Spring Boot 1.2.4 发布 wiselyman spring boot
Spring Boot 1.2.4已于6.4日发布，repo.spring.io and Maven Central可以下载(推荐使用maven或者gradle构建下载)。这是一个维护版本，包含了一些修复small number of fixes,建议所有的用户升级。 Spring Boot 1.3的第一个里程碑版本将在几天后发布，包含许多

ChatGPT 核心技术大起底——InstructGPT：研究人类反馈数据比加大模型规模更重要！...

你可能感兴趣的:(chatgpt)