过完年刚开工,很多人还没有从假期综合症中走出来,不想上班,总想摸鱼,可是手上的工作还是要完成的。都2023年了,是时候让ChatGPT来帮我们完成工作了!本文将教你如何用ChatGPT高效地完成工作,并提供相关使用技巧。希望阅读本文后,大家都能轻松搞定工作,开开心心摸鱼。
想用好ChatGPT,我们首先要对ChatGPT有一定了解。
ChatGPT是一个基于GPT-3.5构建的大型语言模型聊天机器人。它将问答交互场景下的文本生成能力向前推进了一大步,超出了人们对对话式人工智能的预期。因此一经推出就惊艳世界,引爆了全球对ChatGPT的关注。ChatGPT的模型架构基于生成预训练转换器(Generative Pre-training Transformer),并基于大量文本数据进行训练。因此除了对话,ChatGPT还能够理解复杂问题并执行高级任务。
具体来说,ChatGPT可以为各种自然语言处理任务(如语言翻译、问题解答和文本摘要)生成类似人类的文本。该模型基于大量文本数据进行预训练,然后针对特定任务进行微调。这使得模型能够理解语言的复杂性,并生成更自然、更准确的文本。
ChatGPT可以用于很多场景,包括:
ChatGPT使用监督学习和强化学习进行了调优。Open AI团队使用了*人类反馈强化学习(Reinforcement Learning from Human Feedback)*技术,将有害、不真实和有偏见的输出降到最低。该技术包括三个步骤:监督微调、奖励模型和近端策略优化。下面逐个介绍这三个部分:
第一步,收集演示数据以训练受监督的策略模型,即SFT模型(Supervised Fine-Tuning Model)。这部分数据收集时会由人工打上标签。他们对一系列提问给出预期的响应输出。这部分数据集相对规模较小,但质量很高,用于微调预训练的GPT-3.5系列模型。然而,由于数据有限,SFT模型仍然可能生成不友好和不正确的文本。因此,更大规模的数据集不是通过人为标记创建,而是通过对SFT模型的输出进行排名来创建奖励模型。
奖励模型的目的是给SFT模型的输出打分,表示输出与人类的期望的匹配程度。这个过程基于一群人工标注者给出的配置和指南进行。
为了实现奖励模型,对于选定问题,SFT模型为每个问题生成多个输出。然后,标注者将输出从最佳到最差进行排序,以创建新的标记数据集。该数据集包含的数据大约是SFT模型使用的精选数据集的10倍。一旦收集到新的数据,就会被用于训练奖励模型,该模型将一些SFT模型输出作为输入,并按照偏好顺序对其进行排序。
在这一步,强化学习将使用近端策略优化来微调SFT策略。近端策略优化模型,即PPO模型,从SFT模型初始化,并由奖励模型初始化价值函数。这里使用的环境是一个“老虎机”(bandit)环境,其中会出现一个随机提问,并且会对提问做出响应。稍后,它会根据提问和响应产生奖励。
虽然ChatGPT名字中包含“聊天”,但它的能力绝不只AI聊天这么简单。下面列举了ChatGPT的几个关键功能,这些功能特性也是让ChatGPT在2022年火爆的原因之一:
开年回来免不了各种启动会议,会议经常要头脑风暴。对于刚过完年脑子还没完全动起来的同志,想头脑风暴点子是件很痛苦的事情。此时就应该请ChatGPT出马。ChatGPT可以对任何主体生成各种数据和见解。比如你可以让ChatGPT “列举10条人工智能未来可能的应用场景”,ChatGPT会马上给你答案,如果不满意,还可以马上“换一批”。
这是一个激发想法的好方法,但是在使用它们之前,你需要仔细检查输出内容的正确性和合理性。
过年回来,打开邮箱会收到很多积压的工作邮件,其中很多商务性质的邮件需要我们一一回复。这些商务邮件的回复涉及人情世故,要仔细把握语气,认真遣词造句,非常费神。这些工作不如交给ChatGPT来代笔。比如让ChatGPT “帮我写一封非常客气的商务邮件,告知对方需求已经收到,我们正在全力跟进。”
看看ChatGPT生成的邮件模板,这商务范,这客套话,真的,我自己都写不出这么客气的邮件回复来。
对早期语言模型的主要改进之一是ChatGPT能够理解和生成代码。甚至可以让ChatGPT修复代码中的错误并获得调试帮助。比如你可以让ChatGPT 用Python实现Dijkstra算法。
上面的代码实现了 Dijkstra 算法,从图 graph
中的 start
点寻找到 end
点的最短路径。图使用字典的形式表示,每个点的邻居是另一个字典,其中键是邻居点,值是边的长度。
或者让ChatGPT帮你找bug
程序员最烦的一件事就是写产品说明或文档。有了ChatGPT后,这些工作都可能由ChatGPT代劳。比如你可以让ChatGPT帮你生成代码功能的描述:
有了ChatGPT后,程序员再也不用发愁写功能描述文档了。甚至可以让ChatGPT帮忙阅读理解别人写的代码。这样,当面对“祖传屎山”时也不用害怕了。
如果你是媒体工作者或内容创作者,那么写文章一定是你日常最主要也是最伤脑细胞的工作。现在可以用ChatGPT生成初稿,提高工作效率。比如,我们可以让ChatGPT帮我们写一篇春节档热门电影《流浪地球2》的影评:
看看这文笔,还是相当不错的,反正比我写得要好。
有时ChatGPT给出的回复可能不是很令人满意,此时不要气馁,我们可以尝试换一个提问方式试试。向ChatGPT提问或发指令有一些原则和技巧,以下几点需要大家使用时注意:
ChatGPT旨在理解和响应类人类语言,当你使用简洁清晰的句子时,它的效果最好。避免使用复杂或模棱两可的语言,在提问或下达命令时尽量具体。
ChatGPT是在一个大型的人类语言数据集上训练的,因此它希望你使用正确的语法和文字。如果你语法有误或使用方言俚语,ChatGPT可能很难理解你的意思。
错别字也非常影响ChatGPT的理解,尽管它有一定的纠错理解能力,但是就目前测试来看ChatGPT对中文的模糊纠错能力还有待提升。因此尽可能确保输入文字正确,不要出现错别字。
ChatGPT对英文的理解和处理能力要高于中文,因为训练数据集以英文为主。所以当一个问题ChatGPT始终无法给出令人满意的回复时,不妨试试用英文提问,往往能获得令人满意的回复。
ChatGPT是一个强大的工具,但它仍然是一台机器,可能不能总是像人类那样快速地理解和响应。如果没有立即得到响应,请给ChatGPT一点时间来处理您的输入。
最后,我们讨论一个严肃的问题:ChatGPT虽然很强大,但是我将其用于工作安全吗?很遗憾,OpenAI的免责声明不保证这一点。
上面这一大段免责声明核心内容是:“……我们对服务不作任何保证(明示、暗示、法定或其他),并否认所有保证……我们不保证服务不中断、准确或无误,也不保证任何内容都是安全的,不会丢失或更改。”
也就是说:我们自己要对使用ChatGPT的行为负责。那么如何判断ChatGPT是否适合用于工作呢?我总结如下几个判断原则:
上面的判断逻辑我整理成一张逻辑清晰的图,供大家参考:
ChatGPT在各个行业的使用预计将带来巨大的优势,企业可以通过ChatGPT优化不同的业务流程。基于AI的系统,如ChatGPT,预计将彻底改变人机交互,也将彻底改变我们的工作方式。
最后,祝大家开年大吉,摸鱼愉快。有什么好的灵感或想法,欢迎留言交流。