大家好,我是羡鱼!
最近OpenAI又整了个新活儿,ChatGPT,效果惊艳的对话模型,已经快被脑洞大开的网友们玩儿坏了!闲聊、问答、写代码,你能想到的它都会!甚至有国外的网友表示,Google is done!另外夕小瑶小姐姐的公众号文章《谷歌要完,百度也危了》也是直接将话题拉满,比较夸张,但也侧面说明了ChatGPT确实强啊!
这里我为大家准备了一份ChatGPT的实践指南,手把手教你Chat with ChatGPT!
先说结论,个人感觉生成模型+RLHF或许能为我们带来文本生成实用化的曙光!
本文脉络:首先简单介绍一下原理,然后手把手教大家如何注册OpenAI账号并开始与ChatGPT交流,随后会提供笔者在十个领域上与ChatGPT交流的示例,最后进行总结与展望。一起迎接AIGC的时代吧!
前两天还在有关扩散模型的帖子下面讨论着能不能将扩散模型的思想用到NLG领域(可能得做些改造或者与其他技术结合)来提升其实用性水平?
https://www.zhihu.com/question/568791838/answer/2781856167
没想到2号OpenAI又给大家整了个新活儿,ChatGPT,一个对话生成模型,效果看上去比较令人惊艳,已经被大家玩儿坏了。生成模型+Reinforcement Learning From Human Feedback (RLHF),这路子感觉就很合理,人类对话基本就是这个路子啊(基于对方的反馈来对话)。我一直觉得,文本生成不仅需要新的强大的生成模型,还需要人类的反馈参与其中(尤其是对话这种交互式场景)。因为个人感觉文本生成与图像生成的最大的差异在于文本为人类专属,不具有自然界的对照,在生成效果上更难以评价,没有人类反馈的参与,无论是GAN、VAE,还是现在的扩散模型,或者是各种扩散模型的结合,再强大的生成模型在文本领域都会水土不服,只能是无根浮萍。
于是昨晚和朋友感叹到今年或许真是AIGC元年,AIGC开始从实验室水平走向实用水平,标志性的事件就是扩散模型将AI绘画带到了一个新的实用化的高度。而文本领域也开始有了像ChatGPT这样的曙光,我更加期待即将到来的GPT4了,也更加期待文本生成的实用化!
文本生成,道阻且长,大佬们赶紧卷起来啊QAQ!
我已经迫不及待的想要先来看看ChatGPT到底表现如何了,但是openAI的服务不支持中国,GAN(一个模型)!
官网:
https://chat.openai.com/auth/login
注册:基本流程可以参考这篇博客,不过作者是在英国,咱们大陆注册会遇到很多问题。
https://zhuanlan.zhihu.com/p/589005258
注册账户:随便弄个邮箱或者就用Google、微软账号注册就行。然后可能会提示你OpenAI’s services are not available in your country.
首先要个梯梯(懂的都懂,不宜多言),顺利的话你会看到填写用户名的页面:
最麻烦的部分:需要国外的手机账号来注册和接收验证码。无奈之下,只好找国外的同学帮忙绑了一个账号。
注册成功后大概长这样:
那么除了找人帮忙,还有没有别的方式来获得国外电话进行OpenAI的注册呢?本着这么好的生意不可能没人做的想法,我大概搜了搜,现有几种方法可以尝试,但最好找朋友帮忙,网上水太深,容易把握不住!
有些博客上有相关教程了,B站上也有些视频教程。基本原理就是通过虚拟号来做电话验证,其中有些是免费的但是有很多人用,有些是收费的。
免费的临时电话网站,可能会有风险,请谨慎使用;另外,免费的最大问题就是大家都去薅羊毛,导致羊都被薅秃了,这些临时电话基本都很难注册成功,别问我怎么知道的(含泪猛试半小时):
https://sms24.info/en/messages/OpenAI
https://jiemahao.com/
收费的临时电话网站,这种临时号同样可能会有风险,但毕竟拿钱办事儿。只试了这个,朋友推荐的,但还是要注意风险,请谨慎尝试:
https://sms-activate.org/cn/getNumber
简单省事儿,基本同淘宝,但是比淘宝便宜。
通过验证之后,页面长这样,基本上就大功告成了!
一点忠告:电话验证稳妥起见最好找朋友帮忙或者走淘宝。本文只是大概尝试了几种可行的电话验证的方式,并不构成建议,电话验证部分请谨慎尝试!!!否则,后果自负哈~
Now, Let’s chat with ChatGPT!
注册成功之后,我们回到chatgpt的测试页面:
https://chat.openai.com/chat
在正式试用之前,我们先来看看ChatGPT的特性:
Free Research Preview: ChatGPT is optimized for dialogue. Our goal is to make AI systems more natural to interact with, and your feedback will help us improve our systems and make them safer.
所以,多多试用,为chatgpt提供反馈吧,这样基于人类反馈的强化学习才能帮助GPT系列越来越强!
咱先来点儿哲学问题:
可以看到效果相当不错啊,对于它不擅长的东西,还会巧妙的避开:
再来点儿世界杯问题:
可惜ChatGPT是基于21年之前的数据训练的,无法回答,但就是这种拒绝回答已经是非常大的进步了。
牛啊!效果真的出乎我的预料!至少,辅助写作是用的上的!
偶尔会遇到生成内容戛然而止的情况。
但是效果再次令人惊艳,甚至可以解释GPT和transformer的原理!我有一个大胆的想法,面试不会了说不定可以问问它!
惊到我了!
以经典的求平方根为例:
太6了,还可以直接copy code!
我让它从头实现,它不仅写出来了,甚至还有注释和解释!!!太强了!
必须得夸一夸:
我承认,我就是来找茬儿的QAQ。
娱乐圈的水太深,ChatGPT你把握不住啊!
好了,前面笔者对ChatGPT进行了大概十个方面的高强度测试,高强度是指我自己哈,它是不会累的,我把自己聊累了~
其实逛网的总结就蛮全面的,ChatGPT的能力和限制:
优点:
缺点:
从扩散模型将AI绘画带入实用化水平开始,到各种扩散模型遍地开花,再到今年最后一个月突然冒头的ChatGPT为我们带来了文本实用化的曙光,这不得不让人感叹技术发展之快,或许今年真的是AIGC的元年!让我们拭目以待!
关于文本生成未来的方向:
个人感觉,主要是:更强的生成模型+更好的人类反馈机制+更多更好的数据+更好的评价指标,另外还要着重补短板。
更强的生成模型:
除此之外,当然还有很多事情可以做,一个很有想象空间的事情就是和传统的搜索引擎结合,生成模型+搜索引擎!前面我们在尝试的过程中,ChatGPT也说了自己不是搜索引擎,没有联网搜索的能力,但是这个真可以有!
这俩不是矛盾关系,而是可以相互结合相互促进的。华为前不久就发布了全球首个多语种权威知识检索生成模型——WebBrain。
https://www.sohu.com/a/602953833_121431682
生成模型+搜索引擎,或许可以实现所搜即所得。
当AIGC的实用性开始提升,其潜在的商业价值自然就会水涨船高,也许我们很快就将看到AIGC应用到各个领域并产生巨大的商业价值!
Let’s play with AIGC!
Let’s chat with ChatGPT!
最后,我们让ChatGPT自己来展望一下文本生成的未来吧!
注:AIGC真的是点燃了我久违的激情,周末玩儿了两天,不知不觉又到了凌晨。码字不易,如果觉得有用的话,请多多支持。最后的最后,一家之言,请谨慎参考~
https://openai.com/blog/chatgpt/
https://www.sohu.com/a/602953833_121431682
https://juejin.cn/post/7119267206847791134
https://zhuanlan.zhihu.com/p/589005258
https://www.zhihu.com/question/570189639
https://zhuanlan.zhihu.com/p/461204074
https://mirror.xyz/0x6E12A28086548B11dfcc20c75440E0B3c10721f5/9O9CSqyKDj4BKUIil7NC1Sa1LJM-3hsPqaeW_QjfFBc