花了近三周时间对 ChatGPT 进行多方面了解、体验后写的报告,超级全面,建议想了解的朋友看看

优质介绍视频:

  • GPT4+前端【AI编程新纪元】

  • 【渐构】万字科普GPT4为何会颠覆现有工作流;为何你要关注微软Copilot、文心一言等大模型

ChatGPT 是什么:ChatGPT最初是2022年11月30日由OpenAI开发并推出的聊天机器人,是基于 GPT-3.5 架构的大型语言模型并通过强化学习进行训练。除了可以以文字方式与用户进行互动,还可以用于相对复杂的语言工作,包括自动文本生成、自动问答等功能,还具有编写和调试计算机程序,创作文本、故事的能力。


优点:
  • 可以辅助工作,相对直接百度搜索,ChatGPT 有结合上下文的特性,它更能理解你说的话,所以搜索结果会更加符合预期,且很大概率出现相对高质量回答
    • 对搜索能力、提问题能力有一定要求,会百度的可能百度更好用,不会百度的可能 ChatGPT 也用不好,毕竟百度搜索出来的答案还会比较多
  • 对问题描述本身要求不那么高了
    • 使用百度之类的搜索引擎,很可能你问的问题网上有答案了,但是你搜的关键词不对,死活就是搜不出来,一定程度上降低了搜索的门槛,但也需要找到跟 gpt 聊天的感觉才能用的更顺手,不然总是哪里怪怪的

但是百度搜索还可以结合最新数据,而 ChatGPT 必须通过插件才能达到这一效果


缺点/注意点:

  • ChatGPT3.5 数据总体为2021年9月之前的,无法结合最新信息回答问题
    • 比如视频演示的创建项目,其实我们用脚手架很多东西不需要再配一下,外加他推荐的版本可能有点老,但也影响不大(比如 vue3 用的是 pinia,但它推荐的还是 vuex)
    • 可能存在编造数据/返回不正确的数据(有被污染的风险)
      • 比如我之前看到的一篇公众号文章:让ChatGPT来指导带娃,会不会比人更安全?
        • 其中让我印象最深刻的就是烧伤是应该如何处理,ChatGPT 的回答是用凉水冲,而这一常规做法却会对孩子造成较大的伤害(虽然他答对了很多道题)
  • ChatGPT4 调用次数有限制,目前官方策略是三小时内最多对话25次
    • 2023.4.3 左右爆出已关闭 plus 开通路径(按钮变灰色了)
    • 似乎是分时段的,2023.4.6 又可以了(2023.4.5还不行)
  • 注册使用有一定的费用:注册账号比较困难,国内号码无法注册,开通 Plus 才能使用 ChatGPT4,20$/月(当然实际开通还得多个一两美元,即140+¥/月)
  • 需要fq/科学上网,且网络状态不是特别稳定
    • 国内其实可以找免费的镜像站,大多数体验 ChatGPT3.5 是不收费的,还不用
  • 可能出现编造回答
    • 切记,chatgpt 的回答并非 100% 正确,需要有一定的专业性去质疑去更正,如果觉得不对,你也可以提出来,让 chatgpt 自己去排查

所以某些比较敏感、准确率要求较高、安全要求较高不容有差错的场景还是以人为主比较合适,人一定要对 ChatGPT 回答的内容进行审核把控


试用地址

国内免翻:

  • https://chat.plexpt.com/chat
  • Free ChatGPT Site List (ai55.cc)(列举了一堆免费好用的 chatgpt 镜像站点)
    • 仅用于开发学习交流 (binjie.site)
      • 据说作者被警察叔叔找上门要求关停网站了(4.10 晚)

官网:

  • https://chat.openai.com/chat
    • fq 使用亚洲节点有一定的封号几率

声明

我不提供科学上网教程、不卖账号、不提供 Plus 开通的方法或链接(并且这些网上随便搜搜也能搜到,一搜一大把)

想要体验推荐是用用国内的镜像网站,成本很低

其实有探索水平还是更建议自己去注册个账号玩,比较稳定


个别插件推荐

ChatGPT 有插件市场,但我申请还没通过,暂时不知道怎么样,据说可以发挥的空间很大,很有想象空间

WebChatGPT 浏览器插件

  • 可访问互联网的 ChatGPT,在 chatgpt 官网上用的
  • 似乎是在 ChatGPT 未搜到结果时自动去搜索相关内容,将相关内容发给 ChatGPT,让 ChatGPT 进行总结(纯属个人观察推测,未验证)
    • 要知道联网获取的内容输出的结果是没法和训练出来的数据相比的(在某篇文章里看到过相关分析)
  • 开启后可以联网搜索(比如搜 2023.4.5 左右公布的 Midjourney V5,联网后可以搜出来,不联网他不知道是什么)

Sider – AI Sidebar 浏览器插件【荐】

  • 可以集成至浏览器,亲测可以在百度的同时进行 chatgpt 搜索(会自动进行,也可以在扩展里配置为点击才搜索)
  • 可以在看网页时进行翻译、概括、改写等,交互也很友好(内置的这些内容其实是按模板组织语句去问 chatgpt 的,支持自己扩展)
  • 不需要,响应挺快~~,强烈推荐~~
    • (2023.4.7)免费版:现在不登录好像有最多40次使用机会,登录后每天有30次使用机会
  • 缺陷:不能记住上下文、使用的是 chatgpt3 的版本,连3.5都不是
    • 近期更新了,有对话窗口了,可以有上下文的概念了
  • 用的是 ChatGPT 的 API(应该是开发者自掏腰包的,因为每次调用 ChatGPT 的 API 都会收费,具体收费策略可见 API 调用收费相关科普 章节内容)

ChatGPTPromptGenius

  • 可以考虑结合此前了解到的 prompt 网页内容,把自己会用到的一些 prompt 配置起来,方便后续点选应用
  • 个人觉得可以用来替代目前比较火的 AIPRM for ChatGPT(要收费了,还挺贵,没感觉功能强大到哪里去,自己学会提 prompt 就能省下这笔钱啦)

ChatGPT 的竞品

复旦大学 MOSS

不如 ChatGPT 般强大,已暂停对外访问,正在内部测试中

百度 文心一言

百度旗下的人工智能产品(网上骂声比较多,不如 ChatGPT 强大)

Google Bard

谷歌旗下的人工智能产品

需要国外邮箱注册,目前还在申请排队中(需要科学上网并在浏览器无恒模式下访问申请)

冷静了几天也没有看到铺天盖地的信息,可能还是没法跟 chatgpt 相提并论的

华为 盘古大模型

华为大模型,预计4月25日发布(可以小小期待一下)

阿里 通义千问

阿里推出的,4.7放出开放内测申请的消息,并将于 4.11 召开发布会(可以小小期待一下)

360智脑 x 360搜索

360推出的,4.10低调放出消息,诚邀企业安全云用户内测体验,不是很感兴趣,没有过多了解


ChatGPT 的周边产品/相关产品

Github Copilot、New Bing、Office 365 copilot

微软集成 chatgpt 的相关产品(网上有人猜测是微软把配套的产品体系都做差不多了才对外公布的 ChatGPT4)

未亲自体验,未网上了解,不作展开

下面介绍两个可能跟开发相关性大一点的

Github Copilot 的简单介绍

Github Copilot 是微软结合 github 上的数据训练出来的

AI帮忙写代码: github-copilot使用手册

  • 可以看看使用效果

“GitHub Copilot Chat不仅仅是一个聊天窗口。它可以识别开发人员键入的代码、显示的错误消息,并将其深度嵌入到IDE中。开发人员可以深入分析和解释代码块的用途,生成单元测试,甚至获得对错误的建议修复。”

3月22日,微软旗下代码托管平台GitHub发布了编程辅助工具Copilot的全新版本Copilot X,新版本接入GPT-4,并新增了聊天和语音功能,允许开发人员用自然语言询问如何完成特定的编码功能。

Copilot X更新的一系列功能包括有:GitHub Copilot Chat,可实现与AI对话完成编码;Copilot for Pull Requests,由AI协助程序员拉取请求;Copilot for Docs,智能文档编写工具;Copilot for CLI,命令工具;Copilot Voice,语音扩展功能,说话就完成程序编写。

针对软件开发代码管理 git 有配套支持,我们后续是否考虑将代码管理迁移到 git?部署公司私有化的代码管理库 gitlab?探索一些更高级的自动化流程?

  • pull request 自动运行测试,辅助编写测试代码(需要探索和慢慢转型,时间!)
  • 个人付费 10$/月,1$≈6.88¥,大约68.8¥/月

争议和风险:

  • GitHub遭炮轰:Copilot“抄袭”已经失控,为训练AI侵权整个社区
  • 知识产权滥用,不管什么协议的代码,只要是 github 上的基本都被它拿来训练了,有可能你传上去的代码就被拿来无私奉献了

Cursor

Cursor教程:全自动代码生成器,GPT-4让人人都可以编程

  • ctrl + k 生成代码
  • ctrl + l 问问题
  • 这个比较适合程序员用,可用性进一步提高,还可以问问题,让改写,具体怎么样可能还得用了才知道
    • 似乎没有 copilot 稳定靠谱,且网上有人说对接了 chatgpt4,实际并不是

个人简单试用了一下,一言难尽,能用,但总感觉傻傻的

  • 已经开始收费,20$/月……,个人认为不如 copilot,copilot 还只需要 10$/月

花了近三周时间对 ChatGPT 进行多方面了解、体验后写的报告,超级全面,建议想了解的朋友看看_第1张图片

花了近三周时间对 ChatGPT 进行多方面了解、体验后写的报告,超级全面,建议想了解的朋友看看_第2张图片


近期了解到 AI 领域比较火的东西

可能是一些相关或不太相关或是可以相互配合的产品

AI 制图工具 Midjourney【Hot】

这个是真的有惊艳到我,给出的图片真的可以用欣赏来形容,对我一个外行人来说是真好看,真清晰,牛逼!

看了几个视频,感觉操作交互是真的简单,很容易上手的样子!

  • 推荐视频:一站式入门AI绘画!Midjourney胎教级入门指南!普通人也能成为设计师
  • 推荐文章:
    • 火爆全网的Midjourney-AI绘画教程来啦

    • 教你Midjourney AI 新手秒变高手

    • 地球最强组合GPT4+Midjourney V5 意味着什么? (多图演示)


但除了默默点赞,对于我的工作生活,我想不到什么应用场景,所以只能算是开开眼界,谨防诈骗

  • 有些图片不仔细看已经很难分辨图片是 AI 生成的还是真实的了(甚至很多人仔细看也还是分辨不出来)

Midjourney 是一款 AI 制图工具,只要关键字,就能透过 AI 算法生成相对应的图片,只需要几十秒到一两分钟的时间。

图片生成领域,跟我们关联不大,是画师需要着重关注的内容

(可以搭配 ChatGPT 自动生成提示词,让生成的图片细节更丰富)


(收费:Midjourney V5版:超详细注册及使用流程,手把手教你用AI画画!)

  • Midjourney 其订阅服务分月收费和年收费,月收费有三个档次,分别为基本计划10美元,标准计划30美元、60美元三个等级的会员,而年收费每月将节省20%订阅费,按年收费更划算。目前,Midjourney接受Mastercard、VISA 等支付方式。因此在订阅付费时,因没有境外信用卡,付费订阅计划受阻。

(本来放了一张:Midjourney 生成的 “川建国在河南农村” 的图片,很可惜被和谐了,我的评价是画面融入得很好,很和谐不突兀,皮鞋上还有泥巴灰,但是涉及政治咋还是理解的,感兴趣的朋友自己网上搜,有很多网友恶搞生成的图片)

Stable diffusion【Hot】

同 Midjourney,是文字生成图片的开源项目,可以用自己的电脑去训练图片

(当然,对你的 显卡GPU 要求有点高,我电脑不配,没有去尝试过)

  • 自己电脑显卡配置不错,想试试的朋友可以去网上搜搜相关视频、文章教程

文字生成视频模型 Gen-2

(我没有去了解过,也没有专门去搜过,只是记录一下)

可以说,有了Runway Gen-2,你就能用任意的图像、视频或文本,生成一段酷炫大片,想要啥风格,就有啥风格。

  • 目前 Gen-1 的内测排队都还没排到, Gen-2 就出了

个人感受

与人类交流和与 ChatGPT 交流的直观感受

ChatGPT 也能理解人类对话

  • 人也不一定每次都能理解对方说的话,但人搞不清楚的时候有些会选择问清楚再回答,而 ChatGPT 基本不会告诉你他不理解,大概率直接按他的理解答/

ChatGPT 的知识库十分庞大,有一定的专业性、全面

  • 你问专业性的问题他大多能说上个四五六(但跟行业专家相比,ChatGPT 可能还是差很多的)

ChatGPT 答案回复速度很快

  • 人可能要想很久,结合多种情况,层面的因素,还不一定讲的全面,ChatGPT 的回答还是相对全面的,基本都是网上的高赞答案,当然,实测也有漏掉的时候,并不能百分百依赖(网上有案例,连乘法运算他都能错,少几个0,所以不要百分百信任他的回答)

ChatGPT 不会嫌人烦

  • 可把 chatgpt 当成同事朋友来问问题(让他给你解释一些东西的意思,AI好处在于不会嫌你烦,嫌你菜,随便你问)
  • 随便你问,总能保持比较好的态度,也不会觉得你烦了随便敷衍你

其他感受

ChatGPT 发展很迅猛,可能是后续工作的必备小助手

  • 已经有人在研究:联网搜索、支持图形输入输出、导入文件直接对文件内容进行提问(目前网友反馈:还不是特别靠谱)

    • 但后续收费策略还会调整,需要进一步了解
  • 建议等他再发展发展,持续跟进,定期了解(预计一个多月之后,2023.5.28左右可能比较适合)

  • 网上还有说可以接入公司数据库,变成智能管理

    • 但数据交给 ChatGPT 我不是很放心,不少国家机构也比较担心,由于目前中美关系紧张,政府相关数据必然还是不能通过 ChatGPT 处理的
    • 且近期也传出了三星公司数据泄密的新闻,所以敏感信息请不要用 ChatGPT 处理

变化非常快,各种状况频发,悲喜参半

  • 一时传出封禁亚洲账号的消息,一时传出各种项目产品集成的消息,一时传出数据泄密的信息,一时传出服务抽风报错的消息,各种镜像网站涌现出来,各种镜像网站被封停,各种好用工具收费……

可以助力工作,但怎么运用,给工作提效需要花精力探索、找到顺手的用法和相关的技巧

  • 毕竟有点颠覆常规工作方式,前期的探索阶段并不会提高工作效率,甚至可能让工作效率更低,是需要有这么个过程的

可以考虑用来了解陌生领域、不熟悉的内容(如技术名词、专业名称)、写邮件、概括文章内容、写总结等

  • 可以拿 ChatGPT 的内容来改写,某种程度上来说可以让不擅长表达的人得到一个还看得过去的表达

目前网上吹嘘的文章很多,有点过分夸大了,需要辩证的看待

  • 这几周了解下来,接收到的所有信息(主要来源:B站视频、公众号文章)里,80%的都是推广知识星球割韭菜的,15%是卖 chatgpt 账号/代开 plus 的,3% 是为了蹭热点强行吹的,2%的人可能是分享点什么东西的
  • 还有很多讲用 ChatGPT 写代码的,其实看下来实现的都是很简单的应用,确实比较快,甚至大多都是网上已经有了的案例,能否用于大型项目开发,还有待考察

我个人比较认同网上看到的说法,可能由一个专业人员使用 ChatGPT 辅助工作才能发挥 ChatGPT 的最大作用

  • 而不是拿自己的业余和 ChatGPT 去挑战人家的专业
  • (个人推测)比如写方案你可以把需求告诉他让他写一份、帮你搜集某方面的相关资料、对文章部分内容做语句润色,然后自己基于他提供的信息做加工处理、补充

这几天突然想到的担忧/提醒:

我们使用 ChatGPT 可以使用好的地方,但别忘了现实生活中还是要和人交流的,别养成了交流的坏习惯(命令、习惯性提要求、简短不耐烦、傲慢),给对话方设定过高的要求、标准

别上来就含糊其辞在慢慢完善,虽然 ChatGPT 可以让你补充信息重新回答,但跟人这么交流还是不如一开始就讲清楚的,要注意语气,少用命令式,建议用谦和的语气交流


个人碎碎念

关于 ChatGPT,还有很多可以探索了解的地方:

  • 一些比较好的开源项目,应用场景实例
  • ChatGPT API(可以看看能拿来做什么)
  • 总结提炼自己的一套问答方式
  • 探索 ChatGPT 提效工作的方式
  • ……

关于 ChatGPT,还可以有很多思考以及进阶技巧探索,等我梳理积累了一定的思考后可能会再分享出来,目前还是有些困惑没有想清楚的,如

  • 是否可以让 ChatGPT 反问我们,主动让我们补充问题细节?
  • 让 ChatGPT 自己告诉我们可以如何帮助我们
  • ……(大家也不用期待,估计我会鸽)

ChatGPT 使用辅助/技巧

要想 ChatGPT 给出高质量回答的前提:把问题描述清楚(即写好 prompt 指令)

ChatGPT 的回复质量取决于提示词(即 Prompt)。这通常是用户提供的问题或文本,以激活模型生成回复。

简单来说,prompt 就是用户想要询问的内容,作为输入送到 ChatGPT 中,ChatGPT 会尝试理解这个输入,然后输出合适的回答或响应。通过优化提示词,可以使 ChatGPT 生成更加准确、有用的回复。

花了近三周时间对 ChatGPT 进行多方面了解、体验后写的报告,超级全面,建议想了解的朋友看看_第3张图片

特色玩法

如果觉得 ChatGPT 回答不完整,可以让它 继续/接着说

  • ChatGPT 回答的内容有文字长度限制(好像是 token 数限制),如果要输出的内容过多,可能就会被截断,此时你只需要让他继续即可

花了近三周时间对 ChatGPT 进行多方面了解、体验后写的报告,超级全面,建议想了解的朋友看看_第4张图片


要求按照指定格式回答

花了近三周时间对 ChatGPT 进行多方面了解、体验后写的报告,超级全面,建议想了解的朋友看看_第5张图片


让 ChatGPT 进行类比

  • 问 ChatGPT 时,他给出的回答可能会比较专业,或者拗口,难以理解,可以让 ChatGPT 给你类比一下,或者说打个比方,做个比喻

花了近三周时间对 ChatGPT 进行多方面了解、体验后写的报告,超级全面,建议想了解的朋友看看_第6张图片


让 ChatGPT 返回图片(纯图一乐,可以期待一下后续的发展……)

  • 注意:他返回的内容是基于 unsplash 网站去找的,不是 ChatGPT 自己生成的
请按照以下规则给我发送图片:
1.使用markdown格式;
2.使用unsplash API;
3.使用" ![imgae]https://source.unsplash.com/featured/?<已翻译的英文内容> "格式回复;
4.不要使用代码块,不要描述其他内容,不要解释;
5.根据我输入的内容生成对应格式;
第一个输入内容:三只哈士奇拉着一辆车在沙滩上朝着不同方向奔跑

让 ChatGPT 扮演相应角色,使回答处于某种情境之下,可以使 ChatGPT 的回答更加专业

  • 让生产力加倍的 ChatGPT 快捷指令:ChatGPT Shortcut
    • 建议是多看看,学习学习人家是怎么写的,掌握了之后,自己就可以问出好问题了,而无需局限于别人提供的模板,可以沉淀出自己的模版来
      • 我希望你能充当英语翻译、拼写纠正者和改进者【扮演角色】。我将用任何语言与你交谈,你将检测语言,翻译它,并在我的文本的更正和改进版本中用英语回答【描述需求】。我希望你用更漂亮、更优雅、更高级的英语单词和句子来取代我的简化 A0 级单词和句子。保持意思不变,但让它们更有文学性【追加细节描述】。我希望你只回答更正,改进,而不是其他,不要写解释【加要求/限制回答】。我的第一句话是 [要翻译的语言]
      • 我希望你能作为一名 IT 专家。我将向你提供有关我的技术问题的所有信息,而你的角色是解决我的问题【扮演角色】。你应该用你的计算机科学、网络基础设施和 IT 安全知识来解决我的问题【描述需求】。在你的回答中,使用聪明的、简单的、为各种层次的人所理解的语言会有帮助。逐步解释你的解决方案并使用要点是很有帮助的。尽量避免过多的技术细节,但在必要时使用它们【追加细节描述】。我希望你用解决方案来回答,而不是写任何解释【加要求/限制回答】。


一些翻车对话案例(打破网上吹嘘的神话)

觉得大家目前对于 chatgpt 的期望过高,所以内容更偏向于泼冷水

  • 后文的内容既有基于 ChatGPT 3.5 的也有基于 ChatGPT 4的(还是一些是早期通过国内镜像网址进行测试的)

使用 ChatGPT 生成测试数据(测试对开发工作的辅助作用)

给我用中文生成30条测试数据,以js数组的形式给我,有id、姓名、年龄、地址、身份证号、手机号等字段,其中地址字段需要是中国浙江省金华市金东区的范围内的,要不一样,XX公司/XX号这种形式的;年龄要在15~45之间,名字最多3位数,且更自然一些,id用8位UUID

  • 感觉多少有点听不懂问的意思,我要的是 JS 数组的形式啊,这个地址和名字、手机号也有点一言难尽
  • (2023.4.10 用 ChatGPT 3.5 又测了一遍,效果靠谱了很多)

花了近三周时间对 ChatGPT 进行多方面了解、体验后写的报告,超级全面,建议想了解的朋友看看_第7张图片


了解2023年3月份推出的 freebus5(测试对新数据的感知)

  • 咋一看板板正正的,实际上介绍不会很全面,甚至可能是编的(充电5分钟,听2小时没介绍到)
  • 信息可能有错的(耳机有陶瓷白、冰霜银、珊瑚橙三种配色)
    • 编的很逼真,不了解不知道很可能就被骗了

花了近三周时间对 ChatGPT 进行多方面了解、体验后写的报告,超级全面,建议想了解的朋友看看_第8张图片

花了近三周时间对 ChatGPT 进行多方面了解、体验后写的报告,超级全面,建议想了解的朋友看看_第9张图片

一个声称使用了 ChatGPT 4 的国内代理网站回答的问题(感觉很离谱)

请添加图片描述

2023.4.10 问 ChatGPT 4 的回答

花了近三周时间对 ChatGPT 进行多方面了解、体验后写的报告,超级全面,建议想了解的朋友看看_第10张图片


了解微信公众号文章失效情况(测试解决问题的能力)

  • 并没有回答到我常用的,最简单可行的解决办法,复制失效链接用微信打开重新复制永久链接……
  • 问起来感觉有点笨笨的,聪明又不太聪明


让 ChatGPT 给我推荐几个入门 Mermaid 的博客(让 ChatGPT 推荐网页)

(问的 ChatGPT4)非常可惜,推荐的文章除了官方博客,没有一个能打开的,进去全是404……

花了近三周时间对 ChatGPT 进行多方面了解、体验后写的报告,超级全面,建议想了解的朋友看看_第11张图片

让 ChatGPT 概括文章内容(测试 ChatGPT 阅读网页的能力)

(问的 ChatGPT4)很遗憾这是他编的,和文章内容毫不相干

  • 对话里的文章链接:让 ChatGPT 自己告诉你如何与它高效交流(终稿)

  • 注意,这个会话的前文是我让 ChatGPT 教我入门 Mermaid,他有可能被前面的对话内容干扰了

花了近三周时间对 ChatGPT 进行多方面了解、体验后写的报告,超级全面,建议想了解的朋友看看_第12张图片

新建了一个会话,看看他的回答

  • 就很好奇,既然他无法直接访问网页链接,为什么前面的对话里不直接告诉我,还要编一个答案……

花了近三周时间对 ChatGPT 进行多方面了解、体验后写的报告,超级全面,建议想了解的朋友看看_第13张图片


角色扮演翻车案例(测试技巧的适用性)

用的是 ChatGPT 3.5,2123*32 的答案是 67936

花了近三周时间对 ChatGPT 进行多方面了解、体验后写的报告,超级全面,建议想了解的朋友看看_第14张图片


API 调用收费相关科普

ChatGPT 官方对话框对话不收费

收费: gpt3.5 $0.002/1000token(分词)

花了近三周时间对 ChatGPT 进行多方面了解、体验后写的报告,超级全面,建议想了解的朋友看看_第15张图片

Token是什么?(摘自:ChatGPT的计费方式)

在自然语言处理(NLP)中,token是指一组相关的字符序列,例如一个单词或一个标点符号。

将文本分解为token是NLP的一项基本任务,因为它是许多其他任务的先决条件,例如词性标注、命名实体识别和机器翻译。

在文本处理中,token可以是一个词语、数字、标点符号、单个字母或任何可以成为文本分析的单个元素。

在分解文本时,通常会根据空格、标点符号和其他特定的分割符号来确定token的边界。

例如,在以下句子中,标点符号和空格用于分解成为不同的token:

“我喜欢吃冰淇淋。”

在这个句子中,每个汉字和标点符号都可以切分开成一个token。

但是,一个字一个字去理解整句话的意思,可能反而会理解错误。

例如“冰淇淋”,就是一个完整的词,分开成“冰”“淇”“淋”三个字反而无法理解了。

类似的,NLP中,token还可以是比词更高级别的语言单位,例如短语或句子。

例如,对于短语token,“红色的苹果”可以被视为一个token,而不是单独的“红色”和“苹果”token。

因为存在不同的切分方式,所以“红色的苹果”,就需要切分成“红”“红色”“的”“苹果”“果”“红色的苹果”等多个token去理解。

在处理文本时,理解token的概念是非常重要的,因为它是许多文本分析任务的基础。NLP算法会使用token来构建文本的表示形式,理解自然语言,以便进行其他分析任务。

因此,对于NLP系统来说,选择正确的分词方法(tokenization)非常重要,它将直接影响到其他任务的准确性和效率。

ChatGPT API的价格

再回来看ChatGPT API的[1],

“$0.002 per 1k tokens”

在英语中“一个 token 通常对应大约 4 个字符”,而1个汉字大致是2~2.5个token。

1000 tokens大概是750单词。那也就是说,大概2美元可以问100万个token,相当于750000个单词。75万个单词只要不到15块钱人民币,相比人类作家,够便宜的了!

当然,虽然100万个token看起来很多。但其实,发送一段供API响应的文本可能就会花费不少token。

根据大家的经验,基本问清楚1个问题就要耗费100~200个token,算起来其实不少的,尤其在连续会话中,为了保持对话的连续性,必须每次都要回传历史消息,并且输入都要算 token 数算钱的,满打满算,按量付费其实也不便宜。

如果你想查询一串指定的文本到底需要耗费多少个token(钱),官方也有提供一个免费查询计算器,有兴趣可以看一看。


ChatGPT 的发展历程

OpenAI总部位于旧金山,由特斯拉的马斯克、Sam Altman及其他投资者在2015年共同创立,目标是开发造福全人类的AI技术。

从2018年起,OpenAI就开始发布生成式预训练语言模型GPT(Generative Pre-trained Transformer),可用于生成文章、代码、机器翻译、问答等各类内容。

2019年2月发布 GPT-2,参数量为15亿

2020年5月发布 GPT-3,参数量达到了1750亿

ChatGPT 于 2022年11月30日由 OpenAI 公司开发并推出,是基于 GPT-3.5 架构的大型语言模型

(期间是基于不同学科基础,不同的算法模型迭代,一步步迭代过来走过来的,同时 chatgpt 需要消耗巨大的计算资源,成本非常非常巨大)

2023年3月发布 GPT-4


粗略记录的相关新闻(可以看出,发展变化非常迅猛)

2023.02.08

new bing 发布

2023.03.15

OpenAI发布了ChatGPT的最新“升级版本”——GPT4模型


2023.03.16

微软宣布将 chatgpt 集成至 office

2023.03.22

微软旗下代码托管平台GitHub发布了编程辅助工具Copilot的全新版本Copilot X,新版本接入GPT-4

2023.03.23

OpenAI宣布ChatGPT能够支持第三方插件接入

2023.03.29

微软公司宣布推出下一代人工智能产品Microsoft Security Copilot,将AI技术应用于网络安全领域,为安全专业人员提供一个有效的工具,以快速检测和响应威胁,并更好地了解整个隐患存在的态势。

包括埃隆·马斯克(Elon Musk)和苹果联合创始人史蒂夫·沃兹尼亚克(Steve Wozniak)在内,1000多名科技界领袖呼吁暂停开发人工智能。他们担心这场危险竞赛会对社会和人类构成“深远的风险”,且可能产生“灾难性”影响。

在由非营利组织生命未来研究所(The Future of Life Institute)发布的一封名为《暂停大型人工智能实验》公开信中,马斯克和其他科技界领袖呼吁,所有人工智能实验室停止开发产品至少6个月,并对其进行更多风险评估。


2023.03.31

谷歌 bard 宣布开放测试?,可以排队申请体验

2023.04.02

OpenAI 官宣

预计 GPT-4.5 将在 9 月或 10 月推出(可能会有)

2023年12月 ChatGPT5 正式发布

该模型具备人工通用智能的能力,能够像人类一样思考和推理。通过理解和回应自然语言的能力,ChatGPT5 将使人与机器之间的交流比以往任何时候都更无缝。ChatGPT5 不仅仅是普通的人工智能模型,而是一个改变游戏规则的东西,将改变我们与技术互动的方式。

花了近三周时间对 ChatGPT 进行多方面了解、体验后写的报告,超级全面,建议想了解的朋友看看_第16张图片


2023.4.3

微软官方开放 Microsoft 365 Copilot 抢先体验

突发!ChatGPT致三星半导体机密泄漏

2023.4.4

华为将会在 4.25 发布盘古大模型,号称全世界最大的中文模型,更能理解我们国人的对话

ChatGPT Plus 开通按钮已禁用(网传有人用国外0余额信用卡套刷 ChatGPT Plus 会员,薅羊毛把羊薅疼了,亦或是使用人数太多了,计算资源不够用了,禁用前就网传 ChatGPT 回答会报错了,还有 4.5 会给出一堆回答,大量内容重复打印)


2023.4.6

ChatGPT Plus 注册按钮已恢复


2023.4.7

阿里 通义千问 开放内测申请

2023.4.10

360 的 360智脑 x 360搜索低调邀请企业内测


题外话

如果大家觉得文章写的不错,请帮我点个赞~

花了好几天梳理出来的文章,挺累的

原文标题:花了近三周时间对 ChatGPT 进行多方面了解、体验后写的报告,超级全面,建议想了解的朋友看看
链接:https://blog.csdn.net/qq_37177115/article/details/130073225
著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

你可能感兴趣的:(从发现到技巧,chatgpt)