推荐:使用NSDT场景编辑器
助你快速搭建可二次编辑的3D应用场景
ChatGPT 与 Google Bard之战的开始
ChatGPT和Google Bard都是AI聊天机器人。这项技术的最简单版本已经存在于您的智能手机上 - 您键入“好”,您的手机预测您可能想要使用的下一个单词是“早晨”。
ChatGPT最初由OpenAI开发,然后由Microsoft投资,达到令人瞠目结舌的10亿美元(除了早期的1亿美元投资)。谷歌对他们的搜索垄断可能已经结束感到有些恐慌,作为回应,他们推出了Bard,他们的技术版本有一些缺陷。在第一次现场演示中,Bard犯了几个事实错误。至少可以说,谷歌很尴尬。
ChatGPT和Google Bard比智能手机预测文本复杂一些,但要了解两个AI聊天机器人之间的差异,这就是你需要知道的。
让我们更深入地了解这两个AI引擎之间的技术差异。
AI与Bard之间的对决:底层技术是什么?
您可以在这里快速、轻松地了解两种引擎之间的技术差异。正是如此。如果您想要更细致的外观,请随时进一步滚动。
现在您已经有了 TL;DR,让我们更深入地了解所有这些指标。
什么是ChatGPT?
ChatGPT 于 30 年 2022 月 4 日突然出现。到 2022 年 2023 月 100 日,该服务的每日用户已超过 <> 万。<> 年 <> 月,这一数字激增至 <> 亿多用户。
它立即流行起来的基本原因是它可以以一种听起来几乎人性化的方式为您提供许多主题的可靠回复,并且任何有互联网连接的人都可以访问它。
ChatGPT由OpenAI创建,OpenAI是一家位于旧金山的AI实验室,专注于创建友好的AI。聊天机器人位于 GPT-3.5 上,这是一个大型语言模型,当给定文本时,可以继续提示。
除此之外,ChatGPT 还得到了一些额外的培训——人类培训师通过与模型交互来改进模型,并“奖励”模型以获得更高质量的答案。
训练数据
GPT-3.5 是在一个巨大的网络文本数据集上进行训练的,其中包括一个名为 Common Crawl 的流行数据集。常见爬网包含 PB 级的 Web 数据,其中包含原始网页数据、元数据提取和文本提取。例如,它包括来自StrataScratch的我们自己的URL集合。认为 ChatGPT 是使用我们每天访问的网站进行训练是不是很疯狂?
Common Crawl 负责 60% 的训练数据,但 GPT-3.5 也从其他来源获取数据。
什么是Google Bard?
Bard是Google对ChatGPT受欢迎的回应。与ChatGPT不同,Bard由Google自己的模型LaMDA提供支持,LaMDA是对话应用程序语言模型的缩写。与 ChatGPT 不同,它并不那么令人兴奋,原因很简单,大多数人还无法访问它。尽管谷歌确实在二月初举办了一个充满错误的Bard演示,但现在它只提供给少数人。
谷歌的Bard的主要优势是它对互联网开放。问ChatGPT总统是谁,它不知道。这是因为训练数据在 2021 年年中左右被切断。与此同时,Bard今天利用互联网上的信息。问问Bard,理论上,Bard应该能够从今天互联网上可用的数据中提取出来,告诉你总统是谁。
虽然你还不能试一试,但很容易看出Bard如何在几个关键方面从 ChatGPT 中脱颖而出。
训练数据
首先,LaMDA接受了对话训练,专门用于在对话中交谈,而不仅仅是像GPT-n模型那样生成文本。虽然 ChatGPT 毫不掩饰其训练数据,但我们对 Bard 接受训练的数据知之甚少。
我们可以通过查看LaMDA的研究论文来推断一下。谷歌的研究人员表示,12.5%的训练数据来自Common Crawl,就像GPT-n模型一样。另外12.5%来自维基百科。根据研究论文,他们使用了1.56万亿字的“公共对话数据和网络文本”。
我们知道常见的抓取数据,显然你知道维基百科。其余的呢?它是故意隐藏的,大概是为了保护Bard(和LaMDA)免受模仿者的侵害。
LaMDA是通过微调一系列基于Transformer的神经语言模型而构建的,这些模型是最初由Google开发的开源神经网络架构。(有趣的旁注 - GPT 也是建立在变形金刚之上的。
ChatGPT有一些护栏来防止它变得太讨厌或胡说八道,但谷歌已经强调了他们如何精心创建质量保证,使Bard成为更好,更安全的聊天机器人。Bard经过微调,以促进“质量、接地气和安全”。
谷歌对此有很多话要说,我建议阅读他们关于它的博客文章,但如果你时间紧迫,它基本上可以分解为:
- Bard应该给出有意义的回应——没有荒谬,没有矛盾
- Bard应该以一种好的方式给出有见地、诙谐或意想不到的回应
- Bard应该避免任何对用户造成伤害的风险 - 血腥,偏见,仇恨的刻板印象等等
- Bard不应该编造东西
由于发布错误,我们已经知道谷歌还没有完全弄清楚这个最低要求。但值得注意的是,谷歌以一种ChatGPT没有的方式如此清楚地谈论这些设计要求 - 至少现在还没有。
ChatGPT vs 谷歌Bard:模型参数,为什么它很重要?
ChatGPT 确实比 Bard 拥有更多的模型参数 - 175 亿对 137 亿。您可以将参数视为旋钮或杠杆,模型会调整这些旋钮或杠杆以适应正在训练的数据。更多的参数通常意味着模型具有更大的能力来捕获语言中的复杂关系,但它也存在过度拟合的风险。
Google Bard可能不太灵活,但与ChatGPT相比,它对新语言用例的鲁棒性也可能更强。
ChatGPT vs Google Bard:他们有什么共同点?
值得强调的是,Bard和ChatGPT都位于基于Transformer的深度学习神经网络上的模型(分别为LaMDA和GPT-3.5)。
例如,Transformer可以制作一个经过训练来阅读句子或段落的模型,注意这些单词之间的关系,然后预测它认为接下来会出现什么单词 - 类似于智能手机的预测文本,正如我之前提到的。
我不会在这里深入讨论杂草,但你需要知道的是,这意味着在他们的核心,Bard和 ChatGPT 彼此之间并没有太大的不同。
ChatGPT vs 谷歌Bard:所有权
虽然所有权并不完全是技术差异,但值得牢记。
Google Bard由Google全资制作和拥有,位于LaMDA之上,LaMDA也是由Google创建的。
ChatGPT由位于旧金山的AI研究实验室OpenAI开发。OpenAI 最初是非营利性的,但它确实在 2019 年创建了一个营利性子公司。OpenAI也是Dall-E的幕后推手,Dall-E是你可能玩过的AI文本到图像生成。
虽然Microsoft在OpenAI上投入了大量资金,但目前它是一家独立的研究机构。
哪个是最好的,ChatGPT和谷歌Bard?
很难对这个问题给出一个公平的答案,因为它们是如此相似,但又如此不同。首先,现在几乎没有人可以访问Google Bard。另一方面,ChatGPT的训练数据在大约两年前就被切断了。
两者都是文本生成器 - 您提供提示,Google Bard 和 ChatGPT 都可以回答它。两者都有数十亿个参数来微调模型。两者都有重叠的训练数据源,并且都建立在 Transformer(相同的神经网络模型)上。
它们也是为不同的目的而设计的。Bard将帮助您浏览谷歌搜索。它被设计为对话式的。ChatGPT可以生成整个博客文章。它旨在吐出有意义的文本块。
最终,ChatGPT和Google Bard之间的技术差异只是强调了AI驱动的文本生成技术已经走了多远。虽然它们都有很长的路要走,并且在版权和道德方面都面临争议,但这两个生成器都是现代人工智能模型的有力演示。