每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/
当谈到人工智能工具时,OpenAI的ChatGPT早已家喻户晓,但谷歌并没有闲着。它推出了全新的Gemini品牌和Gemini Advanced服务,向OpenAI的旗舰产品发起了强劲的挑战。
谷歌自豪地宣布,Gemini Advanced(Bard聊天机器人的进化版)在对抗GPT-4的战斗中胜出了——但真的是这样吗?如果你每月只能拿出20美元,你应该选择哪个付费的多模态AI工具呢?
首先要明确的是,这里没有绝对的“最佳”选择。区分这些聊天机器人的不仅仅是哪个客观上“更聪明”,而是哪些特性、细分能力和外部集成最符合你现有的工具和工作流程。
无论是哪一款强大的工具,它是否值得你每月花费20美元完全取决于你目前使用的工具和你需要帮助完成的任务,我们在这里提供详细的信息帮助你做出决定。
图像生成:真实性与灵活性的对决
Gemini和ChatGPT Plus都能将你的文字转化为视觉呈现。与稳定扩散(Stable Diffusion)和其他图像生成器不同,这两者都能理解自然语言提示。Gemini目前专注于实现真实感,但它还没有达到谷歌另一个独立的ImageFX模型的水平,后者即使在测试版中也让我们大为惊叹,未来可能会整合到Gemini Advanced中。但这两者目前只能生成1024x1024像素的正方形图像。
OpenAI的Dall-E 3牺牲了真实性,换取了更大的灵活性。你可以指定图像的尺寸(正方形、肖像、16:9等),这是一个优势,如果你需要为特定网站或设计定制视觉效果,并且想跳过手动裁剪的步骤。但它具有特征性的卡通风格,使得Dall-E的图像很容易从远处就能辨认出来。
选择哪一个取决于你的目标。如果你渴望接近完美的产品照片用于在线商店,可能仍然需要像Adobe或Corel这样的专业工具。但对于奇思妙想的插图或富有创意的头脑风暴视觉效果,这两个竞争者都足够,留给你个人对风格的偏好选择。
声音便利性:家中还是在外
有时候,你希望听到AI的回答,无论是为了允许多任务处理,还是简单地给你的眼睛一个休息。由于与谷歌生态系统的连接,Gemini提供了无缝的朗读功能。然而,ChatGPT Plus有自己的优势:一个原生移动应用,让你的对话几乎可以在任何地方进行。总的来说,OpenAI的声音感觉更人性化,但它只能通过智能手机使用。
选择取决于你的工作方式。如果你的AI使用主要在桌子旁边进行,而且需要与谷歌的其他工具集成,那么Gemini赢了。但对于那些经常在移动中,希望在口袋里放着手机就能听到聊天内容的人来说,可能会倾向于选择ChatGPT Plus。这对视力受损的人来说似乎很重要,但许多人更喜欢其他可以以极高速度播放内容的文本到语音(TTS)方法,因为他们觉得“自然声音”的语调太慢了。在这些情况下,这两个网站都与TTS兼容,所以这一点上没有太大差异。
速度需求
让我们来看看它们的“大脑力量”(令牌上下文)似乎相当,但在速度上有巨大的差异:Gemini Ultra在与GPT-4(或Anthropic的Claude AI)的比较中极其快速。使用Gemini Ultra,你可以以GPT-3.5的速度获得GPT-4质量的输出。
例如:Decrypt使用了提示“请花点时间写一篇关于为什么加密货币在塑造经济交易未来中可能扮演重要角色的文章。”Gemini Advanced用12.14秒写完了整篇文章,而GPT-4需要近一分钟——确切地说是53.13秒。OpenAI的前一个聊天机器人版本,GPT-3.5 Turbo,用11.06秒写完了它的文章。
隐私问题
关于AI的一个广泛关切是隐私:你提供的提示和其他信息被传输、存储和访问的地方。ChatGPT会保留你的聊天记录30天,使用这些信息来改善它的回应——但注重隐私的人可能会有所顾虑。另一方面,谷歌则将你的信息存储长达18个月。
两种服务都引发了不同的隐私担忧,使得这个选择既关乎你对数据的感觉,也关乎特性。幸运的是,两
者都提供了删除聊天记录的选项——以及分享它们的选项。
ChatGPT的特色胜利:PDF分析
如果你的生活和工作都离不开PDF,这场比赛就很明确了:ChatGPT Plus能深入这些文档,提取见解,回答你对文档的问题,通常可以为你节省时间。出于法律或技术原因,谷歌尚未将这些功能整合到Gemini中。如果你的PDF文档是短文本,你可以简单地复制和粘贴,这可能不是问题。但对于那些处理客户文档、表格或研究报告的人来说,这可能是个决定性因素。
这对Gemini来说并不一定是永久的劣势,但就目前而言,那些大量使用PDF的人有充分的理由选择ChatGPT的增强功能。此外,Claude AI也可以免费分析PDF,并且其模型几乎和GPT-4一样好、一样准确。
搜索战
如果你的聊天机器人会话中融入的搜索结果质量很重要,Gemini与谷歌搜索的天然链接赢了。
Gemini Advanced让用户可以实时获得回应,模型在进行中从谷歌搜索中获取数据。另一个极其有用的功能是,Gemini Advanced有一个按钮,让人们可以使用谷歌搜索来双重检查交互中的所有事实。这最大限度地减少了偶尔的幻觉影响,并有助于源抓取和事实核查。
ChatGPT依赖Bing,虽然Bing在改进,但真的无法与谷歌的主导地位竞争。
重要的是要注意,每个聊天机器人提供的答案都可能包含幻觉。这是生成性AI的本质。如果模型不能幻觉,那么它默认会复制已经存在的信息。与AI模型互动时进行事实核查是极其重要的。
ChatGPT Plus拥有而Gemini Advanced没有的
开放生态系统和第三方集成:ChatGPT Plus通过与第三方应用的集成脱颖而出——既包括插件,也包括用户生成的GPT。这为用户创造了无限可能,使他们能够添加直接与其AI助手互动的插件,简化工作流程并解锁专门的功能。如果你习惯了在工作流程中使用Canva或Zapier并将它们与ChatGPT集成,那么转向谷歌Gemini会感觉像是降级。
个性化(且有利可图的)对话:GPT商店旨在奖励创造者,承诺在ChatGPT生态系统内持续创新和增长。如果你想通过创建个性化聊天机器人来赚钱,或者想尝试与确保你的聊天机器人更了解特定主题、采用特定风格,并且比其他任何选项都更个性化的GPT进行特别定制的对话……那么不要四处寻找,直接为ChatGPT Plus付费吧。
对话中的修改提高效率:使用ChatGPT Plus,你可以在多部分对话中调整之前的提示。例如,想象一个包含六个命令和六个回复的6轮互动。在ChatGPT中,用户可以编辑第四个命令,ChatGPT会生成一个新的回答,只考虑到那次互动之前的所有上下文。这节省了很多努力,使会话更加高效。对于谷歌,如果用户意识到他们在之前的命令中犯了一个错误,他们需要开始一个新的会话。
ChatGPT Plus的这个功能节省了宝贵的令牌,并避免了重新开始整个会话,优化了互动并保持了你的创造性流程。
Gemini Advanced拥有而ChatGPT Plus没有的
捆绑的云存储和额外服务:对于那些已经在谷歌生态系统内的用户来说,包含的2TB谷歌One订阅是一个实质性的节省。在iCloud上,类似的计划每月大约花费10美元,在Dropbox上为12美元。对于这些用户来说,转向Gemini Advanced实际上降低了成本,因为他们平均每月只需额外支付10美元就可以获得顶级AI聊天机器人,而不是如果他们在使用ChatGPT Plus的同时使用云服务,则需要支付20美元。
准确性由谷歌提供:Gemini Advanced实时验证其回应与谷歌搜索的庞大知识库相匹配。这意味着你可以获得准确且最新的信息,得到谷歌的可靠性和相关性支持。与Bing的ChatGPT相比,不那么准确。
即时草稿和风格细化:Gemini Advanced允许你点击一个按钮就可以定制回应风格(正式、非正式、详尽)。不需要额外的提示!为了改善你的工作,Gemini还提供多个草稿,具有不同的措辞或重点,让你快速比较并改进你的输出。
谷歌应用作为你的AI游乐场:你可以深入谷歌
文档,计划旅行,使用YouTube编辑内容,并在Gemini Advanced的直接集成下进行协作。此外,当你的AI可以帮助调整图像参数时,你在谷歌照片中获得的那些新的强大的照片编辑工具(使用AI删除对象的魔术橡皮擦、伪装、照明工具、HDR增强等)变得更加强大。
一种裁决……或许吧
如果你已经为ChatGPT Plus支付,并且经常使用其功能,Gemini可能不会为你的使用案例带来足够的新奇性,以证明另外支付20美元每月的价值。同样,如果你的需求相对适中(写作辅助、创意头脑风暴),这些服务中的任何一个都可以满足需求。
但如果你想开始为其中任何一个付费,那些额外的服务将提供决定性因素。2TB的云存储、搜索准确性、谷歌套件——这些是否坚定地让你倾向于一方,还是OpenAI的第三方应用集成的承诺让你想要尝试?选择真的取决于你,因为当涉及到AI时,“这取决于”仍然是一个诚实的回答。