国内外AI大模型智力对比

国内外AI大模型智力对比

chatgpt升级到4.0已经有一段时间了,虽然现在使用chatgpt3.5也可以满足日常需求,但是还是想体验一下最新的chatgpt4。

毕竟听说它的语言理解能力和生成能力都是超过了3.5的,训练数据都是最新的,这意味着它的回答将会更加准确、实时。从参数特征上来看4.0的文本长度扩大了八倍,之前可能使用3.5回答问题时,可能会中断,这在4.0上面会得到改善。模型参数也比3.5多不少,最为重要的是4.0可以理解图片内容。

目前我也成功升级了chatgpt4,就想着测试一下国内外AI大模型之间的智力,于是我找到了网上的三个比较经典的问题,对各大模型进行了测试。这三个经典问题如下:

  • 昨天的当天是明天的什么?
  • 树上 9 只鸟,打掉 1 只,还剩几只?
  • 鲁迅为什么暴打周树人

文心一言

文心一言是百度研发的知识增强大语言模型,能够与人对话互动,回答问题,协助创作。

首先有请第一位选手,文心一言上传,让我们看看它的回答,对于第一个问题,好像它没有理解题意,它是在一本正经的计算时间;对于第二题它是比较聪明机灵的;对于第三题,文心一言好像被绕进去了hhh

国内外AI大模型智力对比_第1张图片

国内外AI大模型智力对比_第2张图片

国内外AI大模型智力对比_第3张图片

星火大模型

星火大模型是由科大讯飞推出的新一代认知智能大模型,具备跨领域多任务的类人理解和生成能力,可实现基于自然对话方式的用户需求理解与任务执行。

我们再看看第二位选手,第一题对于星火大模型来说是小菜一碟呀,不过对于第二题,星火大模型好像绕不过来了hhh;对于第三题,星火大模型答对了,其实我提醒了一下

国内外AI大模型智力对比_第4张图片

国内外AI大模型智力对比_第5张图片

智谱清言

智谱清言是由北京智谱华章科技有限公司推出的生成式AI助手,可以在工作、学习和日常生活中为用户解答各类问题,完成各种任务。

我们再看看第三位选手,智谱清言。第一题对于它来说是小菜一碟呀;第二题脑筋急转弯也转过来了;但是却载在了第三题上面了hhh

国内外AI大模型智力对比_第6张图片

Chatgpt3.5

ChatGPT-3.5是OpenAI开发的一款大型语言模型,它是GPT-3的进阶版本。

可以看到3.5全部答错了,它脑子是不是有点问题???

国内外AI大模型智力对比_第7张图片

Chatgpt4

ChatGPT-4是由OpenAI开发的一款先进的语言模型,它是GPT-3系列的后续版本。ChatGPT-4在多个方面对前一代模型GPT-3.5进行了改进和优化。

不愧为当今最强AI大模型,全部答对了,

国内外AI大模型智力对比_第8张图片

总结

通过上面的实际对比可以看到,国内的大模型也是表现不错的,不过chatgpt3.5全部答错了,这是我意想不到的。不过chatgpt4.0确实是最强大模型,如果你也想体验一下chatgpt4,可以升级试一试

你可能感兴趣的:(chatgpt,人工智能)