阿里大模型——通义千问

目录

前段时间世界人工智能大会在上海举行,我去参观感受了一下,整个感受是有点名不副实的,参展的有各种银行、车企、还有中国电信、联通三个运营商都来凑热闹了。

阿里大模型——通义千问_第1张图片

但是也有Google、华为、阿里、腾讯、商汤这样的大厂。现场也可以体验一些大厂开发的大语言模型。例如阿里的通义千问、百度的文心一言,这些感觉生成效果都不错。还有华为的盘古大模型,尤其是盘古气象大模型,听说效果不错,研究成果还发布到了《Nature》

ok,今天就来介绍一下阿里的通义大模型。

阿里的通义大模型是达摩院自主研发的超大规模语言模型,包括了:
• 通义千问(内容生成)
• 通义听悟(音频处理)
• 通义万相(AI绘画)
我申请体验了一下,没想到第二天就申请通过了,速度还是挺快的,大家也可以申请体验一下:https://tongyi.aliyun.com/

我体验了一下通义千问这个模型,在一些常规问题上的效果还不错,但是在逻辑理解、代码理解能力还有些不足。例如给它一个算法题,给出的代码甚至不能通过编译,并且无法完成代码的纠错。而ChatGPT给出的代码一次即可通过测试。​

通义千问是类似ChatGPT一样的文本内容生成模型。

做一份旅游攻略

代码生成
实现一个快速排序:

给它一个Leetcode算法题(最长回文子串),把它的代码测试运行一下,发现编译都报错…

然后我发现它给出的代码中不知道为什么要用一个int变量减去一个布尔值

然后它就一直重复回答…

同样的prompt,我们看下ChatGPT的效果:

阿里大模型——通义千问_第2张图片

ChatGPT给出的代码放在Leetcode上可以直接运行成功,通过测试。
阿里大模型——通义千问_第3张图片

让ChatGPT成功指出通义千问代码的错误,并且修正后的代码运行测试通过。
阿里大模型——通义千问_第4张图片

而通义千问对代码的理解能力却有待提高:

并且UI还有显示的BUG:

内容创作
这效果差的不是半点啊


阿里大模型——通义千问_第5张图片

另外我还体验了通义万相,是AI绘画类模型,但是生成的效果和MidJourney、Stable Diffusion这些差了一些。

你可能感兴趣的:(人工智能,chatgpt,阿里云)