讯飞星火认知大模型全新升级,全新版本、多模交互—测评结果超预期

写在前面

版本新功能

1 体验介绍

登录注册

申请体验

2 具体使用

2.1 多模态能力

2.1.1 多模理解

2.1.2 视觉问答

2.1.3 多模生成

2.2 代码能力

2.2.1 代码生成

2.2.2 代码解释

2.2.3 代码纠错

2.2.4 单元测试

2.3 插件功能

2.3.1 PPT生成

2.3.2 简历生成

2.3.4 文档问答

3 其他功能

4 权威测评

4.1智商指数

4.2 工具提效

5 总结

优势

体验


 

写在前面

认知大模型(Cognitive Grand Model)是指一种综合性的认知模型,旨在模拟和解释人类的认知过程和智能行为。

它是对人类认知系统的整体建模,涵盖了知觉、注意力、记忆、学习、推理、语言理解和生成等多个认知功能。

可以说,AI大模型正在全球掀起新一轮的技术革命与商业浪潮,从技术突破到应用落地,加速改变着我们的生活与产业。依托通用人工智能领域的持续深耕和系统性创新,科大讯飞于5月6日正式发布星火认知大模型,并于6月9日迅速完成迭代升级,受到用户持续好评,为行业与企业提质增效。

8月15日,讯飞星火认知大模型V2.0如约而至!代码能力与多模态能力重磅发布,通用人工智能能力持续升级,蓬勃发展的开发者生态,构筑起通用人工智能的新生态。

在这之前,8月12日,新华社研究院中国企业发展研究中心发布的《人工智能大模型体验报告2.0》报告中,讯飞星火以总分1013分,被评为国产卓越大模型之一。

今天我们就来体验一下传说中的讯飞星火认知大模型

体验地址:体验地址

版本新功能

在体验之前,先了解一下这次2.0版本的新功能吧,这几个模块都做了全新升级,另外还增加了插件功能,满足各种场景的需求:

  • 多模交互
  • 代码能力
  • 文本生成
  • 数学能力
  • 语言理解
  • 知识问答
  • 逻辑推理

讯飞星火认知大模型全新升级,全新版本、多模交互—测评结果超预期_第1张图片

1 体验介绍

登录注册

申请体验:申请地址

讯飞星火认知大模型全新升级,全新版本、多模交互—测评结果超预期_第2张图片

然后点击申请注册,会跳到登录注册页面,我选择的是手机验证码登录,如果之前没注册,他会默认帮你注册,这一点挺好的,不用走注册流程了。

 

讯飞星火认知大模型全新升级,全新版本、多模交互—测评结果超预期_第3张图片

登录成功之后会看到头像

申请体验

登录成功之后,再点击申请注册,就会到申请页面

点击申请注册,就会有对应的弹框,然后输入你的信息就可以申请啦

讯飞星火认知大模型全新升级,全新版本、多模交互—测评结果超预期_第4张图片

提交成功

讯飞星火认知大模型全新升级,全新版本、多模交互—测评结果超预期_第5张图片

等待审核,稍微等待一会,审核很快(最快5分钟,最慢4小时)审核成功之后会有短信通知,申请通过之后,就可以使用啦

2 具体使用

讯飞星火大模型是新一代认知智能大模型,它拥有跨领域知识和语言理解能力,能够基于自然对话方式理解与执行任务

2.1 多模态能力

在多模态方面,讯飞星火也在此次做了新的更新,支持图片提问功能,目前GPT-4也暂未开放该功能。

用户可以向讯飞星火发送一张图片,然后根据图片内容向讯飞星火提问,例如,发送一张西安大雁塔的图片,让其识别图片展示的是哪一处建筑,有哪些相关的历史典故等。

下面我们来进行详细的使用

2.1.1 多模理解

上传图片素材,大模型完成识别理解,返回关于图片的准确描述

测试

直接上传一张图片,等待返回

结果

这是一张室内照片,画面中有一位坐在电脑前的女性。她穿着一件黑色的毛衣,头发扎成马尾辫。桌子上放着一台显示器和一个台灯,背景墙上挂着一些装饰品。整个场景给人一种专注和安静的感觉。

2.1.2 视觉问答

围绕上传图片素材,响应用户的问题,大模型完成回答

测试

描述一下这张图片

结果

在这张图片中,我们可以看到一个巨大的紫色行星和一个孤独的人站在沙漠中。这个行星非常巨大,占据了整个天空的大部分空间,而人则站在它的边缘附近。这个人似乎在欣赏着这个美丽的景象,可能是因为它令人惊叹或令人感到平静。

 

2.1.3 多模生成

根据用户的描述,生成符合期望的合成音频和视频

测试

帮我生成一段下雨的天,雨水下落,落到地面,落到屋檐。落到树林里的音频

讯飞星火认知大模型全新升级,全新版本、多模交互—测评结果超预期_第6张图片

结果

它不仅输出了一段音频,还有对应的文字描述,

(雨声轻拍树叶的声音)在下雨的天里,雨水从天空中缓缓下落,轻轻地拍打着大地。它们落在地面上,溅起一圈圈涟漪,发出微弱而悦耳的声音。同时,雨水也滴落到屋檐上。屋檐上的水滴不断滑落,形成一连串清脆的声响。这些声音交织在一起,仿佛是大自然为我们奏响的一曲美妙的乐章。而在树林里,雨水更是带来了一种独特的韵律。它们轻轻触碰着树叶和树枝,发出沙沙的声音。这些声音在树林中回荡,营造出一片宁静而祥和的氛围。总的来说,下雨天的声音是如此迷人。无论是雨水落到地面、屋檐还是树林里,都带给我们一种宁静和放松的感觉。让我们沉浸在这美妙的声音中,享受大自然的恩赐吧!

2.2 代码能力

2.2.1 代码生成

智能生成单行或函数级代码建议;根据注释、函数名自动生成代码

测试

帮我用pyhon实现一个复杂度较高的排序算法结果

结果

讯飞星火认知大模型全新升级,全新版本、多模交互—测评结果超预期_第7张图片

代码详情

def quick_sort(arr):
if len(arr) <= 1:
    return arr
else:
    pivot = arr[0]
    left = []
    right = []
    equal = []
    for i in range(1, len(arr)):
        if arr[i] < pivot:
            left.append(arr[i])
        elif arr[i] > pivot:
            right.append(arr[i])
        else:
            equal.append(arr[i])
    return quick_sort(left) + equal + quick_sort(right)

可以看到不仅生成了代码,还输出了一段对代码的介绍

这个快速排序算法的时间复杂度为O(nlogn),是一种非常高效的排序算法。它的基本思想是选择一个基准元素(这里选择第一个元素),将数组分为小于、等于和大于基准元素的三个部分,然后递归地对小于和大于基准元素的两个子数组进行排序,最后将三个部分合并起来即可得到有序数组。

2.2.2 代码解释

类、函数及其作用逐一详解;支持逐行代码注释;学习海量范式,快速精准解读

测试

因为是一个对话,上下是有效的,所以就直接让它针对上述代码进行逐行解释

结果

代码详情

def quick_sort(arr):
# 定义一个名为quick_sort的函数,参数为一个数组arr
if len(arr) <= 1:
# 如果数组长度小于等于1,说明已经有序,直接返回该数组
    return arr

else:
# 否则,需要进行排序操作
    pivot = arr[0]
# 选择数组的第一个元素作为基准元素
    left = []
# 定义一个空列表left,用于存放小于基准元素的值
    right = []
# 定义一个空列表right,用于存放大于基准元素的值
    equal = []
# 定义一个空列表equal,用于存放等于基准元素的值
    for i in range(1, len(arr)):
# 遍历数组中除第一个元素外的所有元素
        if arr[i] < pivot:
# 如果当前元素小于基准元素,将其添加到left列表中
            left.append(arr[i])

        elif arr[i] > pivot:
# 如果当前元素大于基准元素,将其添加到right列表中
            right.append(arr[i])

        else:
# 如果当前元素等于基准元素,将其添加到equal列表中
            equal.append(arr[i])

    return quick_sort(left) + equal + quick_sort(right)
# 递归地对left和right两个子数组进行排序,并将它们与equal列表合并起来得到最终的有序数组

可以看到,确实实现了代码的逐行解释,而且解释的内容也是正确的。

2.2.3 代码纠错

精准定位拼写、语法、逻辑错误;新老代码比较,支持一键修改

测试

因为是一个对话,上下是有效的,所以就直接让它针对上述代码进行逐行拼写、语法、逻辑错误定位

结果

讯飞星火认知大模型全新升级,全新版本、多模交互—测评结果超预期_第8张图片

经过检查,上述代码没有拼写错误、语法错误和逻辑错误。它能够正确地实现快速排序算法,并且代码风格清晰简洁,易于理解和维护。

2.2.4 单元测试

选中代码,一键生成单测用例;多主流单元测试框架;智能生成单元测试数据

测试

因为是一个对话,上下是有效的,所以就直接让它针对上述代码进行单元测试用例的输出

结果

用例详情

def test_quick_sort():
assert quick_sort([3, 1, 4, 1, 5, 9, 2, 6, 5, 3, 5]) == [1, 1, 2, 3, 3, 4, 5, 5, 5, 6, 9]
assert quick_sort([9, 8, 7, 6, 5, 4, 3, 2, 1]) == [1, 2, 3, 4, 5, 6, 7, 8, 9]
assert quick_sort([]) == []
assert quick_sort([1]) == [1]
assert quick_sort([1, 1, 1, 1]) == [1, 1, 1, 1]

 

2.3 插件功能

2.3.1 PPT生成

测试

我想针对k8s核心组件做一次技术分享,主要实现初学者了解k8s是什么,以及k8s组件的特点优势等内容,请帮我准备一下分享ppt

结果

ppt详情

可以看到已经按照要求生成了ppt,看了下内容,真的很不错,内容张弛有度,图文并茂,目录排版合理,字体简洁大方。基本上稍微优化一下就可以拿去分享了,太赞了!

2.3.2 简历生成

测试

帮我生成一份今年毕业,计算机专业的大四学生的实习简历

结果

讯飞星火认知大模型全新升级,全新版本、多模交互—测评结果超预期_第9张图片

简历详情

可以看到,这个简历模板,稍微优化下,就可以成为自己的简历了!

讯飞星火认知大模型全新升级,全新版本、多模交互—测评结果超预期_第10张图片

讯飞星火认知大模型全新升级,全新版本、多模交互—测评结果超预期_第11张图片

2.3.4 文档问答

测试

文档截图如下,是我先写好的一个问题。

讯飞星火认知大模型全新升级,全新版本、多模交互—测评结果超预期_第12张图片

结果

3 其他功能

另外,围绕讯飞星火V2.0重磅升级的核心能力,星火助手完成全新升级:

• 结构化指令:简单填写“角色设定、目标任务、需求说明、风格设定”等,大模型初学者也能轻松完成清晰的指令,创建属于自己的高质量助手;

• 私域知识库:上传用户私域数据与知识文档,通过融合大模型通用知识与个人专业知识,快速完成更专业的大模型应用;

• 一键生成应用:聚焦已创作的星火助手,一键发布成为独立Web应用,让我们零代码也可能创建自己的大模型应用;

• 一键定制专属API:每个助手都可独立生成API,开发者可以将其快速集成到自己的应用中;

更强大的助手功能,让我们专注创意idea,把剩下的工作交给讯飞星火!让再小的场景,也能轻松拥有专属大模型应用!

4 权威测评

新华社研究院中国企业发展研究中心于8.12日发布的《人工智能大模型体验报告2.0》,科大讯飞以总分1013分位列本次国产主流大模型测评榜。

在四大评测维度中的智商指数和工具提效指数两个维度获得第一,该报告任务讯飞星火在"工作提效方面优势明显"。

4.1智商指数

在智商部分,讯飞星火、智谱AI-ChatGLM并列第一

讯飞星火认知大模型全新升级,全新版本、多模交互—测评结果超预期_第13张图片

4.2 工具提效

在工作提效部分,讯飞星火、百度文心一言、商汤商量、智谱AI-ChatGLM表现优良;其中讯飞星火排名第一

讯飞星火认知大模型全新升级,全新版本、多模交互—测评结果超预期_第14张图片

5 总结

优势

讯飞星火认知大模型”是科大讯飞推出的新一代认知智能大模型,具有7大核心能力,即

  1. 文本生成
  2. 语言理解
  3. 知识问答
  4. 逻辑推理
  5. 数学能力
  6. 代码能力
  7. 多模态能力

拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务。从海量数据和大规模知识中持续进化,实现从提出、规划到解决问题的全流程闭环。

可以说,在通用人工智能的实现之路上,多模态已成为赋能行业的刚需,因此也成为讯飞既定的人工智能技术长期战略。

过去三年,讯飞在多模态领域累计获得17个国际权威评测冠军,并且在2022年启动了讯飞超脑2030计划,致力于“让人工智能懂知识、善学习、能进化,让机器人走进每个家庭”。

另外,大模型的爆火,为人工智能打开了广阔的想象空间,拥抱通用人工智能,已成为企业与个人的共同选择。

自星火大模型发布以来,讯飞开放平台开发者同比增长超282%,深度赋能“企业服务、教育培训、医疗健康、智慧金融、智能硬件”等行业。

体验

如果您是渴望使用认知大模型的用户,无论是个人还是企业,讯飞星火都是您最佳的选择!亲自动手试试!

您可以访问以下链接申请测试:体验地址

看看它是否能够满足您的需求。

通过这个【专属链接】链接申请体验的,审核更快(最快5分钟,最慢4小时),强烈建议通过专属链接来申请;

另外还有开发者权益福利:通过【专属链接】申请还可以有更高的星火大模型API测试额度,比普通渠道申请多30%,至高可申请500w Tokens。

你可能感兴趣的:(大模型,人工智能,人工智能,讯飞星火认知大模型,讯飞星火)