年底快到了,公司需要对今年的一些业务数据进行年终总结,我的第一反应是直接让 AI 总结呗, 但是经过我的再三尝试,发现AI输出的结果一直在胡说八道,而且分析过程也不够透明,导致我一直要去调整提示词,既然AI行不通,那我就转专业的数据分析产品工具,看到网络上推荐了很多,例如:PowerBI
、Excel
、Thoughtspot
等,但是这些都需要你去熟悉他们的产品并且还需要人为去处理整个分析流程,非常繁琐,直到我发现了 TableAgent
,这个东西的神奇之处在于可以直接把AI变成专业的数据分析师,我第一次看到也很惊讶,但是随着我的深入,我发现我之前使用的对话AI模型体现的缺点在 TableAgent
上不复存在,发现它真的特别强大,不同于传统的数据分析平台,TableAgent
本身就是一个基于语言的数据分析智能体,你只需要用自然语言告诉它分析需求,它就能自动帮你写代码,运行分析,得到报告结果,并且过程透明还有对应的逻辑代码,我们以前用Excel
做报表相当于是原始人了,现在直接用语言就可以完成了。
为了更好地体现TableAgent
的能力,本次我们使用 TableAgent
体验对话式对豆瓣Top250
的电影数据进行分析 ,实现思路如下:
TableAgent
能力TableAgent
平台进行体验Top250
的电影数据进行数据分析TableAgent
与传统数据分析平台Thoughtspot
TableAgent
是在九章云极 DataCanvas
自主研发的 DataCanvas Alaya
九章元识大模型基础上开发的能够实现私有化部署的企业级数据分析的智能体,有非常强大的意图理解能力、分析建模能力和洞察力。TableAgent
在充分的理解用户意图后,自主的利用统计科学、机器学习、因果推断等高级建模技术从数据中挖掘价值,进而提供分析观点和指导行动的深刻见解。
TableAgent
的背后是九章云极DataCanvas
公司自主研发的Alaya
元识大模型,TableAgent
拥有强大的数据理解和分析建模能力,它通过专业模型组技术可以支持不同行业和场景下的分析需求。TableAgent
采用对话交互,只要用户会提问,就可以实现自动建模和深入数据分析,可以帮助用户从数据中自动挖掘价值和见解,实现人人都是数据分析师。
核心特点如下图所示:
这次我特意准备了多个重复字段的数据,看看AI的智能化到底能达到什么程度,我的测试数据链接也放到这里,大家可以随意下载进行体验:https://ugcmarkdown.s3.amazonaws.com/douban.csv
数据大致情况如下图:
我们在浏览器输入官网网站进入产品首页: https://tableagent.datacanvas.com
,点击立刻体验即可进入TableAgent
如果还未登录需要通过填入最基本的手机号即可进行注册体验
完成注册后会进入TableAgent
的主界面,主界面主要分为对话区和数据集区,数据集可以通过使用样例数据或者自己上传,我们稍后就会把准备好的豆瓣Top250
数据进行上传
点击旁边的上传提示词,选择豆瓣 CSV
文件既可让模型装载我们的分析数据
本次体验我也准备了一些我关注的问题,大概如下:
我的预期大概就是首先TableAgent
应该能够进行逻辑分析,并且能输出可视化图表,才能证明TableAgent
确实拥有数据分析师的能力,而不是胡诌的分析结果,让我们开始实践吧!
对于分析过程我们不需要过多介入,只需要到输入框中输入要们的要得出的数据结果即可
这次我对话的内容是:
我给你提供的豆瓣
Top250
电影的数据集,请帮我分析 这些电影在不同年代分布情况,并以柱状图输出
可以看到TableAgent
第一时间就会把数据对应的过程进行响应
那这个结果可信吗?TableAgent
到底是怎么进行分析的呢?我们可以拿出自己通过Excel
分析的结果图进行对比,如下图所示:
还不信?不急,我们会看到TableAgent
不仅仅是只输出一个结果,点开详情按钮后,它会把整个结果的过程分析出来,首先TableAgent
会新进行数据逻辑图绘制,然后Alaya
模型会进行逻辑分析,同时也会将处理过程的 Python
代码进行输出,然后把相关处理的结果数据展示出来
最后根据处理好的数据在进行绘图,同时绘图的代码也会进一步展现
同样通过文本输入,这次输入的内容是:
请你帮我分析一下 电影的制片在不同国家分布以饼状图输出
这次我们换成饼状图,结果还是能够完美地输出,同样也可以通过详情看到TableAgent
的详细分析过程
这次输入的对话内容是:
请帮我分析一下 电影数在2部以上的导演有哪些
简单的数据统计已经测试了,那它能不能实现条件处理分析呢?当我发出分析需求后,TableAgent
也是很快就把对应的结果集进行响应,非常精准,因为每个过程都要代码作为逻辑依据,非常容易判断
这次的对话内容是: 为了看到比较不错的电影,可以根据数据输出一份交互式评分比较散点图
响应的数据与图片非常高效而且准确
我使用Excel
分析的数据图如下:
我们体验了TableAgent
这种 AI 数据分析,我们也来看一下,在没有TableAgent
时我们是怎么通过数据分析平台进行数据分析的,这里我以 Thoughtspot
为例:
同样我们也是先上传数据集:
然后我们就可以对数据集进行相关分析了,比方说我们要找评分大于 9 的,我们在数据分析平台中应该如何操作呢?
可以看到平台也是提供了一些最通用的数据分析操作给我们,数据也是能够正常出来的
但是平常我们的业务需求是很复杂的,平台是如何解决的呢?一般会提供在线SQL
进行分析,需要使用者懂一些SQL
分析的语句,那这样对比下来,TableAgent
和Thoughtspot
这类分析平台的区别就出来了,如下图:
根据上面的 Thoughtspot
数据分析平台的体验,大概大家也能感受到TableAgent
的独到之处,我也说一下我认为TableAgent
相对数据分析平台的一些优点:
TableAgent
可完全部署在企业内部,防止数据外泄。Thoughtspot
是基于公有云的SaaS
产品,无法实现真正的私有化运行。TableAgent
采用对话式自然语言交互,极大降低了数据分析门槛。Thoughtspot
需要用户掌握SQL或编程语言进行开发式交互。TableAgent
可以自动生成可分享和调用的Python
代码,实现开放式分析。Thoughtspot
仅限于内置指标和可视化分析。TableAgent
支持定制专业领域模型,可更好适应某些细分行业。Thoughtspot
通用性较强。相比仅提供指标查询及报表的传统产品,TableAgent
具有自动生成代码进行建模和分析的独特优势,TableAgent
强调人机交互和对话式交互。
本次体验以豆瓣TOP250
电影数据集为例,利用TableAgent
通过对话方式对电影数据进行分类、聚类和问答式分析,分析的结果非常精准和高效,这下我终于明白创新为什么说 TableAgent
改变了数据分析环境。以前的数据分析都需要专业人员深度参与,而 TableAgent
让数据分析变成了随手可完成的任务,将数据价值复现得更快更高效。相比其他产品,TableAgent
诠释了人人皆可的数据分析新姿势。
在试用过程中,我发现TableAgent
不仅支持对结构化数据如数值和时间等字段进行分析,也支持对电影名、导演名等非结构化文本信息进行解析理解。这让TableAgent
在解读数据价值上拓展到一个新的层面。
以往数据分析软件均对非结构化文本信息支持不足,很难直观和系统地挖掘其中的深层次含义。而TableAgent
通过自然语言处理能力,将非结构化字段视为一个首要分析维度。这在解读信息中具有很高的参考意义。
总体来说,本次体验再次证明TableAgent
如其名,真正实现了人人都能参与和利用数据分析。
在使用的过程中,我想同时进行多个数据的分析,我发现没有办法切换或者新建另一个会话,只能将当前会话清空,但是清空之后又看不到原来的会话数据,不知后续能否加上会话管理或会话记录的能力,能够随时进行对话切换。