【玩转 TableAgent 数据智能分析】引领数据分析新革命

【玩转 TableAgent 数据智能分析】引领数据分析新革命_第1张图片

文章目录

    • 一、文章前言
    • 二、内容大纲
    • 三、TableAgent概述
    • 四、TableAgent的核心技术优势
    • 五、TableAgent实战案例-豆瓣Top250电影数据分析
      • 5.1 数据准备
      • 5.2 平台体验
      • 5.3 数据上传 & 分析需求整理
      • 5.4 电影不同年代分布情况分析
      • 5.5 分析电影的制片在不同国家的分布
      • 5.6 分析电影数在2部以上的导演有哪些
      • 5.7 分析交互评分情况
    • 六、TableAgent与其他数据分析工具的对比
    • 七、总结

一、文章前言

年底快到了,公司需要对今年的一些业务数据进行年终总结,我的第一反应是直接让 AI 总结呗, 但是经过我的再三尝试,发现AI输出的结果一直在胡说八道,而且分析过程也不够透明,导致我一直要去调整提示词,既然AI行不通,那我就转专业的数据分析产品工具,看到网络上推荐了很多,例如:PowerBIExcelThoughtspot等,但是这些都需要你去熟悉他们的产品并且还需要人为去处理整个分析流程,非常繁琐,直到我发现了 TableAgent,这个东西的神奇之处在于可以直接把AI变成专业的数据分析师,我第一次看到也很惊讶,但是随着我的深入,我发现我之前使用的对话AI模型体现的缺点在 TableAgent 上不复存在,发现它真的特别强大,不同于传统的数据分析平台,TableAgent本身就是一个基于语言的数据分析智能体,你只需要用自然语言告诉它分析需求,它就能自动帮你写代码,运行分析,得到报告结果,并且过程透明还有对应的逻辑代码,我们以前用Excel做报表相当于是原始人了,现在直接用语言就可以完成了。

【玩转 TableAgent 数据智能分析】引领数据分析新革命_第2张图片

二、内容大纲

为了更好地体现TableAgent的能力,本次我们使用 TableAgent 体验对话式对豆瓣Top250的电影数据进行分析 ,实现思路如下:

  • 深度了解TableAgent能力
  • TableAgent 平台进行体验
  • 上传豆瓣Top250的电影数据进行数据分析
  • 对比TableAgent与传统数据分析平台Thoughtspot
  • 体验总结

三、TableAgent概述

TableAgent是在九章云极 DataCanvas 自主研发的 DataCanvas Alaya九章元识大模型基础上开发的能够实现私有化部署的企业级数据分析的智能体,有非常强大的意图理解能力、分析建模能力和洞察力。TableAgent 在充分的理解用户意图后,自主的利用统计科学机器学习因果推断等高级建模技术从数据中挖掘价值,进而提供分析观点和指导行动的深刻见解。

【玩转 TableAgent 数据智能分析】引领数据分析新革命_第3张图片

四、TableAgent的核心技术优势

TableAgent的背后是九章云极DataCanvas公司自主研发的Alaya元识大模型,TableAgent拥有强大的数据理解和分析建模能力,它通过专业模型组技术可以支持不同行业和场景下的分析需求。TableAgent采用对话交互,只要用户会提问,就可以实现自动建模和深入数据分析,可以帮助用户从数据中自动挖掘价值和见解,实现人人都是数据分析师。

核心特点如下图所示:

【玩转 TableAgent 数据智能分析】引领数据分析新革命_第4张图片

五、TableAgent实战案例-豆瓣Top250电影数据分析

5.1 数据准备

这次我特意准备了多个重复字段的数据,看看AI的智能化到底能达到什么程度,我的测试数据链接也放到这里,大家可以随意下载进行体验:https://ugcmarkdown.s3.amazonaws.com/douban.csv

数据大致情况如下图:

【玩转 TableAgent 数据智能分析】引领数据分析新革命_第5张图片

5.2 平台体验

我们在浏览器输入官网网站进入产品首页: https://tableagent.datacanvas.com,点击立刻体验即可进入TableAgent

【玩转 TableAgent 数据智能分析】引领数据分析新革命_第6张图片

如果还未登录需要通过填入最基本的手机号即可进行注册体验

【玩转 TableAgent 数据智能分析】引领数据分析新革命_第7张图片

完成注册后会进入TableAgent的主界面,主界面主要分为对话区和数据集区,数据集可以通过使用样例数据或者自己上传,我们稍后就会把准备好的豆瓣Top250数据进行上传

【玩转 TableAgent 数据智能分析】引领数据分析新革命_第8张图片

5.3 数据上传 & 分析需求整理

点击旁边的上传提示词,选择豆瓣 CSV 文件既可让模型装载我们的分析数据
【玩转 TableAgent 数据智能分析】引领数据分析新革命_第9张图片

本次体验我也准备了一些我关注的问题,大概如下:

  • 电影在不同年代分布情况
  • 电影制片在不同国家分布情况
  • 电影数在2部以上的导演
  • 电影的交互评分散点图

我的预期大概就是首先TableAgent应该能够进行逻辑分析,并且能输出可视化图表,才能证明TableAgent确实拥有数据分析师的能力,而不是胡诌的分析结果,让我们开始实践吧!

5.4 电影不同年代分布情况分析

对于分析过程我们不需要过多介入,只需要到输入框中输入要们的要得出的数据结果即可

这次我对话的内容是:

我给你提供的豆瓣 Top250电影的数据集,请帮我分析 这些电影在不同年代分布情况,并以柱状图输出

可以看到TableAgent第一时间就会把数据对应的过程进行响应

【玩转 TableAgent 数据智能分析】引领数据分析新革命_第10张图片

其中不仅仅是单纯的进行数据输出,也说出了自己的一些见解
【玩转 TableAgent 数据智能分析】引领数据分析新革命_第11张图片

最后也把我们预期的柱状图输出出来,分布情况如下图所示:
【玩转 TableAgent 数据智能分析】引领数据分析新革命_第12张图片

那这个结果可信吗?TableAgent到底是怎么进行分析的呢?我们可以拿出自己通过Excel分析的结果图进行对比,如下图所示:

【玩转 TableAgent 数据智能分析】引领数据分析新革命_第13张图片

还不信?不急,我们会看到TableAgent不仅仅是只输出一个结果,点开详情按钮后,它会把整个结果的过程分析出来,首先TableAgent会新进行数据逻辑图绘制,然后Alaya 模型会进行逻辑分析,同时也会将处理过程的 Python 代码进行输出,然后把相关处理的结果数据展示出来

【玩转 TableAgent 数据智能分析】引领数据分析新革命_第14张图片

最后根据处理好的数据在进行绘图,同时绘图的代码也会进一步展现

【玩转 TableAgent 数据智能分析】引领数据分析新革命_第15张图片

5.5 分析电影的制片在不同国家的分布

同样通过文本输入,这次输入的内容是:

请你帮我分析一下 电影的制片在不同国家分布以饼状图输出

这次我们换成饼状图,结果还是能够完美地输出,同样也可以通过详情看到TableAgent的详细分析过程

【玩转 TableAgent 数据智能分析】引领数据分析新革命_第16张图片

【玩转 TableAgent 数据智能分析】引领数据分析新革命_第17张图片

同样,我自己使用的Excel分析结果如下:
【玩转 TableAgent 数据智能分析】引领数据分析新革命_第18张图片

5.6 分析电影数在2部以上的导演有哪些

这次输入的对话内容是:

请帮我分析一下 电影数在2部以上的导演有哪些

简单的数据统计已经测试了,那它能不能实现条件处理分析呢?当我发出分析需求后,TableAgent也是很快就把对应的结果集进行响应,非常精准,因为每个过程都要代码作为逻辑依据,非常容易判断

【玩转 TableAgent 数据智能分析】引领数据分析新革命_第19张图片

5.7 分析交互评分情况

这次的对话内容是: 为了看到比较不错的电影,可以根据数据输出一份交互式评分比较散点图

【玩转 TableAgent 数据智能分析】引领数据分析新革命_第20张图片

响应的数据与图片非常高效而且准确

【玩转 TableAgent 数据智能分析】引领数据分析新革命_第21张图片

我使用Excel分析的数据图如下:

【玩转 TableAgent 数据智能分析】引领数据分析新革命_第22张图片

六、TableAgent与其他数据分析工具的对比

我们体验了TableAgent 这种 AI 数据分析,我们也来看一下,在没有TableAgent时我们是怎么通过数据分析平台进行数据分析的,这里我以 Thoughtspot 为例:

同样我们也是先上传数据集:

【玩转 TableAgent 数据智能分析】引领数据分析新革命_第23张图片

【玩转 TableAgent 数据智能分析】引领数据分析新革命_第24张图片

然后我们就可以对数据集进行相关分析了,比方说我们要找评分大于 9 的,我们在数据分析平台中应该如何操作呢?

【玩转 TableAgent 数据智能分析】引领数据分析新革命_第25张图片

可以看到平台也是提供了一些最通用的数据分析操作给我们,数据也是能够正常出来的
【玩转 TableAgent 数据智能分析】引领数据分析新革命_第26张图片

但是平常我们的业务需求是很复杂的,平台是如何解决的呢?一般会提供在线SQL进行分析,需要使用者懂一些SQL分析的语句,那这样对比下来,TableAgentThoughtspot 这类分析平台的区别就出来了,如下图:

【玩转 TableAgent 数据智能分析】引领数据分析新革命_第27张图片

根据上面的 Thoughtspot 数据分析平台的体验,大概大家也能感受到TableAgent的独到之处,我也说一下我认为TableAgent相对数据分析平台的一些优点:

【玩转 TableAgent 数据智能分析】引领数据分析新革命_第28张图片

  1. 私有部署能力。TableAgent可完全部署在企业内部,防止数据外泄。Thoughtspot是基于公有云的SaaS产品,无法实现真正的私有化运行。
  2. 使用交互方式。TableAgent采用对话式自然语言交互,极大降低了数据分析门槛。Thoughtspot需要用户掌握SQL或编程语言进行开发式交互。
  3. 代码生成能力。TableAgent可以自动生成可分享和调用的Python代码,实现开放式分析。Thoughtspot仅限于内置指标和可视化分析。
  4. 行业专业化。TableAgent支持定制专业领域模型,可更好适应某些细分行业。Thoughtspot通用性较强。

相比仅提供指标查询及报表的传统产品,TableAgent具有自动生成代码进行建模和分析的独特优势,TableAgent强调人机交互和对话式交互。

七、总结

本次体验以豆瓣TOP250电影数据集为例,利用TableAgent通过对话方式对电影数据进行分类、聚类和问答式分析,分析的结果非常精准和高效,这下我终于明白创新为什么说 TableAgent 改变了数据分析环境。以前的数据分析都需要专业人员深度参与,而 TableAgent 让数据分析变成了随手可完成的任务,将数据价值复现得更快更高效。相比其他产品,TableAgent 诠释了人人皆可的数据分析新姿势。

  • 我的感受:

在试用过程中,我发现TableAgent不仅支持对结构化数据如数值和时间等字段进行分析,也支持对电影名、导演名等非结构化文本信息进行解析理解。这让TableAgent在解读数据价值上拓展到一个新的层面。

以往数据分析软件均对非结构化文本信息支持不足,很难直观和系统地挖掘其中的深层次含义。而TableAgent通过自然语言处理能力,将非结构化字段视为一个首要分析维度。这在解读信息中具有很高的参考意义。

总体来说,本次体验再次证明TableAgent如其名,真正实现了人人都能参与和利用数据分析。

  • 反馈建议:

在使用的过程中,我想同时进行多个数据的分析,我发现没有办法切换或者新建另一个会话,只能将当前会话清空,但是清空之后又看不到原来的会话数据,不知后续能否加上会话管理或会话记录的能力,能够随时进行对话切换。

你可能感兴趣的:(python)