2020-07-14

图计算,也许是数据可视化的“一阳指”

​数据是新时代的石油,这个判断有一个隐含的条件,那就是数据利用的“平民化”。就像小汽车走进千家万户,工业遍地开花,才让石油成为这个社会流动的血液。数据要成为新社会流动的血液,也必须有个前提,那就是从“高高的庙堂”上走下来,走进寻常百姓家。让普通人也能懂数据,用数据。

一个东西要实现平民化,有两个前提条件:低成本和便捷化。就像电脑一样,除了电脑的小型化、低成本化之外,视窗操作系统大大降低了使用门槛,让普通人也可以用鼠标点击的方式使用电脑,这成为电脑普及的关键。试想一下,如果电脑上只有一行行代码,要做什么操作也必须以写代码的形式来实现,那全世界电脑用户就只能限于不到1000万的程序员群体了。

对于数据而言,目前普通人只是作为数据源存在的,能利用数据的是有技术能力的互联网公司、政府机构以及其他一些企业。普通人只能“生产”数据被别人利用,自己并不能利用数据。

如何改变这一现状?降低数据分析的门槛,普通人也能获得数据分析的能力,而不仅仅是程序员的专利。数据可视化做的就是这样一件事情。让数据看起来更直观一点,让数据分析更容易一点,这是一件很重要的事情。就像视窗操作系统配合上鼠标,看起来也没什么,但永远的改变了一切。

应该说,现在的数据可视化,只是尽量在做数据显示的可视化,而没有做数据分析的可视化。

什么意思呢?

一般的数据可视化,都是将数据库中以表格形式存储的数据,通过各种形象的图表展示出来。

如果要做不同维度、不同指标的分析,还是要回到表格里,选取相应的指标和维度然后再以图表方式展示。

这就会导致一个问题:人们还是必须要在数据库中去处理各种数据,在数据表格里去理解各种维度和各种指标,数据的处理和计算是只能在数据表格里完成的,“图”只是最终的显示,是分析的结果,而不参与数据的处理和分析过程。

有没有一种方式,暂且叫其“图计算”:直接通过拖动图的方式,来进行数据的计算和分析呢?比如将一个柱状图和一个折线图叠加到一起,能不能直接生成另外一种合成的图呢,或者把几个不同的图直接放在一起,以不同的先后顺序进行叠加,也许最后会得到不同的合成图呢?

当然,实际上数据还是在数据库的表格里进行计算的,但这一步并不显示出来,不需要用户直接操作。每一个图后面其实都是有一张表格作为支撑的,用户直接拖动图形,实质上是将图形后面的两张表格进行叠加,也就是将两张表格进行计算。至于计算的方式,是数据相加,还是相乘,是行相加,还是列相加,这个用户可以选择。更进一步的,通过知识图谱技术构建不同的模型,针对不同的数据指标设定一些合理的“数据叠加”方式。比如银行数据表格的叠加,一般都是有哪些方式,工厂制造数据的叠加又应该以什么方式?这些都可以通过知识图谱进行一些设定。

不过对于“图计算”而言,这些数据的计算过程,对用户而言是无感知的。用户感知到的只是将两张或者几张图放在一起,会产生新的不同的图。比如将两张显示性别、年龄的图叠加在一起,得到一张既有年龄又有性别维度的图。也许用户对得到的结果不满意,或者得到的新图没有意义,用户可以重新再“叠加”一遍,得到新的结果。这种不断将不同的图叠加在一起的过程,就完成了数据分析的过程。

要让这种拖拽图片的简单操作有意义,后面是对数据仓库里数据的计算能力支持,以及强大的知识图谱支撑。越是能让用户“傻瓜式”操作的平台,越需要强大的技术支持。

把复杂留给平台,把简单给用户,这就是“图计算”的含义。

乍一看起来,这似乎是无足轻重的小伎俩,但这其实是很有难度的事情。而且,不要看轻“简单”带来的力量。想想视窗操作系统,以及苹果的触屏操作,给我们带来的什么!!

你可能感兴趣的:(2020-07-14)