❤前言我想吟诗一首:开个新专栏,一点也不难,Tableau学完,收获感满满!❤
这篇我们主要来聊一下数据可视化常用软件——Tableau的介绍,在学习Tableau之前我们要知道数据可视化究竟是什么,它的发展历史到底是怎样的,啥也不知道就开始学,难不成你要抓瞎?
数据可视化就是把数据转化成图或者表的形式,这样可以更直观的展现数据,读者一眼就能看懂你要表达的信息,可视化把很多很多的复杂数据统统转化成更准确、高效、简洁、全面的信息,甚至我们还能在里面发现某些规律和特征,从而挖掘数据背后的价值。
下面是我查阅各种资料、引用各个作者的文章集天地之精华总结而来,通过总结把数据可视化的历史分成了下面这几部分:
17世纪以前:萌芽阶段
17世纪:测量与理论
18世纪:图形符号
19世纪:现代数据图形的开端
20世纪:多维数据可视化
2004年至今:可视分析学
在公元前6200年的土耳其,人们出行可没有高德地图,这就面临着迷路的风险,于是人们开始绘制地图用于导航和管理土地,就像下面这样,一个一个小方块。这就是最早是数据可视化,土地就是数据,地图就是数据可视化。
到公元前1150年的埃及,最早的地形图诞生了,这不光有路线,还包括了地理和矿物开采的数据。
可视化的数据越来越复杂,公元前366-355年。罗马世界的城市路线图被清晰的涂在羊皮纸上。
公元150年,第一张通过天体观测来制定陆地位置的地图第一次采用了经纬线。
1569年,墨卡托绘制的世界地图标志着我们如何在平坦的纸上描绘球形地球表面的一个重大进展。我们现在用的世界地图的投影就是用的他的墨卡托投影,他的神奇之处就在于不仅本地地理得以保留,并且地图上的直线在看着指南针时可以转换为恒定方位线,因此非常适合海上航行,很受欢迎。
但墨卡托投影的地图最大的缺点就是和现实差别太大,变形非常严重。在墨卡托投影的地图上,变形最严重的就是非洲和格陵兰岛了。地图上非洲的大小和格陵兰岛差不多大,但如果计算一下的话:非洲面积约是3020万平方千米,格陵兰岛面积约是217万平方千米,而3020÷217≈14。也就是说,非洲的面积是格陵兰岛的14倍!
17世纪理论上有了巨大的新发展:解析几何的兴起,测量误差的理论和概率论的诞生,以及人口统计学的开端和政治版图的发展。到本世纪末,数据可视化方法必不可少的要素已经来临了,一些具有重大意义的真实数据,一些有意义的理论及视觉表示的想法出现,可以将本世纪视为视觉思维的开端。
1662年John Graunt 建立人口统计学:重要统计数据概念的发展(伦敦洗礼和葬礼的记录)可以用来构建生活表。伦敦的平均预期寿命为27岁,其中16%的人到16岁时死亡。
1693年哈雷 Edmond Halley 首次使用矩形区域来显示独立的二进制事件的概率。
社会和科技进步相伴随的,数据的价值开始为人们所重视,人们不满足只展示几何图形,抽象图形和函数图形的功能被大大扩展,许多崭新的数据可视化形式在这个世纪里诞生了。
1769年约瑟夫·普里斯特利发行了被认为是18世纪最具影响力的时间表《新图》,显示了帝国的兴衰。水平线传达了成名,影响力,权力和统治力的持续时间的概念。垂直阅读传达了思想,事件和人的同时性印象,空隙表示知识分子的黑暗时代。
1786年Playfair的条形图,显示小麦与工资的价格。
随着工艺设计的完善,统计图形和主题制图爆炸性增长,包括柱状图,饼图,直方图,折线图,时间线,轮廓线等。在专题制图学中,制图从单一地图发展为全面的地图集,描绘了涉及各种主题(经济,社会,道德,医学,身体等)的数据,同时演化出了可视化思考的新方式。
1801年 William Playfair 的饼图和圆形图,用于显示整体关系。不过他早在1789年就使用饼图显示土耳其各地区疆土比例。
1826年,查尔斯·杜品《法国总人口图鉴》:发明了在使用连续的黑白底纹来显示法国识字分布情况的方法,这可能是第一张现代形式的主题统计地图。
1854年约翰·斯诺《伦敦爆发的霍乱病例群》:使用点图映射了1854年的宽街霍乱疫情,他还使用统计数据来说明水源质量与霍乱病例之间的联系,这表明该疾病是通过受污染的水传播的,而不是以前认为的空气传播的斯诺的研究是公共卫生和地理历史上的重大事件。它被认为是流行病学的创始事件。
1879年Luigi Perozzo 绘制立体图(三维人口金字塔)以实际数据为依据(瑞典人口普查,1750-1875年)。此图与之前所看到的可视化形式有一个明显的区别:开始使用三维的形式,并使用彩色表示了数据值之间的区别,提高了视觉感知。
计算机的出现彻底地改变了数据分析工作。计算机对数据可视化的影响:高分辨率的图形和交互式的图形分析,提供了手绘时代无法实现的表现能力。
1933年绘制的伦敦地铁图,出版后迅速为乘客接受,并成为今日交通线路图形的一种主流表现形式。
1971年不规则多边形"星图"代表多元数据(顶点等距间隔开,到中心的距离与变量的值成正比)。下图为美国城市犯罪率星图。
1974年,彩色的胃癌发生率,在地图上用不同颜色表示所在区域的变量值。
1989年哈斯莱特 ,安东尼·温温 和克雷格交互动作链接到地图显示的统计图形-Graham Wills。
1996年 Jason Dykes 发明制图数据可视化工具:一种地图可视化工具包,具有用于查看数据的图形工具,包括用于探索性空间数据分析的多种映射选项。
进入21世纪,随着计算机相关硬件升级,现有可视化已难以应对海量、高维、多源的动态数据的分析挑战,需要综合可视化、图形学、数据挖掘理论与方法,研究新的理论模型,辅助用户从大尺度、复杂、矛盾的数据中快速挖掘出有用的数据,做出有效决策,这门新兴学科称为可视分析学。
数据分析的任务通常是定位、识别、区分、分类、聚类、分布、排列、比较、内外连接比较、关联、关系等。可视化分析降低了数据理解的难度,突破了常规统计分析的局限性。如下,交通拥挤图:
值得注意的是,可视化分析的基础理论与方法,仍在形成、探索、沉淀。
数据可视化的历史说到这里就说完了,有兴趣的可以去看看《数字可视化简史》等书籍,当然了我也不能白嫖人家劳动成果,我这里只是每个年代分别举了几个例子,如果想看更多年代详细的变化可以去看看:可视化简史 - 知乎 (zhihu.com)
数据可视化领域可谓是相当广泛了,像金融、电力、通信、医疗、商业等等到处都是,我举几个来自不同领域的大家熟知的例子,只是想让大家知道数字可视化存在的意义和价值,提升对数据可视化工具Tableau的兴趣。
案例1:全球可视化航班运营✈
大家经常坐飞机的应该深有体会,全球航班运营可视化系统,通过显示某一时刻全球航班的飞行数据,使公众能够非常清楚地了解全球航班的总体分布和运行状态。
案例2:卫星的分布运行可视化
我们经常发射各种卫星,但是我们需要根据其他卫星的运行状态来决定我们即将发射卫星的轨迹,如果发射后两个卫星撞车了就不好了,把太空中所有卫星的运行数据直观地显示出来,大众就能一目了然地了解太空中的卫星状态。
案例3:教育行业
领导可以掌控全省的中小学的学校分布情况、并可深入到各个区域,分析对比各个区域的学生入学情况、师资配备情况等,精准定位困难区域、困难学校,合理的资源分配,解决教育区域发展不均衡的难题。
案例4:疫情地图
这个案例我敢说没有几个人没见过,疫情期间我们每天统计哪个省新增多少例,病历多的颜色最深,没有病历的颜色最浅色,大家一眼就直观的看出来哪些地方严重哪些不严重。
到此为止我们已经对数据可视化有了一定的了解,或许看到现在你已经有些视觉疲劳了,那现在你可以眺望一会窗外的远方,因为下面就要进入真正的学习状态啦!
Tableau是一款轻量级数据可视化工具,它将数据运算与美观的图表完美地结合在一起,不要求用户编写代码,仅仅通过拖拽方式就可以快速洞察数据,探索不同的视图,甚至可以轻松地将多个数据源组合在一起,完成数据展示、探索和分析工作。
Tableau是一家提供商业智能的软件公司,正式成立于2004年, 总部位于美国华盛顿西雅图。产品起源于美国国防部一个提高人们分析信息能力的项目,项目移交斯坦福大学后快速发展。三位负责产品的博士Christian,Pat和Chris后来共同创建了Tableau公司,将数据可视化功能整合到数据库中,使其具有前所未有的交互性和可理解性,从而彻底改变了行业。2013年在纽交所上市,融资2.5亿美元。当时的年收入达到2.3亿美元。Tableau出现之前,已经有Cognos,Business Objects,Microsoft Excel等公司在这个市场,这些公司也都做的很成功,但Tableau从西雅图的一个小办公室开始,到今天110亿美元市值的公司,成功确立了自己在行业中的地位。Tableau刚推出来,IT专业人员认为不值得而并不接受它。但是,当业务分析师和营销人员发现其功能对商业数据领域的作用时,公司找到了自己的方向。Tableau目前在全球拥有超过60,000家公司以及无数的用户,致力于帮助客户利用自己的工具来简化分析问题的复杂度,快速,美观,实用是它们的准则。
有很多人去官网发现Tableau的产品好有多种啊,瞬间就头皮发麻了,不清楚自己该学习哪个了,没关系,这里将告诉你Tableau的每个家族产品的都是做什么的。
我们重点学习的是Tableau的核心产品——Tableau Desktop(以后我在我的专栏里只要不说别的Tableau家族产品一律视我说的Tableau为Tableau Desktop)
Tableau Desktop:PC端编辑工具,提供完整的数据连接、展示、分析功能,可将结果保存为本地文件 或直接发布至Server端。
Tableau Server:针对企业级用户的需求开发的服务器版本,可在本地或云服务器上部署,用于发布和管理Tableau Desktop制作的可视化文件和数据源。可通过web浏览器直接使用,保证信息安全和管理元数据,并现实Desktop中几乎所有功能。
Tableau Online:Server的云托管版本,建立在与Tableau Server相同的企业级架构上,不需要进行Server软硬件的维护、升级和安全管理,为用户省去硬件的安装和部署时间,让商业分析更加快速轻松。
Tableau prep:PC端编辑工具,提供数据探索、清理、整合和重塑功能,包含Tableau Prep Builder和Tableau Prep Conductor两种产品,分别用来创建数据流和管理数据流。
Tableau Moblie:针对移动办公需求用户开发的免费的移动端APP,为移动端用户提供完整的数据连接、展示、分析功能,但是它的数据操作端口必须要接到Server上,所以需要付费购买Server或者Online的服务才可以使用。
Tableau Public: PC端编辑,web端存储的免费工具。提供基本的数据连接和完整的展示分析功能,但是不能读取远程数据库,不能将结果保存为本地文件,只能在web上公开发布。
Tableau的特点说起来都能写一篇文章了,不过咱们也不是出书的,搞那么长的文章我怕我没写累你先看累了,所以这里集天地之精华做了一个总结。
Tableau的特点总结起来就几个词语:快速、简单、易用、安全、强大、灵活、实时。我为什么这样说呢,看了下面词条你就明白了。
快速:在数分钟内完成数据连接和可视化,Tableau 比现有的其他解决方案快10 到100倍
简单:不写代码、基本靠拖拽操作
易用:界面新颖、图表生动、数据挖掘这件事变得平民化
安全:身份验证、授权、数据和网络安全
强大:可以连接一个或多个数据源、支持单数据源的多表连接和多数据源的数据融合
灵活:灵活的部署适用于企业环境、灵活的云端投资
实时:使用Tableau Server或Tableau Online安全地共享数据,并基于可信数据进行协作。
接下来就是下载和安装步骤,请睁大双眼:
第一步:在官网下载Tableau Desktop,Tableau Desktop | 连接和分析任何数据并对其进行可视化
第二步:自定义路径并点击安装。
第三步:注册一下Tableau。
第四步:出现这样的界面就算下载安装并注册成功了。
今天就先写到这吧,下篇文章主要来讲Tableau的结构,一些操作类似如何连接数据库等等,这篇文章写了这么多或许你们只关心四到六Part,但我认为我们不应该带着疑问来学习Tableau,毕竟在我刚学习Tableau的时候我产生过这些疑问,比如我会分不清家族产品,我不清楚我为什么要学习数据可视化,这到底会给我的生活有什么帮助,我写下来的目的就是希望你们的疑问都可以在本片文章中找到。