慕课笔记-数据科学导论-第七章数据可视化-数据可视化发展历程/分类/数据可视化工具/案例/科学可视化/信息可视化/可视化分析学

数据可视化

(1)可视化

(1)可视化的含义

  • 定义

    • 可视化是一种使复杂信息能够容易和快速被人理解的手段,是一种聚焦在信息重要特征的信息压缩,是可以放大人类感知的图形化表示方法。
  • 可视化为人类大脑与计算机这两个信息处理系统之间提供了一个接口。可视化对信息的处理和表达方式有其他方式无法取代的优势,其特点可总结为可视性、交互性和多维性。

(2)可视化的发展历程

  • SGI公司推出的GL三维图形库表现突出,其易于使用而且功能强大
  • 随着计算机技术的发展,GL已经进一步发展成为OpenGL。OpenGL已被认为是高性能图形和交互式视觉处理的标准,在计算机领域被广泛采用。

(3)可视化的作用

  • 1.可视化后的信息易于理解
  • 2.以建设性方式讨论结果
  • 3.理解运营和结果之间的连接
  • 4.发现新兴趋势
  • 5.与数据交互

(2)数据可视化分类

纯技术角度

  • 基于几何投影的数据可视化
  • 面向像素的数据可视化
  • 基于图标的数据可视化
  • 基于层次的数据可视化
  • 基于图形的数据可视化

实用角度

  • 可视化分析学尤其关注的是意会和推理,科学可视化处理的是那些具有天然几何结构的数据,信息可视化处理的是抽象数据结构,如树状结构或图形。

  • 科学可视化

    • 1987年,在华盛顿召开的一次科学计算会议上,针对大数据处理问题,美国计算机成像专业委员会提出了解决方案:可视化——用图形和图像解释数据。这次会议形成了题为“科学计算可视化”的报告,后被称为科学可视化(Scientific Visualization,SV)。

    • 1.可视化是一种计算方法

      • 科学可视化包括图像生成和图像理解两个部分,它既是由复杂多维数据集产生图像的工具,又是解释输入计算机的图像数据的手段。
      • 它得到以下几个相对独立的学科的支持:计算机图形学、图像处理、计算机视觉、计算机辅助设计、信号处理、图形用户界面及交互技术。
    • 2.可视化所研究的课题就是人与计算机之间的交互机制

      • 可视化应使人与计算机协同地感知、利用和传递视觉信息。科学可视化按功能划分为如下3种形式。
      • (1)事后处理方式。计算和可视化是分成两个阶段进行的,两者之间不进行交互作用。
      • (2)追踪方式。可将计算结果即时以图像显示,以使研究人员了解当前的计算情况,决定计算是否继续。
      • (3)驾驭方式。这是科学可视化的最高形式。研究人员可参与计算过程,对计算进行实时干预。
    • 3.科学可视化的应用范围包括当代科学技术的各个领域(典型)

      • (1)科学研究:分子模型、医学图像、数学、地球科学、空间探索及天体物 理学。
      • (2)工程计算:计算流体力学和有限元分析。
    • 4.当前科学计算可视化技术的发展特点

      • (1)可视化图像的实时显示及交互控制
      • (2)网络环境下实现的科学计算可视化
      • (3)虚拟环境下实现的科学计算可视化
  • 信息可视化

    • 信息可视化(Information Visualization,InfoVis)是情报学领域一个较新的研究热点。

    • 信息数据分类(可视化领域)

      • 1.一维数据

        • 这类数据以一维向量为主,只具有单一属性,主要用来表征数值、时间、方向等具有射线属性的一维坐标信息。
      • 2.尺寸数据(二维数据)

        • 这类数据主要出现在平面设计、地理图件和地理信息系统相关的应用领域,一般采用横纵坐标法呈现其数据,可以充分将横向和纵向的位置信息显现出来,并且可以利用相应的位置坐标数据做空间信息计算,如求最短路程、最小面积和最小高程等。
      • 3.三维数据

        • 三维数据包含3个维度的属性信息,能够更加立体和直观地展示事物的立体属性和物理状态。该数据类型的应用领域比较广泛,我们熟知的医学、地质、气象、工业工程设计等领域都离不开三维数据类型的支撑。
      • 4.多维数据

        • 这类数据包含4个或4个以上的属性信息,主要用于分析多维数据内部属性的关联和相互关系。该类数据以财务与统计数据为主,主要用于分析过往的财务状况,预测未来的可能的发展趋势等。这是信息可视化研究的一个重要方向。
      • 5.分层数据

        • 分层数据模型是一种抽象的分类数据集合模式,是比较常见的数据关系。传统的图书馆资源管理模型和窗口系统资源管理模型使用的就是典型的分层数据,这类模型将现实的事务管理做分层、分类处理,以达到科学、高效管理的目的。
      • 6.文本数据

        • 这类数据形式多样,如报纸、邮件、新闻等信息都可以作为文本数据。有大量多媒体和超文本信息的互联网成为文本数据的较大来源之一。
  • 可视化分析学

    • 可视化分析学是通过交互式可视化界面促进分析推理的一门科学。

    • 涉及的学科领域

      • 一是分析推理技术,它能使用户获得深刻的见解,这种见解直接支持评价、计划和决策的行为。
      • 二是可视化表示和交互技术,它充分利用人眼的宽带宽通道的视觉能力,来观察、浏览和理解大量的信息。
      • 三是数据表示和变换,它以支持可视化分析的方式转化所有类型的异构和动态数据。
      • 四是支持分析结果的产生、演示和传播的技术,它能与各种观众交流有适当背景资料的信息。

(3)数据可视化工具

数据可视化工具必须具备的特性

  • 1.实时性
  • 2.简单操作
  • 3.更丰富的展现方式
  • 4.多种数据集成支持方式

入门工具

  • Excel

信息图表工具

  • 简介

    • 信息图表是对各种工具进行形象化,可视化加工的一种工具
    • 根据道格·纽瑟姆(Doug Newsom)的概括,作为视觉化工具的信息图表包括图表(chart)、图解(diagram)、图形(graph)、表格(table)、地图(map)和列表(list)等。
  • 8种典型信息图表工具

    • 1.Visem
    • 2.Canva
    • 3.Google Charts
    • 4.Piktochart
    • 5.Infogram
    • 6.Venngage
    • 7.Easel.ly

地图工具

  • 简介

    • 地图工具适用的数据形式不是一般人都能看懂的表格,而是特定的格式,,包括shapefiles(文件名一般以.shp作为后缀)、geoJSON(一种开源的地理信息代码,用于描述位置和形状)及topoJSON(geoJSON的衍生格式,主要用于拓扑形状
    • 比较有趣的应用案例是以人口规模作为面积重新绘制行政区域的形状和大小,这一类图被称为cartogram)。
  • 1.MapShaper

    • 对需要自定义地图中各区域边界和形状的制图师,MapShaper是个极好的入门级工具
    • 其简便性有助于地图设计师随时检查数据是否与设计图相吻合,修改后还能够以多种格式输出,进一步用于更复杂的可视化产品。
  • 2.CartoDB

  • 3.mapbox

    • mapbox是制图专业人士的工具,可以制作独一无二的地图,从马路的颜色到边境线都可以自行定义。
    • 它是一个收费的商业产品,Airbnb、Pinterest等公司都是其客户。
  • 4.Map Stack

    • Map Stack是由可视化设计机构Stamen(这家“机构”自称既非研究所又非公司,却以盈利为目的,非常独特)推出的免费地图制作工具,简便易用

高级分析工具

  • 1.R

    • ggplot2图形系统是R中功能最强大的图形系统,使用ggplot2展示的数据更加美观和方便
    • 使用R语言绘制的直方图(Histogram)又被称为质量分布图,是一种统计报告图
  • 2.D3

    • D3的全称是Data-Driven Documents(数据驱动文档),是基于数据的文档操作JavaScript库
    • D3能够把数据和HTML、SVG、CSS结合起来,创造出可交互的数据图表。其中,数据来源于作者,文档代表基于Web的文档(或网页),也就是可以在浏览器中展现的一切(如HTML、SVG等),而D3相当于扮演了一个驱动程序的角色,将数据和文档联系起来。
    • D3.js采用链式语法,非常方便用户对库中函数方法的引用。
  • Python

    • Python让用户很容易就能实现可视化
    • 可视化的两个专属库(libraries)——Matplotlib和Seaborn。
    • Matplotlib:基于Python的绘图库为Matplotlib提供了完整的2D图形和有限3D图形支持。这对在跨平台互动环境中发布高质量图片很有用。它也可用于动画。
    • Seaborn是Python中用于创建丰富信息和有吸引力图表的统计图形库。这个库是基于Matplotlib的。
    • Seaborn提供多种功能,如内置主题、调色板、函数和工具,来实现单因素、双因素、线性回归、数据矩阵、统计时间序列等的可视化,以让我们来进一步构建复杂的可视化结果。

(4)数据可视化案例

数字美食

  • 《数字美食》赢得了“The Dataviz 项目金奖”及“杰出个体奖”两个奖项,获奖者是 Moritz Stefaner,他是一名专注于研究数据可视化的独立设计师。
  • 《数字美食》是设计师用艺术与设计的手法展示美味佳肴的制作过程的一种尝试。设计师从某种特别的味道和口感,到不同的温度与肌理,甚至于装盘时体现出来的每一个小小的烹饪细节,用2D或3D的方式,展现出各种不同的具体形象。
  • 慕课笔记-数据科学导论-第七章数据可视化-数据可视化发展历程/分类/数据可视化工具/案例/科学可视化/信息可视化/可视化分析学_第1张图片

空中的间谍

  • 《空中的间谍》出自美国新闻网站Buzzfeed的两名编辑Peter Aldous和Charles Sefie。凭借《空中的间谍》,两人获得“最美奖”和“数据新闻金奖”两项大奖。
  • 《空中的间谍》详细展现了美国联邦调查局和国土安全局通过飞机在美国各大城市进行空中监视的情况,如图7-15所示。
  • Buzzfeed 通过分析航班实时追踪网站Flightradar24从2015年8月中旬到12月末的飞行器位置数据,绘制出了这张飞行轨迹图,且可以拖动时间进度条,以查看单架飞机的航线及每天的具体情况。
  • 慕课笔记-数据科学导论-第七章数据可视化-数据可视化发展历程/分类/数据可视化工具/案例/科学可视化/信息可视化/可视化分析学_第2张图片

XMind: ZEN - Trial Version

你可能感兴趣的:(#,数据科学导论,课程笔记(全套带导图))