时变数据可视化中的一些概念

时变数据:随着时间变化的、带有时间属性的数据。
时变型数据的分类
(1)时间序列数据。比如:股票走势图、奥运会的日程
(2)顺序型数据。比如:文本、DNA测序。
时变型数据的特点
量大、维数多、变量多、类型丰富、分布范围广泛。

时变型数据可视化设计的三个维度

时变数据可视化中的一些概念_第1张图片

表达维度

线性以典型的阅读方式呈现内容;将时间数据作为二维的线图显示;x轴表示时间、y轴表示其他的变量。
径向将时间序列编码为弧形;沿圆周排列;合适呈现周期性的时变型数据。比如:南丁格尔玫瑰图。
网格和日历相对应;一般采用表格映射的方式。
螺旋可用条形、线条或数据点、沿着螺旋路径显示。
随机两类:1、基于排版形式的随机;2、时间曲线。

比例维度

一、比例维度(按时间顺序)可以被用来表示时间之间的距离,时间的持续时间。
二、相对顺序是指存在一个基线事件在时间零点,可以被用在多时间线的对比。
三、对数的比列从按时间的前后顺序排列的比例转换而来,强调了最早的或最近的事件,对数比例适用于长范围或不均匀的事件布局。
四、次序,按次序的比例中连续事件之间的距离是相等的,值表达事件的顺序。
五、次序+中间时长,这种形式可以用来表示长时间和不均匀分布的事件。

布局维度

1单一时间线
2多个时间线
3分段时间线
,在这种形式中,一个时间线被有意义的进行划分,进行另一种形式的比较。
4多个时间线加上分段时间线,指不同属性时间线加上分割的时间段,可以进行多种形式的比较。

多变量时变型数据可视化

由于存在多个变量可视化需要兼顾数据本身的属性和数据集的顺序性结合数据分析的方法展现、和挖掘数据中的规律

流程

第一步,数据抽象,包括数据降维、特征选取和数据简化。
第二步,数据聚类,核心在于定义恰当的距离或相似性度量。
第三部,特征分析,包括特征抽象、语义分析等操作。

形式

1、基于线表示
主要针对高维 抽象的 时变 非空间 数据的可视化
第一步:进行高维曲线采样,采样的频率由用户交互指定。
第二步:将采样后的高维曲线分段,便于刻画每段曲线的特征。
第三部:用降维方法将高维曲线投影到二维空间,显示和研究曲线的特征。

2、基于图结构
核心:时间演化的组织
第一步,用户根据领域需求和任务描述,从数据中找到与用户关注点实际相匹配的事件。
第二步,对事件分类,根据事件不同类型的特征描述,从输入的数据中检测事件,得到事件实例。
第三部,通过可视化方法将检测到的事件整合到可视表达中。

交互

核心:表现重要的区域
方法:
1概览加上下文
2层次细节

时变型数据可视化常用的一种交互手段是从时变型数据中查询特定的时间序列,以便交互地发现特征和趋势

代表性例子:TimeSearcher
特点:直接指定时变趋势模式;操作形变型3数据集;基于实例查询给定的时变趋势模型。

流数据可视化

流数据的输入数据并不存储在可随机访问的磁盘或内存中,而是以一个活多个“连续数据流”
的形式到达。

常见的流数据

移动通信日志
网络数据(日志、传输数据包、警报等)
高性能集群平台日志
传感器网络记录
金融数据(股票市场)
社交数据

流数据的特点

第一、数据流的潜在大小也许是无限的;
第二、数据元素在线到达,需要实时处理;
第三、无法控制数据元素的到达顺序和数量;
第四、某个元素被处理后,要么被丢弃,要么被归档存储;
第五、对于流数据的查询异常情况和相似类型比较耗时,人工检测日志相当乏味且易出错。

用户的交互

对输出内容的可视检测
对可视布局的基本交互
自定义的数据定制

多数据库的设计

保护了原始数据
提高了数据存取的效率

流数据可视化按功能可以分两种可视化类型:

1、监控性:用滑动窗口苦丁一个时间区间,把流数据转化为静态数据,数据更新方式可以是刷新,属于局部分析。
2、叠加型或者是历史型:吧新产生的数据可视映射到原来的历史数据可视化结果上,更新方式是渐进式更新,属于全局分析。


系统日志数据反映了一台机器、一个计算集群的系统性能,是商业智能中最重要的数据。
文本数据从事件角度对文本进行可视分析,挖掘事件的发生、发展及变化。

你可能感兴趣的:(计算机基础)