可视形式进行解释的动作、过程
Function上
功能 |
---|
点 |
线 |
区域 |
间隔(柱状图 |
路径 |
纲要(schema |
从分割来看
形式上 Form
颜色
材质
光学 |
---|
模糊 |
透明度 |
从cue上
input 图像 | input 知识 | |
---|---|---|
output图像 | 图像处理 | 计算机视觉 |
output知识 | 图形学/数据可视化 | others |
作用
感知与认知
颜色模型
爬取: BeautifulSoup
数据分析: Panda
Excel, Shell, Cygwin
2D: AngularJS(MVC) React(JSX) VUE
3D: three.js Unity3D
Qt
2D
Photoshop
Pixelmator
AI
CorelDraw
Vector Magic
3D:
3DMax
Maya
Blender
2d
qlik
tableau
db
echarts
leaflet
arcgis
vtk
以下概念入手
整合以上内容 – 数据处理算法 可视编码 – 图形标记 视觉通道
目的: 简化数据 解决特定问题 提供可视化设计选择
如
definition:
为近似原分布的特征,统计分布中选出样本
如随机采样,泊松采样
可视设计
如K-means
随机产生K个中心位置
将每个数据点归为距离最近的中心位置所属的类
• 根据新的类别划分重新计算中心位置
• 回到第二步,直到满足一定约束
表现力
• 准确编码数据包含的所有信息
• 尽量忠于原始数据
有效性
• 符合属性的重要性
RGB颜色 或HSL(Hue Saturation Lightness)颜色 Lab颜色
折线图
柱状图
样式可以使用堆叠,对称等
饼状图
散点图
盒须图
感知
客观事物,通过人的感受器官,在人脑形成的反应
感受器官:眼耳鼻触觉神经末梢
视觉感知:通过视觉,人脑形成的反应
影响因素
考虑使用 显著性图/视觉重要性/热力图
关于怎样理解和解释东西 —— 外部认知: 利用大脑以外的资源增强大脑认知
格式塔理论
表现力
有效性
因素如下考虑
色彩/光谱
系统比如
RGB颜色系统
HSL
Lab
基本概念
相较于树型数据中明显的层次结构,图(网络)数据并不具有自底向上或自顶向下的层次结构,表达的关系更加自由和复杂
应用
其中力引导算法
物理引擎: 边 – 弹簧, 节点–互斥
弹簧模型
E S = ∑ i = 1 n ∑ j = 1 n 1 2 k ( d ( i , j ) − s ( i , j ) ) E_S = \sum^n_{i=1}\sum^n_{j=1}\frac{1}{2}k(d(i,j) - s(i,j)) ES=i=1∑nj=1∑n21k(d(i,j)−s(i,j))
能量
E = E S + ∑ i = 1 n ∑ j = 1 n r w i w j d ( i , j ) E = E_S + \sum^n_{i=1}\sum^n_{j=1}\frac{rw_iw_j}{d(i,j)} E=ES+i=1∑nj=1∑nd(i,j)rwiwj
随机生成节点排列
循环
优点:灵活,容易实现,现成库
局限:局部最优,初始位置影响较大,迭代复杂度O(N^2)
其他形式
节点连接图:
优点:反应网络关系
表现图的结构、簇、路径
灵活
局限:
复杂度大
密集图不适用
N*N矩阵,代表N个节点,矩阵内的位置(i, j)表达了第i个节点和第j个节点之间的关系
相关算法:排序,路径搜索
优点:
缺点
可以混合
内部: 关系用相邻矩阵, 外部 点-线
可是 Gmap
平面代表实体,平面联通代表实体关系
还可以边绑定 —— 可能产生误导信息
鱼眼
减少点 | 聚类 |
减少边 | 最小生成树 |
考虑
分析:网络、社会特性
重点:
有效管理,稳定、可持续
G , V , E G, V, E G,V,E
分类
树形、网状是基本方法,重要组成部分
展示面临挑战
方法
图论树形的扩展,核心为:结点和边的位置编码和视觉符号编码,可能遵循以下原则
(他们之间可能会矛盾,需要平衡取舍
可以细分为三种
节点: 水平 or 垂直对齐. 方向与坐标轴一致。 直观
缺点: 对于大型层次结构(广度较大)导致
正交,空间高效
缺点:容易失去上下文
简单递归:
优点:3D空间扩展显示控件;3D动画降低认知成本。
缺点:大树不适用,三维交互难处理
基于区域可视化,空间分块区域表达个体。
展现为“包含,被包含关系”。 假定每个叶节点有 “尺寸” 属性 —— 磁盘文件,机构图薪水等,父节点尺寸是所有子节点尺寸之和(例子,地图
本身没有层次结构 —— 层次安排对结果影响骄傲大,吧类别对数据影响程度作为层次
如 房产数据
一个问题: 逐级纵横切割细分的结果: 狭长四边形, 难和内部节点交互。
使用Voronoi树图 —— 凸多边形代替矩形
弹性层次图
文件浏览器
技能频次,词艺术
预处理: 过滤无效数据,提取有效词。
特征抽取:key word, 词频, 主题
特征度量:相似性,文本聚类
显示方法
未来方向
海洋/植被/地形/土壤/岩石,地质,地下空间/城市
可以分为
离散点:经纬度坐标,无大小尺寸
流线可视化;静态流场,时变流场,从某一点开始的一条柳絮的先,任一点切线与向量场该点方向一致
d x s t r e a m ( s ) d s = u ( x s t r e a m ( s ) , ϕ ) 或 x s t r e a m ( 0 ) = x 0 \frac{dx_{stream}(s)}{ds} = u(x_{stream}(s),\phi) 或 x_{stream}(0) = x_0 dsdxstream(s)=u(xstream(s),ϕ)或xstream(0)=x0
s : 流线轨迹参数, ϕ :某个时间点流场 s:流线轨迹参数,\phi:某个时间点流场 s:流线轨迹参数,ϕ:某个时间点流场
种子点放置
基于纹理
两个/多个线段 or 路径
线绑定技术(航线,流动图
等值线图/轮廓线图
还可以使用等值区间地图(数据属性在一个区域内平均分布,一个区域用一个颜色表示属性
但Chropleth地图会有数据分布 – 地理区域大小对称问题
—— 地理位置大,实际数据较小
保证思维连贯:可以缩放或用别的相似形状,如Cartogram区域缩放算法
判断区域面积大小,rec map, 识别问题。
区域属性直接的多关系 —— 连线集合方法表达
气泡集
线集:集合所有点用曲线链接(尽量 避免自相交和弯曲
路线规划,导航,广告,市政,交通模拟
问题
seam carving加入空间,不破坏其他路状态
其他形式
相关现象
非注意盲视
边缘实例需要更强的信号
空间/标量/矢量/张量/多变量
人机界面,把科学工程数据交互转换为易为感知的图形图像,解释结构、特征、演化规律
数据拓扑:数据存储离散位置,介乎中间位置发生了什么?kernel函数,坐标重建,对非组织数据更复杂
标量:密度/温度
向量:风向/立场(一阶张量)
张量:压力/张力/漫射 —— 基于基向量,可以用丰富组合
坐标图常用于一维数据可视化,注意数据转换,坐标轴转换
二维
三维
等值面
直接体绘制的问题
光线投射算法:图片屏幕的像素,从视点投射像素视线,视线穿过体数据空间 —— 视线的采样值合成像素亮度
吸收(不透明度)/发射模型(颜色 rgb)。
局部光照模型,容易实现,不必考虑间接光照(散射)与阴影。example:phong光照模型
需要考虑等值面法向量 —— 梯度矢量
决定吸收的值(不透明度α) 和发射的部分(颜色RGB)
传输函数:关键因素
原则:感兴趣的部分高不透明,反之高透明
设计困难
简单方法:最近邻域插值
常用方法:三线性插值
体重采样/等距离采样。
问题:delta_t小速度慢,大则漏特征
物理过程模拟。 两种顺序
跳过空单元。以三维空间数据场为处理对象,从数据空间出发向图像平面传递数据信息,累积光亮度贡献
体素标量到光学属性映射
对数据分类,解释内部结构。 输入数据,输出影响绘制的参数
设计方法
向量方向与大小。 信息包括: 趋势,模式
基于几何: 线条,箭头,方向标识符。矢量线/面:流线、粒子。
标记方法:
质量提升:标记方式,降低可是混乱,自适应采样
对于流线来说:静态流场或时变流场的某个时刻,某一点开始,一条连续曲线。上任一点的切线方向均与向量场在 该点的方向一致
迹线pathline:时变流场: 某一点释放一个粒子在各个时刻形成的一条曲线。
脉线:时变流场某点持续释放例子:形成轨迹线
时线:脉线的扩展,一个其实轨迹/区域不同位置生成脉线
如何提升积分曲线质量?
思想: 指定的度量标准进行流线
数据点的值为n维矩阵: 三维数据:3x3x3张量
描述数据在数据点邻域上如何变化
• 扫描设备:人脑中水的弥散
• 模拟:压力,张力
扫描设备:
直接体可视化:切片重建
最大密度投影
神经外科的可视化
体绘制优点
缺点
模型剖切
数据降维:线性/非线性变换把高位投影到低维:保留重要关系(无重要信息损失,保持数据区分)
线性方法
非线性
交互 - 灵活轴线法
最大化方差(变量的信息量) —— 最小化投影后损失
降维后,方差对应协方差矩阵特征值 —— 方差最大,要最大特征值,对应特征向量为最佳投影向量
example:人脸数据
高纬度相似 —— 降到低维位置较近
• 基于点的方法——散点矩阵、径向布局
• 基于线的方法——线图、平行坐标、径向轴
• 基于区域的方法——柱状图、表格显示、像素图、维度堆叠、马赛克图
• 基于样本的方法——切尔诺夫脸谱图
二位散点图表达维度之间关系(维度相关性),数目与维度平方成正比
改进:自动方法寻找散点矩阵中可能感兴趣的散点图
坐标轴相互平行,每个数据点对应一条穿过所有坐标轴的折线(唯独相关性)
热力图,表格镜子
介于点和区域方法混合
离散N维变2维
辐条编码数值
高维数据多个视图,按邮票大小放于一个视图种
表示与交互
类型
交互类型
新的分类
交互范式
针对明确的用户目标/使用场景/具体任务,还需考虑其他领域应用
定量评估:假设+验证
考虑平衡效应
定性评估
图像数据丰富
用于可视化的图像特征:
• 色彩
• 明暗
• 轮廓
• 场景
时空采样,平均:将时空流内同类图像进行平均
颜色流
线性播放的“视频流”
可视化增强:
• 非线性“视频浏览”
• 提高自动视频分析算法
• 性能
• 检测视频中的物体、特征等
视频立方: 将(平面)视频帧按时间轴堆叠排列;体可视化技术展示视频(流)中的特征
视频签名,视频指纹 - 环形排列+场景对齐
联觉通感,
info/data不同没接的分布,互动
涉及到
基于用户关系的信息分享,传播,获取平台:数据分析领域热点话题
显示内容:文本,图像,视频。
隐形内容:人际关系、舆情、突发事件、信息产生传播消亡
基于学习数据可视化 AI4VIS