目录
Best Papers
1.Simultaneous Matrix Orderings for Graph Collections
2.IRVINE: Using Interactive Clustering and Labeling to Analyze Correlation Patterns: A Design Study from the Manufacturing of Electrical Engines
3.Perception! Immersion! Empowerment! Superpowers as Inspiration for Visualization【关注-超能力!有趣!】
4.Feature Curves and Surfaces of 3D Asymmetric Tensor Fields
5.Jurassic Mark: Inattentional Blindness for a Datasaurus Reveals that Visualizations are Explored, not Seen【理论→实验→结论】
Explainable AI and Machine Learning
6.AffectiveTDA: Using Topological Data Analysis for Improved Explainability in Affective Computing【情绪识别】
7.Human-in-the-loop Extraction of Interpretable Concepts in Deep Learning Models
8.Towards Visual Explainable Active Learning for Zero-Shot Classification
9.M^2Lens: Visualizing and Explaining Multimodal Models for Sentiment Analysis【多模态情感分析】
10.NeuroCartography: Scalable Automatic Visual Summarization of Concepts in Deep Neural Networks
11.Visual Analytics for RNN-Based Deep Reinforcement Learning略
Interaction
12.Task-Based Effectiveness of Interactive Contiguous Area Cartograms【理论→实验→结论】
13. Nebula: A Coordinating Grammar of Graphics
14.Rotate or Wrap? Interactive Visualisations of Cyclical Data on Cylindrical or Toroidal Topologies【理论→实验→结论】
15.DIEL: Interactive Visualization Beyond the Here and Now【分布式数据和异步事件,特定情境】
16.VizSnippets: Compressing Visualization Bundles Into Representative Previews for Browsing Visualization Collections【缩略图生成】
17.Interactive Dimensionality Reduction for Comparative Analysis【降维方法】
Surfaces and Volumes【国内博客没有写的,江河日下啊】
18.Real-Time Denoising of Volumetric Path Tracing for Direct Volume Rendering【以前没有关注过VPT,MC路径追踪这些】
19.Learning Adaptive Sampling and Reconstruction for Volume Visualization【题目即一切】
20.STNet: An End-to-End Generative Framework for Synthesizing Spatiotemporal Super-Resolution Volumes【这是时空超分辨率体生成的一系列文章,稳扎稳打的代表】
21.Interactive Exploration of Physically-Observable Objective Vortices in Unsteady 2D Flow【注意标题】
22.3D Virtual Pancreatography-略
23.Visual Analysis of Multi-Parameter Distributions across Ensembles of 3D Fields
Graphical Perception and Coloring
24.Context Matters: A Theory of Semantic Discriminability for Perceptual Encoding Systems【提出理论与度量】
25.Conceptual Metaphor and Graphical Convention Influence the Interpretation of Line Graphs【理论→实验】
26.Rethinking the Ranks of Visual Channels【理论→实验】
27.Affective Congruence in Visualization Design: Influences on Reading Categorical Maps【理论→实验】
28.Modeling Just Noticeable Differences in Charts【理论→实验】
29.Augmenting Parallel Coordinates Plots with Color-coded Stacked Histograms 【新可视化图形设计】
Perspectives and Reflections
30.Seek for Success: A Visualization Approach for Understanding the Dynamics of Academic Careers【系统-理解学术生涯动态的可视化方法】
31.VitaLITy: Promoting Serendipitous Discovery of Academic Literature with Transformers & Visual Analytics-【系统——查找学术论文】
32.VIS30K: A Collection of Figures and Tables From IEEE Visualization Conference Publications【数据收集过程】
33.Gender in 30 Years of IEEE Visualization【特定数据-分析-结论】
34.E-ffective: A Visual Analytic System for Exploring the Emotion and Effectiveness of Inspirational Speeches【分析演讲因素】
35.Explanatory Journeys: Visualising to Understand and Explain Administrative Justice Paths of Redress【行政司法救济途径】
Decision Making
36.The Unmet Data Visualization Needs of Decision Makers within Organizations【定性研究,决策】
37.Knowledge Rocks: Adding Knowledge Assistance to Visualization Systems
38.A Critical Reflection on Visualization Research: Where Do Decision Making Tasks Hide?【观察→分析→结论】
39.From Jam Session to Concert Hall: Synchronous Communication and Collaboration Around Data in Organizations【定性,分析】
40.Causal Support: Modeling Causal Inferences with Visualizations
41.Sibyl: Understanding and Addressing the Usability Challenges of Machine Learning In High-Stakes Decision Making
Multi-View and Visual Environments
42.Semantic Snapping for Guided Multi-View Visualization Design
43.SightBi: Exploring Cross-View Data Relationships with Biclusters【利用Biclusters探索跨视图关系,关注一下】
44.matExplorer: Visual Exploration on Predicting of Ionic Conductivity for Solid-State Electrolytes【固体电解质的离子电导率,标题即一切,领域性太强了】
45.TimeTubesX: A Query-Driven Visual Exploration of Observable, Photometric, and Polarimetric Behaviors of Blazars【天体耀变体-特征和模式检测-领域性非常强】
46.Towards replacing physical testing of granular materials with a Topology-based Model-以基于拓扑的模型取代颗粒材料的物理测试【领域性很强,标题代表一切】
47.Tracking Internal Frames of Reference for Consistent Molecular Distribution Functions【分子分析,空间分布函数,领域性强】
Recommendation and Automation
48.InfoColorizer: Interactive Recommendation of Color Palettes for Infographics【信息图配色】
49.A Mixed-Initiative Approach to Reusing Infographic Charts
50.Kori: Interactive Synthesis of Text and Charts in Data Documents数据文档中文本和图表的交互式合成
51.Deconstructing Categorization in Visualization Recommendation: A Taxonomy and Comparative Study解构可视化推荐中的分类【可视化推荐】
52.KG4Vis: A Knowledge Graph-Based Approach for Visualization Recommendation【可视化推荐】
53.VizLinter: A Linter and Fixer Framework for Data Visualization【帮助用户发现并纠正缺陷】
Immersive Environments, Personal Vis, and Dashboards
54.Propagating Visual Designs to Numerous Plots and Dashboards【应用到大量数据集】
55.Exploring the Personal Informatics Analysis Gap: “There’s a Lot of Bacon”【有哮喘相关的东西】
56.What’s the Situation with Situated Visualization? A Survey and Perspectives on Situatedness【综述】
57.TIVEE: Visual Exploration and Explanation of Badminton Tactics in Immersive Visualizations羽毛球
58.Touch and Beyond: Comparing Physical and Virtual Reality Visualizations比较物理和虚拟现实可视化
59.An Automated Approach to Reasoning About Task-Oriented Visualization Insights in Responsive Visualization
Multi-Dimensional Data
60.Imma Sort by Two or More Attributes With Interpretable Monotonic Multi-Attribute Sorting基于两个或多个属性的可解释单调多属性排序
61.Integrated Dual Analysis of Quantitative and Qualitative High-Dimensional Data定量和定类高维数据的对偶分析
62.Revisiting Dimensionality Reduction Techniques for Visual Cluster Analysis: An Empirical Study,实证研究
63.DimLift: Interactive Hierarchical Data Exploration Through Dimensional Bundling
64.Attribute-based Explanations of Non-Linear Embeddings of High-Dimensional Data
65.Measuring and Explaining the Inter-Cluster Reliability of Multidimensional Projections【度量指标】
Sports, Commerce, and Social Media
66.Augmenting Sports Videos with VisCommentator
67.TacticFlow: Visual Analytics of Ever-Changing Tactics in Racket Sports【球拍类运动-迅速改变战术的可视分析】
68.VideoModerator: A Risk-aware Framework for Multimodal Video Moderation in E-Commerce
69.A Visualization Approach for Monitoring Order Processing in E-Commerce Warehouse
70.MiningVis: Visual Analytics of the Bitcoin Mining Economy【比特币挖矿经济可视分析,标题即一切】
71.Real-Time Visual Analysis of High-Volume Social Media Posts
Studies and Evaluation Methodology
72.CoUX: Collaborative Visual Analysis of Think-Aloud Usability Test Videos for Digital Interfaces【标题即一切】
73.Professional Differences: A Comparative Study of Visualization Task Performance and Spatial Ability Across Disciplines
74.Rainbow Dash: Intuitiveness, Interpretability and Memorability of the Rainbow Color Scheme in Visualization【彩虹色盘】
75.Understanding Data Visualization Design Practice
76.Learning Objectives, Insights, and Assessments: How Specification Formats Impact Design
77.Untidy Data: The Unreasonable Effectiveness of Tables
Accessible Visualization and Natural Language-略
78.Accessible Visualization via Natural Language Descriptions: A Four-Level Model of Semantic Content
79.Towards Understanding Sensory Substitution for Accessible Visualization: An Interview Study
80.Communicating Visualizations without Visuals: Investigation of Visualization Alternative Text for People with Visual Impairments
81.Natural Language to Visualization by Neural Machine Translation
82.GenNI: Human-AI Collaboration for Data-Backed Text Generation
83.Words of Estimative Correlation: Studying Verbalizations of Scatterplots研究散点图的动词化【】
Flow, Topology, and Fields
84.FTK: A Simplicial Spacetime Meshing Framework for Robust and Scalable Feature Tracking
85.A Progressive Approach to Scalar Field Topology
86.Unordered Task-Parallel Augmented Merge Tree Construction【分布式 系统上计算合并树】
87.Wasserstein Distances, Geodesics and Barycenters of Merge Trees【标题即一切】
88.Optimization and Augmentation for Data Parallel Contour Trees【标题即一切】
89.A Domain-Oblivious Approach for Learning Concise Representations of Filtered Topological Spaces for Clustering【学习用于聚类的过滤拓扑空间的简洁表达】
Grammar and Learning
90.ChartSeer: Interactive Steering Exploratory Visual Analysis with Machine Intelligence
91.Net2Vis - A Visual Grammar for Automatically Generating Publication-Tailored CNN Architecture Visualizations【自动生成出版定制CNN架构可视化】
92.Gosling: A Grammar-based Toolkit for Scalable and Interactive Genomics Data Visualization【一个基于语法的可扩展和交互式基因组学数据可视化工具包】【领域相关】
93.THALIS: Human-Machine Analysis of Longitudinal Symptoms in Cancer Therapy【癌症治疗中纵向症状的人机分析】【领域相关】
94.MultiVision: Designing Analytical Dashboards with Deep Learning Based Recommendation【PKU 博客】【分析面板】
95.Interactive Graph Construction for Graph-Based Semi-Supervised Learning
Autonomous Driving, Urban, and Spatiotemporal Data
96.Geo-Context Aware Study of Vision-Based Autonomous Driving Models and Spatial Video Data【基于视觉的自动驾驶模型与空间视频数据的地理环境感知研究】
97.Visual Evaluation for Autonomous Driving
98.Where Can We Help? A Visual Analytics Approach to Diagnosing and Improving Semantic Segmentation of Movable Objects
99.Compass: Towards Better Causal Analysis of Urban Time Series
100.Visual Cascade Analytics of Large-scale Spatiotemporal Data
101.DDLVis: Real-time Visual Query of Spatiotemporal Data Distribution via Density Dictionary Learning
Scalability and Rendering
102.Interactive Focus+Context Rendering for Hexahedral Mesh Inspection
103.Differentiable Direct Volume Rendering
104.Accelerating Unstructured Mesh Point Location with RT Cores
105.Probabilistic Occlusion Culling using Confidence Maps for High-Quality Rendering of Large Particle Data【粒子数据】
106.A Memory Efficient Encoding for Ray Tracing Large Unstructured Data【非结构化数据】
107.Pyramid-based Scatterplots Sampling for Progressive and Streaming Data Visualization
编辑
Time Series and Events
108.Interactive Visual Exploration of Longitudinal Historical Career Mobility Data【有意思,清朝官员职业轨迹】
109.KD-Box: Line-segment-based KD-tree for Interactive Exploration of Large-scale Time-Series Data【这篇论文的图配色】
110.Sequen-C: A Multilevel Overview of Temporal Event Sequences
111.EVis: Visually Analyzing Environmentally Driven Events
112.HisVA: a Visual Analytics System for Learning History
113.SSR-TVD: Spatial Super-Resolution for Time-Varying Data Analysis and Visualization【低分辨率体序列→高分辨率体序列,wang chaoli老师的系列工作】
Graphs and Trees
114.Multi-level Area Balancing of Clustered Graphs
115.Understanding Missing Links in Bipartite Networks with MissBiN
116.A State-of-the-Art Survey of Tasks for Tree Design and Evaluation with a Curated Task Dataset【题目即一切】
117.Edge-Path Bundling: A Less Ambiguous Edge Bundling Approach
118.STRATISFIMAL LAYOUT: A Modular Optimization Model for Laying Out Layered Node-link Network Visualizations
119.Interactive Visual Pattern Search on Graph Data via Graph Representation Learning【我想看看这个,链接一直转】
Mitigating Bias
120.Left, Right, and Gender: Exploring Interaction Traces to Mitigate Human Biases
121.VisQA: X-raying Vision and Language Reasoning in Transformers
122.The Weighted Average Illusion: Biases in Perceived Mean Position in Scatterplots
123.Impact of Cognitive Biases on Progressive Visualization【设计实验】
124.Improving Visualization Interpretation Using Counterfactuals
125.Lumos: Increasing Awareness of Analytic Behavior during Visual Data Analysis
Data-Driven Communication and Storytelling
126.A Design Space for Applying the Freytag’s Pyramid Structure to Data Stories
127.Kineticharts: Augmenting Affective Expressiveness of Charts in Data Stories with Animation Design
128.Interactive Data Comics
129.Declutter and Focus: Empirically Evaluating Design Guidelines for Effective Data Communication
130.Showing Data about People: A Design Space of Anthropographics
131.Visual Arrangements of Bar Charts Influence Comparisons in Viewer Takeaways
Glyphs and Sets
132.Generative Design Inspiration for Glyphs with Diatoms
133.GlyphCreator: Towards Automatic Generation of Example-based Circular Glyphs【圆形符号自动生成】
134.Shape-driven Coordinate Ordering for Star Glyph Sets via Reinforcement Learning【星形符号集合的坐标排序问题】
135.F2-Bubbles: Faithful Bubble Set Construction and Flexible Editing
136.spEuler: Semantics-preserving Euler Diagrams
137.Visualization of 3D Stress Tensor Fields Using Superquadric Glyphs on Displacement Streamlines【科学可视化】
Uncertainty
138.Visualizing Uncertainty in Probabilistic Graphs【概率图】 with Network Hypothetical Outcome Plots (NetHOPs)
139.Implicit Error, Uncertainty and Confidence in Visualization: an Archaeological Case Study
140.Examining Effort in 1D Uncertainty Communication Using Individual Differences in Working Memory and NASA-TLX
141.Can Visualization Alleviate Dichotomous Thinking? Effects of Visual Representations on the Cliff Effect
142.Effect of Uncertainty Visualizations on Myopic Loss Aversion and Equity Premium Puzzle in Retirement Investment Decisions【投资决策,不确定性】
143.Visualization Equilibrium【信息展示与决策】
Model Evaluation
144.Inspecting the Running Process of Horizontal Federated Learning via Visual Analytics
145.An Evaluation-Focused Framework for Visualization Recommendation Algorithms【可视化推荐算法-评估框架】
146.Visual Analysis of Hyperproperties for Understanding Model Checking Results
147.FairRankVis: A Visual Analytics Framework for Exploring Algorithmic Fairness in Graph Mining Models【图挖掘模型,算法公平性】【论文配色很好看】
148.embComp: Visual Interactive Comparison of Vector Embeddings
149.VBridge: Connecting the Dots Between Features and Data to Explain Healthcare Models
Biological and Medical Visualization
150.COVID-view: Diagnosis of COVID-19 using Chest CT
151.ThreadStates: State-based Visual Analysis of Disease Progression
152.Loon: Using Exemplars to Visualize Large Scale Microscopy Data【大规模显微数据】
153.Scope2Screen: Focus+Context Techniques for Pathology Tumor Assessment【肿瘤评估】 in Multivariate Image Data【领域图】
154.Multiscale Unfolding: Illustratively Visualizing the Whole Genome at a Glance【领域图】
Efficient Representation and Layout
155.Rapid Labels: Point-Feature Labeling on GPU
156.Scalable Scalable Vector Graphics: Automatic Translation of Interactive SVGs to a Multithread VDOM for Fast Rendering
157.Probabilistic Data-Driven Sampling via Multi-Criteria Importance Analysis【疑似科学可视化的采样内容】
158.An Efficient Dual-Hierarchy tSNE Minimization
159.Joint t-SNE for Comparable Projections of Multiple High-Dimensional Datasets
160.Automatic Polygon Layout for Primal-Dual Visualization of Hypergraphs
Simultaneous Matrix Orderings for Graph Collections - Jiacheng Pan's Blog2021年秋季学期视觉计算实验室第十次论文研读预告Simultaneous Matrix Orderings for Graph Collections - Jiacheng Pan's Blog
图集合矩阵可视化的同步排序 (Simultaneous Matrix Orderings for Graph Collections) | PKU Visualization Blog
这是一篇领域论文,IRVINE——视觉分析(VA)系统,有助于分析声学数据以检测和了解电机制造过程中先前未知的错误。
这篇论文很有趣,上海科技大学搞出来的,“超能力”如何激发可视化设计的灵感 - 知乎
可视化技术是帮助认知数据的工具,从一定程度上赋予了用户快速读懂数据的“超能力”。如果沿着这个想法继续思考,那是否可以把超级英雄漫画和其他科幻小说里涉及的超能力,作为可视化设计的灵感来源呢?
针对这个想法,这篇论文对超级英雄漫画中涉及到感知和认知的超能力进行深入研究,作者从两个角度(能力的种类与能力的维度)思考了这些能力和可视化之间关系,并在此框架下提出了一些新的可视化“超能力",并展现了运用这些“超能力”作为设计灵感的机遇与挑战。
三维非对称张量场在流体力学、固体力学等科学和工程领域有着广泛应用。三维非对称张量具有复杂的特征值,故其分析和可视化比三维对称张量更具挑战性。现有的张量场可视化研究主要集中在二维非对称张量场和三维对称张量场。在本文中,我们讨论了三维非对称张量场的分析和可视化。
图形能有效传达数据,因为它们利用了视觉系统快速提取模式的能力。但这种模式提取不是一眼就能完成的。相反,对视觉注意的研究表明,视觉系统在图像上迭代地应用一系列过滤操作,随着时间的推移从视觉信息子集中提取模式,同时在每个时刻选择性地抑制其他信息。为了证明这一系列强大的过滤操作也发生在可视化数据的感知过程中,我们设计了一个任务,让参与者根据散点图上的一类标记做出判断,这可能会激励他们相对忽略其他类别的标记。在被忽略的标记集合中,参与者总是会错过一个明显的恐龙(1s演示中有93%,2.5s演示中有61%),但在忽略该集合的动机被移除的控制条件下(1s演示中有25%,2.5s演示中有11%),这表明数据可视化不是一眼就能“看到”的,而是需要一个积极的探索过程。【理论→实验→结论,没有算法实现】
本文提出了一种利用拓扑数据分析来研究情感计算中使用的面部姿势结构的方法,即识别人类情感的过程。该方法使用多个拓扑距离度量、降维技术和面部子部分(例如,眼睛、鼻子、嘴巴等)对不同情绪进行条件比较,包括各自的情绪和不受时间限制的情绪。结果证实,基于拓扑的方法捕获了已知模式、情绪之间的区别以及个人之间的区别,这是迈向更强大和可解释的机器情绪识别的重要一步。
Human-in-the-loop Extraction of Interpretable Concepts in Deep Learning Models - undefined
支持基于人在循环、主动学习的方法来提取用于模型解释的视觉概念,并识别对模型性能产生负面影响的视觉概念。
零样本分类,对于训练样本类别和测试样本类不相交的问题,零样本分类是一种很有前途的解决方法。实现这一点通常需要专家通过手工指定类属性矩阵来定义哪些类具有哪些属性来外部化他们的领域知识。设计一个合适的类属性矩阵是后续过程的关键,但是这个设计过程是乏味的,并且在没有指导的情况下反复试错。针对上述问题,本文提出了一种视觉解释性主动学习方法——语义导航器的设计与实现。这种方法通过在每个交互循环中有四个动作(询问、解释、推荐、回应)来促进人类与ai的合作。机器提出对比问题,引导人类在属性的思考过程中。一种名为语义地图的新型可视化技术解释了机器的当前状态。
多模态情感分析旨在从言语内容(即文本)、语音和面部表情等多个沟通渠道识别人们的态度。它已成为自然语言处理领域一个活跃而重要的研究课题。许多研究集中在建模不同通信渠道之间复杂的内部和内部交互。然而,目前性能强大的多模态模型通常是基于深度学习的技术,工作起来就像黑匣子一样。目前尚不清楚模型如何利用多模态信息进行情绪预测。尽管最近在增强机器学习模型可解释性方面的技术取得了进展,但它们通常针对单模态场景(如图像、句子),而在解释多模态模型方面的研究很少。在本文中,我们提出了一个交互式视觉分析系统,M2 Lens,以可视化和解释情感分析的多模态模型。
现有的关于深度神经网络的研究通常集中在神经元水平的解释上,这可能不能充分地捕捉到概念是如何被多个神经元集体编码的更大的图景。我们提出了NeuroCartography,一个互动系统,可伸缩地总结和可视化概念学习的神经网络。它自动发现和分组发现相同概念的神经元,并描述这些神经元组如何相互作用,形成更高层次的概念和随后的预测。
Cartograms是基于地图的数据可视化,其中每个地图区域的面积与相关的数字数据值(例如,人口或国内生产总值)成比例。如果一个地图符合这一区域原则,同时保持相邻区域的连接,那么它就被称为连续的。由于其扭曲的外观,连续的地图被批评为难以阅读。一些作者认为,如果地图带有互动功能(如动画、链接刷单或信息提示),那么地图会更容易辨认。我们进行了一个实验来评估这一说法。参与者必须使用交互式和非交互式的连续地图执行可视化分析任务。任务类型涵盖了制图可读性的各个方面,从基本的查找任务到概要任务(即,参与者必须总结两个制图之间的高层差异的任务)。基本任务在有交互和没有交互的情况下都能执行得同样好。相比之下,没有交互功能的概要任务就更加困难。然而,通过互动性,大多数参与者甚至正确回答了一些概括性的问题。在随后的调查中,参与者认为交互功能“易于使用”和“有用”。【理论→实验→结论,没有算法实现】
Nebula:构建交互联动的图形语法(Nebula: A Coordinating Grammar of Graphics) | PKU Visualization Blog
在这篇论文中,我们报告了一项关于周期性数据的可视化表示的研究,以及交互式wrapping条形图“围绕其边界”的效果。与线性条形图相比,极坐标(或径向)可视化的优势在于循环数据可以连续呈现,而无需在心理上架起跨越左右边界的视觉“切线”。为了调查这一假设并评估切割对分析性能的影响,本文展示了一项由72名参与者参与的众包控制实验的结果,他们将新的连续平移技术与线性条形图(交互式wrapping)进行了比较。我们的结果表明,与标准条形图或极坐标图相比,使用交互式wrapping的条形图误差更小。
交互式可视化设计和研究主要集中在本地数据和同步事件。然而,对于更复杂的用例,例如远程数据库访问和流数据源——开发人员必须处理分布式数据和异步事件。目前,构建这些用例是困难和耗时的;开发人员被迫对底层细节进行操作编程,比如异步数据库查询和响应式事件处理。这种方法与基于浏览器的交互式可视化的现代方法形成了鲜明的对比,后者的特点是高级声明性规范。为此,我们提出了DIEL,这是一个声明性框架,支持分布式数据上的异步事件。与许多声明性语言一样,DIEL开发人员只指定他们想要的数据,而不是如何组装这些数据的过程步骤。唯一的是,DIEL将异步事件(例如,用户交互、服务器响应)建模为事件日志中捕获的数据流。为了在任何时候指定可视化的状态,开发人员编写对数据和事件日志的声明性查询;DIEL编译并优化相应的数据流图,并自动生成必要的底层分布式系统详细信息。我们通过使用远程数据和异步事件的交互式可视化示例来演示DIEL的性能和表现力。
为可视化集合中的可视化生成具有代表性的缩略视图(VizSnippets: Compressing Visualization Bundles Into Representative Previews for Browsing Visualization Collections) | PKU Visualization Blog
用于比较分析的交互式降维(Interactive Dimensionality Reduction for Comparative Analysis) | PKU Visualization Blog
比较数据中的两个群组或者多个群组以确定使这些群组彼此相同或不同的因素是一项常见的分析任务。对于高维数据,降维方法经常被用来寻找每个群组的特征。然而,现有的降维方法进行比较分析的能力和灵活性有限。比如,无监督降维方法(如PCA)在计算时不会考虑数据的标签信息,有监督降维方法分析的目标较为狭窄(如LDA只识别最能区分群组的因素)。另外,大多数降维方法都不允许用户进行观察层面的交互,这极大限制了比较的灵活性。为了解决这些问题,作者提出新的降维方法ULCA
使用VPT (Volume Path Tracing)的直接体绘制(DVR)是一种科学的可视化技术,它利用基于物理的照明模型来模拟光与物体物质的传输。蒙特卡洛(MC)光路跟踪常用于曲面模型,但由于在无边界或光滑材料边界的体积介质中集成MC光路的复杂性,使得蒙特卡洛光路跟踪难以应用于体积模型。此外,为体产生的辅助几何缓冲(g -buffer)通常是非常嘈杂的,不能指导依赖该信息来保存图像细节的图像去噪。这使得现有的以无噪声g缓冲器为输入的实时去噪方法在VPT图像去噪时效果较差。我们提出了必要的修改,以图像为基础的去噪以前用于渲染表面模型,并证明了有效的VPT图像去噪。【以前没有关注过VPT,MC路径追踪这些】
数据可视化的一个核心挑战是了解需要哪些数据采样点来生成相关信息编码的数据集的图像。在这项工作中,我们朝着回答这个问题迈出了第一步:通过学习数据、采样模式和生成的图像之间的对应关系,人工神经网络是否可以预测在哪里对密度更高或更低的数据进行采样。我们引入了一种新颖的神经绘制管道,通过端到端训练,从给定的低分辨率输入图像生成稀疏自适应采样结构,并从稀疏样本集重建高分辨率图像。就我们所知,我们第一次证明了,与最终视觉表达相关的结构选择可以与从这些结构表达重建一起学习。
我们提出STNet,一个端到端的生成框架,可以高保真地合成时变数据的时空超分辨率体。STNet包括两个模块:发生器和时空鉴别器。发生器的输入为两端两个低分辨率体,输出为中间和两端时空超分辨率体。时空鉴别器利用卷积长短时记忆,接受时空超分辨率序列作为输入,并根据每个体的空间(体本身)和时间(前体数据)信息预测每个体的条件分数。我们提出了一个无监督的训练前阶段,利用周期损失来提高STNet的泛化。一旦训练完成,STNet就可以从低分辨率的数据中生成时空超分辨率的数据,为科学家提供了保存数据存储的选择(即在空间和时间维度上对模拟输出进行稀疏采样)。
最先进的不稳定流中旋涡的计算和可视化采用了客观的旋涡准则,这使得它们独立于参照系或观察者。然而,客观性本身虽然至关重要,但并不足以保证人们可以识别物理上可实现的观察者,他们会感知或检测到相同的漩涡。此外,一个重大的挑战是,单一的参照系往往不足以准确地观察遵循不同运动的多个漩涡。本文提出了一种新的框架,用于探索和使用交互式选择的一组观察者,由此产生的相对速度场,以及目标涡结构。我们表明,我们的方法有助于相对于良好适应的参考坐标系运动的涡流的客观检测和可视化,同时保证这些观察者实际上是物理上可实现的。
对于一个三维多参数域组集数据,我们提出了一个可视化的分析工作流程,以分析所选的多参数分布的哪些部分/是否存在于所有组集成员中。
Context Matters: A Theory of Semantic Discriminability for Perceptual Encoding - undefined
语言中的许多隐喻反映了构成思维的概念隐喻。与“高的数字”之类的隐喻表达相一致,实验表明,人们将更大的数字与向上的空间联系在一起。与这一比喻相一致的是,高的数字通常被描述在线形图y轴的高位置上。人们还会将好的和坏的(情感效价)与向上和向下的位置联系起来,这与“令人振奋”和“情绪低落”等隐喻表达一致。描述好数量的图形(例如,假期)与图形惯例和价隐喻是一致的,因为“更多”的好数量是由更高的y轴位置表示的。相反,描述坏数量的图形(例如谋杀)与图形惯例一致,但与价的比喻不一致,因为更多的坏数量是由较高(而不是较低)的y轴位置表示的。我们进行了两个实验(每个实验N = 300),参与者回答了关于描述好数量和坏数量的线图的问题。对于一些图,我们颠倒了传统的数字轴顺序。与效价隐喻(up = good)对齐(或不对齐)的线形图更容易解释,但是这种有益的影响并没有超过反转轴编号的不利影响。描述好(与坏)数量的线形图更容易解释,使用x轴(与y轴)表示数量的图形也是如此。我们的结果表明,概念隐喻对线形图的解释很重要。然而,线形图的设计者被警告不要为了与概念隐喻保持一致而颠覆图形惯例。
数据可以用视觉通道(如位置、长度或亮度)来直观地表示。现有的这些视觉通道的排名是基于参与者报告两种描述值之间的比例的准确性。有一个假设,这个排名应该适用于不同的任务和不同的分数。然而,现有的工作测试假设很少,特别是考虑到在现实世界的可视化中,与看到、记住和比较趋势和图案相比,视觉计算比率相对不重要,在几乎普遍描述两个以上的值的显示中。
我们要求参与者立即根据记忆重现一组值。通过贝叶斯多层建模方法,我们观察了视觉通道的相关等级位置如何在不同的标记数(2、4或8)之间移动,以及偏差、精度和误差测量。即使复制2分,排名也没有保持不变,新的排名对于复制不同数量的分数是高度不一致的。除了通道选择之外,其他因素对性能的影响要大得多,比如序列中数值的数量(例如,分数越多,误差就越大),或者每个分数的值(例如,小数值会被系统高估)。
8分的回忆比4分更差,这与视觉记忆的既定限制一致。这些结果表明,我们必须超越两值比判断作为视觉通道质量排名的基线,包括测试新任务(检测趋势或图案)、时间尺度(立即计算,或稍后的比较)和值的数量(从少数到数千)。
最近在数据可视化方面的工作表明,小的,感知上明显不同的调色板,如分类映射中使用的调色板,可以暗示重要的情感质量。被绘制或可视化的数据通常在本质上也具有情绪性,要么是固有的(如气候变化、疾病死亡率),要么是设计的,如可以在视觉叙事中找到。然而,在可视化设计中,颜色的情感品质与数据环境的情感品质是如何相互作用的,目前还知之甚少。本文描述了一项关于情感一致和不一致配色方案对分类地图阅读反应的影响的众包研究的结果。我们报告了两个目标(模式检测;区域比较)和主观(情感质量;适当性;偏好)测量地图阅读者的反应。我们的研究结果表明,情感一致的颜色增强了人们对带有情感主题的地图的情感质量的感知,情感不一致可能会导致混淆,而情感一致在积极倾向的数据主题地图中尤其具有影响力。最后,我们提出了在主题地图设计中平衡色彩一致性与其他设计因素,以及综合色彩与情感语境的初步设计建议。
可视化的基本任务之一是比较两个或多个可视化元素。然而,通常很难从视觉上区分编码了微小值差异的图形元素,例如柱状图中类似条形图的高度或饼状图中类似部分的角度。知觉规律可以用来模拟我们何时以及如何感知这种差异。在这项工作中,我们模拟了仅可见差异(JNDs)的感知,这是视觉属性的最小差异,允许在图表中忠实地比较相似的元素。具体而言,我们通过柱状图、饼状图和气泡图三种图表来探讨jnd与视觉要素强度和视觉要素之间距离这两大视觉变量之间的关系。通过实证研究,我们确定了柱状图中距离、饼状图中强度以及气泡图中距离和强度对JND的主要影响。通过拟合线性混合效应模型,我们对JND进行了建模,发现JND是变量的指数函数。我们重点介绍了几种使用JND建模的场景,在这些场景中,通过辅助视觉线索来检测和增强匹配的JND下面的元素,以便更好地识别。
利用颜色编码的堆叠直方图增强平行坐标图 (Augmenting Parallel Coordinates Plots with Color-coded Stacked Histograms) | PKU Visualization Blog
引入了并行直方图(PHP),一种克服平行坐标图(PCP)固有局限性的技术,它将带有离散配色方案的堆叠直方图附加到了PCP中。
Seek for Success: A Visualization Approach for Understanding the Dynamics of Academic Careers - undefined
对学术文献进行评论有一些突出的做法,包括在谷歌Scholar上搜索特定的关键词或检查一些初始种子论文的引用。这些方法服务于学术文献综述的关键目的,但当相似的工作可能使用不同的术语时,在识别相关文献方面仍然存在挑战(例如,混合主动性视觉分析论文可能不会使用与模型指导论文相同的术语,但这两个主题是彼此相关的)。在本文中,我们引入了一个系统,VITALITY,旨在补充现有的实践。特别地,VITALITY促进使用transformer语言模型的相关文献的意外发现,允许用户在给定(1)输入论文列表或(2)工作摘要的单词嵌入空间中找到语义相似的论文。
VIS30K: IEEE国际可视化大会论文的图表集合(VIS30K: A Collection of Figures and Tables from IEEE Visualization Conference Publications ) | PKU Visualization Blog
我们展示了VIS30K数据集,29689张图片,代表了IEEE可视化会议系列(Vis, SciVis, InfoVis, VAST)中每个轨道30年的图表和表格。VIS30K对可视化科学文献的全面覆盖,不仅反映了该领域的进展,也让研究者可以研究最先进的技术的演变,并基于图形内容找到相关的工作。我们描述了数据集和我们的半自动收集过程,它将卷积神经网络(CNN)与curation耦合起来。
我们对过去30年在IEEE可视化(VIS)会议上的作者、委员会成员和获奖者的性别代表性进行了探索性分析。我们的目标是提供描述性的数据,以供社区的多样性讨论和建立。我们特别关注VIS作者的性别,将其作为整个社区的代表。我们考虑了作者之间的总体性别代表性、职业差异、作者列表中的位置和合作的衡量标准。我们发现,女性作者的比例从会议前五年的9%上升到了会议后五年的22%。多年来,我们发现项目委员会中的女性比例是相同的,组织委员会中的女性比例略高。
是什么使演讲有效一直是一个争论的话题,直到今天,公共演讲专家们对什么因素使演讲有效以及这些因素在演讲中的作用存在广泛的争议。此外,缺乏定量分析方法来帮助理解有效的口语策略。在本文中,我们提出了一种视觉分析系统e - effective,让演讲专家和演讲新手都能分析演讲因素在有效演讲中的作用和贡献。通过对领域专家的采访和对现有文献的调查,我们确定了励志演讲中需要考虑的重要因素。我们从多模态数据中获得了与有效性数据相关的生成因子。我们的系统支持快速理解励志演讲中的关键因素,包括通过新颖的可视化方法和交互作用的情绪影响。
行政司法涉及个人与国家的关系。它包括对儿童的教育、社会照顾、许可证、规划、环境、住房和无家可归的决定的纠正和投诉。然而,如果有人有投诉或问题,人们很难理解不同的可能的补救途径,并探索什么途径适合他们的情况。解释性可视化有可能以一种清晰的方式展示这些补救途径,这样人们可以看到、理解和探索他们的选择。可视化挑战更加复杂,因为信息分散在许多文件、法律、指导和政策中,需要司法解释。因此,没有关于补救途径的单一数据库。在这项工作中,我们介绍了我们如何共同设计了一个系统,以可视化的行政司法途径的补救。同时,我们对来自专家研讨会、启发式评估和专家批判性反思的基础数据进行分类、整理和组织。
The Unmet Data Visualization Needs of Decision Makers within Organizations - undefined
当一个组织在备选方案中选择一种行动方案时,这项任务通常落在具有相关知识、经验和对环境的理解的决策者身上。决策者依赖于数据分析,数据分析要么委托给分析师,要么自己完成。通常,决策者将不确定或不完整的数据与多目标问题空间中的非形式化知识结合起来,在更广泛的背景和目标中权衡分析师的建议。由于过去对可视分析的大多数研究都集中在理解数据分析师的需求和挑战,对组织决策者的任务和挑战以及可视化支持工具的帮助知之甚少。在这里,我们将决策者描述为领域专家,回顾了相关的管理理论文献,并报告了一项实证调查和对组织决策人员的采访的结果。
我们提出Knowledge Rocks,一种将可视化系统扩充为KAVA模型定义的知识辅助可视化系统的实现策略和指南。可视化系统变得越来越复杂。因此,越来越重要的是要用一个完整的知识库来支持用户作出建设性的选择和得出正确的结论。我们支持通过知识辅助来增强可视化软件资源的有效激活。
人们普遍认为可视化系统的一个关键目标是帮助决策,但这是真的吗?我们对决策活动是否确实是可视化领域的中心进行了批判性的调查。通过将决策作为一个用户任务来处理,我们探索了决策任务在可视化研究和用户研究中明显的程度。我们的分析表明,决策任务在当前的可视化任务分类中并不常见,可视化领域还没有利用决策理论领域的指导来研究这类任务。我们进一步发现,大多数处理决策的可视化并没有根据其辅助决策任务的能力进行评估。最后,为了帮助扩大可视化分析在组织和休闲决策活动中的影响,我们启动了一个研究议程,即如何在整个可视化研究中提升决策辅助。
之前关于可视化交流的研究主要集中在公共展示和非同步的个人消费,比如新闻领域。可视化研究社区对组织内数据的同步和多模态通信(从团队会议到执行简报)知之甚少。我们进行了两项定性访谈研究,研究对象是准备并向组织中的受众提供数据演示的个人。
我们通过采用因果支持(一种贝叶斯认知模型,在给定一些数据的情况下学习其他因果解释的概率)作为因果推断的规范基准,正式评估来自可视化的因果推断的质量。我们贡献了两个实验来评估众包工作者检测(1)a treatment effect和(2)混淆关系的能力。我们发现图表使用者的因果推断往往不受样本大小的影响,以致偏离了我们的标准基准。虽然可视化中的交互式交叉过滤数据可以提高灵敏度,但平均而言,用户使用普通可视化的表现并不比使用文本联列表的表现更好。
理解和解决机器学习在高风险决策中的可用性挑战
多视图可视化设计的引导式语义捕捉(Semantic Snapping for Guided Multi-View Visualization Design) | PKU Visualization Blog
可视化信息显示通常由多个可视化图形组成,用于促进对底层数据的理解。一个常见的例子是仪表板,它经常用于金融、流程监视和业务智能等领域。然而,用户可能不知道现有的指导方针和缺乏专家的设计知识时,构成这样的多视图可视化。在本文中,我们提出了语义捕捉,一种帮助非专业用户从已有视图集设计有效的多视图可视化的方法。我们的方法使用一种动态程序来检测和建议解决冲突,误导,或模糊的设计,以及提供替代方案的建议。
目前,探索跨视图数据关系严重依赖于视图协调技术(例如,刷边和链接),这可能需要用户在多次试错尝试中付出大量努力,例如反复选择一个视图中的元素,然后观察和跟踪在其他视图中突出显示的元素。为了解决这个问题,我们提出了SightBi,这是一种支持跨视图数据关系探索的可视化分析方法。我们详细讨论了SightBi的设计原理,以及关于使用跨视图数据关系的用户任务。SightBi将交叉视图数据关系形式化为biclusters,从数据集中计算它们,并使用bi-context设计,突出强调创建独立的关系视图。
Blazars:耀变体,一种天体。通过对blazar的光度和偏振观测的分析,天文学家旨在了解blazar相对论喷流的物理特性。然而,识别观测到的偏振、强度和发射光的颜色的相关性和时间变化是具有挑战性的。在我们之前的研究中,我们提出TimeTubes,将blazar数据可视化为3D体积tube。在本文中,我们主要以blazar数据集的TimeTubes表示形式为基础,构建了一个新的可视化分析环境,命名为TimeTubesX。在该环境中,我们集成了复杂的特征和模式检测技术,用于在长期、多维数据集中有效地定位可观测数据和反复出现的时间变化模式。自动特征提取检测与众所周知的blazar行为相对应的时间间隔。
在对填充颗粒材料的研究中,样品的性能(例如,高能炸药的爆炸)往往与对流过样品的流体的测量有关。“有效表面积”,即气流可到达的表面积,通常使用渗透率测量仪器,通过carmen - kozeny方程将流动导度与渗透表面积联系起来。这个公式允许计算在给定的压降下,流体流经样品中填充的颗粒的流速。然而,Carman-Kozeny对隧道形状和流动路径做出了固有的假设,这在颗粒形状、大小和纵横比分布广泛的情况下可能不准确,因为许多技术和商业利益的粉末系统都是如此。
在分子分析中,空间分布函数(SDF)是回答与空间发生和原子结构随时间变化关系有关的问题的基本工具。例如,给定一个分子轨迹,sdf可以揭示水在特定结构中的出现,从而提供疏水和亲水区域的线索。为了计算有意义的分布函数,分子参考结构的定义是必不可少的。因此,我们为表示选定分子结构的标记点集引入了内部参考框架(IFR)的概念,并提出了一种使用kabch算法的变体在时间和空间上跟踪IFR的算法。这种方法让我们为分子轨迹和分子集合的SDF聚合产生一致的空间。
InfoColorizer: Interactive Recommendation of Color Palettes for Infographics - undefined
在信息图设计时,一般的用户会使用已有的信息图工具得到期望的配色,而这有时会损失配色的灵活性,或者要求用户有专业的设计知识,或者忽略了元素的空间安排。本文提出了一个数据驱动的方法,能够在考虑用户偏好的情况下保证配色的灵活度,通过自动化方法降低对专业知识的要求,并根据元素的空间布局合理修正配色方案。
信息柱状图由于其吸引力和可记忆性而被广泛用于数字信息的交流。然而,这些信息图通常是用PowerPoint和Adobe Illustrator等通用工具手工创建的,仅仅由原始的视觉元素组成,如文本块和形状。由于没有图表模型,更新或重用这些信息图需要繁琐且容易出错的手工编辑。在本文中,我们提出了一种混合主动性Mixed-Initiative方法来缓解这一痛点。一方面,机器被用来执行精确而琐碎的操作,例如将数值映射到形状属性和对齐形状。另一方面,我们依靠人类来执行主观和创造性的任务,例如修改修饰或批准机器的编辑。我们将我们的技术封装在一个PowerPoint插件原型中,并通过将我们的技术应用于一系列不同的信息柱状图示例来演示其有效性。
图表与文本一起用于交流复杂的数据,在新闻文章、在线博客和学术论文中被广泛采用。它们提供数据的图形摘要,而文本解释消息和上下文。然而,通过文本和图表综合信息是困难的;它要求读者经常转移注意力。我们研究了在数据文档中支持文本和图表紧密耦合的方法。为了理解它们之间的相互作用,我们通过新闻文章和科学论文分析了图表-文本引用的设计空间。根据分析结果,我们开发了一个混合倡议的界面,使用户能够在文本和图表之间构建交互式引用。它利用自然语言处理来自动建议引用,并允许用户毫不费力地手动构造其他引用。
可视化推荐(VisRec)系统在探索性数据分析过程中为用户提供潜在的有趣和有用的下一步建议。这些建议通常根据分析操作进行分类,即从当前勘探状态过渡到推荐可视化的操作。然而,尽管在最近的工作中出现了大量的VisRec系统,但这些系统在分析工作流中所使用的类别的效用尚未得到系统的研究。我们的论文通过形式化常见类别的分类法和开发一个实现这些类别的系统Frontier来探讨推荐类别的有效性。使用Frontier,我们评估用户采用的工作流策略以及类别如何影响这些策略。与会者发现,添加属性以增强当前可视化的建议和过滤到子种群的建议在数据探索过程中相对最有用。
可视化推荐或可视化自动生成可以显著降低普通用户快速创建有效数据可视化的门槛,特别是对于那些没有数据可视化背景的用户。然而,现有的基于规则的方法需要可视化专家手工规范可视化规则。其他基于机器学习的方法通常像黑箱一样工作,很难理解为什么推荐特定的可视化,限制了这些方法的广泛采用。本文提出了一种基于知识图(KG)的可视化推荐方法KG4Vis,填补了这一空白。它不需要人工规范可视化规则,也能保证良好的可解释性。具体而言,我们提出了一个构建知识图的框架,由三种类型的实体(即数据特征、数据列和可视化设计选择)及其之间的关系组成,以建模数据之间的映射规则和有效的可视化。
尽管自动化可视化工具越来越流行,但现有的系统往往提供的直接结果并不总是符合输入数据或满足可视化需求。因此,在真实的用例中仍然需要额外的规范调整。然而,手动调整是困难的,因为大多数用户不一定拥有足够的技能或可视化知识。即使是有经验的用户也可能创建不完美的可视化,包括图表构造错误。我们提出了一个框架,VizLinter,以帮助用户发现缺陷,并纠正已经建立但有缺陷的可视化。该框架由两个部分组成,(1)可视化检查,应用公认的原则来检查呈现的可视化的合法性,(2)可视化修复器,根据检查自动纠正检测到的违规。AVA 2.0:洞见,新开篇 - 知乎
在开发为流行病学家和建模科学家提供可视化和可视化分析(VIS)工具的基础设施的过程中,我们遇到了在有限的开发资源下快速可靠地将大量可视化设计应用于大量数据集的技术挑战。在本文中,我们提出了一种技术解决方案来应对这一挑战。在操作上,我们分离了数据管理、可视化设计、绘图和仪表板部署的任务,以简化开发工作流。在技术上,我们利用本体将数据集、可视化设计、可部署图和仪表板置于同一管理框架下;用于发现与视觉设计匹配的潜在数据集的多准则搜索和排序算法;以及一个专门设计的用户界面,用于将每个可视化设计传播到适当的数据集(通常是几十个或数百个),并在部署之前保证传播的质量。该技术解决方案已用于RAMPVIS基础设施的开发,以通过可视化支持流行病学家和建模科学家的联盟。
个人信息学研究帮助人们追踪个人数据,以达到自我反思和获得自我认识的目的。然而,这一领域主要集中在数据收集和自我跟踪的洞察生成元素,较少关注灵活的数据分析。结果,这种疏忽导致了僵化的分析管道,不能反映或支持人们想要使用数据的不同方式。本文回顾了个人信息学和可视化研究文献,揭示了我们在设计灵活工具方面的知识缺口,这些工具可以帮助人们在个人环境中处理和分析个人数据,我们称之为个人信息学分析缺口。我们通过对哮喘患者如何处理个人空气质量数据的多阶段纵向研究来探索这一差距,我们报告参与者如何:被广泛而多样的目标激励;展示了他们探索数据的方式的模式;以有趣的方式使用他们的数据;通过偶然的探索发现新的见解;他们不愿意自己使用分析工具。
位置可视化是可视化中的一个新兴概念,它将数据在与人相关的位置进行可视化。其核心思想是通过将数据与数据所指的物理环境或物理参照物[100,105]连接起来,将数据可视化带入其使用的环境中,带到地点和人的环境中。这一概念已经获得了多个研究团体的兴趣,包括可视化、人机交互(HCI)和增强现实。这导致了对这一概念的一系列探索和应用,然而,这一早期工作集中在情境性的操作方面,导致对这一概念和术语的采用不一致。首先,我们贡献了一个文献调查,其中我们分析了44篇明确使用术语“位置可视化”的论文,以提供研究领域的概述,它如何定义位置可视化,常见的应用领域和使用的技术,以及数据类型和可视化类型。我们的调查显示,对情境可视化的研究集中在以技术为中心的方法,前景对情境的空间理解。
战术分析是羽毛球运动中的一个重要问题,战术的有效运用是取胜的关键。羽毛球中的战术被定义为连续的击球。大多数现有方法使用统计模型来查找笔画的顺序模式,并应用二维可视化(如字形和统计图表)来探索和分析所发现的模式。然而,在羽毛球运动中,像羽毛球轨迹这样的空间信息,本质上是三维的,是战术的核心。二维可视化中缺乏足够的空间意识,在很大程度上限制了羽毛球的战术分析。在这项工作中,我们与领域专家合作,研究了在3D环境下的羽毛球战术分析,并提出了沉浸式视觉分析系统TIVEE,以帮助用户从多个层面探索和解释羽毛球战术。
我们比较了简单数据可视化的物理和虚拟现实(VR)版本,并探索虚拟注释和过滤工具的添加如何影响观众解决基本数据分析任务。我们报告了两项研究,其灵感来自于之前对数据物化的检查。第一项研究考察了观看者与实物手比例尺、虚拟手比例尺和虚拟表比例尺可视化交互的差异,以及不同形式对观看者解决问题行为的影响。第二项研究探讨了交互式注释和过滤工具如何支持超越物理表示的限制的新使用模式。我们的研究结果突出了与虚拟现实表现相关的挑战,并暗示了交互式注释和过滤工具在VR可视化中的潜力。
在为桌面和移动设备创建可视化(即响应式可视化)时,作者经常通过缩放、聚合和其他技术将大屏幕可视化转换为小屏幕。然而,转换可能会改变大屏幕视图所暗示的关系或模式,这要求作者在调整设计以适应小屏幕时仔细考虑保留哪些信息。我们提出了一种自动化的方法,来近似在源可视化的响应式转换中失去对面向任务的可视化洞察(识别、比较和趋势)的支持。我们将识别、比较和趋势损失作为目标函数,通过比较呈现的源可视化和每个实现的目标(小屏幕)可视化的属性来计算。为了评估我们方法的效用,我们在一组源可视化中对机器学习模型在人类排序的小屏幕替代可视化上进行训练。
许多选择问题通常包含多个属性,这是一种智力挑战,因为只有一个属性是整齐排序的,而其他属性可能是随机排列的。我们假设,感知多个属性的近似单调趋势是排序结果的整体可解释性的关键,因为用户可以很容易地预测下一个条目的属性值。我们扩展了排序主曲线模型来调整属性的单调趋势,提出了Imma Sort方法,通过权衡主排序属性的单调性来提高人类对其他属性的可预测性,从而同时对多个属性进行排序。我们描述了它如何对不同的属性相关性、属性首选项、列表长度和属性数量执行。
Integrated Dual Analysis of Quantitative and Qualitative High-Dimensional Data - undefined
定量和定类高维数据的对偶分析(Integrated Dual Analysis of Quantitative and Qualitative High-Dimensional Data) | PKU Visualization Blog
这篇论文浙大和北大可视化小组都写了。
降维(DR)技术可以生成二维投影,并使高维数据集的集群结构的可视化探索成为可能。然而,不同的DR技术会产生不同的模式,这将显著影响视觉聚类分析任务的性能。我们展示了一项用户研究的结果,该研究调查了不同DR技术对视觉聚类分析的影响。我们的研究集中在最受关注的特性类型,即线性和局部性,并评估了12种具有代表性的DR技术。通过4个对照实验,分别评估DR技术对1)聚类识别、2)隶属度识别、3)距离比较和4)密度比较任务的促进作用。我们还评估了用户对于投影集群质量的DR技术的主观偏好。
DimLift-Interactive Hierarchical Data Exploration through Dimensional Bundling - undefined
【直接看浙大博客↑】识别有趣的模式和关系对探索性数据分析至关重要。这在高维数据集中变得越来越困难。虽然可以利用降维技术来减少分析空间,但这些技术可能会在无意中将关键维隐藏在更大的分组中,并混淆有意义的模式。在这项工作中,我们引入了DimLift,这是一种新颖的可视化分析方法,用于创建维度束并与之交互。
高维数据嵌入被广泛应用于数据挖掘、分析结果验证和信息交流等方面。它们的解释,特别是关于输入属性的解释,通常是困难的。对于像PCA这样的线性项目,轴仍然可以进行有意义的注释。在非线性投影中,这就不再可能了,而需要一些替代策略,如基于属性的颜色编码。在本文中,我们回顾了现有的增强技术,并讨论了它们的局限性。我们提出了非线性嵌入测量器(NoLiES),它结合了投影数据(范围集)的一种新的增强策略和小倍数设置中的交互式分析。范围集使用一种基于集的可视化方法来显示二进制属性值,使用户能够快速观察结构和检测异常值。
我们提出稳健性和内聚性这两个新的指标来衡量多维投影(MDP)的簇间可靠性,特别是簇间结构在原始高维空间和低维投影空间之间的保留情况。测量集群间的可靠性是至关重要的,因为它直接影响到集群间任务(例如,从投影视图识别原始空间中的集群关系)的执行情况;然而,尽管集群间任务很重要,我们发现以前的指标,如可信性和连续性,不能衡量集群间的可靠性。我们的指标考虑了集群间可靠性的两个方面:稳定性衡量投影空间中的集群形成原始空间中的集群的程度,内聚性衡量相反的程度。他们在一个空间中提取具有任意形状和位置的随机簇,并评估这些簇在另一个空间中被拉伸或分散的程度。
体育视频中的可视化数据在体育分析中越来越受欢迎,因为它能够传达深刻的见解和解释玩家的策略。然而,用这样的数据可视化来增强体育视频是具有挑战性的,尤其是对体育分析师来说,因为这需要相当多的视频编辑专业知识。为了简化创建过程,我们提出了一个设计空间,在元素级别(成分是什么)和剪辑级别(这些成分是如何组织的)描述增强体育视频。为此,我们系统地回顾了从电视频道、球队和联赛收集的233个增强体育视频示例。设计空间指导各种目的的数据洞察和可视化的选择。在设计空间和与领域专家的密切合作下,我们设计了VisCommentator,一个快速原型工具,通过利用基于机器学习的数据提取器和基于空间的可视化建议来简化创建增强乒乓球视频。
事件序列挖掘通常用于从数百个序列中总结模式,但在处理球拍运动数据时面临着特殊的挑战。在球拍类运动(如网球和羽毛球)中,一个球员击球被认为是一个由多个属性(如击球技术和球位)组成的多变量事件。因此,一个回合(即从一名球员发球开始,以一名球员赢得一分结束的一系列连续击球)可以被视为一个多元事件序列。挖掘频繁模式并描述模式如何随时间变化,对于那些想要学习更多包含多次命中的短期竞争策略(如战术)的玩家来说具有指导意义。而在球拍类运动中,运动员往往会根据对手的反应而迅速改变战术,导致战术进程不断变化。在这项工作中,我们引入了一个基于新颖的多元序列模式挖掘算法的定制可视化系统,以促进各种战术和战术进展的探索性识别和分析。
阿里巴巴-浙江大学前沿技术联合研究中心
随着社交媒体应用的普及,视频审核变得越来越重要。未经审核的视频内容可能给社交媒体平台带来未知的法律与道德风险。随着监管部门对视频合规要求的不断提高,视频审核已经成为各大互联网平台不可或缺的一项任务。视频审核旨在探究视频中蕴含的多模态风险内容,包括视觉信息的风险,例如裸露、血腥恐怖等,也包括音频信息的风险,例如粗话、脏话等。对于该项任务,一种策略是使用机器学习模型来进行风险的自动检测。然而,机器学习模型存在低准确率、不可解释等问题。过于严苛的审核策略会导致机器学习模型假阳率偏高,产生大量的误判案例,影响平台内容创作者的热情,而过于宽松的审核策略则会导致机器学习模型召回率不够,给平台带来潜在风险。
阿里巴巴-浙江大学前沿技术联合研究中心
电商仓库的订单处理效率对电商服务质量而言至关重要。高效的订单处理效率能保障电商物流交货的及时性,提升客户的网络购物体验。实时监控、及时根据实际情况调整仓内生产状态,可以提效订单处理。然而传统的关于流式数据可视化和工业流程可视化的方法不能直接应用在这一领域。电商仓库面临着大体量且数量类型均不确定的订单,仓内实操对滞留订单的判定界限较为模糊,操作人员关于订单处理的优先级决策也比较复杂。这些特征都使实时地监控、分析并维护电商仓库内的订单处理这一问题变得困难。
我们提出了一个可视化分析工具MiningVis,以探索比特币挖矿生态系统的长期历史演变和动态。比特币是一种备受关注但仍然难以理解的加密货币。对比特币的成功、稳定和安全尤其重要的是系统的一个组件,称为“挖矿”。矿工负责验证交易,并被金钱奖励的承诺激励参与。矿池已成为矿工的集体,以确保更稳定和可预测的收入。
大规模实时社交媒体数据分析(Real-Time Visual Analysis of High-Volume Social Media Posts) | PKU Visualization Blog
回顾一个think-aloud的视频既耗时又费力,因为它需要UX(用户体验)专业人员关注视频中用户的许多行为信号。此外,当多个用户体验专家需要协作以减少偏见和错误时,挑战就出现了。我们提出了一个协同的视觉分析工具,CoUX,以促进用户体验评估人员集体审查数字界面的可用性测试视频。CoUX在集成环境中无缝地支持可用性问题识别、注释和讨论。为了简化可用性问题的发现,CoUX通过机器学习从一个think-aloud会话的视频和音频中提取声音、文本和视觉特征,并将一组问题指标可视化。CoUX通过一个类似聊天盒的用户界面,进一步支持用户体验评估者之间的协作,以记录、评论和巩固发现的问题。我们与两位用户体验专家进行了一项形成性研究,并从文献中获得了一些见解,从而设计了CoUX。
问题驱动的可视化工作植根于对目标领域的数据、参与者、过程和工作流的深入理解。然而,个人的个性特征和认知能力也可能影响可视化的使用。不同的用户需求和能力自然会对可视化设计的特殊性提出疑问:不同领域的个体在使用可视化时会表现出不同的性能吗?是否有与认知能力相关的系统性变异?本研究将特定领域的可视化设计视角与认知和感知提供的视角联系起来。我们测量了化学、计算机科学和教育中可视化任务表现的差异,并将这些差异与空间能力的差异联系起来。我们与60多位领域专家一起进行了一项在线研究,包括与饼状图、等高线图和3D散点图相关的任务,并以一项有充分证据的空间能力测试为基础。在更复杂的可视化(等高线图和散点图)中,任务表现(正确性)随着职业的不同而不同,但饼状图并不是比较常见的可视化。我们发现,正确性与空间能力相关,而不同的职业在空间能力方面存在差异。
在证明彩虹颜色仍然在科学出版物中普遍使用后,我们在一个有544名参与者的经验用户研究中比较评估了彩虹和顺序颜色方案在chorpleth和等差数列地图上的效果,以检验a)人们是否会直观地将这些方案中的颜色顺序联系起来,b)他们是否能够成功地进行感知和语义地图阅读,以及在顺序可能具有隐性或显性重要性的量化数据的回忆任务。我们发现,对彩虹颜色的排序几乎没有一致的意见,而对顺序颜色的排序确实是由被试凭直觉决定的,深色较强的被试更有偏见。顺序颜色比彩虹颜色更有利于大多数定量地图读取任务,而彩虹颜色更有利于从地图中提取特定值,并且可能比顺序颜色更好地支持色调回忆。
数据可视化设计师的专业角色越来越受欢迎,对学术研究和专业实践社区之间关系的兴趣也越来越大。然而,尽管这些社区之间有知识共享的潜力,但我们对实践者在现实世界的专业环境中设计的方式知之甚少。许多设计学科的研究表明,实践者处理复杂情况的方式与研究人员的方式根本不同。在这项工作中,我采取了一种实践主导的方法来理解可视化设计实践本身。我们采访了20名数据可视化从业者,并询问了他们的设计过程,包括他们采取的步骤,他们如何做出决定,以及他们使用的方法。研究结果表明,实践者不遵循高度系统的过程,而是依赖于已知和行动的特定形式,在这种形式中,他们从先例中吸取经验,并使用当时确定合适的方法和原则。
尽管交际可视化无处不在,但在设计过程中明确交际意图是特别的。无论我们是从一组可视化中选择,委托他人制作,还是自己创造,一种明确意图的有效方法都可以帮助指导这个过程。理想情况下,我们应该有一种简洁和共享的规范语言。在之前的研究中,我们认为交际意图可以被视为一个学习/评估问题(即,读者应该学习什么,他们应该在什么样的测试中做得好)。基于学习的规范格式是相互联系的(例如,评估源自于目标),但有些可能更有效地指定交际意图。通过大规模的实验,我们研究了三种规格类型:学习目标、见解和评估。参与者在其中一个规范的指导下,对他们对一组可视化设计的偏好进行评级。然后,我们评估了可视化设计的集合,以评估哪一种规格使参与者更喜欢最有效的可视化。
非整洁数据:表格未知原因的有效性 (Untidy Data: The Unreasonable Effectiveness of Tables) | PKU Visualization Blog
处理表格形式的数据通常被认为是意义生成过程中一个准备和繁琐的步骤;一种为更复杂的可视化和分析工具准备数据的方法。但对许多人来说,电子表格——最典型的表格工具——仍然是他们信息生态系统的重要组成部分,让他们能够以更复杂的工具隐藏或抽象的方式与数据进行交互。对于数据工作者来说尤其如此:他们将处理数据作为工作的一部分,但并不认为自己是专业分析师或数据科学家。我们报告了一项关于这些工人如何与他们的数据互动和推理的定性研究。
自然语言描述有时伴随着可视化来更好地交流和语境化他们的见解,并提高残疾读者的可访问性。然而,很难评估这些描述的有用性,以及它们如何有效地改善对有意义信息的访问,因为我们对它们传达的语义内容以及不同的读者如何接收这些内容知之甚少。为此,我们为可视化的自然语言描述所传达的语义内容引入了一个概念模型。通过对2147个句子的基础理论分析,我们的模型跨越了四个层次的语义内容:列举可视化结构属性(如标记和编码);报告统计概念和关系(例如,极值和相关性);识别知觉和认知现象(例如,复杂的趋势和模式);并阐明特定领域的见解(例如,社会和政治背景)。为了展示我们的模型如何应用于评估可视化描述的有效性,我们对30名盲人和90名视力正常的读者进行了混合方法评估,并发现这些读者群体在他们认为最有用的语义内容上存在显著差异。总之,我们的模型和研究结果表明,对有意义的信息的访问是非常针对读者的,而自动可视化字幕的研究应该面向描述,更丰富地传达总体趋势和统计数据,对读者的偏好敏感。
尽管可视化具有支持数据分析的潜力,特别是在探索性的情况下,但它也造成了障碍:盲人和视觉受损者的可访问性。无论可视化多么有效,为盲人用户提供平等的访问需要可视化研究社区的范式转变。要实现这样的转变,仅仅将可视化可访问性视为另一个需要克服的技术问题是不够的。相反,要支持世界各地数以百万计的盲人和视力受损用户,他们与视力正常的人一样,对数据分析有着同样有效的需求,就需要一种尊重、公平和全面的方法,从一开始就包括所有用户。在本文中,我们利用可访问性研究方法来实现这一方法。我们首先确定了那些对盲人如何感知世界有具体见解的人:定向和移动(O&M)专家,他们是教盲人如何使用非视觉感官在物理世界中导航的导师。我们采访了10位O&M专家——他们都是盲人——来理解如何最好地使用感官替代,而不是视觉来传达空间布局。最后,我们使用主题分析来调查我们的定性研究结果。一般来说,盲人倾向于同时使用声音和触觉来理解他们周围的环境,我们关注的是听觉支持以及如何使用它们来实现数据可视化——使用声化和听觉化。然而,我们的专家建议支持感官-声音和触摸的结合,使图表更容易获得,因为盲人可能更熟悉探索触觉图表。我们报告了声音和触觉可见性的研究结果,并讨论了盲人可及性视觉的影响
在向盲人或视力较低的人传达图形时,替代文本至关重要。特别是对于包含丰富信息的图形,如可视化,书写不当或缺乏替代文本会加剧视觉障碍人士获取信息的不平等。在这项工作中,我们巩固现有的指南和调查当前的实践,以检查当前的实践和建议在多大程度上是一致的。然后,为了更深入地了解人们在可视化替代文本中想要什么,我们采访了22名有视觉障碍的人,询问他们在可视化文本中的体验和他们在替代文本中的信息需求。研究结果表明,在听其他文本时,参与者会积极尝试在头脑中构建一种可视化的图像,并希望像正常的观众那样执行可视化任务(例如,检索特定的值)。这项研究也提供了充分的支持,需要参考基础数据,而不是视觉元素,以减少用户的认知负担。根据这项研究,我们提供了一套建议,以组成一个信息丰富的替代文本。
Natural language to visualization by neural machine translation (IEEE VIS 2021)解读+总结_ying wong的博客-CSDN博客_vis2021论文
支持从自然语言(NL)查询到可视化(NL2VIS)的转换可以简化数据可视化的创建,因为如果成功,任何人都可以用自己的自然语言从表格数据生成可视化。最先进的NL2VIS方法(例如NL4DV和FlowSense)是基于语义解析器和启发式算法的,它们不是端到端的,也不用于支持(可能)复杂的数据转换。
Table2Text系统利用机器学习基于结构化数据生成文本输出。这些系统对于虚拟助手等工具流畅的自然语言界面至关重要;然而,如果让这些ML系统自由生成,常常会产生误导或意外的输出。GenNI (Generation Negotiation Interface)是一种人机高级协作生成描述性文本的交互式视觉系统。该工具利用深度学习模型设计了显式控制状态。该工具利用深度学习模型设计了显式控制状态。这些控件允许用户全局地约束模型的生成,而不牺牲深度学习模型的表示能力。可视化界面使用户能够与遵循精细化预测范式的人工智能系统进行交互,以确保生成系统以人类用户认为合适的方式工作。
从多模式交互到丰富的数据总结和见解,自然语言和可视化越来越多地以不同的方式被部署在一起,以支持数据分析。然而,对于观众如何用语言表达他们对视觉化的理解,以及他们如何在这样的语境中解释视觉化的语言表达,研究人员仍然缺乏系统的知识。我们描述了两项旨在确定与此类任务相关的数据和图表特征的研究。第一项研究要求参与者用语言描述他们在描述不同水平相关性的散点图中看到的东西。然后,第二项研究要求参与者选择与给定的相关语言描述相匹配的可视化图像。我们从响应中提取关键概念,将它们组织在一个分类法中,并分析分类后的响应。我们观察到,参与者在所有散点图中使用了广泛的词汇,但对于相关性较高的特定概念,他们更喜欢使用。
我们提出了特征跟踪套件(FTK),这是一个简化、缩放和提供各种科学数据特征跟踪算法的框架。FTK的关键是我们的高维单纯形网格格式,它将规则和非结构的空间网格推广到时空,同时将时空网格元素镶嵌到单纯形。使用简单时空网格的好处包括:(1)减少特征提取和跟踪的模糊情况,(2)使用symbolic perturbations简化degeneracies的处理,(3)支持可扩展和并行处理。simplicial spacetime meshing的使用简化和改进了对临界点、量子漩涡和等值面的几种特征跟踪算法的实现。作为一个软件框架,FTK为终端用户提供了VTK/ParaView过滤器、Python绑定、命令行接口和特性跟踪应用程序的编程接口。
本文介绍了标量数据拓扑分析的渐进式算法。我们的方法基于输入数据的层次表示和拓扑不变顶点的快速识别,这些顶点对数据的拓扑描述没有影响,并且我们表明,当它们被引入层次结构时,不需要进行计算。这使得定义高效的从粗到细的拓扑算法成为可能,该算法利用了对普通顶点的快速更新机制,避免了对拓扑不变顶点的计算。我们通过两个拓扑算法示例(临界点提取和持久图计算)来演示我们的方法,它们在中断请求时生成可解释的输出,并逐步细化它们。
当代科学数据集需要快速和可扩展的拓扑分析来实现可视化、简化和交互。在这一领域,并行合并树的构建已经有了大量的贡献,分散的、任务并行的或面向smp的算法在总运行时间方面占主导地位。然而,这些最近的方法都没有在分布式系统上计算完整的合并树,这一领域留给传统的分而治之的方法。
Persistence diagrams在数据可视化中被广泛用于量化过滤拓扑空间的底层特征。在许多应用中,计算图表之间的距离是必不可少的;然而,由于计算成本高,计算这些距离一直具有挑战性。在本文中,我们提出了一个persistence diagram hashing框架,它学习persistence diagram的二进制代码表示,这允许快速计算距离。
ChartSeer-基于机器智能对探索式可视分析进行交互操纵 - undefined
在探索性可视分析(EVA)中,决定探索哪些数据变量和使用何种可视化形式是具有挑战性的,此外,缺少对分析方案的整体理解,也容易导致错误的分析路径。本文提出ChartSeer,利用GrammarVAE等深度学习技术来表征创建的图表并生成视觉摘要,同时根据用户交互推荐适当的图表,以促进用户进一步探索。
为了在出版物中传达神经网络结构,适当的可视化是非常重要的。虽然目前大多数深度学习论文都包含这样的可视化,但这些通常是在发表前手工制作的,这导致缺乏常见的可视化语法、大量的时间投入、错误和歧义。目前的自动网络可视化工具主要集中在网络本身的调试上,对于生成出版物可视化效果并不理想。因此,我们提出了一种方法,通过将Keras中指定的网络架构转换为可以直接嵌入任何出版物的可视化,来自动化这个过程。为此,我们提出了一种卷积神经网络(CNNs)的视觉语法,该语法是通过分析从2013年至2019年发表的所有ICCV和CVPR论文中提取的此类数据得出的。
基因组学中不同的数据类型和分析任务的结合导致了广泛的可视化技术和工具的发展。然而,现有的大多数工具都是针对特定的问题或数据类型定制的,提供的定制功能有限,这使得优化新的分析任务或数据集的可视化具有挑战性。 为了解决这一挑战,我们设计了gosling——一种用于交互式和可扩展的基因组数据可视化的语法。Gosling平衡了全面多尺度基因组数据可视化的表达能力和领域科学家的可访问性。
基于深度学习推荐的分析面板设计 (MultiVision: Designing Analytical Dashboards with Deep Learning Based Recommendation) | PKU Visualization Blog
我们提供了一种基于深度学习的方法,帮助设计用于分析数据表的分析仪表板。对于一个数据表,数据工作者通常需要经历一个冗长而耗时的过程来选择有意义的数据列组合来创建图表。由于需要创建由多个视图组成的仪表板,以揭示不同的数据透视图,这一过程变得更加复杂。现有的自动推荐多视图可视化的方法主要建立在手动设计规则的基础上,产生次优或无关的建议。为了解决这一差距,我们提出了一种选择数据列和推荐多个图表的深度学习方法。更重要的是,我们将深度学习模型集成到混合主动系统中。
半监督学习(SSL)提供了一种通过使用未标记样本来提高预测模型(如分类器)性能的方法。一种有效且广泛使用的方法是构造一个图来描述标记样本和未标记样本之间的关系。实践经验表明,图的质量对模型的性能有显著影响。在本文中,我们提出了一种可视化分析方法,交互式地构建一个高质量的图,以获得更好的模型性能。特别地,我们提出了一种基于大余量原理的交互式图构造方法。我们已经开发了一个河流可视化和一个混合可视化,它结合了散点图、节点链接图和柱状图来传达基于图的SSL的标签传播。
基于视觉的深度学习(DL)方法在基于大规模视频数据集的自动驾驶模型学习方面取得了很大进展。他们接受训练,根据车载摄像头捕捉到的视频数据预测瞬时驾驶行为。在本文中,我们开发了一个地理环境感知的可视化系统,用于自动驾驶模型(ADM)的预测研究,并结合大规模的ADM视频数据。通过将DL模型性能与地理空间可视化技术相结合,实现了可视化研究与地理环境的无缝集成。模型性能度量可以与地图视图上的一组地理空间属性一起研究。用户还可以发现和比较多个DL模型在城市层面和街道层面的预测行为,以及道路图像和视频内容。
自动驾驶技术往往使用最先进的人工智能算法,了解车辆与外部环境的关系,预测环境的变化,然后相应地规划和控制车辆的行为。这类技术的复杂性使得评估自动驾驶系统的性能和寻找改进方法具有挑战性。目前评估这类自动驾驶系统的方法主要使用单个分数来表示系统的整体性能,但领域专家很难理解自动驾驶系统中的单个组件或算法如何影响该分数。为了解决这一问题,我们与领域专家合作研究自动驾驶算法,提出了一种自动驾驶视觉评估方法。
语义分割是自动驾驶的一个重要组成部分,出于安全考虑,必须对其进行全面评估。基于深度神经网络(DNN)的语义分割模型在自动驾驶中得到了广泛的应用。然而,基于dnn的模型由于其黑匣子性质而具有挑战性,在自动驾驶应用中,评估关键对象(如丢失的货物和行人)的模型性能更加困难。在这项工作中,我们提出了VASS,a V isual A nalytics方法来诊断和提高S emantic S egmentation模型的准确性和鲁棒性,特别是在各种驾驶场景中移动的关键物体。我们的方法的关键组成部分是上下文感知的空间表示学习,提取对象的重要空间信息,如位置、大小和纵横比,与给定的场景上下文有关。
城市传感器产生的空间时间序列使我们能够观察到前所未有规模的城市现象,如环境污染和交通拥堵。然而,从这些观察中恢复因果关系来解释城市现象的来源仍然是一项具有挑战性的任务,因为这些因果关系往往是时变的,需要适当的时间序列分割来进行有效的分析。先前的方法在给定长期观测的情况下提取一个因果图,不能直接应用于捕捉、解释和验证动态城市因果关系。本文提出了一种新的可视化分析方法Compass,用于深入分析城市时间序列的动态因果关系。为了开发Compass,我们确定并解决三个挑战:探测城市因果关系、解释动态因果关系和揭示可疑的因果关系。
许多时空事件可以被视为传染病。通过遵循级联模式,这些事件隐式地跨越空间和时间传播,扩大其影响,并生成涉及多个位置的事件级联。分析这种级联过程对各种城市应用都有重要意义,例如交通规划和污染诊断。由于现有方法在挖掘和解释级联模式方面的能力有限,我们提出了一个名为VisCas的可视化分析系统。VisCas将推理模型与交互式可视化相结合,使分析人员能够推断和解释时空背景中潜在的层叠模式。为了开发VisCas,我们解决了三个主要挑战:1)广义模式推理;2)隐性影响可视化;3)多层面级联分析。
时空数据的可视化查询在可视化分析应用中越来越重要。在实时查询大型时空数据方面,已经有了各种各样的工作。然而,时空数据分布的实时查询仍然是一个开放的挑战。随着时空数据的日益庞大,其聚合、存储和查询的方法变得至关重要。我们提出了一种新的可视化查询系统,它创建了一个低内存存储组件,并提供时空数据的实时可视化交互。
由于同时绘制所有网格面或其边缘时产生的杂波和遮挡,对一个六面体网格单元质量的可视检测是困难的。当前的方法克服了这个问题,通过将焦点集中在特定的元素上,然后将其渲染为不透明的,并去除所有遮挡其视图的元素。在这项工作中,我们使用先进的GPU着色器功能来生成焦点+上下文渲染,突出选定区域的元素,同时传达周围的全局网格结构。为了实现这一点,我们建议通过将基于片段着色器的边缘和人脸渲染与逐像素片段列表相结合,从基于边缘的焦点渲染逐步过渡到体积上下文渲染。
我们提出了一种可微体绘制的解决方案,提供了可微的所有连续参数的体绘制过程。这个可微分的渲染器是用来引导参数的设置与一个问题特定的目标函数的最优解决方案。我们通过对混合函数的解析反演来实现恒定的内存占用,从而量身定制了体绘制的方法。这使得它独立于通过体积的采样步骤的数量,便于考虑小规模的变化。该方法为绘制过程的外部参数和体积密度场本身的自动优化奠定了基础。我们演示了它的用途,自动视点选择使用可微熵作为目标,并优化传递函数从渲染图像的给定体积。
我们提出了一种利用近期Nvidia RTX gpu中可用的光线追踪硬件的技术,以解决经典光线追踪之外的问题。具体来说,我们演示了如何使用这些单元来加速由平面和双线性面组成的一般非结构化元素的点定位。这种非结构化的网格点定位问题以前一直是GPU架构上的加速挑战;然而,这些查询的性能对于许多非结构化的量渲染和计算应用程序来说是至关重要的。从CUDA参考方法开始,我们描述和评估三种方法,重新制定这些点查询,以增量映射算法的复杂性到这些新的硬件光线跟踪单元。每个变体都用更复杂的射线查询替换了更简单的点查询问题。初始变量利用射线追踪核心来加速BVH遍历,随后的变量使用射线三角形交叉和每个面元数据来检测元素中的点交叉。
我们提出了一种基于锥体的散点图抽样技术,以避免过度绘图,并使大数据的渐进和流式可视化。我们的技术基于底层密度图的多分辨率锥体分解,并利用锥体中的密度值来指导每个尺度的采样,以保持相对数据密度和异常值。我们的技术在质量上与最先进的方法是有竞争力的,运行速度大约快一个数量级。此外,我们对其进行了调整,通过处理数据块和更新散点图区域,使其在密度图中具有可见的变化,从而提供渐进式和流式数据可视化。
定量历史数据集的增加为社会科学的多个学科提供了新的研究机会。在本文中,我们与新数据集CGED-Q (China Government Employee Database-Qing)的构建者密切合作,CGED-Q记录了1760年至1912年中国清朝官僚机构中超过34万名政府官员的职业轨迹。我们利用这些数据从历史的角度研究职业流动,了解社会流动和不平等。然而,现有的统计方法不足以分析具有细粒度属性和长时间跨度的历史数据集中的职业流动性,因为它们大多是假设驱动的,需要大量的工作。我们提出了CareerLens,这是一个交互式可视化分析系统,可以帮助专家从历史职业数据中探索、理解和推理。通过CareerLens,专家们从三个细节层面研究流动模式,即宏观层面提供总体流动的总结,中观层面提取潜在的群体流动模式,微观层面揭示个体的社会关系。
KD-Box: Line-segment-based KD-tree for Interactive Exploration of Large-scale Time-Series Data
汪云海老师主页上材料特别多。直接去看
时间序列数据(通常以直线的形式呈现)在金融、气象学、卫生和城市信息学等许多领域发挥着重要作用。然而,很少有人支持大规模时间序列数据的交互式探索,这需要具有低延迟交互的无杂波可视化表示。在本文中,我们提出了一种新的基于线段的kd树方法,以实现对多个时间序列的交互分析。我们的方法不仅可以在选定的感兴趣区域的时间序列上快速查询,而且还可以使用line splatting方法高效地计算密度场和代表性线的选择。此外,我们还开发了一个交互式系统——KD-Box,它提供了丰富的交互功能,如时间框、属性过滤、多视图协调等。通过定量比较,我们展示了KD-Box在支持高效线查询和密度场计算方面的有效性,并展示了它在几个真实数据集的交互式可视化分析方面的有效性。
Sequen-C:时序事件序列的多层级概览(Sequen-C: A Multilevel Overview of Temporal Event Sequences) | PKU Visualization Blog
用最优的细节水平(即简化但有信息)构建时序事件序列的可视化概述是一个持续的挑战——期望用户放大概述的每个重要方面可能会导致遗漏的见解。我们提出了一种技术来构建事件序列的多层次概述,其粒度可以跨序列集群(纵向详细级别)或纵向(横向详细级别)转换,使用分层聚合和一种新的集群数据表示Align-Score-Simplify。默认情况下,概览显示了通过平均轮廓宽度度量获得的最佳序列簇数,然后用户可以探索其他最佳序列簇。概述的垂直详细级别随集群数量的变化而变化,而水平详细级别指的是应用于每个集群表示的摘要级别。
地球科学家越来越多地使用多维度、高时间分辨率的时间序列数据来研究气候和环境变化对地球大气层、生物圈、水圈和岩石圈的影响。然而,导致自然现象的大量变量和不同时间尺度的先决条件阻碍了科学家完成最基本的分析之外的更多工作。在本文中,我们提出了一种新的可视化分析原型EVis(环境可视化),以帮助科学家分析和探索反复发生的环境事件(如岩石断裂、滑坡、热浪、洪水)及其与连续数值环境变量(如环境温度和降水)的高维时间序列的关系。EVis提供协调散点图、热图、直方图和RadViz用于基础分析。
学习历史涉及许多困难的任务。例如,在大型事件空间中搜索适当的数据,按时间和空间理解历史事件的故事,以及寻找事件之间可能不明显的关系。教师广泛使用组织良好、论据充分的材料(如教科书和网络资源),会导致学生在理解历史时采用狭隘的视角,并阻止学生自发地调查历史事件,因为学生们会提出自己的问题。在这项工作中,我们提出了HisVA,一个视觉分析系统,允许从维基百科使用三个视图:事件、地图和资源有效地探索历史事件。HisVA提供了一个有效的事件探索空间,用户可以通过回顾和连接历史事件在空间和时间上的关系来调查历史事件之间的关系。
我们提出了一种新的深度学习框架TSR-TVD,该框架使用对抗学习生成时变数据(TVD)的时间超分辨率(TSR)。TSR-TVD是第一个应用循环生成网络(RGN)的工作,这是一种循环神经网络(RNN)和生成对抗网络(GAN)的组合,从低分辨率的体序列生成时间高分辨率的体序列。TSR-TVD的设计包括一个发生器和一个鉴别器。
我们提出了一种多层次的区域平衡技术,用于布局Clustered Graphs,以促进对存在于不同领域的复杂关系的全面理解,如生命科学和社会学。Clustered Graphs通常用于对伴随基于属性的分组信息的关系建模。这些信息对于可靠的数据分析是必不可少的,例如对生物分类或教育背景的研究。因此,为了成功地传递属性数据,需要在一定的屏幕空间内聪明地排列文本标签和打包图的能力。在这里,我们建议使用Voronoi镶嵌在多个细节层次上对输入屏幕空间进行分层划分。在我们的方法中,文本标签的位置是由约束力和来自中心体Voronoi细胞的力的混合指导的。
Bipartit 网络的分析在智能分析中实体共现的探索和生物信息学中基因表达的研究等多个应用领域中具有重要意义。缺失链接预测是一项重要的任务,它根据当前观测到的链接来推断不可见链接的存在。在本文中,我们提出了一个可视化的分析系统,MissBiN,让分析人员参与到链接预测结果的循环中。MissBiN利用Bipartite网络中的双团信息,提出了一种新的Bipartite网络中的链路预测方法。它还提供了一个交互式可视化来理解算法输出。MissBiN的设计是基于三个高层次的分析问题(什么,为什么,如何)关于缺失的环节,这三个问题是从文献和专家访谈中提炼出来的。
在信息可视化领域,任务的概念是理论和方法的一个基本组成部分,可视化研究者或实践者如何理解用户需要执行什么任务,以及如何创建一个新的设计。在本文中,我们关注树可视化的任务集合,这是一个常见的可视化编码领域,从生物学到计算机科学到地理。尽管它们具有共性,但之前并没有收集和抽象定义树可视化任务的工作。我们介绍了树木可视化论文的文献综述,并生成了一个包含200多个任务的有策划的数据集。为了能够有效地对树进行任务抽象,我们还对多级任务类型进行了新的扩展,包括支持树特定任务的更多特异性,以及对树可视化进行任务抽象的系统程序。
边捆绑技术将具有相似属性(即方向相似和接近程度相似)的边缘聚集在一起,以减少视觉上的混乱。到目前为止,所有的边捆绑技术都隐式或显式地基于这些属性将单个边缘或它们的一部分聚集在一起。这些集群可能导致数据中不存在的不明确连接。网络的融合图没有这些歧义,但要求布局计算作为捆绑过程的一部分。我们设计了一种新的捆绑方法,边-路径捆绑,以简化边的混乱,同时大大减少歧义比以往的捆绑技术。边-路径捆绑以一个布局为输入,并将每条边沿着一条加权的最短路径聚集,以限制其偏离直线。边-路径捆绑不会产生在所有边缘捆绑方法中常见的独立边二义性,捆绑的级别可以通过最短路径距离、欧氏距离和两者的组合来调整。
STRATISFIMAL LAYOUT:一种分层节点链接网络可视化的模块化优化模型(STRATISFIMAL LAYOUT: A Modular Optimization Model for Laying out Layered Node-link Network Visualizations) | PKU Visualization Blog
节点链接可视化是显示网络中的关系的一种常见且功能强大的工具。这些可视化的可读性高度依赖于节点使用的空间布局。在本文中,我们关注计算分层布局,其中节点在一组平行轴上对齐,以更好地暴露层次关系或顺序关系。
图是一种普遍存在的数据结构,用于建模各种领域中的流程和关系。例子包括程序中的控制流图和图像中的语义场景图。识别图中的子图模式是理解其结构特性的重要方法。我们提出了一个可视分析系统GraphQ,以支持在包含许多独立图的数据库中进行人在循环、基于实例的子图模式搜索。为了支持快速、交互式查询,我们使用图神经网络(GNNs)将一个图编码为固定长度的潜在向量表示,并在潜在空间中执行子图匹配。由于该问题的复杂性,在对可视化和解释至关重要的匹配结果中,仍然难以获得精确的一对一节点对应关系。因此,我们提出了一种新的节点对齐GNN,称为NeuroAlign,以方便查询结果的验证和解释。
探索交互日志来减轻人的偏见(Left, Right, and Gender: Exploring Interaction Traces to Mitigate Human Biases) | PKU Visualization Blog
视觉问答系统的目标是根据输入图像回答开放式文本问题。它们是学习高级推理的试验台,主要用于人机交互,例如帮助视觉受损的人。最近的研究表明,最先进的模型倾向于利用训练数据中的偏差和捷径来生成答案,有时甚至不看输入的图像,而不是执行所需的推理步骤。我们提出VisQA,这是一个视觉分析工具,探讨了推理与偏见利用的问题。它揭示了最先进的神经模型的关键元素——attention maps in transformers。我们的工作假设是,导致模型预测的推理步骤可以从注意力分布中观察到,这对可视化特别有用。VisQA的设计过程受到深度学习和视觉语言推理领域中著名的偏见例子的启发,并通过两种方式进行评估。
散点图可以通过使用额外的通道,如大小或颜色(如气泡图)来编码第三维。我们探索了一种对三元散点图的潜在误解,我们称之为加权平均错觉,在这种错觉中,较大和较暗的点的位置被赋予更多的x均值和y均值估计的权重。这种系统性偏差对设计师选择映射到数据上的尺寸或轻度范围很敏感。在本文中,我们对不同尺寸/轻度范围和数据相关性量化这种偏差。我们讨论其原因的可能解释测量注意给予个别数据点使用视觉科学技术称为质心方法。我们的工作说明了整体处理机制和心理捷径是如何显著扭曲数据的视觉总结的,并可能导致错误的概念,如已证明的加权平均错觉。
渐进式可视化正在迅速成为可视化社区中的一种技术,以帮助用户与大量数据进行交互。通过渐进式可视化,用户可以检查复杂或长时间运行的计算的中间结果,而无需等待计算完成。虽然这对用户是有益的,但最近的研究发现了潜在的风险。例如,用户可能会误判中间结果的不确定性,得出不正确的结论或看到最终结果中不存在的模式。在本文中,我们进行了一组全面的研究,以量化渐进可视化的优势和局限性。根据Micallef等人最近的一份报告,我们研究了在渐进可视化过程中可能出现的四种认知偏差:不确定性偏差、错觉偏差、控制偏差和锚定偏差。研究结果表明,使用渐进式可视化是一种谨慎但有前景的方法——虽然可以显著节省任务完成时间,但在某些条件下,准确性会受到负面影响。
Improving Visualization Interpretation Using Counterfactuals - undefined
复杂高维数据分析被广泛应用于多个领域。然而,对高维数据的分析很容易受到混杂变量的影响,特别是当用户仅应用特定的过滤操作来可视化数据集的某个子集时。因此,对因果关系强弱的错误估计可能会存在于可视数据分析中,并误导用户。这项工作介绍了一种新的可视分析方法,旨在于可视分析过程中,依靠反事实的可能情况(counterfactual possibilities),揭示混杂变量的存在。作者为这种方法实现了可视化原型系统CoFact,帮助用户确定、可视化、分析反事实子集,以更好地支持用户对属性间关系的探索。
Lumos Increasing Awareness of Analytic Behavior during Visual Data Analysis - undefined
浏览数据时,可能会产生无意间的偏差从而引起偏见,当你浏览的数据分布和真实的数据分布存在区别时,你就会形成偏见,比如你见过的黑人都犯罪,你会觉得黑人都犯罪,然而现有的分析工具(Tableau/Excel)并不会报告上述偏差。作者想要提出能够在分析过程中反馈偏差的工具,于是他们贡献了 Lumos,一个可视化数据交互历史的分析工具,能够在数据分析和决策时提醒用户存在潜在的交互偏见。
数据故事整合了引人注目的视觉内容,以叙事的形式传达数据见解。一个数据故事的叙事结构是决定其表现力的支柱,它可以在很大程度上影响观众如何感知洞察力。弗雷塔格金字塔Freytag's Pyramid是一种经典的叙事结构,被广泛应用于电影和文学作品中。虽然有关于将Freytag's Pyramid应用于数据故事的持续建议和讨论,但关于如何使用Freytag's Pyramid创建结构化数据故事的系统和实用指南却很少。为了弥补这一差距,我们通过分析从103个数据视频中提取的故事,研究了现有的实践如何应用Freytag的金字塔。基于我们的研究结果,我们提出了一个叙事模式、数据流和视觉传达的设计空间,为通过故事创作实现叙事意图、组织数据事实和选择视觉设计技术提供实践指导。我们通过一个有25名参与者的工作坊来评估拟议的设计空间。结果表明,我们的设计空间为Freytag's Pyramid的数据故事的快速故事脚本提供了一个清晰的框架。
数据故事往往寻求从观众那里引出情感感受。然而,如何设计情感数据故事仍然有待探索。在这项工作中,我们调查了一个特定的设计因素,动画,并提出了Kineticharts,一个动画设计方案,创建图表,表达五种积极的影响:喜悦,娱乐,惊喜,温柔和兴奋。这五种影响在数据故事中经常通过动画传达。对于每种影响,我们设计了以条形图、折线图和饼图表示的各种运动,从而得到了关于这五种影响的60个动画图表。我们设计了Kineticharts,首先与数据新闻的专业从业者进行了一项需求寻找研究,然后分析情感运动图形的语料库,以识别显著的动力学模式。我们通过两项用户研究评估了Kineticharts。
本文研究了如何使数据漫画具有互动性。数据漫画是一种有效且通用的视觉传达手段,它利用了连续叙述的力量,并结合了文本和视觉内容,同时通过富有表现力的布局组合面板提供了故事情节的概述。虽然一种强大的静态叙事媒体在纸质支持上很有效,但为数据漫画添加交互性可以实现非线性叙事、个性化、细节层次、解释,并可能丰富用户体验。本文介绍了一套量身定制的操作,以支持数据漫画的叙事目标,超越由故事作者策划的传统线性、不变的故事线。其目标和操作包括在预定义布局中添加和删除面板,以支持分支、视角更改或按需细节访问,以及提供和修改数据,并与数据表示交互,以支持个性化和读者定义的数据焦点。我们提出了一种轻量级的规范语言COMICSCRIPT,让设计人员将这种交互性添加到静态漫画中。为了评估我们创作过程的可行性,我们招募了6名专业插画师、设计师和数据漫画爱好者,请他们创作一幅交互式漫画,让我们了解创作工作流和我们方法的潜力。
数据可视化设计对我们认为哪些模式是突出的以及我们看到它们的速度有强大的影响。可视化从业者社区为创建清晰高效的可视化提供了两条流行的指导原则:整理和聚焦。清理指南建议删除不重要的网格线、数据值的过度标记和颜色变化,以改善美学,并最大限度地强调相对于设计本身的数据。解释性交流的焦点指南建议包括一个描述相关数据模式的清晰标题,用独特的颜色突出相关数据值的子集,并将这些值与更广泛的论点上下文化的书面注释连接起来。我们评估了这些建议如何在杂乱的、有序的和有序的6个图形主题的集中设计中影响描述信息的回忆。本科生被要求重新绘制之前看到的可视化图像,回忆他们的主题和主要结论,并对不同的设计在美学、清晰度、专业性和可信度方面进行评分。整理的设计在专业性上获得更高的评分,而增加对设计的关注则在美学和清晰度上获得更高的评分。
在展示关于人的数据时,可视化设计师和数据记者通常会使用设计策略来帮助受众与这些人建立联系。Anthropographics这个术语最近被创造出来,用来指这种实践和由此产生的可视化效果。Anthropographics是一个丰富和不断增长的领域,但迄今为止,这项工作仍然是分散的。尽管有初步的实证工作和一些实践者写的网络文章,但缺乏关于Anthropographics的思考和交流的明确语言。我们通过引入Anthropographics概念框架和设计空间来解决这一差距。我们的设计空间由七个基本的设计维度组成,可以合理地假设这些维度对亲社会情绪或行为有一定的影响。它扩展了之前的设计空间,并从报纸、网站和研究文章中收集了105个可视化的分析。
设计良好的数据可视化可以让查看者进行更强大、更直观的处理。为了帮助查看者直观地比较数据值以快速生成关键信息,可视化设计人员可以操纵数据值在图表中的排列方式,以提供特定的比较。本研究以简单柱状图为个案,实证检验了四种常见排列方式的比较支持度:垂直并列、水平并列、叠加和堆叠。我们要求参与者在图表中输入他们所感知到的模式,并将他们的结论编码为比较类型。在第二项研究中,我们请数据可视化设计专家预测他们将使用哪种排列方式来进行每种类型的比较,结果发现与我们的发现既有一致的,也有不一致的。
我们介绍了Diatoms,一种通过从标记形状、编码通道和字形支架形状的调色板中采样来产生字形设计灵感的技术。在尊重数据表中列施加的约束时,Diatoms允许一定程度的随机性:它们的数据类型和域以及设计器指定的列之间的语义关联。我们将生成式设计过程与两种形式的交互设计外部化相结合,使设计方案能够进行比较和评论。首先,我们合并了一个熟悉的小倍数配置,其中每个数据点都是根据单个字形设计绘制的,并具有在不同字形设计之间分页的功能。其次,我们提出了一个小型的置换设计图库,其中根据每种备选字形设计绘制单个数据点,并提供在数据点之间分页的功能。我们演示了我们的技术的实现,作为Tableau的扩展,具有三个示例调色板,并更好地理解如何硅藻可以适应现有的设计工作流程,我们与12名设计师进行了采访和司机演示。
圆形符号用于跨不同的字段表示多维数据。然而,尽管这些符号非常有效,但创建它们往往是费力的,即使对那些具有专业设计技能的人来说也是如此。本文介绍了GlyphCreator,一个用于基于实例生成圆形字形的交互式工具。给定一个圆形字形和多维输入数据的示例,GlyphCreator会迅速生成一个设计候选列表,其中任何一个都可以编辑以满足特定表示的需求。
提出了一种基于强化学习训练的神经优化模型来解决星形符号集合的坐标排序问题。给定一组与多个类标签相关的星形符号,我们建议使用形状上下文描述符来度量符号对之间的感知距离,并使用衍生的轮廓系数来度量整个集合内对类可分性的感知。为了找到给定集合的最优坐标顺序,我们使用强化学习训练神经网络来奖励具有高轮廓系数的顺序。
在本文中,我们提出了F2-Bubbles,这是一种集覆盖可视化技术,可以解决overlapping artifacts,并支持智能建议的交互式编辑。该方法的核心是一种新的、高效的set overlay construction算法,该算法通过考虑集元素及其非集邻居来逼近最优集覆盖。
由于其复杂性,为高度重叠的集合类型数据创建可理解的可视化是一项具有挑战性的任务。为了便于深入了解集合连接并利用交集之间的语义关系,我们提出了一种快速的两步布局技术,用于匹配良好和格式良好的欧拉图。我们的方法符合欧拉图在语义、美观和可读性方面的既定准则。
应力张量场在固体力学研究中发挥着重要作用,但其在三维空间中的可视化仍然具有挑战性,因为信息密集的多变量张量需要在三维空间中采样,同时要避免杂波。从目前的张量可视化中获得线索,我们采用了基于字形的三维空间应力张量可视化。我们还开发了一个测试框架,并进行了用户研究,以评估各种基于字形的张量可视化方法的客观精度测量,以及每种可视化方法的主观用户反馈。为了表示应力张量,我们对原始的超二次字形进行了颜色编码,在用户研究中,我们将其与为二阶对称张量开发的超二次字形进行了比较。
概率图是使用传统的节点-链路图进行可视化的一个挑战。使用宽度或模糊度等可视化变量编码边缘概率,使得静态网络可视化用户难以估计不确定性下的网络统计信息,如密度、隔离度、路径长度或聚类。我们引入了网络假设结果图(NetHOPs),这是一种可视化技术,它从概率边定义的网络分布中采样一系列网络实现。NetHOPs采用一种用于动态和纵向图绘制的聚合和锚定算法来参数化布局稳定性,以进行不确定性估计。我们提出了一种社区匹配算法,使聚类成员和社区发生的不确定性可视化。我们描述了一项研究的结果,在该研究中,51名网络专家使用NetHOPs完成了一组常见的视觉分析任务,并报告了他们如何感知受不确定性影响的网络结构和属性。
虽然我们知道量化不确定性的可视化会影响洞察力的信心,但很少有人知道不确定性是否同样适用于源自数据固有方面的不确定性,它们只能定性解释。在一个考古项目中,我们意识到如何评估这种定性的不确定性,对于全面和准确地理解几千年来人类住区的区域时空格局至关重要。因此,我们通过一个特意表示三种不同隐式错误的探针,即不同的收集方法、数据解释的主观性和对时间连续性的假设,来研究可视化定性隐式错误对意义构建过程的影响。通过分析14位具有不同领域专业知识水平的考古学家的交互,我们发现,新手更加积极地意识到通常被忽视的数据问题,领域专家对可视化本身也更加自信。我们观察了参与者如何引用社会因素来减轻一些不确定性,而为了最小化它,他们要求额外的背景广度或深度的数据。虽然我们的可视化并没有减轻所有的不确定性,但我们认识到它是如何引发关于数据的方法论方向的反思元见解的。我们相信,我们的发现为未来的可视化提供了信息,即如何处理一系列用户类型学和数据高度关键的应用领域(如数字人文学科)的隐式错误的复杂性。
随着面向普通观众的不确定性可视化越来越普遍,设计师必须了解不确定性沟通技术对观众决策过程的全部影响。先前的研究表明,在个人如何使用各种对不确定性的视觉和文本描述来做出决定方面,结果是混合的。部分结果的不一致性可能是由于过度依赖任务的准确性,这本身不能提供不确定性可视化技术如何支持推理过程的全面理解。在这项工作中,我们通过对个人在提供分位数点图、密度图、间隔图、平均图和不确定性文本描述时所使用的努力和策略进行收敛的定量和定性分析,推进了围绕现代1D不确定性可视化效果的争论。我们利用两种方法通过不确定性通信技术来检验工作成果:一种是工作记忆能力的个体差异,即操作跨度(OSPAN)任务,另一种是NASA-TLX感知工作量的自我报告。
科学文章中统计结果的常见报告风格,如p值和置信区间(CI),已被报道倾向于二法解释,特别是在零假设显著性检验框架方面。例如,当p值足够小或研究药物和安慰剂的平均效应ci不重叠时,科学家倾向于宣称显著差异,而往往忽略效应大小的量级和绝对差异。这种推理方式已经被证明对科学有潜在的危害。有人建议使用依赖于对证据强度的视觉估计的技术来减少这种二分法解释,但它们的有效性也受到了挑战。我们对具有统计分析专业知识的研究人员进行了两项实验,以比较几种不同的置信区间表示,并使用贝叶斯多层模型估计表征风格对研究人员对结果的主观置信差异的影响。我们还询问了受访者对表现风格的看法和偏好。我们的结果表明,与具有p值的经典CI可视化和文本表示相比,在经典CI表示中添加视觉信息可以减少二分解释的趋势——用“悬崖效应”来衡量:p值0.05附近的置信度突然下降。
对许多家庭来说,为退休进行投资是最重要的决定之一,而且充满了不确定性。在行为经济学的一项经典研究中,Benartzi和Thaler(1999)使用柱状图发现,投资者在退休决策中表现出了短视的损失厌恶情绪:投资者过度关注短期损失的可能性,导致他们减少了对风险较高的资产的投资,错过了更高的长期回报。近年来,不确定性可视化技术的发展已经在多种任务的不确定性下的决策方面取得了进展。本文复制Benartzi和Thaler(1999)的实验结果,采用可控激励的众包实验来衡量不同不确定性表征对近视损失厌恶的影响。与原始研究一致的是,我们通过柱状图发现了短视损失厌恶的证据,并发现参与者在较长的评估周期中做出了更好的投资决策。
在许多现实世界的战略设置中,人们使用信息显示来做出决定。在这些设置中,信息提供者选择向战略代理人提供哪些信息以及如何呈现这些信息,而代理人则根据这些信息和他们对他人行为的预期制定最佳反应。我们贡献了一项受控在线实验的结果,以研究在拥堵游戏中,信息的提供和呈现是如何影响人们的决策的。我们的实验比较了显示这些信息的不同可视化方法,包括柱状图和假设的结果图,以及不同的信息条件,包括可视化信息是私人的还是公共的(即,所有代理都可以获得),如何影响决策和福利。我们描述了可视化预期的效果,指的是当一个代理从单独可以访问一个可视化,到知道其他人也可以访问这个可视化来指导他们的决定时,行为的变化。
作为一种分散的训练方法,水平联合学习(HFL)使分布式客户机能够协作学习机器学习模型,同时在本地设备上保持个人/私人信息。尽管与本地训练相比,HFL的性能和效率有所提高,但由于HFL的隐私保护特性,通常缺乏检测参与客户行为和联邦模型的线索。因此,用户只能对潜在的异常行为进行浅层的分析,对个体客户贡献的评估和实施必要的干预手段有限。可视化技术已经被引入,以促进HFL过程检查,通常通过提供模型指标和评估结果作为仪表板表示。虽然现有的可视化方法允许对HFL模型性能进行简单的检查,但它们不能支持对HFL过程的深入探索。在本研究中,我们严格遵循HFL隐私保护协议,为HFL过程设计了一个探索性的视觉分析系统,称为HFLens,它支持在概述、通信轮和客户端实例级别的比较视觉解释。
尽管我们已经看到了大量推荐可视化效果的算法,但这些算法很少相互比较,因此很难确定哪种算法最适合给定的可视化分析场景。虽然已经提出了一些正式的框架来回应,但我们认为这个问题仍然存在,因为可视化推荐算法从评估的角度来说没有得到充分的说明。在本文中,我们提出了一个以评估为重点的框架,以上下文化和比较广泛的可视化推荐算法。
模型检查器提供算法来证明一个系统的数学模型满足给定的规格。在违反的情况下,返回一个显示错误行为的反例。理解这些反例是具有挑战性的,特别是对于超属性规范,也就是将系统的多个执行相互关联的规范。我们的目标是通过我们的H per V is工具来促进这种反例的可视化分析,该工具提供了给定模型、规范和反例的交互式可视化。在一个迭代和跨学科的设计过程中,我们开发了可视化解决方案,可以有效地沟通模型检查结果的核心方面。具体来说,我们引入了二进制值的图形表示,以改进模式识别,颜色编码以更好地表示相关方面,视觉增强的文本描述,以及广泛的交叉视图突出显示机制。
图挖掘是推荐系统和搜索引擎的重要组成部分。图挖掘模型的输出通常提供一个按每个项目的相关性或效用排序的排序列表。然而,最近的研究发现了此类模型中的算法偏差问题,并提出了新的图挖掘算法来纠正偏差。因此,算法开发人员需要工具来帮助他们发现模型中的潜在偏差,同时探索在使用公平感知算法时纠正偏差的影响。在本文中,我们提出了FairRankVis,一个视觉分析框架,旨在探索图挖掘算法中的多类偏差。我们支持群体和个人公平水平的比较。我们的框架旨在使模型开发人员能够比较算法之间的多类公平性(例如,比较PageRank与去偏PageRank算法),以评估算法去偏对群体和个人公平性的影响。
这项工作引入了embComp,这是一种比较两种嵌入的新方法,可以捕获对象之间的相似性,比如word和文档嵌入。我们调查了比较这些嵌入空间是有用的场景。从这些场景中,我们派生出常见的任务,引入支持这些任务的可视化分析方法,并将它们组合成一个全面的系统。embComp的核心特性之一是概览可视化,它基于测量对象周围局部结构差异的指标。对嵌入的这些局部度量进行汇总,可以提供对相似性和差异性的全局概述。这些全局视图使用户能够识别一组有趣的对象,这些对象在嵌入中的关系可以进行比较。详细视图允许对选定对象的局部结构进行比较,并将该局部信息与全局视图关联起来。集成并连接所有这些组件,\sysname支持一系列的分析工作流,帮助理解嵌入空间之间的相似性和差异性。
VBridge: Connecting the Dots Between Features and Data to Explain Healthcare Models - undefined
现在机器学习方法越来越多的使用在电子医疗数据中完成一些临床预测任务,但是模型的透明性和可解释性限制了这些方法在实际中的应用。本文设计了可视分析工具VBridge,来帮助机器学习方法按照实际临床的决策过程进行解释。
深入学习(DL)模型用于COVID-19胸部CT数据的肺和病变自动分割和分类,已经做了大量的工作。然而,目前还没有全面的支持COVID-19双视觉+DL诊断的可视化系统。我们提出了COVID-view,这是一种专门为放射科医生从胸部CT数据诊断COVID-19的可视化应用程序。该系统包含一个完整的管道,自动肺分割,定位/隔离肺异常,随后的可视化,可视化和DL分析,以及测量/量化工具。我们的系统结合了放射科医生传统的2D工作流程和更新的2D和3D可视化技术,并支持DL,以实现更全面的诊断。COVID-view融合了一种新的DL模型,用于将患者分类为COVID-19阳性/阴性病例,该模型为放射科医生使用COVID-view提供阅读帮助,并提供注意力热图作为模型输出的可解释DL。我们通过建议、密切反馈和对真实患者数据进行案例研究来设计和评估COVID-19视图,这些专家具有诊断COVID-19胸部CT扫描、肺栓塞和其他形式的肺部感染的丰富经验。我们提出了COVID-19诊断的需求和任务分析,这激励了我们的设计选择,并产生了能够处理真实病例的实用系统。
越来越多的纵向队列研究正在生成跨多个时间点的广泛患者观察数据。这些数据为更好地了解疾病的进展提供了很有希望的机会。然而,在现有的可视化分析工具中,这些观察通常被视为一般事件。因此,它们建模疾病进展的能力没有得到充分利用。为了填补这一空白,我们设计并实现了ThreadStates,这是一个交互式可视化分析工具,用于探索纵向患者队列数据。ThreadStates的重点是通过人在回路的方式从观察数据中学习来识别疾病进展的状态。我们提出了一种新颖的字形矩阵设计,并将其与散点图相结合,以实现无缝识别、观察和细化状态。疾病的进展模式,然后显示在状态转换方面使用桑基为基础的可视化。我们采用序列聚类技术来发现具有显著进展模式的患者群体,并揭示疾病进展和患者水平特征之间的关联。
哪种药物对癌症患者最有希望?一种新的以显微镜为基础的方法,可以测量使用不同药物治疗的单个癌细胞的质量,有望在几个小时内回答这个问题。然而,从这些图像中提取数据的分析管道距离完全自动化还很远:对于分割、调整滤波器、去除噪声和分析结果等预处理步骤的质量控制,人工干预是必要的。为了解决这个工作流程,我们开发了Loon,一个基于定量相显微镜成像的可视化工具,用于分析药物筛选数据。Loon可以将增长率和成像数据等派生数据可视化。由于图像是大规模自动采集的,人工检查和分割图像是不可行的。但是,审查具有代表性的细胞样本对于质量控制和数据分析都是必不可少的。
使用光学显微镜检查组织是诊断许多疾病,特别是癌症的主要方法。高度多路组织成像建立在此基础上,使多达60个通道的分子信息加上抗体染色细胞和组织形态学的收集成为可能。这为疾病生物学提供了独特的见解,并有望帮助设计针对患者的治疗。然而,在将产生的多元图像数据可视化并在屏幕上有效支持数字环境中的病理工作流程方面,还存在很大的差距。因此,我们开发了Scope2Screen,这是一个可扩展的软件系统,用于对全片、高复杂度的组织图像进行焦点+上下文探索和注释。我们的方法可扩展到分析每个通道10^9或更多像素的100GB图像,包含数百万个单元格。一个由可视化专家、显微镜专家和病理学家组成的多学科团队确定了关键的图像探索和注释任务,包括以直观和有凝聚力的方式发现、放大、量化和组织roi。基于scope2screen的比喻,我们展示了在单细胞和组织水平上操作的交互式透镜技术。
我们提出了一种交互式技术Multiscale展开,用于在单一视图中直观地显示DNA的多个层次尺度,显示不同尺度的基因组,并展示一个尺度如何在空间上折叠到下一个尺度。DNA的极长的连续结构——在几个不同的尺度层次上以不同的方式排列——通常在传统的3D描述中丢失,主要是由于其多层密集的空间填充和由此产生的闭塞。此外,对这个复杂结构的交互探索是很麻烦的,需要像切割一样的可见性管理。与现有的时间控制的多尺度数据探索不同,我们允许观看者始终看到所涉及的任何尺度并与之互动。为了这个目的,我们将描绘分为恒定尺度和尺度过渡区域。恒定尺度区域保持单尺度表示,同时仍然线性展开DNA。受插图的启发,尺度过渡区通过水平展开、缩放和透明度连接相邻的恒定尺度区域。因此,我们表示了整个DNA大分子的空间结构,保持其局部组织特征,线性化其高层组织,并使用空间控制的,可理解的插值相邻尺度。
标签、简短的文本注释是数据可视化、插图、信息图和地理地图的重要组成部分。在交互式应用程序中,负责定位标签的标记方法不应该从应用程序本身获取资源。换句话说,标记方法应该尽快提供结果。在这项工作中,我们提出了一种运行在GPU上的贪婪点特征标记方法。与现有的按顺序定位标签的方法不同,本文提出的方法是并行定位多个标签。然而,我们保证定位标签不会重叠,也不会重叠重要的视觉特征。该方法在搜索一个点特征的标签位置时,根据与重要视觉特征的重叠、与其他点特征的标签候选重叠以及它们的模糊性来评估可用的候选标签。每个候选标签的评估在恒定的时间内完成,独立于点特征的数量,重要的视觉特征的数量和所创建的图像的分辨率。我们的测量表明,提出的方法能够定位更多的标签比现有的贪心方法,不评估标签候选之间的冲突。
Web可视化的主流标记语言—可缩放矢量图形(scalable Vector Graphics, SVG)—相对容易学习,它是开放的、可访问的、可通过CSS定制的、可通过DOM搜索的,并且易于交互处理和调试。因为这些属性允许可视化创建者专注于实现细节上的设计,基于SVG构建的工具,如D3.js,对可视化社区来说是必不可少的。然而,缓慢的SVG呈现会有效限制屏幕上的数据点数量,从而限制设计,这可能会迫使可视化创建者切换到Canvas或WebGL。这些不太灵活(例如,不能通过CSS进行搜索或样式化),而且更难学习。我们引入了可伸缩矢量图形(Scalable Scalable Vector Graphics, SSVG)来减少这些限制,并允许使用SVG创建复杂而平滑的可视化。SSVG自动将交互式SVG可视化转换为动态虚拟DOM (VDOM),通过拦截JavaScript函数调用来绕过浏览器缓慢的“到规范”呈现。将SVG可视化规范与SVG呈现解耦,并获得动态VDOM,为可视化系统研究创造了灵活性和机会。
虽然超级计算机正变得越来越强大,但到目前为止,它们的组件还没有按比例扩大。计算能力正在极大地增长,并使精细的分辨率模拟产生从未见过的特征。然而,I/O能力会滞后几个数量级,这意味着只有一小部分模拟数据可以存储起来进行事后分析。预先指定的保存特性和感兴趣的数量的计划不适用于以前未见过的特性。在仿真运行过程中,需要采用数据驱动的智能采样方案来检测和保存仿真的重要部分。在此,我们提出了一种新颖的采样方案,该方案在保留重要区域的同时,将数据的大小减少了几个数量级。
t分布的随机邻域嵌入(t-SNE)已经成为探索性数据分析的标准,因为它能够在需要最少用户输入的复杂数据中揭示集群。虽然它的运行时复杂性在过去限制了小数据集,但最近的努力改进了昂贵的相似性计算和以前的二次最小化。尽管如此,t-SNE在数百万个点上运行时仍然有很高的运行时间和内存成本。我们提出了一种执行t-SNE最小化的新方法。虽然我们的方法总体上保持了线性的运行时复杂性,但我们在最昂贵的最小化部分获得了显著的性能提升。我们实现了一个显著的改进,而没有明显降低精度,即使在目标为3D嵌入。我们的方法在嵌入上构造了一对空间层次,同时遍历它们来近似多个n体的相互作用。
我们提出了联合t-随机邻域嵌入(Joint t-SNE),一种用于生成多个高维数据集的可比投影的技术。尽管t-SNE已被广泛应用于各种领域的高维数据集的可视化,但它仅限于投影单个数据集。当使用t-SNE对一系列高维数据集(如随时间变化的数据集)进行独立投影时,会得到错位的布局。即使跨数据集具有相同特征的项目也会被投影到不同的位置,这使得该技术不适合进行比较任务。为了解决这个问题,我们引入了边缘相似度,它基于Graphlet频率分布(GFD)捕捉两个相邻时间段之间的相似性。然后,我们将一个新的损失项集成到t-SNE损失函数中,我们称之为向量约束,以保留投影点之间的向量,允许这些点作为投影之间直接比较的视觉地标。
基于多边形的超图可视化的布局自动生成方法(Automatic Polygon Layout for Primal-Dual Visualization of Hypergraphs) | PKU Visualization Blog