01 生物数据可视化

原文:Visualizing biological data

数据可视化越来越重要,但它需要明确的目标和更好的实现方式。

今天的研究人员可以获得空前数量的数据。主要挑战是要在不被(海量数据)压垮的情况下从这种丰富(数据)中获益。有效探索和有效沟通的数据可视化是科学进步的重要组成部分。为了使可视化继续成为发现(新事物)的重要工具,数据可视化分析者需要成为研究团队的成员。

数据可视化的目标之一是使人们能够利用人类识别模式的能力,借助交互式软件探索和解释数据。它的成功在于发展了将信息转化为视觉形式以供理解的方法和技术。这是一个综合了工程、统计和平面设计以及其他一些学科的技能的过程。

近年来,我们目睹了(人们)对信息可视化展现日益增长的兴趣。生成复杂的计算机图形变得简易鼓励了可视化的(广泛)使用。然而,这种流行的交流形式的价值和效用仍然不清楚。我们很容易被骗而认为自己在看到丰富多彩的信息时吸收更多的信息。

当应用于科学研究时,数据可视化一定不仅仅是信息的图形化显示。需要明确的目标来驱动设计,这样我们才能评估可视化的效用和实用性。研究人员希望或需要在数据中看到的是什么?哪种计算方法和可视化编码最能体现这一趋势?可视化实现者必须与研究人员一起工作,以确保不断地改进设计决策以满足研究目标。

遗憾的是,由可视化专家和生物研究人员高度整合的团队几乎没有(可参考的)模式。不同的专业会议和出版商的存在可能是妨碍合作的部分原因。例如,诸如可视化生物数据(VIZBI)和 BioVis(电气和电子工程师协会/VisWeek 的一部分)之类的信息可视化方面的主要专业会议很少吸引生物学家(参加)。因此,可视化方面的前沿发现没有得到充分的推广,也没有与生物界分享。

共享的资金来源无疑将有助于在一套共同的责任和可交付成果下联合各专业。遗憾的是,很少听到支持科学研究的机构被成功说服资助可视化工作的故事。如果没有综合团队紧密的工作关系,我们就会放弃将与研究中的想法付诸快速实现的能力:随着数据类型和研究问题的不断深入,需要不断改进和调适可视化方式。在生物研究方面能够采用补充资助金的经费补助机制以集中于可视化。这项工作的主要目的是扩大研究结果的实用性和可理解性。

认识到并非每一个生物问题都将从可视化中获益是有用的,因此,图形方法应使用在产生最大影响的项目上。许多数据(分析)难题可以用仅使用计算来完美地解决。然而,对于研究问题的子集,可视化可以提供比计算更特定优势。在我们还不知道宇宙的规律的情况下数据可视化为探索数据模式提供了一种强大的方法。可视化还可以在项目中作为算法的补充(分析)方法。例如,在基因组学中,自动化过程可以可靠地找到发生重排的位点,但是随后需要可视化以提供心理图像,从而可以充分理解和理解结构变化的细节(图一)。

数据可视化为理解数据提供了有力的帮助,因为设计良好的信息图形描述可以用简单的感知推理代替繁重的认知评估。因此,可视化可以在生物学中产生重大影响,特别是在大数据时代。在过去两年半的时间里,我研究了描述科学数据的可视化策略。虽然这个月之后观点将会中断,但是这些专栏代表了自然出版集团/致力于满足科学数据的可视化交流挑战的一部分。

01 生物数据可视化_第1张图片
图一

全基因组重排的可视化。Circos 示意图1绘制了来自两个不同肿瘤的全基因组序列数据,显示基因重复和染色体重排。外环描绘了端对端排列的染色体。内环绿色表示的拷贝数的数据,紫色表示染色体间易位。 转载自参考文献2

参考文献

  1. Krzywinski, M. et al. Genome Res. 19, 1639–1645 (2009).

  2. Imielinski, M. et al. Cell 150, 1107–1120 (2012).

你可能感兴趣的:(01 生物数据可视化)