2019-08-02 【Tools】SPRING:FASTQ数据的下一代压缩器

基本信息

标题:SPRING: a next-generation compressor for FASTQ data

作者:Shubham Chandak, Kedar Tatwawadi, Idoia Ochoa, Mikel Hernaez, Tsachy Weissman

期刊:Bioinformatics, Volume 35, Issue 15, 1 August 2019, Pages 2674–2676, https://doi.org/10.1093/bioinformatics/bty1015

前言

高通量测序技术以短基因组读数,相关质量值和读标识符的形式产生大量数据。由于这些FASTQ数据集中存在重要结构,通用压缩器无法完全利用大部分固有冗余。尽管在设计FASTQ压缩器方面已经做了大量工作,但大多数都缺乏对一个或多个关键属性的支持,例如支持可变长度读取,高覆盖率数据集的可扩展性,保持配对的压缩和无损压缩。

下载和使用

SPRING可以从https://github.com/shubhamchandak94/SPRING下载。

提出了SPRING——一个用于FASTQ文件的无参考压缩器。SPRING支持多种压缩模式和功能,包括无损压缩,保持配对压缩,质量值的有损压缩,长读压缩和随机访问。SPRING实现了比现有工具更好的压缩,例如,SPRING将来自Illumina的NovaSeq测序仪的195 GB的25×全基因组人FASTQ压缩至小于7 GB,比先前最先进的FASTQ压缩机小1.6倍。SPRING在使用可比较的计算资源的同时实现了这种改进。

你可能感兴趣的:(2019-08-02 【Tools】SPRING:FASTQ数据的下一代压缩器)