【小工具】智能合并测序数据fastq的脚本

介绍:

这是一个可以自动合并数据的简易脚本

应用场景:

有一批数据有三十几个样本,测序公司返回数据时由于数据量不达标,需要加测一次,部分样本数据量还是不够, 又加测一次才够,总共三次数据,需要根据样本名称合并成一个fq.gz。这么多数据要一个一个对应太麻烦了.

那么如果经常发生这种情况,建议换一家测序公司。

脚本使用注意事项:

批次之间的文件如何区分:

通常是根据lane号区分的,比如:

  • XXX_L3_1.fq.gz(第一批测序回来的)
  • XXX_L2_1.fq.gz(第二批测序回来的)

再有就是两批数据完全相同的名称:

  • XXX_L3_1.fq.gz(第一批测序回来的)
  • XXX_L3_1.fq.gz(第二批测序回来的)

这两种都支持!

脚本的使用:

只需要放入需要合并的数据的所有路径,有多少批数据路径就放多少批数据路径:

./DataMerge.py /path/to/data1  /path/to/data2  /path/to/data3

特此说明:由于脚本是打包了环境的,所以是一个二进制文件,直接使用就行,不用再安装python所需依赖包。遇到permission denied时:chmod 755 /path/to/data_merge/dist/DataMerge

已更新:

  • 支持相对路径
  • 结果不会替换原来的文件,而是生成新的文件夹:
  • 会检查每个路径的fastq数量,并根据fastq名称一一对应.
  • 支持10x数据的-1,-2,-3,-4的数据:
  • 所有的数据一个都不漏,该合并的合并,不需要合并的就链接地址过来.

待更新:

SE的数据没有验证过,

举例:

./DataMerge.py ../20220331_HG5GLDSX3_Result/Rawdata ../20220404_HFVV3DSX3_Result/Rawdata

点赞+评论获取脚本

你可能感兴趣的:(【小工具】智能合并测序数据fastq的脚本)