提取一个数据的子集

perl脚本练习

要求

根据提供的ID,提取一个数据的子集输出到一个新的文件

数据

表达矩阵

目标基因ID
提取一个数据的子集_第1张图片

思路

  1. 目标基因按行循环读取,获得一个哈希,基因名为键
  2. 表达矩阵按行读取,提取基因名,判断是否存在哈希的键中,如果存在就输出这一行,没有就跳过

代码

open(IN, "D:/exp.txt") || die "$!";
open(INID, "D:/id.txt") || die "$!";
open(OUT, ">D:/out.txt") || die "$!";

my %keep_id=();
while(my$line=){
	chomp $line;
	$keep_id{$line}=1;
}
close(INID);

while(my$line=){
	chomp $line;
	my @tmp=split(/\t/, $line);
	if (exist($keep_id{$tmp[0]}){
		print OUT$line."\n";
	}	
}
close(IN);
close(OUT);

你可能感兴趣的:(perl,生信教程)