常用数据处理计算

将基因fa或蛋白fa序列文件由多行转换为一行
awk 'NR==1{a[NR]=$0}NR>1{if(a[NR-1] ~ ">"){print a[NR-1];a[NR]=$0}else if($0 ~ ">"){print a[NR-1];a[NR]=$0}else{printf a[NR-1];a[NR]=$0}}END{print a[NR]}' test.fa > all_oneline.fa
计算序列长度
awk '/^>/{if (l!="") print l; print; l=0; next}{l+=length($0)}END{print l}' wox.fasta

你可能感兴趣的:(常用数据处理计算)