1. 文件夹的归档和整理
mkdir zmays-snps
mkidr data
mkidr data/seq scripts analysis
2. data
从哪来的,
什么时间
data的version信息
record怎么下载数据的
记录使用软件的版本,如果没有版本号,记录软件发布的日期
这些信息最好保存在纯文本的readme中
readme最好保存在每个项目的主文件中
3. {}的使用
echo dog-{gone,bowl,bark} 注意{}里面的没有空格
mkdir -p zmays-snps/{data/seqs,scripts,analysis}
touch seqs/zmays{A,B,C}_R{1,2}.fastq
ls seqs/zmaysB_?.fastq
[]的使用
ls seqs/zmays[ABCD]_R1.fastq 等价于 ls seqs/zmays[A-D]_R1.fastq
4. 命名时候要连续命名 leading zeros
5. 按照年代命名
6. 使用plain-txt来记录,推荐使用markdown
稍后学习markdown的使用方法
格式转换
pandoc
pandoc --from markdown --to html notebook.md > output.html
Pandoc - About pandoc
7. 确定shell 的类型
echo $SHELL
echo $0
推荐使用ZSH
8. cat 命令
Linux cat命令详解 - Danny Chen - 博客园
9. > or >>重新定位
cat 1.fasta 2.fasta > 3.fasta 如果没有文件先创建
> 覆盖已有内容
>> 不覆盖已有内容
10. ls -lrt 按时间顺序排序
ls -lt 按时间倒序排序,第一个最后修改或者创建的文件
11. ls -l 1.fasta 2.fast(not exit) > listing.txt 2> listing.stderr
listing.txt 存储正确的stand output
listing.stderr 存储错误stand output
12. tail -n 来查看错误日志
13. tail -f 可以用来监测某个文件的写入
14. program < inputfile > outputfile
inputfile作为标准输入给program然后将标准输出rediretion to outputfile
< 并不常见
一般常用 cat inputfile | program > outputfile
15. the goden rule of Bioinformatics is not trust your tools or data
16. grep -v "^>" 1.fasta | \ grep --color "[^ATCG]"
program1 input.txt 2> program1.stderr | \
program2 2> program2.stderr > results.txt
17. program1 2>1& | grep "error"
将程序1执行后的stand error 传递到grep
18. tee 保存中间文件
program1 input.txt | tee intermediate-file.txt | program2 > results.txt
19.