2019-04-16

1. 文件夹的归档和整理

mkdir zmays-snps

mkidr data

mkidr data/seq scripts analysis

2. data 

从哪来的,

什么时间

data的version信息

record怎么下载数据的

记录使用软件的版本,如果没有版本号,记录软件发布的日期

这些信息最好保存在纯文本的readme中

readme最好保存在每个项目的主文件中

3. {}的使用

echo dog-{gone,bowl,bark}  注意{}里面的没有空格

mkdir -p zmays-snps/{data/seqs,scripts,analysis}

touch seqs/zmays{A,B,C}_R{1,2}.fastq

ls seqs/zmaysB_?.fastq

[]的使用

ls seqs/zmays[ABCD]_R1.fastq 等价于 ls seqs/zmays[A-D]_R1.fastq


4. 命名时候要连续命名 leading zeros

5. 按照年代命名

6. 使用plain-txt来记录,推荐使用markdown

稍后学习markdown的使用方法



格式转换

pandoc

pandoc --from markdown --to html notebook.md > output.html

Pandoc - About pandoc

7. 确定shell 的类型

echo $SHELL

echo $0

推荐使用ZSH

8. cat 命令

Linux cat命令详解 - Danny Chen - 博客园

9. > or >>重新定位

cat 1.fasta 2.fasta > 3.fasta 如果没有文件先创建

> 覆盖已有内容

>> 不覆盖已有内容

10. ls -lrt 按时间顺序排序

      ls -lt 按时间倒序排序,第一个最后修改或者创建的文件

11. ls -l 1.fasta 2.fast(not exit) > listing.txt 2> listing.stderr

listing.txt 存储正确的stand output

listing.stderr 存储错误stand output

12. tail -n 来查看错误日志

13. tail -f 可以用来监测某个文件的写入

14. program < inputfile > outputfile 

inputfile作为标准输入给program然后将标准输出rediretion to outputfile

< 并不常见

一般常用 cat inputfile | program > outputfile

15. the goden rule of Bioinformatics is not trust your tools or data

16. grep -v "^>" 1.fasta | \ grep --color "[^ATCG]"

     program1 input.txt 2> program1.stderr | \

     program2 2> program2.stderr > results.txt

17. program1 2>1& | grep "error"

将程序1执行后的stand error 传递到grep 

18. tee 保存中间文件

program1 input.txt | tee intermediate-file.txt | program2 > results.txt

19. 

你可能感兴趣的:(2019-04-16)