2020-05-22生信日记2--运行软件的命令

       又是难过的几天,学生信真是九九八十一难,解决一个难关还没高兴一会儿就又会遇到下一个难题。今天写一写我能成功运行的一些命令,让我先开心一会儿吧!

1、使用Tassel将plink格式(.ped  .map)文件转成hmp

run_pipeline.pl -Xms512m -Xmx10g -fork1 -plink -ped data.indica1.ped -map data.indica1.map 

-export meso_hap -exportType Hapmap -runfork1

# 不加 -Xms512m -Xmx10g  会报错内存不足,每个人电脑的-Xms 与-Xmx好像不同,有的改成

-Xms64g -Xmx64g可以用,我的不行。

2、使用plink转换格式

例如

1.bed bim fam 转.ped .map

#在文件夹中准备好.bed .bim .fam文件,cd 进入文件夹的路径运行命令,输入文件不用带后缀。

/home/yanru/plink --bfile meso--recode --out meso1

2.ped .map转.bed .bim .fam     

#在文件夹中准备好.ped .map文件

/home/yanru/plink --file meso1 --make-bed --out meso  

3.连锁不平衡 LD 过滤,文件会产生两个文件,一个是plink.prune.in,一个是plink.prune.out

#core_v0.7是一个plink格式的文件。

/home/yanru/plink --bfile core_v0.7 --indep -pairwise 50 5 0.5

4.这个文件是可以用来做删选的参数的

/home/yanru/plink --bfile core_v0.7 --extract plink.prune.in --make-bed --out pruneddata

5.#这里clean是.bed .bim .fam文件,,,产生两个文件eigenval  eigenvec

plink --bfile clean --pca 5 --out clean

#eigenval     每个主成分可以解释多少基因的变异

#eigenvec    每个个体在每个主成分上的投影

6.转换成admixture可以识别的格式

#生成.ped为admixture输入格式,注意--recode12

/home/yanru/plink--bfile test.filter.prune.in --recode 12 --out test.filter.prune.in 

7. plink软件.bed .bim .fam转换,生成.ped和.info格式,是haploview可以使用的格式。

/home/yanru/plink --bfile data.indica --recode HV --out meso_haplo

#这里我得到的是每条染色体(chr1-chr12)单独的.ped和.info文件。

8.获得一条染色体的全部信息

grep '^rs6' pav.emmax.ps.dat > pav.chr6.emmax.ps.dat

9.安装R,

#如需获取 3.6 的版本,需要添加镜像到你的源索引里

sudoadd-apt-repository "deb https://cloud.r-project.org/bin/linux/ubuntu$(lsb_release -cs)-cran35/"

#需要添加密钥到服务器中:

sudo apt-key adv --keyserver keyserver.ubuntu.com --recv-keys

E298A3A825C0D65DFD57CBB651716619E084DAB9

#然后更新服务器信息并安装R环境:

sudoapt update

sudoapt install r-base

#输入R出现版本等信息则安装完成。

R

10.运行R进行GAPIT

#R版本大于3.5用这个安

if(!requireNamespace("BiocManager", quietly = TRUE))

 install.packages("BiocManager")

yes

yes

BiocManager::install("multtest")

install.packages("gplots")

install.packages("LDheatmap")

install.packages("genetics")

install.packages("ape")

install.packages("EMMREML")

install.packages("scatterplot3d") 

library(multtest)

library(gplots)

library(LDheatmap)

library(genetics)

library(ape)

library(EMMREML)

library(compiler)

library("scatterplot3d")

source("http://www.zzlab.net/GAPIT/emma.txt")

source("http://www.zzlab.net/GAPIT/gapit_functions.txt")

#(以上基本很顺利)

setwd("F:\\myGAPIT\\GAPIT_Tutorial_Data")

#(Q:不能更改目录,  A:又蠢了,linux和windows两种系统的路径表达方式不同,以下是正解)

>setwd("/mnt/f/myGAPIT/meso_gapit")

#导入数据

> myY <-read.table("/mnt/f/myGAPIT/meso_gapit/meso_trait.txt", head = FALSE)

> myG <-read.table("/mnt/f/myGAPIT/meso_gapit/meso.hmp.txt",header =T,sep="," )


今天写到这,命令能成功运行真好!

你可能感兴趣的:(2020-05-22生信日记2--运行软件的命令)