又是难过的几天,学生信真是九九八十一难,解决一个难关还没高兴一会儿就又会遇到下一个难题。今天写一写我能成功运行的一些命令,让我先开心一会儿吧!
1、使用Tassel将plink格式(.ped .map)文件转成hmp
run_pipeline.pl -Xms512m -Xmx10g -fork1 -plink -ped data.indica1.ped -map data.indica1.map
-export meso_hap -exportType Hapmap -runfork1
# 不加 -Xms512m -Xmx10g 会报错内存不足,每个人电脑的-Xms 与-Xmx好像不同,有的改成
-Xms64g -Xmx64g可以用,我的不行。
2、使用plink转换格式
例如
1.bed bim fam 转.ped .map
#在文件夹中准备好.bed .bim .fam文件,cd 进入文件夹的路径运行命令,输入文件不用带后缀。
/home/yanru/plink --bfile meso--recode --out meso1
2.ped .map转.bed .bim .fam
#在文件夹中准备好.ped .map文件
/home/yanru/plink --file meso1 --make-bed --out meso
3.连锁不平衡 LD 过滤,文件会产生两个文件,一个是plink.prune.in,一个是plink.prune.out
#core_v0.7是一个plink格式的文件。
/home/yanru/plink --bfile core_v0.7 --indep -pairwise 50 5 0.5
4.这个文件是可以用来做删选的参数的
/home/yanru/plink --bfile core_v0.7 --extract plink.prune.in --make-bed --out pruneddata
5.#这里clean是.bed .bim .fam文件,,,产生两个文件eigenval eigenvec
plink --bfile clean --pca 5 --out clean
#eigenval 每个主成分可以解释多少基因的变异
#eigenvec 每个个体在每个主成分上的投影
6.转换成admixture可以识别的格式
#生成.ped为admixture输入格式,注意--recode12
/home/yanru/plink--bfile test.filter.prune.in --recode 12 --out test.filter.prune.in
7. plink软件.bed .bim .fam转换,生成.ped和.info格式,是haploview可以使用的格式。
/home/yanru/plink --bfile data.indica --recode HV --out meso_haplo
#这里我得到的是每条染色体(chr1-chr12)单独的.ped和.info文件。
8.获得一条染色体的全部信息
grep '^rs6' pav.emmax.ps.dat > pav.chr6.emmax.ps.dat
9.安装R,
#如需获取 3.6 的版本,需要添加镜像到你的源索引里
sudoadd-apt-repository "deb https://cloud.r-project.org/bin/linux/ubuntu$(lsb_release -cs)-cran35/"
#需要添加密钥到服务器中:
sudo apt-key adv --keyserver keyserver.ubuntu.com --recv-keys
E298A3A825C0D65DFD57CBB651716619E084DAB9
#然后更新服务器信息并安装R环境:
sudoapt update
sudoapt install r-base
#输入R出现版本等信息则安装完成。
R
10.运行R进行GAPIT
#R版本大于3.5用这个安
if(!requireNamespace("BiocManager", quietly = TRUE))
install.packages("BiocManager")
yes
yes
BiocManager::install("multtest")
install.packages("gplots")
install.packages("LDheatmap")
install.packages("genetics")
install.packages("ape")
install.packages("EMMREML")
install.packages("scatterplot3d")
library(multtest)
library(gplots)
library(LDheatmap)
library(genetics)
library(ape)
library(EMMREML)
library(compiler)
library("scatterplot3d")
source("http://www.zzlab.net/GAPIT/emma.txt")
source("http://www.zzlab.net/GAPIT/gapit_functions.txt")
#(以上基本很顺利)
setwd("F:\\myGAPIT\\GAPIT_Tutorial_Data")
#(Q:不能更改目录, A:又蠢了,linux和windows两种系统的路径表达方式不同,以下是正解)
>setwd("/mnt/f/myGAPIT/meso_gapit")
#导入数据
> myY <-read.table("/mnt/f/myGAPIT/meso_gapit/meso_trait.txt", head = FALSE)
> myG <-read.table("/mnt/f/myGAPIT/meso_gapit/meso.hmp.txt",header =T,sep="," )
今天写到这,命令能成功运行真好!