16s—α多样性分析(R画箱线图)

一、α多样性分析的概念

α多样性分析是反映生态系统内物种的多样性,包括丰富度均匀度的综合指标。

丰富度:物种类别的多少,越丰富多样性越高。

均匀度:不同物种的数目均匀程度,越均匀多样性越高。

二、展示α多样性常用的指数

【群落丰富度指数】Community richness

1、Chao指数:是用chao1 算法估计群落中含OTU 数目的指数,chao1 在生态学中常用来估计物种总数,由Chao (1984) 最早提出。

2、Ace指数:用来估计群落中含有OTU 数目的指数,是生态学中估计物种总数的常用指数之一,与Chao1的算法不同。

Chao和Ace越大,说明群落中含有的OTU数目越多,群落的丰富度越大。

【群落多样性指数】Community diversity

1、Simpson指数:是生态学中常用的一个指数,它反映的是优势种在群落中的地位和作用,若一个群落中优势种占的多,其他非优势物种所占的比例则会减少,那么Simpson 指数值较大,这说明群落多样性较低,该指数与其他多样性指数均呈负相关

2、Shannon指数:用来估算样品中微生物的多样性指数之一。它与Simpson 多样性指数均为常用的α多样性的指数。Shannon值越大,说明群落多样性越高(包括丰富度和均匀度)。

3、Coverage:是指各样品文库的覆盖率,其数值越高,样本中序列没有被测出的概率越低。该指数反映了测序结果是否代表样本的真实情况。

三、用R绘制箱线图

1、一些设置和R包的安装

如果已经安装了就可以跳过这部分。

#设置镜像站点

options()$repos  ## 查看使用install.packages安装时的默认镜像

options()$BioC_mirror ##查看使用bioconductor的默认镜像

options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") ##指定镜像,这个是中国科技大学镜像

options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) ##指定install.packages安装镜像,这个是清华镜像

#在Rstudio里面,Tool--Global Options--Packages选择China (Beijing) [https] - TUNA Team, Tsinghua University

#直接在R安装目录下

setwd("D:/R-4.0.3/etc/")

shell.exec(file = "Rprofile.site")  ##打开文件夹修改文件内容

#修改文件内容如下

# set a CRAN mirror

local({r <- getOption(“repos”)

r[“CRAN”] <- “http://mirrors.tuna.tsinghua.edu.cn/CRAN/”

options(repos=r)}


# Install phyloseq from Bioconductor

if (!requireNamespace("BiocManager", quietly = TRUE))

  install.packages("BiocManager")

BiocManager::install()

BiocManager::install("phyloseq")

# Install the rest of the packages from CRAN

install.packages(c("vegan", "metacoder", "taxa", "ggplot2", "dplyr", "readr", "stringr", "agricolae", "ape"),

                 repos = "http://cran.rstudio.com",

                 dependencies = TRUE)

library(phyloseq)

library(taxa)

library(ggplot2)

library(dplyr)

library(readr)

library(stringr)

library(agricolae)

library(ape)

2、根据faith-pd值绘图

(faith-pd也是一个反映种群丰富度的指数)

PD score(phylogenetic diversity):PD score是结合OTUtable和OTU tree一同计算的。考虑到了样本在进化树上的分布。一个OTU的来源越复杂,其PD score越高。来自进化树上不同的地方越多,其PD score越高。

#箱线图-faith-pd-group-significance-metadata

data_faith <- read.table("D:/ilovestudy/faith-pd-group-significance-metadata.tsv",sep = "\t",header = TRUE)

## “header = TRUE”,指所读取的excel数据,第一行是否用作列名称。true则excel第一行用于列名称,具体数据从第二行开始;false则第一行即为具体数据。

head(data_faith,10)   ## 查看 data_shannon 文件的前十行

p <- ggplot(data_faith,aes(SampleGroup,faith_pd)) + geom_boxplot(aes(fill=SampleGroup)) + theme_set(theme_bw())

## 将 SampleGroup 映射给x值,faith_pd 映射给y值

p   

# 展示 p 的内容,也可写作 print(p)

geom_boxplot(outlier.size = 0.7,outlier.alpha = 1,outlier.shape = 2,outlier.color = "red",outlier.fill = "pink")   

## 设置离群点:outlier.size=大小;outlier.alpha=透明度;outlier.shape=形状;color=颜色

3、根据shannon指数绘图

#箱线图-shannon-sig-metadata

data_shannon <- read.table("D:/ilovestudy/shannon-sig-metadata .tsv",sep = "\t",header = TRUE)

# “header = TRUE”,指所读取的excel数据,第一行是否用作列名称。true则excel第一行用于列名称,具体数据从第二行开始;false则第一行即为具体数据。

head(data_shannon,10)   

# 查看 data_shannon 文件的前十行

p <- ggplot(data_shannon,aes(SampleGroup,shannon_entropy)) + geom_boxplot(aes(fill=SampleGroup)) + theme_set(theme_bw())

# 将 SampleGroup 映射给x值,shannon_entropy 映射给y值

p   

# 打印 p 的内容,也可写作 print(p)

geom_boxplot(outlier.size = 0.7,outlier.alpha = 1,outlier.shape = 2,outlier.color = "red",outlier.fill = "pink")   

# 设置离群点:outlier.size=大小;outlier.alpha=透明度;outlier.shape=形状;color=颜色


箱线图-shannon-sig-metadata


参考:

Alpha多样性【转】 - (jianshu.com)

alpha diversity分析方法 - (jianshu.com)

你可能感兴趣的:(16s—α多样性分析(R画箱线图))