ATAC-seq分析:数据介绍(2)

1. 简介

ATACseq (Assay for Transposase-Accessible Chromatin using sequencing) 使用转座酶在测序前有效地片段化可访问的 DNA(DNA可极性)。结果提供了一种绘制可访问/开放染色质基因组范围的方法。

与其他技术相比,ATACseq 有几个优点,包括:

  • 所需输入材料少(> 10,000 个细胞)
  • 实验所需时间短(约 4 小时)
ATAC-seq分析:数据介绍(2)_第1张图片 ATACseq

2. 酶

  • 下面介绍几种不同酶获取数据的差异
ATAC-seq分析:数据介绍(2)_第2张图片 ATACseq, MNaseseq and DNaseseq
  • DNaseseq - 酶消化以从转录因子结合位点周围的开放染色质中提取信号。
  • MNaseseq - 酶消化以提取代表核小体定位的信号。
  • ATACseq - 使用转座酶并提供一种 同时从单个样本的转录因子结合位点和核小体位置提取信号的方法。

3. Work

本教程[1]中,我们将使用一些公开的数据来了解 RATACseq 处理的一些基础知识。

将研究 ATACseq 数据在 TSS 上的比对、比对后处理和绘图。

4. 数据

本教程中,我们将使用三组已发布的数据。

4.1. data_1

第一个数据集来自原始 ATACseq 论文[2]。我们将使用 ATACseq_50k_Rep2 示例 GEO - GSM1155958 可以从 ENAFASTQ 格式获取数据。

  • SAMN02192806 - [here](https://www.ebi.ac.uk/ena/data/view/SAMN02192806 “SAMN02192806”)

4.2. data_2

对于第二个数据集,我们将 UCSDBing Ren 生成的 ATACseq 作为 ENCODE 联盟的一部分。它包括来自小鼠几种组织的样本。数据和示例信息的链接包含在下面的列表中。

  • Liver day 12 - ENCSR302LIV [3]
  • Kidney day 15 - ENCSR023QZX [4]
  • Hindbrain day 12 - ENCSR088UYE [5]

4.3. data_3

最后,我完全按照本次教程中的描述处理了来自 MSKCCChristina Leslie 实验室的一些数据,因此我们可以在练习中回顾 ATACseq 数据的一些特征以及 ENCODE 管道处理的相同数据。

原始数据和处理后的 BAM 文件可从 ENCODEs 门户网站获得

  • T-Reg - [ENCSR724UJS](https://www.encodeproject.org/experiments/ENCSR724UJS/ “ENCSR724UJS”)

FQ 文件可以在此处找到 read1[6] 和此处的 read2[7]。我们还将使用对齐数据作为BAM[8] 文件,该文件可在此处找到。

5. 参考数据

对于 ATACseq 分析,我们需要一些参考数据。

  • fasta 格式的参考基因组——我们将从 BSGenome Bioconductor 注释包中检索。
  • 基因模型——我们将从 TxDb Bioconductor 注释包中检索这些模型。
  • Blacklists 特定于基因组的区域。这些可以在此处的 ENCODE 门户 [9]中找到

6. 已处理数据

我们从以下链接中的公共测序数据开始,并使用 Bioconductor 中的参考数据。由于其中一些处理步骤可能需要一点时间,因此我提供了指向预处理结果的链接。

来自我们对齐/排序/索引的 BAM 文件和 BAI 索引:

  • SAMN02192806 - Greenleaf BAM - Greenleaf 示例的完整 BAM 文件在我们的 Rsubread 对齐、排序和索引中生成。
  • SAMN02192806 - Greenleaf BAI index - Greenleaf 示例中 BAMBAI 索引文件在我们的对齐、排序和索引中生成如下。

小型 BAMpeak calls 和目录结构。

  • ATAC_Workshop_Essential.zip - 需要额外的文件和目录结构。

下载上述文件并解压缩 ATAC_Workshop.zip 后,您应该将 Sorted_ATAC_50K_2.bamSorted_ATAC_50K_2.bam.bai 文件移动到 ATAC_Workshop/ATAC_Data/ATAC_BAM/ 。您还应该将 RU_ATAC_Workshop.Rmd 复制到 ATAC_Workshop/ 目录,然后打开以确保所有相对路径都是正确的。

与上述相同,但具有用于计数的 BAM 以及小型 BAMpeak calls 和目录结构。

  • Bigwigs - 在 IGV 中审查的 BigWigs.
  • ATAC_Workshop.zip - 附加文件和目录结构。

欢迎Star -> 学习目录

更多教程 -> 转录组测序分析教程合集

更多教程 -> 单细胞系列教程:合集


参考资料

[1]

Source: https://rockefelleruniversity.github.io/RU_ATACseq/presentations/singlepage/RU_ATAC.html

[2]

first dataset: https://pubmed.ncbi.nlm.nih.gov/24097267/

[3]

ENCSR302LIV: https://www.encodeproject.org/experiments/ENCSR302LIV/

[4]

ENCSR023QZX: https://www.encodeproject.org/experiments/ENCSR023QZX/

[5]

ENCSR088UYE: https://www.encodeproject.org/experiments/ENCSR088UYE/

[6]

read1: https://www.encodeproject.org/files/ENCFF175VOD/@@download/ENCFF175VOD.fastq.gz

[7]

read2: https://www.encodeproject.org/files/ENCFF447BGX/@@download/ENCFF447BGX.fastq.gz

[8]

BAM: https://www.encodeproject.org/files/ENCFF053CGD/@@download/ENCFF053CGD.bam

[9]

ENCODE portal: https://www.encodeproject.org/annotations/ENCSR636HFF/

本文由 mdnice 多平台发布

你可能感兴趣的:(程序人生)