1、 所有的蛋白都能被修饰吗?都能被甲基化,乙基化,磷酸化等等?http://www.biotrainee.com/thread-450-1-1.html
2、所有的蛋白都能找到抗体吗?http://www.biotrainee.com/thread-451-1-1.html 抗体有效性如何评价?蛋白质有抗体,蛋白质被修饰后修饰位点又有特异性抗体?抗体获取实验环节耗时如何?
3、蛋白质的修饰,主要就是甲基化,乙酰化和磷酸化! 这3种修饰(methyltranferase/acethytransferase/phosphatase),有一些是蛋白质特异性,比如只针对histone,有一些是氨基酸特异性,有一些是广谱的。 甲基化的重点是arginine和lysine,包括PRMT系列和KMT系列,去甲基化主要有JMJD6和KMD系列。 其中PRMT4改名为CARM1。 KMT6改名为EZH2 。 乙酰化的重点是 HATs家族 ,去乙酰化是 HDACs。虽然它们的名字里面带有histone,但其实它们可以作用于其它蛋白质。 磷酸化只能发生在Serine/Threonine/Tyrosine这3个氨基酸上面,统称为kinase,主要是MAPK系列,去磷酸化由有DUSP系列,PTP系列,PPP系列基因。 这个重点是酶与底物的结合!
4、那么既然这么多修饰,我们随便拿其中一个修饰来看看,比如HAT酶,就是给组蛋白的K氨基酸乙酰化的酶,迄今为止,已鉴定的人HAT可分为以下五大类。 (1)Gcn5相关N—乙酰基转移酶(GNAT)超家族: (2)P300/CBP: (3)TAF250: (4)核受体共激活因子: (5)MYST家族: 这是第一个协作任务,那么能把这个完整列表得到吗? gene symbol即可 ,加上分类
5、上面我们说到,组蛋白的K氨基酸乙酰化的酶叫HAT系列,你们可以在genecard上面查一下,就明白了,但实际上,它们应该改名叫做KAT,因为它的重点是K(氨基酸),不是H(histone),这个你们记住,第二个协作任务,把里面的信息搞清楚,历史遗留原因,它被这样命名了。
6、既然组蛋白的K氨基酸可以被乙酰化,根据动态平衡的定律,必然有去乙酰化的酶。 组蛋白去乙酰化酶(histone deacetylase,HDAC)是一类蛋白酶,对染色体的结构修饰和基因表达调控发挥着重要的作用。一般情况下,组蛋白的乙酰化有利于DNA与组蛋白八聚体的解离,核小体结构松弛,从而使各种转录因子和协同转录因子能与DNA结合位点特异性结合,激活基因的转录。而组蛋白的去乙酰化则发挥相反的作用。 而人有18个HDACs,分成4类! 并不是所有的HDACs都被做过CHIP-seq,你们帮我备忘一下,我需要查一查哪一些做过。第三个协作任务。那么能把这个HDACs完整列表得到吗? gene symbol即可 ,加上分类
7、谈到CHIP-seq这个技术,它只是表观研究领域最早最成熟的而已,其实目前有非常多的类似的技术,大家在我们-生信技能树论坛的表观版块可以找到。http://www.biotrainee.com/forum-47-1.html 这是我们的第4个协作任务,你们需要熟悉这个版块,把还没有介绍过的seq技术补全,搜集资料补全即可。
8、前面谈到乙酰化和去乙酰化,初学者会有一个绝对的观点,就是乙酰化就是促进转录,去乙酰化就是抑制转录。同理,很多人会以为,H3K4, H3K36, and H3K79, 这样的active marker,就是激活转录,H3K9, H3K27, and H4K20.这样的repression marker就是抑制转录。同理,大家做一个总结,大家公认的这样的marker的表格,这个是第5个协作任务。大家领取协作任务之前,在这个聊天小群聊一下。
9、前面我们提到了H3K4, H3K36, and H3K79, ,H3K9, H3K27, and H4K20 这些东西,大家可能有人都还不知道,这些组蛋白修饰是什么意思,强烈建议看一下一篇综述,了解组蛋白(包括其它蛋白)可以被哪些修饰,有哪些被研究的修饰可能性。Chromatin Modifications and Their Function
10、接下来,我们说一说转录因子,真核生物的转录非常复杂,转录因子和转录复合物扮演的角色非常重要。转录因子,必然是蛋白质,那么比如也是人体的基因编码的。人人类的基因是已知的,就那么两万多个。而转录因子的定义是已知的,所以理论上我们是可以拿到所有的转录因子列表的,对人类来说,参考:http://www.biotrainee.com/thread-131-1-1.html。而且可以根据重要性,对转录因子进行排序。这是第6个协作任务。转录因子的总结
11、谈到了转录因子和组蛋白,那么我们就要思考一个问题。它们是最主要的CHIP-seq的IP,那么是不是只有转录因子和组蛋白可以做CHIP-seq呢?显然不是,转录复合物,POLY II 的各个组分都可以,PRC1,PRC2也可以,大家还可以提出其它的复合物。这是第7个协作任务,做一个完善的转录相关复合物列表。
12、既然我们把转录因子和组蛋白,转录相关复合物都说完了,是不是CHIP-seq的IP就到处为止了呢?要做CHIP-seq,我们的IP必然跟DNA有联系,这个联系可以是直接的,必然histone包围DNA,必然转录因子结合promoter,必然poly II 复合物结合DNA,那么其它核内蛋白,难道就不跟DNA相接触了吗?那么这是第8个协作任务, 人的2万多个基因里面,还有哪些是核内蛋白,一个完整的列表。
13、说到了核内蛋白,那么它是不是就一定会跟DNA接触了?如果接触,IP抓取这个蛋白的同时就能抓取DNA序列,就有CHIP-seq数据来进行下游分析。如果这个蛋白跟DNA接触了,它是不是就落入了转录因子的定义呢?转录因子分成general和specific的,转录因子有3个区域,看起前面的示意图。什么样的蛋白才有跟DNA接触的生物学基础呢?参照转录因子的3个结构共性。这是第9个协作任务。
14、那我们再谈一谈基因研究的问题,基因必然有promoter区域,有可能被某些specific的TF结合,这个就很值得研究,有数据库。gene的3'UTR区可以预测它是否被miRNA调控。基因必然可以被knock -down or OFF,或者overexpression,这个叫做基因的permutation,那么,哪些基因被研究过,被做过permutation呢?这是第10个协作任务。
15、说到基因的permutation,那么它在不同的tissue,不同的cell line,不同的disease状态,不同的处理,会有不同的后果。这就是大部分文章的终极意义。其中我上面提到的各种酶,各种转录因子,是优先被研究优先被做permutation的。
16、factorbook里面有encode计划的高标准TF,对人来说,有167个(http://www.factorbook.org/human/chipseq/tf/),那么它们的CHIP-seq数据的bam文件和peaks文件都可以拿到,TSS,genebody的profile图和热图,都可以拿到。这个是chipseq数据结果的理解,第11个协作。找到CHIP-seq的可视化图片,越多的类型越好。我会在两个月后给大家一个视频讲解。争取让大家都理解为什么要做CHIP-seq,已经做完CHIP--seq的结果有什么生物学意义
17、factorbook里面有encode计划的高标准TF,对人来说,有167个, 但是却有,837个实验数据,因为TF可以在不同的细胞系发挥作用,大家可以检查两个细胞系看看差异到底有多大,有一个大致的印象。这是第12个协作任务,会下载数据的,可以试一下。然后也是因为同一个TF,有多个不同商家的IP,这个问题就来了,IP的重要性不需要我多说了,这是第13个协作任务,搜集类似的关于IP的重要性的资料。
18、encode计划采用4种高通量测序技术来刻画了超过100种不同的细胞系或者组织内的全基因组范围内的基因调控元件信息。但是我们目前只关心CHIP-seq的技术手段的结果。所有数据从raw data形式的原始测序数据到比对后的信号文件以及分析好的有意的peaks文件都可以下载。下载方法见:http://www.bio-info-trainee.com/1825.html 包括ENCODE官网下载,UCSC下载,ENSEMBL下载,broad研究所数据,IHEC存放的数据,还有GEO下载这6种形式!!!这是第14个协作任务,下载H3K4me3和H3K27me3的任意一种细胞系的peaks,然后看看它们的peaks的overlap情况。
19、第15个协作任务,上面我们谈到了encode计划涉及到的100种细胞系,那么有一个细胞系收集整理表格,有人已经做好,你们需要查询到,然后整理一份,跟大家讨论,我们要记住一些常见的细胞系的名字。(这个我手上有!)
20、熟悉一下3个数据库, http://cistrome.org/db/#/ http://www.genecards.org/ http://biocc.hrbmu.edu.cn/GPA/AdvFuncSearchAction 其中GPA来看某个基因被干扰是否影响某个基因的表达,正反查询均可。 cistrome查询某个chip-seq是否被做过,结果是怎么样的! genecard里面增加了调控原件这个信息,大家可以了解一下。 如果你了解了这3个数据,就做一个调研吧,这是第16个协作任务,EGR1和EZH2两个基因相互作用关系
21、一些图要看懂:
22、一些图要看懂: