22年一定要掌握的十大生信发文路线

生信人公众  号近期推广过很多22年应该掌握的热点,研究方向等之后,后台有小伙伴留言让对生物信息常见的技术路线进行汇总,今天小编就抛砖引玉的简单梳理下常见的医学生物信息常见的技术路线。

一、单基因(IF:1-5)推荐指数:☆

单基因研究路线主要是针对自己手中有现成的基因,需要基于这个基因进行思路设计和文章展开的,建议使用这个思路。主要包括单癌型单基因,和单基因泛癌研究两种。一般技术路线为:首先利用公开数据库数据进行基因的表达差异研究,预后差异研究,表观、突变或者其他方面的综合分析,最后在本癌型或者泛癌型中进行预后的整体评估。生信分析意向表 (mikecrm.com)

关注这个方向的可以阅读CDK5 Functions as a Tumor Promoter in Human Lung Cancer这篇文献,非常容易学习,是国自然申请标书书写最具有性价比的技术路线

二、核心基因(IF:1-3)推荐指数:☆☆☆

核心基因这个思路,对于长期关注生信人的粉丝来说,肯定不陌生。对于这个思路由于其比较标准和规范,我们已经开发成了在线工具easyGEO(https://easygeo.cn),集数据预处理及标准化、差异表达分析及火山图可视化、蛋白质互作网络构建及可视化、Hub基因识别及子网络挖掘、生存分析(Kaplan-Meier⽣存曲线图)等分析模块于一体。用户可以在超过25000套GEO数据集中进行自由探索,用别人的数据、别人的代码、别人的服务器,建自己的idea、发自己的paper。

,时长24:46

三、降维预后(IF:3-5)推荐指数:☆☆☆☆☆

如果说单基因研究路线需要根据自己手头的课题来选择,那么降维预后这个技术路线就属于不挑方向的了,大家看到的生信类文章绝大多数都是这种。这个技术路线的好处在于有一个新的分组,有新的热点,感兴趣的基因就可以试着从头挖掘一遍,而且永远不过时。一般技术路线为:差异分析,富集分析,降维(lasso为主),然后进行模型构建,模型验证(现在对于模型验证的要求更好了,欢迎大家与我们进行技术探讨),模型的各个方面上的评估,包括临床指标,突变,预后,耐药和免疫治疗。

关于这个方向建议大家多关注生信人,我们会第一时间汇总最新的热点和数据给大家。也欢迎大家添加我们的科研助理微信18501231804,更快获取第一手资料。生信分析意向表 (mikecrm.com)

A Novel Ferroptosis-Associated Gene Signature to Predict Prognosis in Patients with Uveal Melanoma

四、分型预后(IF:3-7)推荐指数:☆☆☆☆☆

这个思路相对于降维预后来说提供了另外一种可能,就是可以人为的根据临床特征进行分组,可以作为降维预后效果不好的一种有力补充。当然其分析更为全面,结果阳性率和调试空间更大,近些年成为生信发文的宠儿。

其一般技术路线为:感兴趣的基因集或者差异基因进行聚类分组,评估预后效能,然后分组筛选差异,富集分析,降维,然后进行模型构建,模型验证(现在对于模型验证的要求更好了,欢迎大家与我们进行技术探讨),模型的各个方面上的评估,包括临床指标,突变,预后,耐药和免疫治疗。

m6A regulator-mediated methylation modification patterns and tumor microenvironment infiltration characterization in gastric cancer

五、ceRNA(IF:3-5)推荐指数:☆☆☆

ceRNA虽然生信人平台近一年来都很少推,但是其实仍然是国自然的热点,并且去年也有很多文章发表出来。这个思路本来要求样本同时进行了RNA、miRNA、LncRNA或者circRNA测序的。如果这样看那么就只有TCGA数据能满足这个要求,绝大多数GEO的数据满足不了。所以这样的文章一般要求要进行实验验证,来确保你获得的LncRNA或者circRNA是真实的。所以如果课题组有数据或者有样本,完全可以选择这个方向

ceRNA的一般技术路线为:RNA、miRNA、LncRNA或者circRNA同时做差异分析,构建DEceRNA网络,找到感兴趣的LncRNA或者circRNA进行预后分析或者模型构建。

Construction and comprehensive analysis of a ceRNA network to reveal potential prognostic biomarkers for lung adenocarcinoma

六、WGCNA(IF:1-7)推荐指数:☆☆☆

WGCNA其实只是一个技术,为什么会单独拎出来做一个介绍呢,因为它太重要。简单说他可以建立一种联系,比如临床特征和基因,比如说细胞和甲基化。这种联系太重要了。我们可以很简单的实现两个作用一个是分组,通过关联感兴趣的指标;一个是降维,通过筛选相关性高的模块。所以大家可以看到WGCNA的文章层出不穷,文章各个层面上都有。这个技术一定要掌握,它可以帮助你在穷途末路,看下相关性,万一柳暗花明呢。

Ten hub genes associated with progression and prognosis of pancreatic carcinoma identified by co-expression analysis.

七、机器学习(IF:1-7)推荐指数:☆☆☆☆

关于机器学习的,可以这么说,基本上出来一个好的机器学习方法,都能发表一篇不错的文章,无论是诊断模型还是预后模型。分高低只取决于其采用的验证队列的多少,模型的普适性

所以一般对于没有什么研究的点的疾病和肿瘤强烈推荐这个方向,因为它就依赖于模型的准确性,只关注硬功夫,对于科研问题关注的较少,写作较为容易。一般技术路线也比较简单就是对数据进行区分,分为训练集和验证集,然后构建模型,进行模型验证。

A 23 gene–based molecular prognostic score precisely predicts overallsurvival of breast cancer patients

八、表观调控(IF:3-5)推荐指数:☆☆☆☆

这个方向特指两种修饰,DNA甲基化和RNA转录后修饰(m6A、m5C),当然有蛋白数据的除外。由于受限于数据,RNA转录后修饰一般放在降维预后和分型预后进行分析,而对于甲基化数据,一般思路可以借鉴ceRNA。同样由于GEO中甲基化数据较少,可以探索的内容也较少。目前见过的一般技术路线有两种,第一种是利用甲基化数据和RNA表达数据联合进行筛选预后基因,另外一种是利用甲基化数据进行聚类分型筛选预后基因

Molecular subtypes based on DNA methylation predict prognosis in colon adenocarcinoma patients

九、单细胞(IF:5-7)推荐指数:☆☆☆☆

目前单细胞数据的研究,主要是通过跟bulk RNAseq进行联合分析,利用单细胞数据主要进行或者辅助进行预后标志物的筛选。(当然不排除有大课题组就直接研究单细胞,不屑于用bulk RNA-seq)

从单细胞层面向常规转录组过渡,基本分为三种方式,第一种是利用CIBERSORTX等方法实现基因和细胞过渡;第二种利用数据集的特点(具有不同组织和人群的临床信息)直接过渡;第三种是利用构建样本的单克隆,区分细胞的不同时期,进行分期差异,进行过渡。

还有就是研究的恶性肿瘤细胞,核心在于利用将单细胞数据套用hub gene 思路,筛选出预后基因,然后与常规转录组结合,来构建预后模型。

Identification and Validation of a Malignant Cell Subset Marker-Based Polygenic Risk Score in Stomach Adenocarcinoma Through Integrated Analysis of Bulk and Single-Cell RNA Sequencing Data

十、免疫浸润(IF:5-7)推荐指数:☆☆☆☆

由于免疫治疗的火爆,决定了免疫浸润会持续很长的时间成为国自然的宠儿。

通过转录组进行免疫浸润的评估,进行分组评估免疫治疗,也成了生信分析必不可少的一个环节。一般来说有三种研究方向,第一种研究整体,通过免疫评分,TMEscore等各种评分直接分成高低分组,进行各种指标的关联和研究;第二种是关注免疫相关的signature,这种是聚焦于免疫相关的基因上,通过分组筛选对应的基因,然后做新旧signature和模型的对比;第三种是聚焦在单个免疫细胞上,比如T细胞、CAF等,目的也很明确利用单个免疫细胞作为起手式,把相关的问题全部处理掉,看有没有新的方向和感兴趣的点的出现。Three subtypes of lung cancer fibroblasts define distinct therapeutic paradigms生信分析意向表 (mikecrm.com)

十一、多组学联合(IF:5+)推荐指数:☆☆☆☆☆

多组学联合分析,其实也是生信人多次推荐过的思路。这里要区分你是否有独立的cohort。目前各个组学比较完备的就只有TCGA,如果你自己有独立的数据队列,也有各种组学,这个思路一定要做。而且可做的内容不仅仅是简单的对比,什么最新的新抗原、AS抗原都可以看一波。如果没有独立的数据集,也不用灰心,生信人也有常规的多组学联合分析思路,最常见的就是利用多组学数据进行分型,研究分型预后,如果这个分型预后能被验证出来,那这个文章最少5分起步。如果有自测数据,那更妥妥的加分项。同时这个思路对于新出现的各种新的测序技术,新的组学数据,超级优化,使用起来几乎没成本。

所以如果你有自测数据,生信人欢迎你找我们合作

HCC subtypes based on the activity changes of immunologic and hallmark gene sets in tumor and nontumor tissues

以上小编对常见的生信十大分析路线进行了简单的汇总,受限于文章篇幅只能是点到为止,所写都是小编拙见,只为能对大家有些许帮助,如有瑕疵部分,请轻拍。

最后祝大家2022年,科研如虎添翼,文章虎虎生威,欢迎关注 生信人。公众  号

更多精彩好文

2022年,TCGA数据建模真的还能到10分吗? - (jianshu.com)

国自然热点:细胞衰老 - (jianshu.com)

你可能感兴趣的:(22年一定要掌握的十大生信发文路线)