Nature重磅综述;关于机器学习应用单细胞组学+RNA-seq,你想知道的都在这

单细胞多组学技术”和“空间转录组技术”先后在2019年和2020年被Nature Methods评为年度技术方法。时间和空间维度多维研究技术结合,将以全新研究思路出发,既能够获得单个细胞间异质性,又能获得细胞在组织空间上的结构位置信息,发现更多未知且精细化结果。总而言之,单细胞测序+空间转录组测序:优势互补,同时获得细胞类型群体,以及基因表达和细胞的空间位置信息。

    空间转录组能够定位和区分功能基因在特定组织区域内的活跃表达,为研究和诊断提供宝贵见解。10x Visium 的推出使空间转录组成为了新的研究热点,受到广大研究者的青睐,其不仅可以提供研究对象的转录组等数据信息,同时还能定位其在组织中的空间位置,这对于癌症发病机制、神经科学、发育生物学等众多领域的研究都有重要意义。

    生物医学是综合医学、生命科学和生物学的理论和方法而发展起来的前沿交叉学科,基本任务是运用生物学及工程技术手段研究和解决生命科学,特别是医学中的有关问题。机器学习技术能利用复杂的算法在大规模、异质性数据集中进行运行、在生物医学方面、人类基因组项目、癌症全基因组项目、等项目上都表现出了巨大的潜力,收集并分析与医学疗法和患者预后相关的大量数据集或能将医学转化称为一种数据驱动、以结果为导向的学科,其对于疾病的检测、诊断都有着非常深远的影响。                  


       CADD(Computer Aided Drug Design):计算机辅助药物设计,依据生物化学、酶学、分子生物学以及遗传学等生命科学的研究成果,针对这些基础研究中所揭示的包括酶、受体、离子通道及核酸等潜在的药物设计靶点,并参考其它类源性配体或天然产物的化学结构特征,以计算机化学为基础,通过计算机的模拟、计算和预算药物与受体生物大分子之间的相互作用,考察药物与靶点的结构互补、性质互补等,设计出合理的药物分子。它是设计和优化先导化合物的方法,特别是在食品、生物、化学、医药、植物、疾病方面应用广泛


       然而如何对单细胞及空间转录组数据进行分析并结合生物学背景挖掘到更多有效信息也是困扰很多科研人员的一大难题以及机器学习在生物医学领域发展缓慢,学习平台文献资料较少,培训学习迫在眉睫, 应广大科研人员要求,本单位经过数月调研,决定联合专家举办“单细胞及空间转录组设计分析与机器学习在生物医学+CADD”专题线上培训班,对于培训安排和培训质量一致评价极高 ,精心设计了具有前沿性、实用性和针对性强的理论学习和上机实操,培训请一定要认准我们!

培训对象

全国各大高校、企业、科研院所从事机器学习、生物信息、生物计算、生命科学、生态、肿瘤、遗传、基因改造、细胞分化、植物学、微生物、生物医学大数据分析与挖掘、数学类专业、计算机科学、医学、疾病等研究的科研人员及人工智能爱好者

培训目标(完全适合零基础)

     深度进行单细胞及空间转录组学的讲解和实操,让学员能够掌握单细胞及空间组学深度的课题设计思路及分析流程,系统学习理论知识及熟悉软件代码实操,数据挖掘、文章的复现,学会单细胞及空间组学数据的细胞鉴定、差异分析、功能富集、转录因子、拟时序分析、细胞通讯、双细胞鉴定、CNV推断等,熟练掌握这些分析模块的分析软件和参数使用等

    机器学习(ML)在生物医学中应用,让学员能够学习理论知识及熟悉代码实操,ceRNA 网络构建、精通挖掘GEO、TCGA等数据库、文章的复现,以及利用机器学习方法筛选疾病相关的生物标志物、预测患病风险、预测患者预后、多种机器学习、计算方法综合预测等操作技能,大量演练操作,帮助科研人员利用这些公共数据库挖掘数据,独自完成自己的课题研究项目

助力学员发表Nature、Science、Cell等正刊及子刊杂志!

    CADD计算机辅助药物设计设计流程,让学员能够掌握包括PDB数据库、靶点蛋白、蛋白质-配体、蛋白-配体小分子、蛋白-配体结构、notepad的介绍和使用、分子对接、蛋白-配体对接、虚拟筛选、蛋白-蛋白对接、蛋白-多糖分子对接、蛋白-水合对接、Linux安装、gromacs分子动力学全程实操、溶剂化分子动力学模拟助力学员发表Nature、Science、Cell等正刊及子刊杂志!

    助力学员发表Nature、Science、Cell等正刊及子刊杂志!

培训特色

1、课程特色--全面的课程技术应用、原理流程、实例联系全贯穿

2、学习模式--理论知识与上机操作相结合,让零基础学员快速熟练掌握

3、课程服务答疑--主讲老师将为您实际工作中遇到的问题提供专业解答

培训讲师

主讲老师来自知名985高校,在Nature、Cell等系列杂志发表SCI论文60余篇,在肿瘤、发育、免疫、神经等多领域均有高分文章发表,知识不可谓不渊博,因此可为各研究方向老师提供有效的课题建议和分析方案。承担国家科技部、国家自然基金委和重点研发计划等多项课题。目前与多位国内院士团队和国外顶级实验室合作,已培训学员数千名,成功带领大家系统学习单细胞、空间、表观组学及基因组学等生信知识和技能,并指导多位学员发表CNS系列文章。

        主讲老师来自国内高校李老师授课,生物信息学博士,有十余年的测序数据分析经验。研究领域涉及机器学习,芯片数据分析,核酸及蛋白序列分析,DNA,RNA,甲基化测序数据分析,单细胞测序数据分析,miRNA及靶基因分析,癌症相关基因预测及预后分析等,发表SCI论文30余篇,其中一作及并列一作15篇。

课表内容

              单细胞及空间转录组课题设计与数据分析培训班

第一天

     单细胞测序技术与应用

理论内容:

1.单细胞组学技术的发展和原理。

2.单细胞在各个科研领域的应用。

3.单细胞高分文章分析思路解析(细胞群鉴定、拟时序分析、差异表达、功能富集、转录因子、细胞通讯等)。

4.单细胞组学分析常用数据库介绍及使用。

实操内容:

1. 常规基础Linux命令入门讲解及实操训练。

2. R语言简介及安装,RStudio的安装及使用说明。

3. R语言语法介绍及常用命令。

4. 数据处理功能及统计应用。

5. R语言画图实操:小提琴图,箱型图,火山图,热图,网络图,GO、KEGG富集图,GSEA等图形绘制。

第二天

单细胞转录组数据分析思路及流程以及数据分析实操

理论内容:

1. 单细胞实验处理、建库及测序。

2. 单细胞转录组比对、定量、分群及拟时间分析等分析思路。

3. 单细胞转录组转录因子及功能通路解析。

4. 单细胞组学技术在癌症、发育、免疫及在植物、微生物等领域的研究内容及思路。

实操内容:

1. 10X官方单细胞软件Cellranger讲解及实操。

2.从基因表达矩阵开始到marker基因筛选全过程讲解及实操。

3.单细胞数据质控、归一化处理、PCA降维、聚类、tSNE、UMAP可视化。

4.单细胞转录组细胞类型鉴定及功能分析。

5.单细胞转录组差异分析。

6. 通过Seurat 合并多样本及消除样本异质性。

第三天

单细胞转录组轨迹、通路、转录因子等分析及绘图实操

实操内容:

1. 通过Monocle软件进行单细胞转录组拟时间分析。

2. 通过DAVID及metascape网站进行通路富集分析。

3. 通过GSVA计算细胞通路得分信号等。

4. 通过cellphonedb进行细胞互作分析。

5. 通过infercnv推断染色体拷贝数变异。

6. 通过SCENIC软件进行转录因子预测分析。

理论内容:

1. 空间转录组技术发展历程和原理介绍。

2. 空间转录组技术在科研领域的应用。

3. 近年空间转录组CNS文章思路解析。

4. 空间转录组文章常见图表解读。

5. 空间转录组技术在癌症、发育、神经科学及在植物等领域的研究内容及思路。

第四天

1.空间转录组数据比对、降维及聚类等分析2.空间转录组多样本及与单细胞数据关联分析

实操内容:

1. 10x Visium 组织优化及文库制备。

2. 10x Visium官方分析软件Space Ranger讲解及实操。

3. Space Ranger输出结果解读。

4. Loupe Browser软件安装及使用。

5. 通过Seurat软件进行降维、聚类和可视化。

6. 通过Seurat进行基因表达可视化。

理论+实操内容

1. 通过Seurat进行空间变量特征的识别。

2. 与单细胞数据关联分析(空间细胞类型定义)

3. 通过Seurat处理多个切片。

4. 单细胞及空间转录组数据分析总结。

5. 归纳总结零成本单细胞和空间转录组数据挖掘思路。

6. 单细胞及空间转录组基金申请思路、准备内容及注意事项等。

机器学习在生物医学应用专题培训

第一天

机器学习及生物医学中应用简介

1.   机器学习及生物医学中应用简介

2.  机器学习基本概念介绍

3.  常用机器学习模型介绍(GLM,BF,SVM)

4.   主成分分析(PCA)

5.  一致性聚类分析

6.  ROC曲线和时间依赖的ROC曲线

7.  生存分析基本概念介绍(生存曲线)

8.  预后模型介绍(单因素,多因素cox回归,lasso回归)

           1.     R语言简介

           1.1   R语言概述

           1.2   R软件及R包安装

           1.3   R语言语法及数据类型

           2.     条件语句

           2.1     循环

           2.2     函数

           3.       常用的机器学习相关的R包介绍

第二天

机器学习在生物医学中的应用案例分享

1.   机器学习在生物医学中的应用案例分享

1.1 利用机器学习方法筛选疾病相关的生物标志物

2.   机器学习+生存分析预测患病风险

2.1  机器学习+生存分析预测患者预后

3.    常用生物医学公共数据库介绍

3.1  TCGA数据库介绍

3.2   TCGA数据库下载RNAseq,miRNA-seq数据

3.3   TCGA临床数据下载

3.4  合并TCGA表达谱数据

4.    GEO数据库介绍

4.1  GEO数据库检索

           4.2  GEO数据下载

第三天

机器学习应用于TCGA公共数据,复现科研文章

1.   机器学习应用于TCGA公共数据,复现科研文章

1.1  差异表达分析

1.2  主成分分析(PCA)

1.3  火山图,热图绘制

1.4   GO和KEGG富集分析,柱形图,气泡图绘制

2.生存分析,生存曲线绘制

2.1  一致性聚类分析(ConsensusClusterPlus)

2.2   训练集,测试集拆分

3.     R语言简介  

3.1   单因素,多因素cox分析

3.2   Lasso回归分析

4.风险评估模型构建

5.riskscore计算

6.Nomogram模型构建

6.1时间依赖ROC曲线(Time-dependent ROC)

           6.2 矫正曲线,决策曲线绘制

第四天

机器学习应用于GEO公共数据,复现科研文章

1.  机器学习应用于GEO公共数据,复现科研文章

1.1 差异表达分析

1.2 主成分分析(PCA)

1.3 构建预测模型(SVM,RF,GLM)

2.   特征筛选及重要性评估

2.1 模型评估(ROC曲线绘制)

3.   构建nomogram模型

3.1  矫正曲线绘制

3.2  决策曲线绘制

4.   一致性聚类分析

          4.1 GSEA分析

第五天

ceRNA网格构建

1.  miRNA

2.  circRNA

3.  lncRNA的产生,作用机制,功能

4.  miRNA,circRNA,lncRNA相关数据库及工具介绍,使用及数据下载

5.  ceRNA案例分享

实操内容:

1. ceRNA网络构建(实操,基于R)

2. 差异mRNA,lncRNA,miRNA分析

3. 火山图,热图,聚类图,柱状图

4. 差异表达基因GO,KEGG富集分析,气泡图,柱状图,KEGG通路图展示

5. 生存分析,生存曲线绘制

6. mRNA,lncRNA表达相关性分析,相关性散点图

7. mRNA, lncRNA, miRNA网络构建

8. cytoscape展示,hub基因筛选

学员提问及讨论

部分案例图片:

Nature重磅综述;关于机器学习应用单细胞组学+RNA-seq,你想知道的都在这_第1张图片

Nature重磅综述;关于机器学习应用单细胞组学+RNA-seq,你想知道的都在这_第2张图片

(三)CADD计算机辅助药物设计课表内容

第一天

上午

背景与理论知识以及工具准备

1.PDB数据库的介绍和使用

1.1数据库简介

1.2靶点蛋白的结构查询与选取

1.3靶点蛋白的结构序列下载

1.4靶点蛋白的下载与预处理

1.5批量下载蛋白晶体结构

2.Pymol的介绍与使用

2.1软件基本操作及基本知识介绍

2.2蛋白质-配体相互作用图解

2.3蛋白-配体小分子表面图、静电势表示

2.4蛋白-配体结构叠加与比对

2.5绘制相互作用力

3.notepad的介绍和使用

3.1 优势及主要功能介绍

3.2 界面和基本操作介绍

3.3插件安装使用

下午

一般的蛋白-配体分子对接讲解

1.对接的相关理论介绍

1.1分子对接的概念及基本原理

1.2分子对接的基本方法

1.3分子对接的常用软件

1.4分子对接的一般流程

2.常规的蛋白-配体对接

2.1收集受体与配体分子

2.2复合体预构象的处理

2.3准备受体、配体分子

2.4蛋白-配体对接

2.5对接结果的分析

以新冠病毒蛋白主蛋白酶靶点及相关抑制剂为例

第二天

虚拟筛选

1.小分子数据库的介绍与下载

2.相关程序的介绍

2.1 openbabel的介绍和使用

2.2 chemdraw的介绍与使用

3.虚拟筛选的前处理

4.虚拟筛选的流程及实战演示

案例:筛选新冠病毒主蛋白酶抑制剂

5.结果分析与作图

6.药物ADME预测

6.1ADME概念介绍

6.2预测相关网站及软件介绍

6.3预测结果的分析

第三天

拓展对接的使用方法

1.蛋白-蛋白对接

1.1蛋白-蛋白对接的应用场景

1.2相关程序的介绍

1.3目标蛋白的收集以及预处理

1.4使用算例进行运算

1.5关键残基的预设

1.6结果的获取与文件类型

1.7结果的分析

以目前火热的靶点PD-1/PD-L1等为例。

2.涉及金属酶蛋白的对接

2.1 金属酶蛋白-配体的背景介绍

2.2蛋白与配体分子的收集与预处理

2.3金属离子的处理

2.4金属辅酶蛋白-配体的对接

2.5结果分析

以人类法尼基转移酶及其抑制剂为例

3.蛋白-多糖分子对接

4.1蛋白-多糖相互作用

4.2对接处理的要点

4.3蛋白-多糖分子对接的流程

4.4蛋白-多糖分子对接

4.5相关结果分析

以α-糖苷转移酶和多糖分子对接为例

4.核酸-小分子对接

4.1核酸-小分子的应用现状

4.2相关的程序介绍

4.3核酸-小分子的结合种类

4.4核酸-小分子对接

4.5相关结果的分析

以人端粒g -四链和配体分子对接为例。

操作流程介绍及实战演示

第四天

拓展对接的使用方法

1.柔性对接

1.1柔性对接的使用场景介绍

1.2柔性对接的优势

1.3蛋白-配体的柔性对接

重点:柔性残基的设置方法

1.4相关结果的分析

以周期蛋白依赖性激酶2(CDK2)与配体1CK为例

2.共价对接

2.1两种共价对接方法的介绍

2.1.1柔性侧链法

2.1.2两点吸引子法

2.2蛋白和配体的收集以及预处理

2.3共价药物分子与靶蛋白的共价对接

2.4结果的对比

以目前火热的新冠共价药物为例。

3.蛋白-水合对接

3.1水合作用在蛋白-配体相互作用中的意义及方法介绍

3.2蛋白和配体的收集以及预处理

3.3对接相关参数的准备

重点:水分子的加入和处理

3.4蛋白-水分子-配体对接

3.5结果分析

以乙酰胆碱结合蛋白(AChBP)与尼古丁复合物为例

第五天

分子动力学模拟(linux与gromacs使用安装)

1. linux系统的介绍和简单使用

1.1 linux常用命令行

1.2 linux上的常用程序安装

1.3 体验:如何在linux上进行虚拟筛选

2.分子动力学的理论介绍

2.1分子动力学模拟的原理

2.2分子动力学模拟的方法及相关程序

2.3相关力场的介绍

3.gromacs使用及介绍

重点:主要命令及参数的介绍

4.origin介绍及使用

第六天

溶剂化分子动力学模拟的执行

1.一般的溶剂化蛋白的处理流程

2.蛋白晶体的准备

3.结构的能量最小化

4.对体系的预平衡

5.无限制的分子动力学模拟

6.分子动力学结果展示与解读

以水中的溶菌酶为例

第七天

蛋白-配体分子动力学模拟的执行

1.蛋白-配体在分子动力学模拟的处理流程

2.蛋白晶体的准备

3.蛋白-配体模拟初始构象的准备

4.配体分子力场拓扑文件的准备

4.1 高斯的简要介绍

4.2 ambertool的简要介绍

4.3生成小分子的力场参数文件

5.对复合物体系温度和压力分别限制的预平衡

6.无限制的分子动力学模拟

7.分子动力学结果展示与解读

8.轨迹后处理及分析

以新冠病毒蛋白主蛋白酶靶点及相关抑制剂为例

部分模型案例图片

Nature重磅综述;关于机器学习应用单细胞组学+RNA-seq,你想知道的都在这_第3张图片

授课时间地点

单细胞及空间转录组课题设计与数据分析培训

2022.10.27—10.28晚上授课(19:00-22:00)

2022.10.29—10.30全天授课(9:00-11:30)—(13:30-17:00)

2022.11.1—11.2晚上授课(19:00-22:00)

机器学习在生物医学培训

2022.10.22—10.23全天授课(9:00-11:30)—(13:30-17:00)

2022.10.25—10.26晚上授课(19:00-22:00)

2022.10.29—10.30全天授课(9:00-11:30)—(13:30-17:00)

CADD计算机辅助药物设计专题培训班

2022.10.22 -----2022.10.23 全天授课(上午09.00-11.30 下午13.30-17.00)

2022.10.25-----2022.10.28 晚上授课(晚上19.00-22.00)

2022.10.29-----2022.10.30全天授课(上午09.00-11.30 下午13.30-17.00)

2022.10.31 -----2022.11.01晚上授课 (晚上19.00-22.00)

腾讯会议直播上课

报名费用

单细胞生物医学培训班

公费价:每人每班¥4680元 (含报名费、培训费、资料费)

自费价:每人每班¥4280元 (含报名费、培训费、资料费)

同时报名两个班8680元 (原价9360元)

CADD计算机辅助药物设计培训班

公费价:每人每班¥5880元 (含报名费、培训费、资料费)

自费价:每人每班¥5480元 (含报名费、培训费、资料费)

优惠1:提前报名缴费学员+转发到朋友圈或者到学术交流群可享受每人300元优惠(仅限15名)

优惠2:同时报名两个班免费赠送一个班(CADD、单细胞、生物医学任意报两班免费赠送一个班学习)

优惠3: 报名五个培训班以上包含五个,免费赠送三个培训名额

证书:参加培训并通过考试的学员,可以申请获得工业和信息化部工业文化发展中心颁发的“工业强国建设素质素养提升尚工行动”岗位能力适应评测证书。该证书可在中心官网查询,可作为能力评价,考核和任职的重要依据。评测证书查询网址:www.miit-icdc.org(自愿申请,须另行缴纳考试费500元/人)报名费用可开具正规报销发票及提供相关缴费证明、邀请函,可提前开具报销发票、文件用于报销 

培训福利

     报名缴费成功赠送机器学习生物医学-单细胞学习视频,参加本次课程的学员可免费再参加一次本单位后期组织的“单细胞及空间转录组课题设计与数据分析与机器学习在生物医学应用”相同的专题培训班(任意一期都可以)。课后学习完毕提供全程录像视频回放,发送全部课件资料及数据PPT,长期答疑,微信解疑群永不解散

授课方式

      通过腾讯会议线上直播,理论+实操的授课模式,老师手把手带着操作,从零基础开始讲解,800余页电子PPT和教程+预习视频开课前一周提前发送给学员,所有培训使用软件都会发送给学员,有什么疑问采取开麦共享屏幕和微信群解疑,学员和老师交流、学员与学员交流,培训完毕后老师长期解疑,培训群不解散,往期培训学员对于培训质量和授课方式一致评价极高    

腾讯会议问题实时解答

Nature重磅综述;关于机器学习应用单细胞组学+RNA-seq,你想知道的都在这_第4张图片

Nature重磅综述;关于机器学习应用单细胞组学+RNA-seq,你想知道的都在这_第5张图片

报名咨询请扫描下方微信二维码

Nature重磅综述;关于机器学习应用单细胞组学+RNA-seq,你想知道的都在这_第6张图片

电子邮箱:[email protected]

QQ:3541871068

报名电话/微信13838281574

对此内容感兴趣可点击关注公众号!长期发布各种科研培训,及前沿资讯!

Nature重磅综述;关于机器学习应用单细胞组学+RNA-seq,你想知道的都在这_第7张图片

卓昂研习社

“只要你足够优秀,在任何一个领域都会发光”

公众号

十、往期参会单位

有来自中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所)、西北民族大学、西南大学、中国人民解放军总医院第一医学中心、河南师范大学、南京工业大学、中国医学科学院基础医学研究所、青海省农林科学院、天津中医药大学第一附属医院、山东大学、黑龙江八一农垦大学、新疆农业大学、北京林业大学、滨州医学院烟台附属医院、中国环境科学研究院、云南师范大学、昆明理工大学、湖北医药学院、苏州大学、内蒙古科技大学包头师范学院、乌鲁木齐市疾病预防控制中心、鲁东大学、河北工程大学、复旦大学上海医学院、陕西中医药大学附属医院、中国医学科学院血液病医院(中国医学科学院血液学研究所)、中国科学院深圳先进技术研究院、北京阅众时刻文化传媒有限公司、亦欣生物科技无锡有限公司、张家口泽涵生物科技有限公司、平安科技、广西医科大学、广州市肖悦生物科技有限公司、北京慧康健怡医疗器械有限公司、中山大学、中国医学科学院北京协和医院、江南大学、滨州医学院、宁波大学附属人民医院、华南师范大学、深圳北京大学香港科技大学医学中心、南方医院、浙江省立同德医院、福建省立医院、中南大学湘雅医院、深圳市中医院、北京普利智诚生物技术有限公司、湖南文理学院、中国农业科学院兰州畜牧与兽药研究所、杭州奥明基因科技有限公司、重庆医科大学附属第二医院、湖北医药学院、加州伯克利大学、启元实验室、南昌大学第二附属医院、天津市肿瘤医院、中国科学院上海营养与健康研究所、宁波市第一医院、中国林业科学研究院林业研究所、河南科技学院、陆军特色医学中心、南方医科大学珠江医院、首都医科大学附属北京妇产医院、湖南文理学院、省立同德医院、福州大学、University of Bristol (布里斯托大学)、空军军医大学第一附属医院、北京大学第一医院。感谢对我们培训的认可!还有许多因为时间冲突无法参加。这次我们诚挚邀请您来参加!

                                 报名参会流程

Nature重磅综述;关于机器学习应用单细胞组学+RNA-seq,你想知道的都在这_第8张图片

引用往期参会学员的一句话: 

发现真的是脚踏实地的同时  需要偶尔仰望星空

          非常感谢各位对我们培训的认可!  祝愿各位学业事业有成!

Nature重磅综述;关于机器学习应用单细胞组学+RNA-seq,你想知道的都在这_第9张图片

你可能感兴趣的:(大数据,编程语言,人工智能,机器学习,数据分析)