生物信息软件综合实践学习笔记

学习资料是现代生物学研究基础,以下是一些学习记录。

1基础知识

实验室安全等级划分

  • BSL1微生物:是已知所有特性,危害较低,不致病的微生物
  • BLS2微生物:采用P2防护,主要防护措施为二级生物安全柜和防护服
  • BSL3微生物:是易传播,严重致病甚至致命,虽有预防和治疗措施,但危害巨大的微生物
  • BLS4微生物:是最高危险类别的微生物,这类微生物没有明确的已知预防和治疗措施,具有高度危害性并致命,通常通过气溶胶途径传播或传播途径不明

实验动物福利与伦理概述

实验动物:
经人工培育、对其携带的微生物实行控制、遗传学背景明确或来源清楚,用于科学研究、教学、生物制品或药品鉴定及其他科学实验的动物。

实验动物福利:
是指人类保障实验动物健康和快乐生存权利的理念及其所提供的相应外部条件的总和。

实验动物福利涵盖的因素:

  • 动物自身因素:种类 遗传 性别 年龄
  • 环境因素:温度 湿度 换气次数 光照周期 噪音和粉尘
  • 营养因素:实验动物营养需求与饲料平衡 饲料口感与口味 饲料卫生与储存 饲喂方式
  • 技术因素:保定 麻醉 给药技术 手术 术后护理 采样 检测 安死术

SCI介绍

1.三大科技文献检索系统

SCI:科学引文索引
包括五种索引:引文索引
专利引文索引
来源索引
单位/机构索引
轮排主题索引

ISTP:科技会议索引
EI:工程索引

2.相关术语

  • JCR:《期刊引用报告》Journal Citation Reports
  • Quartile:四分位数 一般划分为四个等级 Q1-Q4
  • IF:某刊前两年发表论文在该年的被引用次数/该刊前两年发表论文总数

3.JCR期刊分区

  • JCR期刊分区:Q1、Q2、Q3、Q4
  • 中科院期刊分区:1区、2区、3区、4区

4.常见顶级期刊

  • Nature
  • Science
  • Cell
  • PNAS
  • JACS
  • ANGEW
  • Cell Research

5.主要英文数据库

  • WSci-Finder
  • PubMed
  • HighWire Press
  • Blackwell
  • Elsevier
  • Springer
  • Wiley
  • RSC
  • ACS

6.文献查阅简介

  • Web of Science

7.文献阅读解析

  • 题目
  • 作者
  • 作者信息
  • 摘要
  • 关键词
  • 介绍
  • 实验
  • 结果和讨论
  • 总结
  • 致谢
  • 参考文献

8.主要数据库

  • NCBI
  • JGI
  • KEGG
  • EBI/DDBJ

9.蛋白质分析

蛋白质特征预测:expasy
跨膜区域测试工具:TMHMM Serve
蛋白质预测:
PREDICT
PROTEIM
GO
蛋白质功能预测:
KEGG
MetacYS
InterPro
String
解析蛋白功能(酶数据库):
Enzyme Portal
BRENDA
ExplorEnz
M-CSA
解析蛋白功能:SWISS-MODEL
CATH

2利用在线工具做生物信息学分析

2.1在线设计和验证引物

  • 如何快速了解实验室课题方向
  • 在线设计引物和验证引物
  • 基因/蛋白质序列获取与比对
  • 蛋白功能注释
  • 蛋白功能富集分析
  • 基因组学及组学数据分析流程

获取信息的几种方式

  • 搜索网站:必应
  • 视频网站:小破站
  • 查询相关SCI文献:NCBI-Pubmed
  • GeneCards:人基因信息最全面的网站
    自动集成来自约150个web源的以基因为中心的数据,包括基因组、转录组学、蛋白质生物学、遗传、临床和功能信息。包括:基因别名(Aliases)、疾病、蛋白、药物、定位、物种同源性、通路与作用等信息。

在线设计引物

  1. 查询相关SCI文献 IF=5.0以上
  2. 引物数据库Primerbank:链接: https://pga.mgh.harvard.edu/primerbank/
    公司数据库:链接: https://www.origene.com/
  3. NCBI在线设计和验证Primer Blast
  4. 软件设计

利用BLAST在线设计引物

  • NCNI官网获得基因序列或cDNA序列
    基因序列用于普通PCR扩增,cDNA序列用于qPCR扩增,即荧光定量PCR
  • 设计引物
  • 挑选合适的引物
  • 验证引物特异性

具体操作,以ERBB2为例:

2.2基因/蛋白质序列比对与获取

多条序列之间的比对

以ACE2为例:

  1. 从NCBI网站得到3个物种的ACE2蛋白质序列(也可能是其他来源的几种序列)
  2. 判断DNA/RNA/蛋白质的保守性
  3. 利用在线比对工具QlustalO做多序列比对

2.3蛋白功能注释

功能富集分析:在某一特定基因子集合中,多个基因共同参与的Pathway通路,与标准背景相比,是否比例升高、具有统计显著性。

注释工具:KOBAS

测序基因
差异基因表达
富集分析
基础实验

进行富集分析及可视化的工具

  • GeneCodis
  • Metascape

1.GO数据库:大部分基因执行哪些功能

  • MF 分子功能
  • BP 生物学过程
  • CC 细胞组分

2.KEGG数据库:他们参与的信号通路有哪些

PATHWAY数据库涵盖:代谢通路、调控通路、信号传导通路

  • 代谢
  • 遗传信息处理
  • 环境信息处理
  • 细胞过程
  • 有机系统
  • 人类疾病
  • 药物开发

如何理解KEGG代谢通路

  • 长方形的黑色框代表基因或蛋白质
  • 小圆圈代表化学分子
  • 弧形的框表明其他的信号通路
  • 黑色箭头表明激活
  • 垂直线表示抑制
  • 虚线箭头表示两者之间发生间接作用
  • 加p和减p表示磷酸化和去磷酸化
  • 加g和减g表示糖基化和去糖基化

2.4基因组学及基因组学分析流程

基因组学是采用DNA测序等技术和生物信息学方法研究基因组序列、结构和功能的学科。

转录组测序技术介绍

转录组:广义上指某一生理条件下,细胞内所有转录产物的集合,包括mRNA、核糖体RNA、转运RNA及非编码RNA;狭义指所有mRNA的集合。
RNA-seq:指针对某一特定时期、特定条件下转录的所有mRNA进行高通量测序。
从头测序技术是对未知基因组的物种进行基因测序。

组学数据分析1—基因表达量定量

clean reads比对到基因组序列上,计算各个样品的基因表达水平,标准化的目的是去除测序数据的技术偏差:测序深度和基因长度。

  • 测序深度:同一条件下,测序深度越深,基因表达的read读数越多
  • 基因长度:同一条件下,不同的基因长度产生不对等的read读数,基因越长,该基因的read读数越高

组学数据分析2—PCA主成分分析

  • 处理组和对照组会有3个以上生物学重复
  • PCA主成分分析方便找出离群样品、判别相似性高的样品簇等
  • 将多个变量通过降维为少数几个相互独立的变量(即主成分),同时尽可能多地保留原始数据信息的一种多元统计分析方法

组学数据分析3—差异基因表达(火山图 热图)

有生物学重复的利用软件DEAeq,筛选条件是:padj<0.05&|log2(FoldChange)|>1,火山图X轴代表log2转换后的差异倍数值,Y轴代表-log10转换后的显著性值;热图用来批量展示组件差异的基因,颜色深浅代表表达量高低。

组学数据分析4—富集分析(条形图 气泡图)

基因表达量从高到低排序,可以从图中直观反映。

你可能感兴趣的:(生信知识,学习,人工智能)