生物信息学-张红-三四五章

记住: 界、门、纲、目、科、属、种

后三节:模式生物、构成生物的四类分子、分子生物学的中心法则

模式生物

噬菌体--病毒--大肠杆菌--酿酒酵母--秀丽线虫--果蝇--拟南芥--水稻--非洲爪蟾--斑马鱼--家鼠--人

构成生物的四类分子

糖、脂肪酸、核苷酸、氨基酸

小分子:单糖、双糖、脂肪酸、核苷酸、氨基酸

大分子:【多糖、淀粉、糖原、纤维素、】【核糖核酸RNA、脱氧核糖核酸DNA】、【蛋白质】

单糖、双糖和多糖
糖类是碳水化合物,
单糖包括葡萄糖、果糖、半乳糖
麦芽糖由两个葡萄糖组成,蔗糖是葡萄糖和果糖,乳糖由葡糖糖和半乳糖组成

脂肪酸

脂肪酸不能形成大分子,是脂肪、油、磷脂的结构成分

分子生物学的中心法则

DNA复制、DNA到mRNA的转录、mRNA的反转录与cRNA、蛋白质的剪接、蛋白质折叠

数据库

一级数据库

直接来源于试验获得的原始数据,只经过简单的归类、整理和注释

包括:一级核酸数据库、一级蛋白质序列数据库、一级蛋白质结构数据库

数据库记录由原始序列数据、描述这些数据生物学信息的注释组成
    世界三大核酸序列数据库:欧美日,美GenBank,欧EMBL,日DDBJ
数据库格式:文字注释+内容

GenBank和EMBL数据库格式和内容:
内容:序列、序列的{名称、长度、日期、说明、编号、版本号、特征表}、物种的{来源、学名、分类学位置}、相关文献的{作者、题目、刊物、日期}、碱基组成
GenBank格式:LOCUS RATOBESE
二级数据库

在一级数据库、实验数据和理论分析的基础上,针对不同的研究内容和需要,对生物学知识和信息进一步整理得到的数据库。

第五章 生物序列相似性搜索

相似性和同源性

相似性指一种很直接的数量关系(量化关系);同源性指从一些数据中推断出的两个基因或蛋白质序列具有共同祖先的结论,属于质的判断。序列的相似性和序的同源性有一定关系,一般来说序列间的相似性越高,同源性的可能就越高。

序列相似性比较:将待研究序列和DNA或蛋白质序列库进行比较,用于确定该序列的生物属性,找出与此序列相似的已知序列是什么。

序列同源性比较:将待研究序列加入到一组与之同源,但是不同物种的序列中进行多序列同时比较,确定该序列和其他序列间的同源性大小。

Alignment:
序列对位排列,对位排列是通过在序列中插入间隔的方法使所比较的序列长度达到一致。
目的是寻找同原序列,对位排列的作用是使序列间的想似程度最大
全局排列,局部排列
Score
相似性积分,打分矩阵作为序列相性测度,以便计算机自动处理序列对位排列问题。

你可能感兴趣的:(生物信息学-张红-三四五章)