生物信息学中用到的计算机知识,生物信息学期末复习知识点总结

生物信息学:利用数学、物理、化学的理论、技术和方法,以计算机为工具,对生命现象加以研究,得到深层次的生物学知识。

研究任务:收集与管理生物分子数据,对数据进行处理分析,为其它生物学研究提供服务

四大“模式生物”:酵母、线虫、果蝇、小鼠

糖的生物功能,作为燃料(是生命活动所需的能源),重要的中间代谢物,参与生物大分子组成,作为信号分子

脂类的生物功能,构成生物膜的骨架,储存能量(效率是糖的2倍左右),构成生物表面的保护层、保温层,重要的生物学活性物质蛋白质的生物功能,是遗传信息转化成生物结构和功能的表达者;参与基因表达的调节,以及细胞中氧化还原反应、电子传递、神经传递、学习记忆等重要生命过程;酶(一类重要的蛋白质)在细胞和生物体内各种生化反应中起催化作用;

蛋白质的空间结构

一级结构(primary structure)多肽链中氨基酸数目、种类和线性排列顺序

二级结构(secondary structure)氢键形成?-螺旋(? -helix)链间形成?-折叠(?-sheet)

三级结构(tertiary structure)肽链进一步沿多方向盘绕成紧密的近似球状结构

四级结构(quaternary structure)具有特定构象的肽链进一步结合,并在空间相互作用检索方法:1)追溯法:通过已知文献后附有的参考文献中提供的线索来查找文献。(2)常用法:利用各种检索工具来查找文献。(3)循环法:是将常用法和追溯法交替使用的一种综合文献检索方法。

(4)浏览法:是从本专业期刊或其它类型的原始文献中直接查阅文献资料。

检索途径:着者途径:分类途径:主题途径:其它途径;

检索过程:(1)分析研究课题(2)制定检索策略(3)查找文献线索(4)获得原始文献大规模基因组DNA测序:

鸟枪法( Shot-gun sequencing)方法:借助物理或化学的手段将整个基因组随机打断成一定大小的片段进行测序,再根据序列间的重叠关系进行计算机排序与组装,确定它们在基因组中的位置。

适用范围:主要用于重复序列少、相对简单的原核生物基因组的测序工作。不适用于分析较大的、更复杂的基因组。优点:速度快、简单易行、成本低

克隆重叠群法(clone contig sequencing)方法:先将染色体打成比较大的片段(几十-几百Kb),利用分子标记将这些大片段排成重叠的克隆群,分别测序后拼装。需要绘制物理图谱,以鸟枪法为基础。适用范围:较大的、更复杂的基因组

蛋白质结构解析:X射线晶体衍射;核磁共振波谱学

其他方法:扫描隧道电子显微镜–圆二色谱一级数据库:直接来源于实验获得的原始数据,只经过简单的归类、整理和注释。

二级数据库:在一级数据库、实验数据和理论分析的基础上,针对不同的研究内容和需要,对生物学知识和信息的进一步整理得到的数据库。

序列比较的根本任务是:通过比较生物分子序列,发现他们之间的

相似性,找出序列之间共同的区域,同时辨别序列之间的差异。

同源性:是指序列们是由共同祖先进化而来,讲两条序列的同源关系,只有两种情况:同源、不同源。相似性:指序列间的差别,是一个度量。

同源与相似的关系:一般认为序列相似性达到一定程度,即可认为是同源,但不绝对。序列比对算法实现:点阵分析:寻找序列间可能的性状对位排列;寻找蛋白质、DNA序列中正向或反向重复;预测RNA中自补区域;直观,整体水平;动态规划算法:精确而全面,非常耗费资源;启发式算法

滑动窗口技术:使用滑动窗口代替一次一个位点的比较是解决这个问题的有效方法。

动态规划算法计算过程:1计算过程从d 0 ,

你可能感兴趣的:(生物信息学中用到的计算机知识)