生物信息学笔记-术语篇

皮尔逊相关系数

它是一种度量两个变量间相关程度的方法。它是一个介于 1 和 -1 之间的值,其中,1 表示变量完全正相关, 0 表示无关,-1 表示完全负相关。

怎样解读spss皮尔逊 P值和r值?

r值就是皮尔逊相关系数的大小,代表了相关的强度,即两个变量共变性的程度,取值范围为(-1,1)。

p值是显著性,与皮尔逊相关显著性检验有关,P<0.05时表示相关显著,即在当前的样本下可以明显的观察到两变量的相关,两个变量的相关有统计学意义。

箱线图

能提供有关数据位置和分散情况的关键信息,尤其在比较不同的母体数据时更可表现其差异。


生物信息学笔记-术语篇_第1张图片
箱线图信息

如上图所示,标示了图中每条线表示的含义,其中应用到了分位值(数)的概念。


Kaplan-Meier生存曲线

随访研究,如对 某人群进行跟踪,直至出现一个特殊事件或终点,如死亡、癌症复发等,对所有研究对象从某特定时间点开始追踪,记录出现特殊事件的时间。通常,当所有研究对 象出现该事件时研究才结束,但也有些研究对象可能失访,或者研究提前结束,这样就有一些对象的结局未知,对这些对象记录跟踪的时间(截尾数据)。

假设检验中的P值

假设检验是推断统计中的一项重要内容。用SAS、SPSS等专业统计软件进行假设检验,在假设检验中常见到P值( P-Value,Probability,Pr),P值是进行检验决策的另一个依据。

P值即概率,反映某一事件发生的可能性大小。统计学根据显著性检验方法所得到的P 值,一般以P < 0.05 为显著, P<0.01 为非常显著,其含义是样本间的差异由抽样误差所致的概率小于0.05 或0.01。实际上,P值不能赋予数据任何重要性,只能说明某事件发生的机率。

主要包含六个数据节点,将一组数据从大到小排列,分别计算出他的上边缘,上四分位数Q3,中位数,下四分位数Q1,下边缘,还有一个异常值。

生存分析中的p值

是表示这两组之间的生存率是否有差异。

因为一般生存分析研究的都是一个实验组的治疗方法之类的, 一个对照组的传统方法之类。通过生存分析对比,可以发现两组生存率之间是否存在差异,继而说明两种实验处理是否有差异,或者哪种处理更有效

是整体比较,比如你的生存时间是5年的,那自然是比较整体5年下来的生存率,如果你的生存时间是10年的跟踪数据,那自然是比较整体10年下来的生存率。

生存分析比较的生存率,本来就是一个整体一段时间持续下来的生存率,而不是单个时间点的生存率

数据的标准化与中心化

数据标准化是指:数值减去均值,再除以标准差;所谓中心化, 是指变量减去它的均值.

免疫印迹(immunoblotting)

又称蛋白质印迹(Western blotting),是一种借助特异性抗体鉴定抗原的有效方法。该方法是在凝胶电泳和固相免疫测定技术基础上发展起来的一种新的免疫生化技术,既具有凝胶电泳的高分辨率又具备固相免疫测定的高特异性和高灵敏性,可检测1-5ng的中等大小蛋白。其优点是方法简便、标本可长期保存、结果便于比较,故被广泛应用于分子生物学等领域,成为一种常用的一种研究方法。

生物学中的保守性

保守性一般是在进化理论中应用较多,“保守性好”指的是发生突变的几率低。以蛋白为例,一般用于进化或物种亲缘关系分析的蛋白都含有可变部分——非保守区,和稳定部分——保守区。

真核基因表达调控的顺式作用元件

顺式作用元件(cis-acting element)是指DNA分子上对基因表达有调节活性的特定核苷酸序列。顺式作用元件的活性只影响同一DNA分子上的基因。这种DNA序列多位于基因上游或内含子中。

真核基因的顺式作用元件按其功能可以分为:启动子、增强子和静止子。

启动子的结构和功能

启动子是转录因子和RNA聚合酶的结合位点,位于受其调控的基因上游,邻近基因转录起始点,是基因的一部分。

增强子的结构和功能

增强子(enhancer),又称强化子(transcriptional enhancer),是一种远端调控元件,至少距转录起始点上游100bp以上,通常位于-700~-1000处,所以又称为上游激活序列(upstream activator sequence, UAS)。

增强子也要通过与特定的蛋白质因子(转录因子)结合而实现其对转录的增强作用。

静止子

是一种类似增强子但起负调控作用的顺式作用元件。有人称为沉默基因。静止子与相应的反式作用因子结合后,可以使正调控系统失去作用。

真核基因调控的反式作用因子

不论是启动子还是增强子序列,他们的转录调节功能都是通过与特定的DNA结合蛋白的相互作用而实现的。

真核生物的RNA聚合酶与原核生物的RNA聚合酶不同,它本身不能启动转录,纯化了的真核生物RNA聚合酶在体外是不能启动转录的。因此必须事先有一套转录因子装配到启动子上,RNA聚合酶才能启动转录。

这些转录因子一般并不是RNA聚合酶的组成成分。

能直接或间接识别各种顺式调控元件并与之结合从而调控基因转录效率的各种蛋白质分子称为反式作用因子 (trans-acting factor)。

能激活真核生物基因转录的蛋白质称为转录因子(transcription factor, TF)。转录因子是参与正调控的反式作用因子,是转录起始过程中RNA聚合酶所需要的辅助因子。

免疫印迹

是根据抗原抗体的特异性结合检测复杂样品中的某种蛋白的方法。
将混合抗原样品在凝胶板上进行单向或双向电泳分离, 然后取固定化基质膜与凝胶相贴。在印迹纸的自然吸附力、电场力或其它外力作用下, 使凝胶中的单一抗原组份转移到印迹纸上, 并且固相化。最后应用免疫覆盖液技术如免疫同位素探针或免疫酶探针等, 对抗原固定化基质膜进行检测和分析。

小干扰RNA(Small interfering RNA;siRNA)

有时称为短干扰RNA(short interfering RNA)或沉默RNA(silencing RNA),是一个长20到25个核苷酸的双股RNA,在生物学上有许多不同的用途。

CpG

CpG表示核苷酸对,其中G在DNA链中紧随C后。CpG对很少出现在人类基因中。然而,在许多基因的启动子(promotor)或转录起始位点(transcription start site,TSS)区域周围,甲基化经常被抑制。这些区域包含浓度相对较高的CpG对,与染色体一起称作CpG岛,其长度通常在几百到几千核苷酸的长度内变化。

CpG岛(CpG island)

CpG双核苷酸在人类基因组中的分布很不均一,而在基因组的某些区段,CpG保持或高于正常概率,这些区段被称作CpG岛,在哺乳动物基因组中的1~2kb的DNA片段,它富含非甲基化的CpG双倍体。

阳性和阴性选择

所谓阴性和阳性指的是细胞生存下来的条件。阳性选择指的是只有反应的细胞才能生存,否则凋亡。阴性选择指的是只有不反应的细胞才能生存,否则凋亡。

对于B细胞来说

阴性选择指的是只有在骨髓发育中不予自身抗原反应的B细胞才能生存;阳性选择指的是在外周在体细胞高频突变的过程中能高亲和力识别T细胞提呈的B细胞才能增殖。B细胞是先阴选后阳选

对于T细胞来说

阳性选择指的是只有在胸腺皮质发育中识别MHC分子的T细胞才能生存;阴性选择指的是只有在胸腺髓质发育中不予自身抗原反应的T细胞才能生存;T细胞是先阳选后阴选


微卫星(microsatellite)

一般指基因组中由短的重复单元(一般为1~6个碱基)组成的DNA串联重复序列。

微卫星DNA符合孟德尔遗传模式,共显性表达,广泛分布于真核生物的基因组中,包括编码区和非编码区.研究表明,可能是DNA复制过程中的“链滑”(strand slippage)现象造成微卫星DNA多态性信息容量(polymorphic information content, PIC)较高.

由于微卫星具有数量多、在基因组内分布均匀、多态性信息丰富、易于检测等优点被作为优良的遗传标记(genetic marker)而得到广泛应用。

根据重复单元的构成与分布,微卫星DNA序列被分为3种类型:单一型(pure),复合型(compound)和间断型(interrupted), 例如:

单一型:ATATATATATATATATATATATAT

复合型: ATATATCACACACACACACAC

间断型: ATATATCA ATATATCA ATATATA

遗传图谱

某一物种的染色体图谱(也就是我们所知的连锁图谱),显示所知的基因和/或遗传标记的相对位置,而不是在每条染色体上特殊的物理位置。由遗传重组测验结果推算出来的、在一条染色体上可以发生的突变座位的直线排列(基因位点的排列)图。

遗传图谱即遗传连锁图谱,是基因组研究中的一个重要组成部分,它是指基因组中基因以及专一的多态性标记之间相对位置的图谱。即通过两点测验和三点测验对统计的各种带型个体数进行连锁分析计算,建立连锁群。也可从第二个标记开始,测验与前一个标记是否协同分离。根据分离资料,用最大似然法估计不同标记位点间的重组率数值并转换成遗传距离,连锁的遗传标记间距离,一般用cM表示,IcM为同源染色体配对期望交换值1%的染色体长度。随着计算机技术的发展,目前已有多个构建遗传图谱的软件,研究者用的较多的软件主要有MapMaker及 JoinMap 3.0 。


Spike-in Control:添加/加入(某种物质)的对照(组)

在某些情况下,待检验样本中不含待测物质或者含有但是浓度很低,为了证明自己建立的方法能对样本中待测物质进行有效的检测,可在待检样本中加入一定量的待测物质(外标)来进行该方法检测能力的验证。有时,这种加入外标的物质,也可用作为阳性对照。

Genetic Mosaic

In genetics, a mosaic, or mosaicism describes the presence of two or more populations of cells with different genotypes in one individual, who has developed from a single fertilized egg.Mosaicism has been reported to be present in as high as 70% of cleavage stage embryos and 90% of blastocyst-stage embryos derived from in vitro fertilization.

全基因组扩增(whole genome amplification, WGA)

WGA是一组对全部基因组序列进行 非选择性扩增的技术,其目的是在没有序列倾向性的前提下大幅度增加 DNA 的总量。其中最具代表性方法是 DOP-PCR 和 PEP-PCR。 DOP-PCR 和 PEP-PCR 的基本原理都是通过其随机引物与基因组 DNA 多处退火从而使大部分基因组序列得到扩增。DOP-PCR 的引物是由其 3′和 5′端的特异核苷酸序列和中间的 6 个核苷酸构成的随机引物组成。PEP-PCR 的引物是由15 个随机核苷酸组成的完全随 机引物。

你可能感兴趣的:(生物信息学笔记-术语篇)