perl模拟癌症细胞测序

整体思路

与前面的测序文章相同,忘记了可以向前翻。可以说唯一的区别就是在于变异有很大不同。只要将癌细胞的变异理解,模仿,在简单修改之前的代码基本就算可以了。

癌细胞的变异

普通细胞有原癌基因和抑癌基因,在抑癌基因被破坏时,就产生了癌细胞,但正常的SNP和Indel是很难破坏基因的,除非是大量的SNP、Indel或者另外一种变异fusion。

介绍下fusion

fusion中文翻译为基因融合,然后fusion分为两种人工的和自然的。癌症的导致当然是由于自然的fusion。自然fusion有主要指染色体变异。

染色体易位

易位是指一条染色体的某一片段移接到另一条非同源染色体上,从而引起变异的现象。如果两条非同源染色体之间相互交换片段,叫做相互易位,这种易位比较常见。

染色体倒位

指某染色体的内部区段发生180°的倒转,而使该区段的原来基因顺序发生颠倒的现象。

染色体缺失

缺失是指染色体上某一区段及其带有的基因一起丢失,从而引起变异的现象。

染色体重复

染色体上增加了相同的某个区段而引起变异的现象,叫做重复。

与SNP和Indel的不同

SNP和Indel都是碱基对的变异,算是量变,而fusion则是质的变化。SNP与Indel的变异十分普遍但是危害小,fusion发生概率小但是危害大。

测序流程

参考之前的模拟Illumina测序的思路就行。

你可能感兴趣的:(perl模拟癌症细胞测序)