文章烂尾了烂尾了

不知道为什么,文章写点东西就会自动白屏,浏览器显示一直在刷新。手动刷新后东西倒是没丢,就是体验极其不好。清除cookie也没用,难道还能是我的edge的问题?
这号算是烂尾了,只能把最近捣鼓的一点东西随便发发。本来是想记录下自己搞生信的技术上的成长,但是人确实是越来越懒了,而且做生信就这点技术,讲真其实微不足道,和运维差不多。还是得靠讲故事。只是自己学历摆在这里,只能算打打杂了。


ichorCNA相关

方法0:
这个方法并未在官方wiki提及,但是conda上确实有,并且指向一个分支

conda install -c bioconda r-ichorcna

似乎是官方维护者开的分支,conda和docker都能装?但是conda我安装还是失败了,docker没试

image.png

R Ichorcna :: Anaconda.org

方法一(放弃):

install.packages("devtools")
library(devtools)
install_github("broadinstitute/ichorCNA")

报错:
fatal error: hb-ft.h: No such file or directory
似乎是devtools依赖的一个包,用conda安装的R装包时,会找不到系统底层啥文件
error in install.packages('textshaping'):fatal error: hb-ft.h: No such file or directory · Issue #31 · r-lib/textshaping (github.com)

方法二:
Checkout the latest release of ichorCNA from GitHub

git clone [email protected]:broadinstitute/ichorCNA.git

install from CRAN

install.packages("plyr")

install packages from

source("https://bioconductor.org/biocLite.R")
BiocManager::install("HMMcopy")
BiocManager::install("GenomeInfoDb")
BiocManager::install("GenomicRanges")
Install the ichorCNA R package

from the command line and in the directory where ichorCNA github was cloned.

R CMD INSTALL ichorCNA
https://zhuanlan.zhihu.com/p/454666519


室间质评——HGVS格式转换与调整

室间质评结果上传时,发现一个突变的填写比较特别
(EGFR p.Leu747_Ala750delinsPro)。
由于比对软件的del都是左对齐,即默认的表示如下

------转录本方向--->
REF:GGAATTAAGAGAAG
ALT:G---------GAAC
而根据hgvs(NCCL上报原则)的表示原则,所有的del都应该认为发生在转录本的3’。即:
------转录本方向--->
REF:GGAATTAAGAGAAG
ALT:GGAA---------C
这使得两个突变合并为一个。对于这种情况,在github找了下,没找到有工具能完全地自动完成此转换。估计,只可能做一个字典,用遇见一个,改一个的做法。(或者自己写个blast,从选择的转录本的5'到3',重新比对。也是挺麻烦的)
详细问题在github的bcftools提了issue,希望bcftool的大佬能早日实现
github


热点突变探究

DoCM是一个高度策划的已知致病突变数据库,它提供了易于探索的变体列表,并直接链接到源引文以便于验证。这个数据库(http://www.docm.info/downloads)收集了网上各种开源数据库的突变信息及其对应的支持文献(不包括cosmic/onckb这些商用付费数据库)。应该可以作为热点突变的位点的集合。但此数据库并不包含用药指导等相关信息(如FDA是否批准,是否有指南提示。)并且逻辑上,如果一个位点是用药靶点,但是并不致病,该数据库可能也没有。
DoCM数据来源有

  • Kin-Driver
  • WashU hematologic malignancy mutation list
  • Literature
  • Drug Gene Knowledge Database
  • CIViC Knowledgebase
  • Pan-cancer recurrent hotspots
  • My Cancer Genome
  • Oncomap Variants

使用mutect2的一些建议

Single-sample Mutect2 optimization recommendation – GATK --- 单样本Mutect 2优化建议- GATK (broadinstitute.org)
(slippage,haplotype,clustered_events 即使是室间质评样本去除这三个标签的变异也会造成假阴性)

你可能感兴趣的:(文章烂尾了烂尾了)