06.如何选取数据集

选取什么样的变异位点?

name 111 222 333 444
aaa bbb ccc ddd eee
fff ggg hhh iii 000
  1. 根据项目的目的,我们需要探索的其实是SNP之间的关联,落在什么通路上。
Hugo_Symbol     Entrez_Gene_Id  Center  NCBI_Build      Chromosome      Start_Position  End_Position    Strand  Variant_Classification  Variant_Type
TEKT4   150483  BI      GRCh38  chr2    94876716        94876716        +       Missense_Mutation       SNP     A       A       G
TKTL2   84076   BI      GRCh38  chr4    163473615       163473615       +       Silent  SNP     C       C       T 
MIR8078 102466878       BI      GRCh38  chr18   109358  109358  +       3'Flank SNP     T       T       C
FLT3    2322    BI      GRCh38  chr13   28028203        28028203        +       Missense_Mutation       SNP     G       G       T  
TMEM119 338773  BI      GRCh38  chr12   108592157       108592157       +       Frame_Shift_Del DEL     C       C       -

你可能感兴趣的:(06.如何选取数据集)