用GDSC数据库的结肠癌细胞系数据来计算基因与IC50的相关性

11111.PNG

目的是重复上图。

背景知识

氟尿嘧啶:5-氟尿嘧啶在体内转化成氟脱氧尿嘧啶( FdUMP )是dUMP的类似物,与胸苷酸合酶发生不可逆的结合,抑制其活性。另外5-FU还可以转化成5-氟尿嘧啶核苷整合进RNA或者DNA,阻碍蛋白质的合成或者RNA发挥作用。


fu.PNG

MSI (microsatellite instability)是微卫星不稳定
MMR(mismatch repair)是指基因错配修复功能
人类错配修复基因(MMR基因)经转录翻译后可表达相应的错配修复蛋白,如果任一MMR蛋白表达缺失可造成细胞的错配修复功能缺陷,则对DNA复制过程中的碱基错配丧失修复功能而造成累积,导致微卫星不稳定(MSI)的发生,约15% 的结直肠癌是经由MSI途径引发的。MSI分为高度不稳定(MSI-H)、低度不稳定(MSI-L)和稳定(MS-S);MMR分为错配修复功能缺陷(dMMR)和错配修复功能完整(pMMR)。dMMR等同于微卫星高度不稳定(MSI-H), pMMR则等同于微卫星低度不稳定(MSI-L)或微卫星稳定(MSS)。

step1 下载数据

进入GDSC数据库(链接),进入下载界面,下载所需文件:

  • Annotated list of Cell lines 所有的细胞系注释信息 文件名:Cell_Lines_Details
  • log(IC50) and AUC values 所有细胞系和药物组合的IC50和AUC值(Natural log half maximal inhibitory concentration (IC50) and Area under the dose-response curve (AUCs) values)文件名:v17.3_fitted_dose_response
  • RMA normalised expression data for Cell lines 细胞系的基因表达数据(基因ID是ENSMBL) 压缩包

step2 整理数据

根据细胞系注释信息在EXCEL中筛选出CRC细胞系,并将其分开成MSS和MSI


CRC.PNG

根据细胞系与药物的数据筛选出5-FU处理的细胞系


5fu.PNG

根据细胞系基因表达数据整理出目标基因的表达数据
gene.PNG

每个数据都有带identifier便于后续数据间的合并

step3 合并数据(R语言)

setwd("D:\\GDSC")
crc=read.table("CRC.txt",sep="\t",header=T,check.names=F)
fu=read.table("celllines-5-fu.txt",sep="\t",header=T,check.names=F)
total=merge(crc,fu,by='CELL_LINE_NAME')
write.table( t, file="t.txt",sep="\t",quote=F,row.names=F)
t=read.table("t.txt",sep="\t",header=T,check.names=F)
MSS=read.table("MSS.txt",sep="\t",header=T,check.names=F)
MSI=read.table("MSI.txt",sep="\t",header=T,check.names=F)
exp=read.table("exp.txt",sep="\t",header=T,check.names=F)
TET2=read.table("TET2.txt",sep="\t",header=T,check.names=F)
MSITET2=merge(MSI,TET2,by='identifier')
write.table( MSITET2, file="MSITET2.txt",sep="\t",quote=F,row.names=F)
MSSTET2=merge(MSS,TET2,by='identifier')
write.table( MSSTET2, file="MSSTET2.txt",sep="\t",quote=F,row.names=F)

step4 作图(Graphpad)

利用graphpad绘制基因与IC50的散点图,并做线性拟合,计算相关系数(pearson)


KDM4CMSS.PNG

KDM4CMSI.PNG

参考文献:
Ou J, Peng Y, Yang W, et al. ABHD5 blunts the sensitivity of colorectal cancer to fluorouracil via promoting autophagic uracil yield[J]. Nature communications, 2019, 10(1): 1078.

你可能感兴趣的:(用GDSC数据库的结肠癌细胞系数据来计算基因与IC50的相关性)