R语言是医学统计、生物医学、基因组学中一个非常强大的工具. CRAN上有着庞大数量的医学分析相关R包, 既有哈佛大学医学院的Bioconductor项目,也有约翰·霍普金斯大学的医学研究, 以及连接诸如WHO数据库的API接口.
医学图像
1
DICOM格式数据
临床成像设备捕获的数据,标准格式为DICOM(Digital Imaging and Communications in Medicine).
DICOM文件非常广泛并且复杂.
通常而言, 每一个DICOM文件都是由2个四字节序列组成文件, 表示十六进制数字, 并形成一个标记. 元素/组用于表示后续的信息类型.
R中支持读取/导出DICOM文件格式的R包有:
oro.dicom
divest
fmri
tractor.base
以上R包均提供了读取/导出DICOM文件格式的函数方法.
2
ANALYZE格式数据
尽管医学成像数据行业标准为DICOM, 但另一种格式图像分析也被大量使用.
ANALYZE格式图像由两个文件组成, 分别为hdr和img文件.
R中支持ANALYZE和NIfTI文件格式的R包有:
RNifti
AnalyzeFMRI
fmri
tractor.base
oro.nifti
neuroim
以上R包均提供了读取/导出ANALYZE和NIFTI文件格式的函数方法.
3
核磁共振成像MRI
Magnetic Tensor Image(MRI)核磁共振成像
Diffusion Tensor Imaging(DTI):
tractor.base 包
speaq:OOL核磁共振波谱对其,基于峰值处理、定量分析和可视化。
Dynamic Contrast-Enhanced MRI:
DATforDCEMRI
dcemriS4 包
adaptsmoFMRI: 使用fMRI数据估计血氧水平
AnalyzeFMRI:处理和分析ANALYZE格式与MRI格式文件.
fmri: 处理MRI数据, 提供了建模方法与分析函数.
mritc:提供了用于MRI分析的工具及
brainR:提供了3D和4D图片处理/
Morpho:绘制交互式2D/3D图像
Rvcg:三角面网格操作、拓扑.例如从医学图像分割出表面
neuRosim: 允许用户生成fMRI时间序列或4D数据, 以及高维数据处理和分析
4
通用图像处理
adimpro: 2D数字图像(黑白图像),通常不用于医学影像, 但可用于一般图像处理.
bayesImageS:用于2D与3D图像分割,例如CT、MRI.包括了贝叶斯、隐马尔可夫链等方法.
EBImage:提供了一个图像的读取、写入、处理和分析功能.
mmand:Mathematical Morphology in Any Number of Dimensions, 提供了形态操作.
5
PET
Positron Emission Tomography:
occ: 提供一组通用方法用于PET审计受体.
6
EEG脑电图
Electroencephalography (EEG)脑电图:
edfReader: 读取主流格式的EEG文件.
eegkit: EEG标记工具集
流行病学
SimInf包:基于马尔可夫链的大规模流行病传播模拟与建模
epiR: 流行病学数据分析
epiflows:提供用于处理、可视化区域间流行病流动的功能和类别, 以及用于预测疾病传播的统计方法.
epibasix:提供流行病学及生物统计学的基本流行病学函数
COVID19:COVID数据跟踪项目API
covid19.analytics: JHU数据
covid19france:COVID19法国数据
covid19italy:COVID-19意大利数据, 按照国家、地区、省份划分
covid19us:COVID19美国数据
可视化案例
约翰·斯诺与“霍乱地图”:地理信息图经典案例
Tree Map:树状图——绘制COVID-19阵列图
临床试验设计、检测、分析
1
设计与检测
TrialSize: 包含超过80个函数方程, 收录在Sample Size Calculations in Clinical Research (Chow & Wang & Shao, 2007, 2nd ed., Chapman &Hall/CRC)中
asd:通过使用早期治疗结果选择, 模拟高级无缝设计.
bcrm:实现单个参数和双参数的贝叶斯CRM设计.可实现交互式结果.
blockrand:创建随机临床试验. 可输出PDF文件作为随机卡片.
clusterPower:使用蒙特利尔方法模拟, 计算随机试验的影响效果.
conf.design:用于计算复杂的分数设计.
CRTSize:包括传统的power-based methods、meta-analysis等,用于随机试验中的聚类评估.
dfcrm:对CRM和TITE-CRM进行解析.
ewoc:Babb, Rogatko and Zacks (1998)药剂过量分析.
模拟临床试验进程中下一剂量的状况, 得到操作特性.
experiment:临床试验工具.例如,随机试验以及一些专门的临床分析选项.
FrF2:线性、非线性部分因子设计.
GroupSeq:使用alpha spending方法,对数据集的组、子序列进行计算.
gsDesign:推导数据子序列设计, 并描述特性.
ldbounds:使用Lan-DeMets Method 计算成组序列试验.提供了大量函数用于计算亚组的边界和概率.
Mediana:基于Clinical Scenario Evaluation(CSE)方法,提供了一个通用框架用于模拟临床试验.该R包支持多种数据类型、分析决策以及关键评估.
PIPS:使用数据和假设理论,预测未来数据分布、绘制区间、模拟置信区间
PowerTOST:计算多种类型临床试验设计的影响、样本大小.
pwr:line of Cohen(1988)的影响分析
qtlDesign:QTL试验分析与设计
samplesize:均衡/非均衡的Student‘s t-test样本大小, Wilcoxon-Mann-Whitney test方法计算分类数据.
2
设计与分析
AGSDest:亚组试验参数评估
clinfun:临床试验、分析工具.包括Fisher's exact test等,可计算亚组的试验.包括临床II期、临床III期试验.
CRM:临床I期Continual Reassessment Method(CRM)模拟
dfpk:包括药物动力学测量在内的统计方法,包括了临床I期的诸多模型,和关系参数、层级模型.该R包提供了一组函数产生数据,用于模拟和决策最大耐受计量.
dfped:儿科药物剂量试验设计与数据分析.包括药物动力学、贝叶斯模型等.
DoseFinding:制药临床II期的药物计量计算.包括multiple contrast test、非线性药物反馈模型等.
MCPMod:dose-response研究的方法与分析.
TEQR:The target equivalence range(TEQR)、modified toxicity probability interval (mTPI) design、standard 3+3 design (3+3)
ThreeArmedTrials:three-arm non-inferiority、
superiority trials、gold-standard design、试验性治疗
3
专用分析工具
adaptTest:自适应二期测试.包括了四个测试:Bauer and Koehne (1994), Lehmacher and Wassmer (1999), Vandemeulebroecke (2006), and the horizontal conditional error function. User-defined tests can also be implemented. Reference: Vandemeulebroecke, An investigation of two-stage tests, Statistica Sinica 2006.
clinsig:临床中带有参数或非参Jacobson-Truax评估
nppbib:非参统计检测,计算部分均衡不完全组的试验结果的数据范围
speff2trial:计算或评估数据范围, 定量或二分数端点非参统计检验.
ThreeGroups:由Gerber, Green, Kaplan, and Kern (2010).提出的, three-group designs中three-group designs
4
通用分析方法
基础R: R中自带了大量高效函数用于计算和分析临床试验.例如:chisq.test, prop.test, binom.test, t.test, wilcox.test, kruskal.test,mcnemar.test, cor.test, power.t.test, power.prop.test, power.anova.test, lm, glm, nls, anova (and its lm and glm methods)
asypow:计算相关性、渐进可能性比率方法.
binomSamSize:计算置信区间、 伯努利分布所需的必要样本大小
coin:双样本、K-sample、非线性ANOVA等方法,相关检测、排序、多变量等问题.
epibasix:流行病学、生物统计学随机试验分析.
Hmisc:包括了大约200个函数,用于高维数据图像、样本计算、缺失值处理、数据标柱、聚类等.可使用LaTeX和S代码.
multcomp:在参数分析中,计算线性和非线性的对比试验、置信区间
survival:描述统计学、双样本检验、参数失效模型、Cox模型等模型.Case-cohort设计.
ssanv:双样本差异中的样本大小计算.调整由于数据与参数的不匹配.
5
Meta-Analysis
metasens:统计方法,并调整meta分析中的偏差.
meta:修正随机影响的meta分析,包括检验、偏差、森林、漏斗图绘制.
metafor:meta分析.修正了随机影响的模型、线性模型,2x2表格数据, Mantel-Haenszel and Peto's method
rmeta:双样本中的meta分析随机影响修正.绘制标准的统计图,检测相关性和异质性
6
综合
mediana:临床试验模拟
rbhit:单倍型抗体
wnl:药物动力学
c212: 工程和物理科學研究理事會 (英國) 資助的專案, 該專案名為 CASE 2 12,用于检测临床试验的安全信号
bayesCT:自适应贝叶斯临床试验的模拟与分析
PTE:个性化治疗评估。为个性化的医学模型提供推断。
simcdm:模拟认知诊断模型数据
Buddle:使用深度学习方法实现统计分类。案例数据包括临床试验患者的统计分类、预测疾病的临床分析。考虑到今日疾病的负面影响,及时正确的对病患进行确诊,在临床中是关键的。确定高危患者群体,并在适当时机安排医疗方案。借助深度学习方法,帮助在各种具有挑战性的临床试验中寻找答案。
webddx:在线诊断生成工具。用户可以生成列出给定的一组症状鉴别诊断,web工具可能会被用于临床实践,但方案交互和数据操作能大大提高效率和再现性研究临床信息。
生物医学
iCellR:单细胞高通量测序分析
riceidconverter:生物数据ID转换
radsafer:辐射安全,也称为“辐射防护”,物理上称为“健康物理学”,此包中包含辐射安全专业人员所需的大量计算。
基因组学
Map2NCBI: 将标记映射到最近的基因组特征
chromoMap:人类染色体的交互式图形可视化,引入染色体热图
GROAN:一个测试基因组回归准确性的工作台
pathfindR:通过提供的基因列表识别蛋白质-蛋白质相互作用路径,并对已确定的子网络实现途径强化分析,确定具有代表性的路径。帮助研究人员能够发现表行背后的机制。
detectRUNS:提供滑动窗口(Purcell等)和连续运行(Marras等)等方法,检测二倍体基因组中纯合性和杂合性的运行。
cRegulome:提供方法来构建预计算的转录因子或microRNA的SQLite数据库文件,数据源于Cistrome和miRCancerdb数据库
ICDS:肿瘤功能障碍鉴定亚途径,基于DNA甲基化、复制数变异和基因表达的数据
GRAPE:基因排序的路径表达分析
DetSel:检测目标基因或者自然选择的基因。
BGData:大基因组数据分析套件
genoPlotR:绘制人口基因组与基因地图
Eagle:在基因组范围内实现多位点关联映射。基于线性混合模型,适合于连续性状的数据分析
GenoScan:用于全基因组序列分析的全基因组扫描统计框架
脑科学
NetworkToolbox:脑、认知、心理网络分析方法
代谢组学
MetabolicSurV:利用代谢组学特征进行分类和预测生存的生物标志物验证方法
cliqueMS:代谢组学分析工具
法医鉴定
benford.analysis: 基于Benford方法的数据验证和法医鉴定
综合
DrInsight:能够反向查询疾病表型或者查询相似功能药物
bamp:贝叶斯年龄-时期队列模型。使用马尔可夫链和蒙特卡洛模拟方法
grf:提供了非参数最小二乘回归、量化回归和治疗效果估计的方法
DSAIRM: 提供一组Shiny应用程序,实现动态模拟系统, 探索宿主免疫反应.
localIV: 提供使用局部工具变量估计边际治疗效果的函数,参见Heckman et al. (2006)、Zhou and Xie (2018)
数据
fingertipsR:Fingertips提供的公共卫生数据
CytobankAPIstats:提供了从细胞库获取和处理细胞数据的工具
SympluR:通过访问Symplur接口,提供了对医疗社会图(Healthcare Social Graph)进行数据分析的功能
getTBinR:获取世卫组织结核病数据
UCSCXenaTools:从UCSC Xena数据库获取数据和探索分析
malariAtlas:从疟疾地图集项目服务器下载公共可用数据。
BioInstaller:生物信息学资源集合
UCSCXenaTools: 顶级基因库. 支持对USCS Xena数据中心等数据访问. 是UCSC托管等公共数据库的集合.
猜你喜欢
朴素贝叶斯及经典实例讲解
统计学知识十问,你都会吗?
如何在科研论文中画出漂亮的插图?
数据仓库建模
探索常用的数据分析统计分布