精选 | 2018年4月R新包推荐

作者:Joseph Rickert

翻译:黄小伟,先后从事游戏、社交及金融数据研究及应用,目前就职网易杭州

2018年4月份,共有约212个R新包收录于CRAN,本文选摘了其中40个R包加以功能简述,有需要的爱好者可以自行下载帮助文档并安装R包进行使用。本文主要包括以下几个类别:计算方法、数据、数据科学、机器学习、音乐、科学、统计、时间序列、工具和可视化等.

一. 计算方法

  1. diffeqr : 支持对微分方程计算工具的调用接口(DifferentialEquations.jl),提供了针对常微分方程(ODE)、随机微分方程(SDE)、时滞微分方程(DDE)、微分代数方程(DAE)等方程的高性能方法.
image
  1. SimRepeat : 提供模拟统计方程的相关系统的功能,其中该方程可具有多种变量类型.

二. 数据

  1. echor : 提供美国环境保护局(EPA)环境合规历史在线(ECHO) 数据的访问接口.

  2. essurvey : 支持从欧洲社会调查(European Social Survey)下载所需数据.

  3. malariaAtlas : 支持从疟疾地图集项目(Malaria Atlas Project)服务器下载公共可用数据,并对其进行可视化分析.访问地址:https://map.ox.ac.uk/

image
  1. salesforcer : 提供 Salesforce平台的访问接口.

三. 数据科学

  1. mleap : 为MLeap提供了一个sparklyr扩展,这是一个开放源码库,可以导出Apache Spark管道.

  2. rdfp : 提供谷歌DFPDoubleClick for Publishers)的访问接口.

访问地址:https://developers.google.com/doubleclick-publishers/

  1. workflowr : 提供了支持可重复性操作和团队协作的数据科学实施框架.

四. 机器学习

  1. aws.translate : 支持将一种语言的文本输入转换成另一种语言的文本输出(AWS Translate).

  2. CBDA : 实现一个集合预测器(“超级学习者”),使用基于过滤和全面感知的方法对大数据进行分类.

image
  1. featurefinder : 通过使用rpart分类和回归树对模型残差进行详细分析,实现了一种用于查找模型特征的方法.

  2. iilassso : 用可独立解释的Lasso实现用于拟合线性、逻辑回归模型的高效算法.

image
  1. live : 通过了解关键因素,实施解释复杂机器学习模型的方法,

详见 Ribeiro et al. (2016) and Staniak and Biecek (2018).

image
  1. mlrCPO : 提供了一套工具集,使得mlr(机器学习框架)更为丰富,可兼容多种预处理操作符(CPOS).

7. varrank : 提供用于执行变量排序和特征选择的计算工具箱.

五. 音乐

1. tabr : 支持通过R代码利用乐谱软件(LilyPond)创建吉他谱的功能,可根据标记语言生成高品质的乐谱.

image

六. 科学

1. DrInsight : 使用基于连接性测绘的药物重复利用工具,能够反向查询疾病表型或者查询与所查询药物具有类似功能的药物.

image

七. 统计

1. cultevo : 提供测量信号系统组成的工具:信息论测量(2016)、距离矩阵相关性的Mantel检验(1983)等.

2. indirect : 提供使用独立的条件均值先验值的贝叶斯广义线性模型的函数.

3. konfound : 实现了反映灵敏度分析最新进展的方法,包括计算稳健性指数的函数.

4. mgc : 实现多等级图关联(MGC),在2017年由Shen等人开发.

image

5. netregR : 提供将网络响应(有向和无向)回归到可能为演员、关系或网络值等感兴趣的协变量,并提供计算系数方差估计值的函数.

image

6. RNGforGPD : 提供生成遵循广义泊松分布的单变量和多变量数据的函数.

7. SmartEDA : 提供自动描述数据结构和关系的功能,以便于探索性数据分析.

image

8. stratifyR : 采用Khan等人的方法对单变量人群实施分层抽样设计.

9. WeMix : 提供运行混合效果模型的功能,其中包括每个级别的权重。遵循Rabe-Hesketh等人所提出的方法(2006),利用自适应正交的方法进行模型训练.

八. 时间序列

1. anomalize : 实现一个“整洁”工作流程,用于检测时间序列数据中的异常情况,支持分解时间序列、检测异常和将多个时间序列的正常数据与异常数据进行分离等功能.

image

2. LPWC : 提供函数-基于加权相关和引入滞后,进行时间序列的距离度量.

九. 工具

1. table1 : 提供用于创建用于描述性统计的HTML表格的功能.

image

2. foolbox : 提供一个操作函数的框架,并使用元编程来翻译.

3. graphframes : 提供了sparklyr包的扩展,提供了基于DataFrame的接口来处理图形.

4. komaletter : 提供用于书写字母的多功能R Markdown模板.

5. pkgnet : 使用图论的工具来分析R包中的函数与其导入的包之间的依赖关系,并量化它们的复杂性等.

6. promises : 提供了在R中进行异步编程的基本抽象.

十. 可视化

1. ERSA : 提供函数对回归计算的结果进行展示,同时该功能可以集成到shiny中进行可视化显示.

image

2. ggplotify : 提供了将绘图函数调用转换为grobggplot的方法,使用户可以对齐由基本图形、网格、点阵和vcd函数生成的绘图.

image

3. ggstatsplot : 对ggplot2进行扩展,生成带有统计试验结果的可视化图形.

image

4. panelView : 提供使用二分法处理可视化面板数据的功能.

image

5. prepplot : 提供一个单独的函数,用于创建基础绘图区域,可以轻松制作自定义图形.

image

说明:限于个人水平,错误在所难免,欢迎批评指正、交流!

你可能感兴趣的:(精选 | 2018年4月R新包推荐)