译:黄小伟,资深大数据分析从业者。目前就职杭州有赞数据分析团队,欢迎加入!
知乎专栏:中国R语言社区 |10000+关注(Top 1)
知乎圈子:数据分析圈 |5000+关注(Top 1)
2020年5月份,184个R新包收录于CRAN(2020年4月份收录148个),累计收录16,606个R包!由于CRAN会不定时进行R包增删,所以具体数量会随时间略有变化。
此次整理了11个类别,分别为数据、效率工具、可视化工具、金融、基因组学、市场营销
机器学习、医学、科学、统计学、时间序列。
以下是本期(总第42期)R新包的核心功能介绍:
1. covid19nytimes: 支持访问纽约时报Covid-19的美国县级数据.
2. geodata: 提供用于基本空间分析概念的小型数据集,其基于GeoDa software工作簿和数据站点.
3. GermaParl: 提供访问由PolMine项目维护的德国联邦议院议会辩论的GermaParl语料库的权限.
4. nhlapi: 支持检索和处理由NHL开放API的数据,包括有关球员,球队,比赛,锦标赛,选秀,排名,时间表和其他端点的信息.
5. polAr: 提供一系列工具,用于分析阿根廷的政治和选举数据.
6. rKolada: 提供从瑞典地区和市政府官方数据库Kolada下载和处理数据和元数据的方法.
二. 效率工具
1. almanac: 提供用于实现重复规则的工具,即用于定义重复事件的功能.
2. gdiff: 提供执行图形差异测试的功能.
3. i2dash: 提供创建基于web仪表板的功能.
4. pkgndep: 提供检查和可视化R包依赖程度的功能.
5. presser: 实现httpbin.org Web服务和功能,以在不使用Internet的情况下测试Web客户端.
6. stringfish:实现一个使用alt-rep系统执行字符串和序列操作的框架,以加快常见字符串操作的计算速度.
7. worcs: 支持实施WORCS科学开放式可复制代码的工作流程.
1. ggpacman: 通过ggplot2和gganimate实现Pac-Man(吃豆人)游戏.
2. iNZightTS: 提供用于处理时间序列数据的工具,主要包括用于绘制、分解和预测、比较多个序列及拟合加法和乘法模型等.
3. prismadiagramR: 支持创建PRISMA图,这些图可用于跟踪鉴定、筛选等.
4. sketcher: 实现将照片转换为线条图像的图像处理效果.
5. upsetjs: 为JavaScript UpSet.js库提供htmlwidget封装.
6. xaringanthemer: 提供创建自定义CSS主题的功能.
四. 金融
1. strand: 提供用于执行投资策略的离散(股票级)模拟的框架。 模拟投资组合会根据位置大小和因素敞口等约束条件,优化对输入信号的敞口.
2. TwitterAutomatedTrading: 提供对MetaTrader5平台的访问,使用户能够使用从twitter和/或Stockwit计算的情绪指数进行自动交易.
1. immunarch: 为批量和单细胞T细胞受体、抗体库的生物信息探索性分析提供框架,其中包括批量和单细胞AIRR(自适应免疫受体库)数据的加载、分析和可视化.
2. SubtypeDrug: 通过集成遗传干扰、药物作用、生物途径和癌症亚型,提供癌症亚型药物优先排序的工具.
3. TransPhylo: 提供利用基因组数据重建传染病传播的功能.
六. 市场营销
1. CLVTools: 实现了各种概率的潜在客户流失模型,适用于非契约环境(例如零售业务)、包括和不包括时不变和时变协变量.
2. grizbayr: 提供执行贝叶斯A / B和Bandit营销测试的功能.
1. applicable: 支持基于适用性域的概念来测量新样本.
2. piRF: 为随机森林实施多种最新的预测间隔方法,包括分位数回归间隔、袋外间隔、观测袋间隔、一步式增强随机森林间隔、偏差校正间隔、高密度间隔和等角形间隔.
3. rules: 允许将预测规则集合、C5.0规则和Cubist与parsnip包一起使用.
1. AdhereRViz: 对AdhereR软件包实施基于Shiny的GUI,以允许用户访问不同的数据源、探索用药模式以及计算各种依从性度量.
2. MrSGUIDE: 基于GUIDE算法促进随机试验和观察性研究中单个和多个反应的亚组分析.
九. 科学
1. ldsr: 提供使用线性动力系统重建流量和气候信息的功能.
2. rties: 提供用于调查双变量(例如二进)系统中时间过程的工具.
十. 统计学
1. Compack: 使用成分协变量实现回归方法,包括Lin等人提出的使用成分协变量的稀疏对数对比回归(2014)、以及Sun等人提出的具有功能成分预测变量的稀疏对数对比回归(2020).
2. ghypernet: 提供用于模型拟合和选择随机图的广义超几何整体(gHypEG)的功能.
3. motifcluster: 提供使用主题邻接矩阵对加权有向网络进行频谱聚类的工具.
4. regmedint: 如Valeri和VanderWeele(2013)以及Valeri和VanderWeele(2015)所述,最初在SAS宏中实施,并使用治疗-介体相互作用项实施基于回归的因果中介分析.
1. DeCAFS: 提供检测时间序列突然变化的功能,其中局部波动是随机游走过程,而自相关噪声是AR(1)过程.
2. Rdrw: 提供函数来拟合和模拟单变量或多变量阻尼随机游动过程(也称为Ornstein-Uhlenbeck过程或一阶连续时间自回归模型),该过程适用于分析具有不规则间隔观测时间和异方差测量误差的时间序列数据.
3. statespacer: 提供使用状态空间方法估计时间序列的函数.
说明:限于个人水平,错误之处难免,烦请批评指正,共同交流~
近5期Top 40 R包介绍:
精选| 2020年4月R新包推荐(第41期)
精选| 2020年3月R新包推荐(第40期)
精选| 2020年2月R新包推荐(第39期)
精选| 2020年1月R新包推荐(第38期)
精选| 2019年12月R新包推荐(第37期)