R语言学堂推文索引 - 2023年3月


专注系列化高质量的R语言教程

推文索引 | 联系小编 | 付费合集


更新时间: 2023.3.31

  • 0 前言

  • 1 数据处理通识专辑

    • 1.1 base-R

    • 1.2 dplyr和tidyr工具包

    • 1.3 文本/日期/分类数据处理

    • 1.4 向量化运算

    • 1.5 文档沟通

    • 1.6 面向对象的编程

    • 1.7 数据获取方法

  • 2 制表与可视化专辑

    • 2.1 基础绘图系统

    • 2.2 ggplot2工具包

    • 2.3 ggplot2拓展包

    • 2.4 各类图形绘制方法/框架

    • 2.5 三维数据绘图

    • 2.6 图形配色方法

    • 2.7 图形布局/拼图方法

    • 2.8 图形元素控制方法

  • 3 数学模型专辑

    • 3.1 概率分布与数理统计

    • 3.2 回归模型

    • 3.3 相关性分析

    • 3.4 分类/聚类/降维分析

    • 3.5 数学规划模型

    • 3.6 时间序列分析

    • 3.7 生存分析

    • 3.8 算法模型

    • 3.9 机器学习

    • 3.10 模型结果可视化

  • 4 地理制图与分析专辑

    • 4.1 sf工具包

    • 4.2 raster工具包

    • 4.3 地理制图与地图数据

    • 4.4 地理数据格式

    • 4.5 空间自相关分析

    • 4.6 空间插值

    • 4.7 地理加权模型

    • 4.8 空间计量模型

    • 4.9 未分类

  • 5 科研实用技能专辑

    • 5.1 Office软件使用技能

0 前言

索引是学堂原创和转载推文的汇编,涵盖了所有知识性推文的最新版本(非知识性推文在学堂纪事中,非最新版本推文在旧文合集中,均不列入索引),并且会不定期地进行更新。索引按专辑-系列的顺序排列,越靠前的系列基础性越强;系列内部按逻辑顺序排列;个别推文会出现在多个系列中。

与数学模型有关的可视化方法在《数学模型专辑》中,一般不再出现在《制表与可视化专辑》中;与地理分析的可视化方法在《地理制图与分析专辑》中,而不在《制表与可视化专辑》;与地理分析相关的模型方法在《地理制图与分析专辑》中,不再出现在《数学模型专辑》中。

转载其他公众号的推文标有“”字样。

1 数据处理通识专辑

1.1 base-R

  • R及其相关程序安装

  • 工具包的安装、加载、更新和删除

  • base | 数值运算符和逻辑运算符

  • R语言的原子类型和数据结构

  • 使用中括号“[]”提取或替换数据

  • 环境Environment(上)

  • 环境Environment(下)——函数环境

  • 如何自定义R语言函数?参数中的省略号`...`有什么用?

  • 如何正确使用R语言的函数——为什么有的模型结果不能使用summary函数查询?

  • base | switch和do.call函数的用法

  • with等函数的用法——让基础包的语法更贴近tidy风格

1.2 dplyr和tidyr工具包

管道操作符和dplyr包

  • magrittr | 管道操作符

  • dplyr | 数据导入和预处理的常用函数

  • dplyr | 提高数据处理效率!数据框的colwise和rowwise操作

  • dplyr | 数据处理函数的功能速查!dplyr工具包中的十类操作函数汇总(上篇)

  • dplyr | 数据处理函数的功能速查!dplyr包中的十类操作函数汇总(下篇)

数据转换与tidyr包

  • tidyr | 长、宽数据的相互转换

  • tidyr | 批量处理数据的前奏——数据嵌套化

  • tidyr | 对数据框分行或分列进行嵌套操作

  • tidyr | 变量取值组合、缺失值处理、变量分列与合并

1.3 文本/日期/分类数据处理

文本(字符串)数据

  • stringr | 文本处理方法(Ⅰ-1):字符串处理函数(上)

  • base | 文本处理方法(Ⅰ-2):正则表达式

  • stringr | 文本处理方法(Ⅰ-3):字符串处理函数(下)

  • glue | 关于胶水函数用法的几个例子

  • 如何把字符串类型的向量转换成对应的数值向量

日期数据

  • lubridate | 日期类型数据的转换

  • 技巧 | 日期数据有缺失值的情况下如何比较大小

分类(因子)数据

  • forcats | tidyverse家族对「分类变量」的解决方案(上)

  • forcats | fct_reorder2函数功能详解及其在可视化中的应用

  • forcats | tidyverse家族对「分类变量」的解决方案(下)

  • R语言基础包对「分类变量」的解决方案

1.4 向量化运算

  • base | 使用apply族函数进行向量化运算

  • 技巧 | 如何批量地将整型变量转换为因子变量

  • purrr | 使用map族函数进行向量化运算

1.5 文档沟通

  • [转] Rmarkdown入门教程汇总

  • [转] Rmarkdown | 28份R语言文档沟通推文汇总

  • shiny | 使用R创建一个网页应用(Web App)

文件夹操作

  • R语言的文件和文件夹操作功能(1):读取文件目录

  • R语言的文件和文件夹操作功能(2)

1.6 面向对象的编程

  • R语言与面向对象的编程(1):proto对象

  • R语言与面向对象的编程(2):proto对象(续)

  • R语言与面向对象的编程(3):R6类

  • 面向对象编程的一个例子——减少代码重复

1.7 数据获取方法

  • rvest | 网络爬虫初步——使用CSS选择器

  • 使用R语言调用百度翻译的API接口

2 制表与可视化专辑

本部分不含与数学模型相关的可视化方法,相关内容在《数学模型专辑》;本部分不含与地理分析相关的可视化方法,相关内容在《地理制图与分析专辑》。

2.1 基础绘图系统

基础绘图系统是指基础包graphics所构建的绘图系统。本部分主要分函数介绍相关功能,更多技巧性推文可见本专辑其他小节。

  • 【系列教程】如何使用R语言进行可视化

  • graphics | 基础绘图系统(一)——主函数plot及其参数

  • graphics | 基础绘图系统(二)—— 绘图参数及par函数

  • graphics | 基础绘图系统(三)——添加文本标注、坐标轴线和图例

  • graphics | 基础绘图系统(四)——柱状图、直方图、扇形图、箱形图和函数图象

  • graphics | 基础绘图系统(五)——plot函数功能再探和低级绘图函数

  • grDevices | 基础绘图系统(六)——如何导出高清图片

  • graphics | 基础绘图系统(七)——各式各样的散点图/折线图

  • graphics | 基础绘图系统(八)——棘状图、符号图、多边形(路径)图、Cohen-Friendly关联图、条件密度图

  • graphics | 基础绘图系统(九)——栅格图、点密度图、等高线(填充)图、三维图

  • graphics | 基础绘图系统(十)——星形图、四瓣图、马赛克图

2.2 ggplot2工具包

本部分主要分函数介绍相关功能,更多技巧性推文可见本专辑其他小节。

入门系列教程

  • ggplot2 | ggplot2作图语法入门

  • ggplot2 | 使用小提琴图+箱形图+抖动图展示数据分布情况

  • ggplot2 | aes_string和aes函数有什么区别?

  • ggplot2 | R语言中的配色方法汇总(Ⅲ):ggplot2的颜色标度函数

  • ggplot2 | 统计变换的初步理解

  • ggplot2 | 统计变换与柱形图、直方图、密度图

  • ggplot2 | 不规则面状图形

  • ggplot2 | 坐标标度函数、坐标系统函数

  • ggplot2 | 图例(Ⅰ):图例函数、主题函数中的图例参数

  • ggplot2 | 图例(Ⅱ):图例符号设置

  • ggplot2 | 注释函数

  • ggplot2 | 位置调整函数

  • ggplot2 | 图形分面函数

  • 索引 | ggplot2基础语法系列推文汇总

自定义ggplot绘图系统函数

  • (1)定义一个简单的统计变换函数

  • (2)自定义参数

  • (3)自定义几何图形函数

  • (4)*_panel和*_group方法的区别

2.3 ggplot2拓展包

  • ggsci | 颜色标度拓展包(1):科研配色风格

  • scatterpie | 几何图形拓展包(1):如何在地图中添加饼图

  • ggspatial | 地图制作拓展包(1):如何添加指北针和比例尺

  • [转] ggstatsplot | 既能统计分析又能可视化绘制的工具包

  • [转] ggpattern | 绘制带填充的学术图表

  • 组图拓展包(1):patchwork(上篇)

  • 组图拓展包(1):patchwork(上篇续)

  • 组图拓展包(1):patchwork(下篇)组合ggplot2和基础绘图系统图形

  • [转] 主题拓展包(1):ggthemr、ggthemr、ggtech、hrbrthemes等工具包

2.4 各类图形绘制方法/框架

  • [转] ComplexHeatmap | 绘制热图的工具包

  • [转] lattice | 曾经作图届的一哥,现在过得如何?

  • 技巧 | 使用基础绘图系统绘制「森林图」

2.5 三维数据绘图

  • plot3D | 三维数据绘图(1):散点图、栅格图、透视图

  • plot3D | 三维数据绘图(2):常见图形——线段、箭头、矩形、长方体、箱线、多边形

  • plot3D | 三维数据绘图(3):mesh函数、surf3D函数、spheresurf3D函数

2.6 图形配色方法

  • RColorBrewer | R语言中的配色方法汇总(Ⅰ)

  • grDevices | R语言中的配色方法汇总(Ⅱ-1)

  • grDevices | R语言中的配色方法汇总(Ⅱ-2)

  • ggplot2 | R语言中的配色方法汇总(Ⅲ):ggplot2的颜色标度函数

  • [转] 数据可视化配色指南——使用颜色传递数据信息

  • [转] Python和R颜色主题包汇总

  • ggplot2 | 如何对连续型变量使用离散型调色板进行配色

2.7 图形布局/拼图方法

  • 技巧 | 如何使用R语言的基础绘图系统的拼图功能

  • 知乎问答 | 如何在同一坐标系下绘制多幅图形

  • graphics | 基础绘图系统的拼图方法之三:使用mfrow、mfcol参数和layout函数

  • 技巧 | 基础绘图系统的subset参数对分类变量的妙用

  • 如封面所示,如何使用R语言制作一张海报

2.8 图形元素控制方法

  • showtext | R语言绘图字体设置——针对Windows系统

  • grDevices | 如何在图形中使用数学表达式作为标注文本

  • 图形标签如何添加特殊文本和特殊格式?

  • ggplot2 | 调整图形的边框和边距

  • ggplot2绘图如何添加多块矩形框标注

3 数学模型专辑

本部分不含与地理分析相关的模型方法,相关内容在《地理制图与分析专辑》。

3.1 概率分布与数理统计

概率分布模式

  • stats | 概率分布与随机数生成(一)——离散型分布

  • stats | 概率分布与随机数生成(二)——均匀分布、指数分布、正态分布、对数正态分布、卡方分布、t分布、F分布和增长分布

数理统计

  • t检验、F检验

  • 卡方检验与列联表、独立性检验

  • 方差分析(1):单因素方差分析

  • 方差分析(2):多因素方差分析(上)

  • 方差分析(3):多因素方差分析(下)

3.2 回归模型

  • R语言的模型表达式含义解析

线性模型

  • stats | 线性回归(一)——模型表达式和输出结果

  • stats | 线性回归(二)——模型假设和模型估计

  • car | 线性回归(三)——残差分析和异常点检验

  • stats | 线性回归(四)——显著性检验和模型评价

  • stats | 线性回归(五)——亚组模型、加权模型和逐步回归

  • 多元线性回归的系数及其标准差估计

广义线性模型

  • stats | 广义线性模型(一)——广义线性模型的基本结构及与线性模型的比较

  • stats | 广义线性模型(二)——泊松回归

  • stats | 广义线性模型(三)——二元Logistic模型和Probit模型

  • MASS | 广义线性模型(四)——负二项回归

非线性模型

  • splines | 多项式回归和样条曲线回归

  • stats | nls——求解非线性回归的待定参数

  • 使用最小二乘法和最大似然法估计非线性模型

异质性模型

  • lme4 | 在R中运行混合效应模型(多层模型)

3.3 相关性分析

  • 相关系数和相关性分析(上):皮尔逊相关系数、斯皮尔曼相关系数

  • 相关系数和相关性分析(下):肯德尔相关系数

3.4 分类/聚类/降维分析

  • stats | 聚类分析之系统聚类法

  • stats | 数据降维之主成分分析(PCA)

  • kohonen | SOM:自组织映射聚类法(1)

  • tree | 分类回归树模型

3.5 数学规划模型

  • stats | 介绍三个数学规划函数

3.6 时间序列分析

  • 时间序列数据的移动平均

时间序列分析

  • 时间序列分析(1) | 自回归移动平均ARMA模型的平稳性条件

  • 时间序列分析(2)| ARMA模型的(偏)自相关函数

  • 时间序列分析(3)| ARMA模型的拟合

  • 时间序列分析(4)| 滞后算子与季节性模型

  • 时间序列分析(5)| 趋势平稳模型和差分平稳模型

  • 时间序列分析(6)| DF检验

  • 时间序列分析(7)| ADF检验

  • 时间序列分析(8)| 结构性变化和Perron检验

  • 时间序列分析(9)| 干扰分析

  • 时间序列分析(10)| 传递函数模型和ADL模型

  • 时间序列分析(11)| 向量自回归模型(VAR模型)

  • 时间序列分析(12)| 脉冲响应函数、格兰杰因果检验

  • 时间序列分析(13)| 误差修正模型、协整检验(完结篇)

3.7 生存分析

  • survival | 生存分析(1):生存曲线(上)

  • survival | 生存分析(2):生存曲线(中)

  • survival | 生存分析(3):生存曲线(下)

  • survival | 生存分析(4):Cox比例风险模型

  • survival | 生存分析(5):加速失效时间模型(Accelerated Failure Time Model)

3.8 算法模型

  • 技巧 | 交叉验证

3.9 机器学习

  • 基于mlr3工具包的机器学习(1)——数据、模型、训练、预测

3.10 模型结果可视化

  • rms | 如何绘制模型带置信区间的预测曲线

  • [转] ggbiplot|主成分分析结果可视化

4 地理制图与分析专辑

4.1 sf工具包

  • sf | 读取和保存空间矢量数据

  • sf | 创建空间矢量对象及其投影设置

  • sf | 判断点线面等几何对象的空间位置关系

  • sf | 空间矢量对象的属性连接方法

  • sf | 空间矢量对象的“聚合”操作

  • sf | 空间矢量对象的几何信息处理方法

  • sf | 使用plot函数绘制地图

  • sp | sp格式的空间矢量对象及其函数方法简介

4.2 raster工具包

  • raster | R语言中的空间栅格对象及其基本处理方法(Ⅰ)

  • raster | R语言中的空间栅格对象及其基本处理方法(Ⅱ):投影、属性提取

  • raster | R语言中的空间栅格对象及其基本处理方法(Ⅲ):切片/掩膜、图层叠加

  • raster | R语言中的空间栅格对象及其基本处理方法(Ⅳ):数据聚合、重采样

  • 技巧 | 栅格的属性数据和经纬度是分开的两个文件,怎么将它们整合到同一个文件上

  • raster | 多图层栅格对象的一些处理方法

  • raster | 栅格对象如何用于非空间模型的预测?

  • 栅格数据对不齐怎么办?原点对齐、平移、翻转、数值替换等操作

  • raster | R中的栅格操作符(上)[翻译]

  • raster | R中的栅格操作符(下)[翻译]

4.3 地理制图与地图数据

地理/投影坐标系统

  • R语言中的地理/投影坐标系统(上)[翻译]

  • R语言中的地理/投影坐标系统(下)[翻译]

静态地图

  • sf | 使用plot函数绘制地图

  • ggplot2 | 使用ggplot2工具包绘制地图

  • ggspatial | ggplot2的地图制作拓展包(1):如何添加指北针和比例尺

  • [转] 技巧 | ggplot2结合相关工具包制作标准中国地图

  • tmap | R语言中专门绘制地图的工具包

  • tmap | 制作地图动画、放大局部区域

  • [转] 双变量映射地图可视化绘制方法

  • 技巧 | 如何使用R语言的常用工具包绘制双变量填充地图

交互式地图

  • mapview | 如何快速使用交互式地图展示空间数据信息

地图产品

  • 技巧 | 在R语言中使用高德地图的API进行地理/逆地理编码(地址与经纬度的相互转换)

  • leaflet |(1)在R语言中导入高德地图

  • leaflet |(2)如何往地图上添加一只冰墩墩(添加各类要素)

4.4 地理数据格式

netCDF数据

  • ncdf4 | netCDF数据格式处理工具包(1):数据读取和查询

  • ncdf4 | netCDF数据格式处理工具包(2):定义新变量

  • ncdf4 | netCDF数据格式处理工具包(3):其他函数

4.5 空间自相关分析

  • spdep | 如何在R语言中计算空间自相关指数

  • spdep | 除了莫兰指数,还有哪些指数可以衡量空间自相关性?

  • 三维空间(魔方)的莫兰指数

  • spdep | 最小生成树

  • deldir | 生成泰森多边形的一段R语言代码

4.6 空间插值

  • gstat | 空间插值(一)——反距离权重插值;使用ggplot2绘制地图

  • gstat | 空间插值(二)——克里金插值之普通克里金

  • gstat | 空间插值(三)——克里金插值之泛克里金和简单克里金

  • gstat | 空间插值(四)——克里金插值之协同克里金和交叉验证

4.7 地理加权模型

  • spgwr | R语言与地理加权回归(Ⅰ-1):线性地理加权回归

  • spgwr | R语言与地理加权回归(Ⅰ-2):广义线性地理加权回归

  • GWmodel | 地理加权模型(Ⅱ-1):地理加权主成分分析(GWPCA)

  • GWmodel | 地理加权模型(Ⅱ-2):如何查看地理加权回归的显著性

  • 地理加权回归 | 模型如何应用于新数据的预测?

4.8 空间计量模型

  • spatialreg | 空间滞后模型、空间误差模型和空间杜宾模型简单形式的R语言实现

  • spatialreg | 空间计量模型的结果解读——直接效应和间接效应

  • spatialreg | 基于特征向量的空间滤波方法

  • spatialreg | 基于特征向量的空间滤波方法(2)

4.9 未分类

  • 两步移动搜索法(2SFCA)计算空间可达性的R语言代码

  • DCluster | 空间扫描统计

5 科研实用技能专辑

5.1 Office软件使用技能

  • word | 如何插入横版页面

你可能感兴趣的:(r语言,机器学习,开发语言,人工智能,大数据)