推荐-数据科学中的 R 语言

首先介绍下,这是我学习R以来遇到的最好的电子书,作者王敏杰老师,是四川师范大学研究生公选课《数据科学中的R语言》的课程内容,系统介绍Hadley Wickham的tidyverse和ggplot2包的内容。

网址:

数据科学中的 R 语言
https://bookdown.org/wangminjie/R4DS/

课程安排是这样的,每个章节研究的内容都是彼此独立的,大家可以单独阅读每章及运行代码。
基础篇

  • 基础篇
    • 第 1 章介绍数据科学基础
    • 第 2 章介绍R语言基本概念
    • 第 3 章介绍R语言中的子集选取
  • tidyverse篇
    • 第 4 章介绍可重复性报告
    • 第 5 章介绍数据读入
    • 第 6 章介绍数据处理
    • 第 7 章介绍数据可视化
    • 第 8 章介绍数据规整
    • 第 9 章介绍字符串处理
    • 第 10 章介绍因子类型数据
    • 第 11 章介绍函数式编程
    • 第 12 章介绍简单数据框
    • 第 13 章ggplot2几何对象
    • 第 14 章ggplot2的主题
    • 第 15 章ggplot2的标度
    • 第 16 章ggplot2的图例
    • 第 17 章ggplot2扩展内容
    • 第 18 章ggplot2统计图层
    • 第 19 章介绍数据可视化中的配色
    • 第 20 章回望tidyverse之旅
    • 第 21 章介绍tidyverse常用技巧
    • 第 22 章介绍tidyverse进阶技巧
    • 第 23 章介绍数据框的列方向和行方向
    • 第 24 章介绍tidyverse中的across()之美
    • 第 25 章介绍tidyverse中的across()之美(续篇)
    • 第 26 章介绍tidyverse中的across()之美(再续)
    • 第 27 章介绍tidyverse中的NA
    • 第 28 章介绍tidyverse中的dot
    • 第 29 章介绍非标准性评估
  • 建模篇
    • 第 30 章介绍模拟与抽样
    • 第 31 章介绍线性模型
    • 第 32 章介绍模型输出结果的规整
    • 第 33 章介绍方差分析
    • 第 34 章介绍统计检验与线性模型的等价性
    • 第 35 章介绍统计推断
    • 第 36 章介绍多层线性模型
    • 第 37 章介绍广义线性模型中的泊松回归
    • 第 38 章介绍logistic回归模型
    • 第 39 章介绍有序logistic回归模型
    • 第 40 章介绍机器学习与tidymodels
    • 第 41 章介绍贝叶斯模型和Stan
  • 应用篇
    • 第 42 章介绍探索性数据分析-诺奖获得者

    • 第 43 章介绍探索性数据分析-奥林匹克

    • 第 44 章介绍探索性数据分析-新冠疫情

    • 第 45 章介绍探索性数据分析-anscombe数据集

    • 第 46 章介绍探索性数据分析-身高体重

    • 第 47 章介绍探索性数据分析-驯鹿迁移

    • 第 48 章介绍探索性数据分析-企鹅的故事

    • 第 49 章介绍探索性数据分析-大学生职业决策

    • 第 50 章介绍探索性数据分析-ames房屋价格

    • 第 51 章介绍探索性数据分析-新冠疫苗有效率的计算

    • 第 52 章介绍网页爬虫

    • 第 53 章介绍社会网络分析

    • 第 54 章介绍文本挖掘

    • 第 55 章介绍时间序列分析

    • 第 56 章介绍地理数据处理

    • 第 57 章介绍tidyverse中行方向的操作

    • 第 58 章介绍科研数据可视化中的统计分布图

    • 第 59 章让你的数据骚动起来

    • 第 60 章介绍我收集的一些有用和有趣的宏包

    • 第 61 章一日一练,有些题目还是很有挑战性的喔

2、课件源代码和数据

王老师将持续改进课件,所以欢迎大家提出建议

  • https://github.com/perlatex/R_for_Data_Science

你可能感兴趣的:(推荐-数据科学中的 R 语言)