LearningR-学习资源

  • 通过阅读来学习,包括了阅读经典的教材、代码、论文、学习公开课。
  • 通过牛人来学习,包括同行的聚会、讨论、大牛的博客、微博、twitter、RSS。
  • 通过练习来学习,包括代码练习题、参加kaggle比赛、解决实际工作中的难题。
  • 通过分享来学习,包括自己写笔记、写博客、写书、翻译书,和同伴分享交流、培训新人。

本文用于收集各类R语言的学习资源,用于学习、练习和分享。

1. 图书参考

1.1 初学入门

  • 《R语言实战》R in Action
    从统计角度入手,分高中低三部分由浅入深的讲解了如何用R来实现统计分析。
  • 《R语言编程艺术》The Art of R Programming
    从程序编写的角度入手,对R的本身特点进行了清晰的介绍。
  • 《learning R》
    这本书没有单纯的讲语法,而是和的流程结合了起来,从数据获取到数据整理再到分析和报告,有一气呵成的感觉,此外最后两章讲如何写稳健的R代码以及写包都是非常精彩的。
  • 《153分钟学会R》
    主要是R常见问题解答。

1.2 参考手册

本节主要介绍R语言快捷参考手册和各种功能强大的R语言包的介绍。

  • 《R语言参考手册》
  • 《R语言基础包函数中文帮助文档(中英文对照v1.0)》
  • 《R Cookbook》
  • 《R in a Nutshell》
    以上两本为词典式的案头参考手册,以便随时查阅。
  • 各类包的参考手册
    如:gglpot2、rcharts、quantmod

1.3 统计进阶

本节主要学习统计计量知识,和通过R语言的实现。

  • 《A Handbook of Statistical Analyses Using R》
  • 《Modern Applied Statistics With S》
    这两本书基本上涵盖了统计的一些高阶内容,例如多元分析、多层回归模型、荟萃分析、生存分析等内容。案例丰富,公式不多,值得反复学习参考。

1.4 数据绘图

ggplot2,是R中最优秀的绘图包。

  • 《ggplot2 Elegant Graphics for Data Analysis》
  • 《R Graphics Cookbook》
    这本书也是RStudio公司的人出的,似乎是Hadley的学生吧,主要是各种ggplot2包的例子,也包括了用其它包来画图,建议通读一遍。
    除了ggplot2外,R还可以通过rcharts和RStudio公司的shiny来实现可交互式的数据展示。
  • rcharts包

1.5 经济投资

1.6 数据挖掘

  • 《Practical Data Science with R》
    以R本身的扩展包和函数入手,很有体系的介绍了数据科学的各个方面。
  • 《An Introduction to Statistical Learning》
    这本书可以说是另一本数据挖掘大作《The Elements of Statistical Learning》的R实现手册,体系结构基本一致,更强调用R来实现,更难得的地方是提供了很好的习题。
  • 《Data Mining with R Learning with Case Studies》
  • 《Machine Learning for Hackers》
    两本侧重于数据挖掘的R书,全是以案例为线索,示范的代码量很大。跟一遍下来会有很大的收获。
  • 《Data Mining explain using R》
    用基本函数来实现各种机器学习算法,对理解算法底层很有帮助。
  • 《Data Science in R》
    以案例为主的书,需要一定的数据挖掘基础。

1.7 科学计算

  • 《Introduction to Scientific Programming and Simulation Using R》
  • 《Mastering Scientific Computing with R》
    除了统计分析外,独特之处在于使用R来做数值分析,如求根,最优化,数值积分。还包括了一些常见的模拟技术。书后的习题和最后的案例非常有用。

1.8 高级编程:

  • 《R Programming for Bioinformatics》
  • 《software for data analysis programming with R》
    如果你是初学者,不要去看上面两本书。如果你想进阶为专家级R用户,那你需要精读它们。前者讲解了R少为人知的一面,例如字符处理、正则表达和XML,还有报错处理以及与其它语言的交互。后者更是编写生产级代码的圣经指南。
  • 《Advanced R programming》
    Hadley的力作,清楚的讲解了R的函数式编程思想和写R包的各种细节,要迈入R高手,不得不读。
  • 《数据科学中的R语言》
    李舰和肖凯的作品

2. 网络资源

  • R语言官方站
    http://www.r-project.org/
  • R-blogger 丰富的R博客资源
    http://www.r-bloggers.com/
  • R语言资源汇总
    https://github.com/qinwf/awesome-R
  • R语言搜索引擎
  • R函数在线帮助
    http://www.rdocumentation.org/
  • stackoverflow关于R的问答
    http://stackoverflow.com/questions/tagged/r
  • 一个入门级的R在线教程
    http://tryr.codeschool.com/
  • 交互式的R在线教程
    https://www.datacamp.com
  • 统计之都
    http://cos.name/
  • Hadley Wickham大神
    http://hadley.nz
  • 肖凯的个人博客
    http://xccds1977.blogspot.com
    https://www.zhihu.com/people/xiao-kai-93
  • 谢益辉的个人博客
    http://yihui.name
  • 尾巴AR的个人博客
    http://www.cnblogs.com/weibaar/
  • 美国计算机世界杂志提供的R语言初学者入门资料
    http://www.computerworld.com/s/article/9239625/Beginner_s_guide_to_R_Introduction
  • R and Data Mining
    http://www.rdatamining.com
  • 各种cheatsheet
    http://cran.r-project.org/doc/contrib/Short-refcard.pdf http://www.rstudio.com/resources/cheatsheets/
  • spatial.ly
    spatial.ly is written by James Cheshire. James is a lecturer at the UCL Department of Geography where he researches, teaches and maps.
  • Oliver Uberti博客
    https://oliveruberti.com
    James Cheshire and Oliver Uberti are the author of 《LONDON: The Information Capital》

3 视频资源

  • Google Developers' Intro to R
  • Twotorials
  • Coursera

Coursera上约翰.霍普金大学的数据科学系列课程该系列课程包含如下几门课。
1.《数据科学家的工具箱》
该课程主要介绍了数据科学家常用的一些工具。包括R、 RStudio、 Git 、Github ,这里强烈推荐RStudio,作为R的一个集成开发环境(IDE), 它可以在Latex、 PDF、 markdown、 html 中游刃有余,并且是个强大的Literate Programming 工具。除了以上提及的强大工具之外,还介绍了数据的类型、数据分析的方法过程、以及数据科学的一些知识点。
2.《R语言程序开发》
主要内容包括:1)R概述,R的数据类型和对象,数据的读写操作;2)R中的控制流,函数式编程,作用域,时间数据类型;3)循环函数,检查代码漏洞的方法;4)数据模拟实现,代码风格规范。
3.《获取和整理数据》
完成这门课程将获得技能:1)从各种资源获取数据;2)数据清洗的原则;3)数据整理的工具与技巧。
4.《探索性数据分析》

完成这门课程将收获:1)运用R中的base,lattice,ggplot2等绘图系统进行数据的可视化展示;2)对不用类型的数据运用基本的数据展示原则创造丰富多样的分析图;3)基于特定问题出发,运用探索高维数据的统计技巧,创造多维度数据的可视化方式。
5.《可重复性研究》
通过这门课程,你将学会:1)使用Rmarkdown撰写文档;2)在分析报告中嵌入R代码;3)用knitr等相关工具编译Rmarkdown文档;4)进行可重复性的数据分析研究。
6.《统计推断》
这门课主要介绍统计推断的基础。可以收获:1)统计推断的概览;2)进行统计推断的模型假设;3)复杂统计推断的技巧。
7.《回归模型》
这门课教会学生:1)如何进行拟合线性模型,如何进行残差分析;2)进一步探索如何引入哑变量解决特殊的模型设定问题;3)介绍广义线性模型,特别是Poisson回归和Logistic回归。
8.《实用机器学习》
完成这门课将收获:1)经典机器学习算法;2)如何应用多种机器学习工具;3)如何对真实数据进行模型评估和预测。
9.《数据产品开发》
内容涵盖:1)如何创造统计产品以进行交互式探究;2)重点学习如何探究不确定性的统计结果;3)如何创造Shiny应用,以及数据产品相关的R扩展包。
作者:黄耀鹏
链接:https://www.zhihu.com/question/21654166/answer/64127931
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

4. 练习资源

  • Euler Project
  • kaggle

你可能感兴趣的:(LearningR-学习资源)