用R做数据分析(1)——R简介

        R语言是由 Ross Ihaka、Robert Gentleman二位创建的,这也许可以解释为什么叫R语言。现在由“R开发核心团队”负责开发。R是基于S语言的一个GNU项目。

  1. 一、R语言介绍

       R是为统计计算和作图的一门语言和环境。是一个GNU项目,和S语言和环境很相似,S语言是由BELL实验室的John Chambers和他的同事开发的。R语言可以认为是从S语言衍生而来的,他们之前有很重要的不同,但是大多数用S语言写的代码也可以在R中运行。

       目前R在高校非常流行,特别是随着这几年互联网的发展,(R在一些大公司的运用得到的实践,例如:国外的google、linkdin、facebook等,国内一些大型互联网公司也在开始使用R),及随着互联网版权的意识增强,也促使了R在互联网的发展。当然R在很多领域都有很广泛的运用。

       R语言是开源的,同时可以运行在各种平台上(Linux、Windows、MacOS等)。R的许多软件包是由R语言、 LaTeX、Java及最常用C语言和Fortran撰写。

      可以说现在R包含各种各样的功能,可以说目前你能想到的功能,都可以找到一个或者多个R包来实现。几千个R包,哪个才最适合你呢?“最适合你自己的R包,也许就是你自己写的那个包”。

二、 R软件安装下载

      CRAN地址:http://www.r-project.org/,什么是CRAN:

      CRAN为Comprehensive R Archive Network(R综合典藏网)的简称。它除了收藏了R的执行档下载版、源代码和说明文件,也收录了各种用户撰写的软件包。现时,全球有超过一百个CRAN镜像站。(来源http://baike.baidu.com/view/942569.htm)

      根据你的操作系统,下载相应的R语言安装文件。

       下载地址:http://ftp.ctex.org/mirrors/CRAN/

R安装 

三、 R语言的特点     1、变量不需要申明即可引用。     2、R语言的核心是:向量。     3、R语言是一个函数语言。     4、向量中的下标是从1开始引用的。     5、R是脚本语言、面像对象;

四、 如何学学习R语言      《R语言学习由浅入深路线图》 这篇文章大家可以参考,这篇文章简单介绍了一下R学习的资料,大家可以根据需要进行参考。那么如何才能学好R,个人理解有以下几点:

1、不要期望你能学会R中所有的包。不要把目标定的那么高。

2、关键能理解R语言的内涵。多看看CRAN上的相关文档,例如:季刊、R语言相关新闻,特别是每次版本更新的一些内容。3、运用     如果你是做数据分析相关的工作的,一定要把学习到的R语言知识运用到你的工作中,不管你把R语言当用一门编程语言还是统计工具,用的多了,自然你就有感觉,很多东西你就记住了。

4、持续     每天花点时间写几条R代码,实现一些小功能。如果你工作上就用R,那是最完美的。

5、多看     多看别人写的代码,R运用的案例。你可以google一下R会有很多好的博客,文章。很多人都是R的GREEK。

6、开放      一定要开放、分享的心态。多与别人交流,不要总是需求,一定要学习给予。(我是我个人观点,如果要真好用到R,让R发挥价值就是必须的。)

7、总结     学到的东西,及时做好总结,可以总结成案例或者笔记,如果可以欢迎分享给大家(http://www.itongji.cn/member/article_add.php 到这投稿是一个不错的选择)     

五、 我对R语言的理解和看法       随时互联网的发展,特别是互联网对于版权、成本的因素考虑,因为免费、开源使越来越多的公司开始用R语言来处理数据、分析数据、完成模型等,当然这其中也伴随着对于数据价值挖掘的,特别是在大数据的背景下,想通过对数据挖掘&分析建立自己的竞争优势。       R不仅 免费还有各种各样的的功能包资源。从某种程度上讲,任何你想要的功能应该都可以找到对应的包,只是说是否完全满足,对于一些算法研究人员来说,可以在原来的代码的基础进行借鉴。这也许就是为什么R最开始主要用到高校或者学术领域(当然和国外学者、专家这种自由、开放的环境或者意识有很关系,这也许就是为什么许多开源软件都是国外出来,很少看到国内的大公司有什么好的东西开源)。       很多行业人士都说R是未来的“王道”,就像unix的发展过程一样。我觉得未来一定有属于R的一片天空,而且这种天空可以说是接近无限。所以,对于有志于从事数据挖掘、数据分析这个行业的朋友来说,掌握R是也许会成为未来的必备技能(就像现在数据分析师大多要求会:SQL)。      最后,我对R语言的理解与总结可以概括为一句话:“开源、二次加工、分享精神”。

你可能感兴趣的:(r)