第1课–使用R进行数据分析的简介

在本课程中,我们将首先了解R的功能和用法。

R是一个非常适合数据分析和图形处理的软件环境。

它最初由新西兰奥克兰大学的Ross Ihaka和Robert Gentleman于1993年创建。 他们创建了R作为一种语言,以帮助向学生教授入门统计学。 他们基于R语言,该语言基于1970年代贝尔实验室较早开发的S语言。

一段时间后,他们将R用作开源GNU项目。 现在,全世界都有非常活跃的R社区。

R被认为是一种领域特定语言,因为它主要用于数据分析。

R程序通常使用函数创建,并且程序由R解释器执行。

R不仅是一种编程语言,它还具有创建高质量数据可视化的本机支持。

R已在医疗,零售和金融服务等许多行业中使用。

R可用于分析结构化和非结构化数据集。

R可以帮助您探索新的数据集并进行描述性分析。

R在建立预测模型方面也很出色。

学习R有益的原因有很多。

作为数据分析师或数据科学家,与仅使用基于电子表格的工具相比,R可以用于更深入地研究数据。

作为软件开发人员,R可以毫不费力地实现数据分析计算和图形到新应用程序或现有应用程序中。

随着大数据的爆炸式增长,在许多新的场景中,使用R是满足用户需求的绝佳选择。

作为数据分析人员,R可用于执行经典的统计检验和预测模型。

R还具有处理时间序列数据集的本机支持。

分类和聚类模型可用于更好地检测模式。

作为开发人员,R是功能强大的函数式编程语言。

由于解释了R脚本,因此它鼓励采用交互式方法进行开发。

R脚本通常使用表达式和内置函数编写。

R为许多有用的数据结构类型提供了本机支持。 其中许多数据结构将在其他课程中进行探讨。

外部库可用于扩展R的功能。

随着R技能的提高,您可能会开始定义自己的功能和可能的新类,以满足用户的需求。

安装R非常简单。

只需导航至R Project页面,然后单击全面的R存档网络或CRAN链接。

CRAN是世界各地的一组服务器,它们存储R的相同,最新的代码和文档版本。

有适用于Windows,Linux和Mac OS平台的二进制安装程序。 可以从源代码构建R,但是如果可能的话,最好避免执行此步骤,以便您可以更快地开始使用R。

在Windows上安装R涉及下载MSI文件并执行。

有32位和64位安装选项。 我们将使用64位版本的课程,因为它对可使用的内存量有更高的限制。

Windows安装完成后,您可以通过启动R命令行环境或RGui工具来开始使用R。

除了R命令行环境外,RGui还为R用户提供了一些有用的生产力功能。

在Linux上安装R涉及:从CRAN网站下载适当的RPM文件,或使用Linux软件包管理器(如YUM),如图所示。

请注意,您必须以root用户身份登录或在Linux系统上具有sudo特权才能完成安装。

一旦安装在系统上,任何用户都可以使用R。

默认情况下,提供了R命令行和GUI,但是许多R用户更喜欢使用更全面的集成开发环境(IDE),例如RCmdr或Rstudio。

RStudio是R随附的RGui工具的绝佳替代品。RStudio在Linux,Mac OS X和Windows上可用。

在此配置中,我们从浏览器内部在Linux服务器上使用RStudio。

对于偶尔使用R的用户,此环境非常理想,因为他们不需要在自己的计算机上安装R即可使用它。

让我们检查一下此处显示的平铺窗口:

•在左上角,我们可以查看2013_cars.csv数据文件和一个名为cars.R的R源文件。

•在左下角有R控制台。

•在右上角,我们可以访问当前R工作区中的对象以及最近使用过的R命令的历史记录。

•在右下角,我们具有数据的直方图以及对R帮助实用程序的访问。

在学习R的同时,值得花时间和精力来安装IDE(例如RStudio)。

先前我们说过R可以使用包来扩展。

CRAN中提供了4000多种不同的软件包,并且经常添加更多的软件包。

CRAN中发布的程序包根据其功能分类到“任务视图”中。

在本课程中,我们将主要使用内置或标准软件包集,但是您可能希望在此过程中探索一些其他软件包。

基本的R环境提供了一组重要的数据分析功能,但是R社区提供了许多出色的软件包。

可以使用install.packages()函数添加新软件包。

将在CRAN中搜索该软件包,或者您提供的新软件包在CRAN中不可用。

只需使用相同的功能并将其定向到新软件包的压缩存档文件即可。

在这里,我们看到正在安装RJDBC软件包,以通过JDBC驱动程序实现与数据库服务器(如Informix或DB2)的连接。

如果您开发的R脚本使用的功能不是R基础的一部分,则您的脚本应在脚本的前几行中包含library()或require()函数,以便在运行时将程序包加载到内存中。

From: https://bytes.com/topic/apis/insights/958465-lesson-1-introduction-data-analysis-using-r

你可能感兴趣的:(操作系统,数据结构与算法,r语言)