深入浅出数据分析|R语言入门

数据图形化

  1. 散点图
    探索性数据分析的工具,发现因果关系。从多方面展现数据特点的快捷方法。
  2. 证伪法(排除法)
    处理异质数据源。让人们对各种假设感觉更敏锐,防止掉入认知陷阱。
  3. 贝叶斯统计

R语言

  • 读取数据
getwd( ) #读取工作路径
dir( ) #查看工作路径下有哪些文件
setwd("C:\Users\Administrator\Desktop") #更改工作路径直桌面
read.csv("hw1_data.csv") #读取hw1_data.csv
read.table() #读取csv格式的文件

  • P265-加载数据并绘制直方图

课本中使用source( )函数从网页读取,但是所给链接并不能访问。
可实现的加载方式:

> employees <- read.csv("hfda_ch10_employees.csv", header=TRUE)
#需首先将文件hfda_ch10_employees.csv置于工作路径下
> employees #输入数据框架名称,显示对应数据框架
> hist(employees$received, breaks=50) #hist直方图函数,employees数据框架中的received数据,break分组依据
> sd(employees$received) #sd求标准差
[1] 2.432138
> summary(employees$received) #进行数据统计
   Min. 1st Qu.  Median   
Mean 3rd Qu.    Max.
 -1.800  
4.600   5.500   6.028  
6.700  25.900

实现结果展示:

深入浅出数据分析|R语言入门_第1张图片
employees$received

  • P271用数据的子集绘制直方图
> hist(employees$received[employees$year == 2007], breaks = 50) #根据2007年的数据绘制直方图
深入浅出数据分析|R语言入门_第2张图片
2007.png
> hist(employees$received[employees$year == 2008], breaks = 50)>
深入浅出数据分析|R语言入门_第3张图片
2008.png
> hist(employees$received[employees$gender == "F"], breaks =
50)

深入浅出数据分析|R语言入门_第4张图片
男性.png
> hist(employees$received[employees$gender == "M"], breaks =
50)

深入浅出数据分析|R语言入门_第5张图片
女性.png
> hist(employees$received[employees$negotiated == FALSE], breaks = 50)

深入浅出数据分析|R语言入门_第6张图片
申请加薪.png
> hist(employees$received[employees$negotiated == TRUE], breaks = 50)

深入浅出数据分析|R语言入门_第7张图片
未申请加薪.png

  • P291R语言绘制散点图

探索性数据分析的工具,发现因果关系。从多方面展现数据特点的快捷方法。

cloud()函数可以绘制三维散点图,参见help(cloud)的帮助文件。

二维散点图练习:

> employees <- read.csv("hfda_ch10_employees.csv", header=TRUE)
#需首先将文件hfda_ch10_employees.csv置于工作路径下
>  head(employees,n=30) #指令集显示数据
> plot(employees$requested[employees$negotiated == TRUE],employees$received[employees$negotiated
== TRUE]) #plot生成散点图
深入浅出数据分析|R语言入门_第8张图片
加薪情况散点图.png

--2016.12.29
--于实验中心510

你可能感兴趣的:(深入浅出数据分析|R语言入门)