学习书籍:ggplot2:数据分析与图形艺术
R语言常用函数(参考来源)
通过上周R语言基础的学习,这周复习上周知识并查找资料对于R语言的整体函数进行总体性了解与针对性学习;
1. R语言基础
主要是一些数据的基本结构数据类型和字符类型结构,基础逻辑运算用于比较,查找和数据筛选;基础的知识需要在使用的时候多去挖掘相关属性。
2. R 语言相关统计知识
作为数据分析的统计核心,统计方法函数需要进行了解和学习;通过了解和学习发现在即对于数据分布特征的了解不够全面和深入(各种数据分布的功能和使用情况),需要后续进行加强学习和使用;经常性的使用数据描述性统计函数(简单统计函数的使用)进行数据的分析。统计检验和多元分析可以在数据分析的挖掘上更有用处,多元分析和数据模型的构造可以挖掘出数据的相关维度和潜在规律(虽然在线性模型的简单应用比较粗糙,不过可以对实际工作有一定的指导)
3.ggplot的绘图学习
set.seed(1410) # 设置随机数据的“种子”,这样得到的随机数可以重复验证
# sample(x,num) 在0-x中随意取num个数字(不重复);nrow(vector) 获取数据的长度-“行数”
dsmall <- diamonds[sample(nrow(diamonds),100),] # qplot(carat,price,data=diamonds) # 绘图plot(x,y,data= 数据源)
# 使用colour="分类列",shape="分类列"
# 无需使用R语言识别的类型“red,green”,会自行识别
qplot(carat,price,data=diamonds, colour = color,shape = cut)
# 几何对象,geom = "point"/"smooth"/"boxplot"/....
qplot(carat,price,data=diamonds, geom = c("point","smooth"))
qplot(carat,price,data=dsmall, geom = c("point","smooth"))
# method 参数,平滑参数span=num
qplot(carat,price,data=dsmall, geom = c("point","smooth"), span = 0.2)
qplot(carat,price,data=dsmall, geom = c("point","smooth"), span = 1)
# weight 对连续变量进行分组求和
qplot(color,data=dsmall, geom ="bar",weight = carat)
+ scale_y_continuous("carat")
# 时间序列
qplot(date, unemploy/pop, data =economics, geom = "line")
qplot(date, uempmed, data =economics, geom = "line")
# 分面
qplot(carat, data= diamonds, facets = color ~ ., geom = "histogram", binwidth = 0.1,xlim = c(0,3))
qplot(carat,..density..,data= diamonds, facets = color ~ ., geom = "histogram", binwidth = 0.1,xlim = c(0,3))
# 其他选项: 坐标轴区间范围(xlim/ylim),轴标签(xlab/ylab),主标题(main),对数运算log=“ ”
qplot(
carat ,price, data= dsmall,
xlab = "Price",ylab ="Weight(carats)",
main = "Price-Weight relationship"
log = "xy"
xlim = c(.2,1)
)