R语言ggplot2:第九章 数据操作

第9章 数据操作

9.1 plyr包简介

plyr包中的ddply()函数能够同时在数据的多个子集上做统计汇总。

  1. ddply(.data, .variables, .fun, ...):data是用来作图的数据,variables是对数据取子集的分组变量,fun是要在各子集上运行的统计汇总函数。

  2. subset() 用来对数据取子集的函数,选择数据中前n个(x%)个观测值,或者再某个阈值之上或下的观测值。

  3. transform() 是用来进行数据变换的函数,与ddply()一起可以计算分组统计量,例如各组的标准差,并且加到原数据上。

  4. colwise()用来向量化一个普通函数,也就是说colwise()能把原本只接受向量输入的函数编程可接受数据框输入的函数。

9.2 把数据化“宽”为“长”

ggplot2进行数据分组时必须根据行,而不能根据列。

reshape2包中的melt()函数和cast()函数可以灵活地整理和综合数据。

多重时间序列和平行坐标图的绘制,查看书籍吧,不想敲字了。

9.3 ggplot()方法

fortify()的原理以及如何用它生成符合ggplot2理念的新方法。

ggplot2将数据整理和图形显示完全分离开了。

你可能感兴趣的:(R语言ggplot2:第九章 数据操作)