data.table教程

感谢大神翻译。
https://youngspring1.github.io/2016/2016-03-13-datatable1/
https://youngspring1.github.io/2016/2016-03-21-datatable2/
https://youngspring1.github.io/2016/2016-03-22-datatable3/
https://youngspring1.github.io/2016/2016-04-02-datatable4/
https://youngspring1.github.io/2016/2016-04-08-datatable5/

data.table优点很明显,默认使用多线程,底层靠C/C++实现,速度不慢于python的numpy, 熟悉后代码够简洁。
初用似乎规则很多,总是不按照预期返回数据。但其实逻辑性很强。

1.j :要注意j位置是操作,不是data.frame的仅选列。
j 位置的操作,相当于dplyr的summarise
i 选行 + j位置操作,相当于对选行后的数据进行summarise操作。
by 位置分组+j位置操作,相当于 dplyr的groupby+summarise。

  1. 传址。:= 是data.table定义的传址操作,不同于R默认的传值操作。

你可能感兴趣的:(data.table教程)