R语言-理解R性能

计算性能限制因素

通过了解限制R计算性能的因素,从而更好的利用起R的性能,影响R的因素:CPU,RAM,磁盘I/O,算法。

  • CPU的速度和性能觉得了计算速度,它需要将R代码翻译成机器语言和实际处理时的执行过程。另外R是单线程的,即整个数据集都在一个CPU核上运行,所以你即使拥有一个多核的CPU,并没有什么用。但是并行编程可以克服这个问题。
  • RAM限定了数据的规模。数据都是先加载到RAM中,所以数据大小不能超过RAM容量。此外,并不是电脑上的全部内存R都可以使用,操作系统,后台进程等都会竞争占用内存,还有R还需要部分内存来储存计算结果。所以数据集的最大规模是空闲内存的1/2或1/3大小。linux系统相比于windows系统好处是可以将内存中的数据换到磁盘上的交换文件,从而扩大R的数据集规模大小。有效的利用内存,也是可以优化这个问题。
  • 磁盘I/O,影响数据的装载还有数据写回磁盘的速度。此限制性能对R性能的影响较大。
  • 自己编写的R代码对性能有着极大的影响。通常使用时间和空间复杂度来描述。

所以,当数据量小时,计算复杂度高,会受到CPU影响。数据量大时,会受到磁盘I/O还有RAM的影响。

R的运行对性能影响

R是解释型语句,即每次运行R程序的时候,R代码需要重新解释翻译成机器代码,即使代码不变。因为每次运行时,CPU都将做两件事,解释代码,执行代码。
与解释型代码形成对照的是类似于C的编译型代码,它们在运行钱将源代码编译成机器代码。编译成功后下次在CPU运行就很快了,因为是计算机的本机语言,但是每次代码改动时,都将进行编译,而编译的时间较长,所以其交互性不好。

你可能感兴趣的:(R语言-性能优化)