windows 系统R默认开启多核运算

windows 系统

前言

目前有两个版本的R可以下载,第一个版本在这里r-projet,缺点是默认单核运算,速度比较慢,优点是版本更新修复bug比较快,包安装起来比较友好。第二个版本是微软提供的microsoft-r-open,优点是默认多核运算,并且使用MKL(Intel®Math KernelLibrary)加速矩阵运算,速度比较快,缺点是版本更新异常慢,包安装起来没有r-projet友好。今天,我将介绍结合这两个版本的优点,安装配置一个默认多核运算并且安装包比较有好的R。

安装前

保证用户名是英文的,如果是中文用户名,请重装系统并用英文用户名 

在非系统盘位置,新建四个文件夹,比如R_soft,R_studio,R_files,R_tools  

安装路径不要包含中文,R对中文支持不好

下载相关文件

直接官网下载网速非常慢,下面给出国内镜像网站地址

R:(https://mirrors.tuna.tsinghua.edu.cn/CRAN/) 

Rstudio:(https://rstudio.com/products/rstudio/download/#download) 

Rtools:(https://cran.r-project.org/bin/windows/Rtools/) 

MKL:(https://software.intel.com/content/www/us/en/develop/tools/parallel-studio-xe/choose-download.html)

安装相关软件

一定要先安装 R 再安装 RStudio!

R:请选择英文路径,建议安装在一开始建立的R_soft文件夹里 

Rstudio: 建议安装在一开始建立的R_studio文件夹里 

Rtools:建议安装在一开始建立的R_tools文件夹里 

MKL: 直接默认安装即可

配置Rtools

安装完以上软件后,启动安装好的Rstudio,输入以下命令并运行:

writeLines('PATH="${RTOOLS40_HOME}\\usr\\bin;${PATH}"', con = "~/.Renviron")

之后重启Rstudio,运行

Sys.which("make")

给出刚才你安装Rtools路径就表示你安装成功!!

下载常用到的包

启动Rstudio,输入以下命令,静静等待即可!

options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))

pkgs <- c("tidyverse","dplyr","tidyfst",

         "fs","sf","mlr","mlr3",

         "EDA","mice","plotly","randomForest",

         "rpart","splines","mle4","ncdf4","gamma4",

         "lubridate","stringr","tidyr","htmlwidgets",

         "DT","gt","tidymodels","car","mgcv","survival",

         "shiny","data.table","purrr","future","progress",

         "tictoc","jsonlite","listviewer","skimr","devtools",

         "rmarkdown","RcolorBrewer","knitr",

         "Rcpp","plyr","rticles","pacman",

         "beepr","laendR","drake","bayesplot",

         "cowplot","hrbrthemes","janitor",

         "nanirar","tidylog","validate",

         "speedglm","fixest")

install.packages(pkgs,dependencies = T)

配置R

找到你刚才安装R的文件目录,进入以下目录../R_soft/R-4.0.2/etc ,用记事本打开Rprofile.site文件,并参考以下代码选择性复制粘贴到这个文件。

#请修改自己的位置,用于存放你下载的安装包,建议放在非系统盘

.CUSTOM_LIB = "E:/R_files/R_library"

#请修改自己的位置,用于存放临时数据

.TMP = "E:/R_files/R_temp"            

if(!dir.exists(.CUSTOM_LIB)){

   dir.create(.CUSTOM_LIB)

}

.libPaths(c(.CUSTOM_LIB, .libPaths()))

message("Using library: ", .libPaths()[1])

if(dirname(tempdir()) != .TMP){

   if(!dir.exists(.TMP)) dir.create(.TMP)

   cat(paste0("TMPDIR = ", .TMP), file="~/.Renviron", sep = "\n")

}

message("Using temp directory: ", .TMP)

##为xaringan 制作presentation服务

options(servr.daemon = TRUE)

##选择默认的镜像网址,加快安装包下载速度

options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))

# 设定字体,特别注意里面有一个 enfont 和 cnfont 是我最常用的两个字体。

windowsFonts(

  en_font = windowsFont("Times New Roman"),

  cn_font = windowsFont("思源宋体")

)

en_font = "en_font"

cn_font = "cn_font"

# 设定 ggplot2 绘图主题

ggplot2::theme_set(hrbrthemes::theme_ipsum(base_family = 'en_font'))

# 取消科学计数法的显示

options(scipen = 1)

# 设定 ggplot2 的默认调色板

options(

  ggplot2.continuous.colour = "viridis",

  ggplot2.continuous.fill = "viridis"

)

配置Rstudio

能设定元素很多,建议仔细看看!下面只是部分例子:

Tools -> Global Options -> General

Tools -> Global Options -> Code

Tools -> Global Options -> Apperance

快捷键 是提高生产力的重要要素,建议设定一组自己能习惯的快捷键

配置MKL,开启多线程运算

安装好MKL以后,找打以下文件夹:

"C:\Program Files (x86)\IntelSWTools\compilers_and_libraries\windows\redist\intel64\mkl"

"C:\Program Files (x86)\IntelSWTools\compilers_and_libraries\windows\redist\intel64\compiler"

以上两个文件夹里所有的文件全部复制粘贴到以下文件夹:“...2”,也就是你安装R的文件夹!

复制好以后在该目录下找到mkl_rt.dll文件,复制到桌面,不改变文件内容,修改文件名成Rblas.dll,并放回“...2”,直接覆盖原来的文件

同理找到mkl_rt.dll文件,复制到桌面,不改变文件内容,修改文件名成Rlapack.dll,并放回“...2”,直接覆盖原来的文件

恭喜你,大功告成,感受一下MKL加速后运算速度有多快,尝试运行以下以下代码,同时你可以拿其他单核运算电脑运行下同样的代码,对比下运行速度。

m <- 10000

n <- 2000

a <- matrix(runif(m*n),m,n)

system.time(s <- svd(a,nu=0,nv=0))

##    user  system elapsed

##   14.42    0.58    2.06

提醒:这步配置好可以卸载MKL,以释放空间!!!

致谢

经过一段时间的学习,算是有那么一丁点入门R了,感谢在成长路上指导帮助我的每一位,首先是自己的导师王斌老师,能给与支持和鼓励,感谢薛涛老师不厌其烦的解答我的每一个细节,感谢Rstata学院的老师同学们耐心又及时解答疑惑,感谢黄天远大神及其在大神组的群里每一个大牛们的技术指导,感谢华东吴亦凡(公众号:pypi主人)用爱发电,感谢王诗翔(公众号:优雅R)分享技术,感谢送哥、霸哥、stone哥等等所有技术大哥给予的指导和帮助!!!!!!!!!!

你可能感兴趣的:(windows 系统R默认开启多核运算)