解决R语言绘图中的中文乱码问题

在R语言环境中,画图有两种情况,一是直接用R自带的绘图功能,也就是默认的plot函数。还一种是用第三方绘图包,例如ggplot2lattice这样的绘图包,要在这两种情况下都能正常显示中文,操作方式是不一样的。

我的操作系统是macOS 10.13.6,R语言安装的是3.6.1版本,从网上下载了免费的思源黑体和更纱黑体(Sarasa Mono)字体文件,下面以此为基础说一下操作步骤::

解决plot的乱码问题

  1. 确定在$HOME目录中有.Rprofile文件,如果你的系统中没有,可以用
touch ~/.Rprofile

的方法建立一个空白的配置文件。

  1. 用编辑器打开.Rprofile,输入如下配置信息:
# My profile file

# 设置绘图设备的属性Hook函数,在绘图设备启动的时候自动载入
setHook(packageEvent("grDevices", "onLoad"),
    function(...) {
        WIDTH = 7; HEIGHT = 5.25; POINT_SIZE=10;
        # macOS Quartz
        grDevices::quartz.options(
                width       = WIDTH,
                height      = HEIGHT,
                pointsize   = POINT_SIZE,
                dpi         = 96)

        styles = c("-Light", "-Regular", "-Medium", "-Bold")
        styles2 = c("-Regular", "-Bold", "-Italic", "-Bold-Italic")
        grDevices::quartzFonts(
                serif=grDevices::quartzFont(paste0("SourceHanSerif", styles)),
                sans=grDevices::quartzFont(paste0("SourceHanSans", styles)),
                mono=grDevices::quartzFont(paste0("Sarasa-Mono-CL", styles2)) )

        # PDF Output
        grDevices::pdf.options(
                width       = WIDTH,
                height      = HEIGHT,
                pointsize   = POINT_SIZE,
               family      = "GB1")
    }
)

# 默认调用plot的时候每次都需要设置中文字体,hook之后就简单了
setHook("before.plot.new",
    function(...){
        if(par('family') == '') par(family="mono");
    },
    'append'
)

这两个hook函数,一个是在Device加载的时候运行,用于设置绘图设备的长、宽、DPI等参数,同时建立字体列表,我的是macOS系统,在苹果系统下绘图设备是quartz,所以创建字体用quartzFonts函数,如果你不是苹果系统,可以在R运行环境下调用一次plot函数打开一个绘图窗口,然后用dev.list()看看当前设备名称是什么,就知道对应的函数名称。
我建立了三个字体列表,分别是衬体(serif),无衬体(san)和等宽(mono),后续我只用这个mono字体,为什么?后面稍做解释。

第二个hook函数在plot启动的时候运行,网上还有一种方法,就是不用hook这个plot,在前一个hook函数中修改device的属性,这个也可以,但是只能在R运行环境中正常工作,RStudio中就无能为力,不如hook掉plot,这样两种运行环境下都能正常工作。这个hook的作用就是检查当前有没有设置字体,如果没有就设置为mono字体,而前面我已经建立了mono字体列表,实际上就是更纱黑体,所以这里就相当于告诉plot,你有没有特别指定字体啊,没有的话就用更纱黑体吧。

  1. 测试结果,保存.Rprofile并启动R,输入
> plot(cos, -pi*2, pi*2, xlab='自变量', ylab='因变量', 
    main='一个余弦函数', font=3)

这里font=3的意思是用斜体,我前面说了一直用这个mono的更纱黑体,道理就在这里,一般中文字体文件中不含斜体,其实有时候我们还是需要斜体的西文字体,更纱黑体刚好有斜体,所以就用它了。结果如图

解决R语言绘图中的中文乱码问题_第1张图片
cosplot.png

至此,R语言的默认中文绘图环境已经设置完毕,下面说一下第三方绘图包中的乱码问题

解决ggplot2的中文乱码

ggplot2并没有继承基础绘图的配置,所以我们得给它单独配置,不过也很简单,打开~/.Rprofile文件,再加一个hook函数:

# 设置ggplot2使用中文字体
setHook(packageEvent("ggplot2", "attach"),
    function(...) {
        try({
            theme_set(theme_get() + 
              theme(text=element_text(family='Sarasa Mono CL')))
        })
    }
)

是不是更简单?其实在绘图当中,我们也可以临时设置字体,只是每次都设置有点麻烦,我这样一次性设置之后使用起来就非常方便了。
保存配置文件之后再打开R运行环境,输入:

library(ggplot2)
qplot(1:10,  rnorm(10), main='正太随机抽取')

结果如下:


解决R语言绘图中的中文乱码问题_第2张图片
rnormplot.png

每个第三方包的工作方式都不一样,这也就意味着每加入一个绘图包,都可能要重新定义,例如lattice就是另外一直方式。

解决lattice的乱码问题

lattice没有ggplot2那么简单明了,实际上我在中文网站上竟然没有发现有人知道如何设置!是的,它确实比较隐秘,但还是有办法的:-),打开~/.Rprofile文件,加入如下hook函数:

# 设置lattice使用中文
setHook(packageEvent("lattice", "attach"),
    function(...) {
        try({
            font.settings <- list(fontfamily = "mono")
            my.theme <- list(
                add.text = font.settings, 
                axis.text = font.settings,
                par.xlab.text = font.settings, 
                par.ylab.text = font.settings, 
                par.zlab.text = font.settings, 
                par.main.text = font.settings,
                par.sub.txt = font.settings )
            lattice.options(default.theme = my.theme)
        })
    }
)

好了,我们再来看看效果如何:

library(lattice)
histogram(~mpg, mtcars, main='每加仑英里数')
解决R语言绘图中的中文乱码问题_第3张图片
hist.png

你可能感兴趣的:(解决R语言绘图中的中文乱码问题)