R Markdown:Elegant, flexible and fast dynamic report generation with R
如果你已经厌倦 Word 或 Pages 等文字处理软件中大量的排版、字体设置、插入等操作,希望专注码字,几乎不动鼠标就生成一篇炫酷的报告,那么请进入R Markdown的新世界。
1.R markdown是什么
R Markdown是通过R语言和markdown标记语法来制作动态文档的一种文件格式以“.Rmd”结尾。其中,markdown是一种「标记」语法,用来代替常见的排版格式,使用诸如 * # 等标记符号生成极富表现力的文档(本文也是用markdown写的)。R Markdown 将markdown和 代码(支持R、SQL、Python等多种语言)整合后可以生成多种静态和动态格式。比如: HTML, PDF,MS Word, Beamer, HTML5 slides, Tufte-style handouts, books, dashboards, shiny applications, scientific articles, websites等。
2.R markdown的文件结构
文件由三种类型内容组成:
-YAML header(可选):头尾用 ---包围,包含标题、作者、日期、输出格式设置等信息。
-* Code chunks:头尾用 ``` 包围,包含代码和代码输出结果,更多内容参考code chunks说明。
-Text*:按markdown语法写的文本。
更多参考资料:R markdown_Reference。
3.实现原理
首先,将.Rmd文件提供给 knitr,该文件执行所有代码块,并创建一个包含代码和输出的新的markdown(.md)文档。
接着, pandoc处理由knitr生成的markdown(.md)文件,并负责渲染完成的相应的文件格式。
4.环境搭建:R+Markdown+LaTeX中文编译方案
R markdown默认情况下能正常输出html、pdf、word等,但输出含有中文字符的PDF会报错或无法显示中文字符,下面将解决在R markdown中输出中文PDF的问题,具体环境如下:Window7(64bit)+R(Version3.4.0)+Rstudio(Version 1.0.143)+Ctex(Version 2.9.2.164)
4.1软件安装
-R:R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。
-RStudio:R语言的集成开发环境。
-CTeX:CTeX中文套装是基于 Windows 下的 MiKTeX系统,集成了编辑器 WinEdt和 PostScript处理软件 Ghostscript 和 GSview 等主要工具。CTeX中文套装在 MiKTeX的基础上增加了对中文的完整支持,安装时建议完整安装(它不是R的包)。
4.2操作及环境配置
a.打开RStudio:File--New File--R Markdown--Document
b.设置文件编码格式:File--Savs as--Choose Encoding:UTF-8
c.用如下代码替换默认内容:
---
title: "My First R Markdown Document"
author: "qinluoao"
output:
pdf_document:
includes:
in_header: header.tex
keep_tex: yes
latex_engine: xelatex
html_document: default
word_document: default
---
#滕王阁序#
####[作者]王勃 [朝代]唐####
豫章故郡, 洪都新府。 星分翼轸, 地接衡庐。(后续文章内容暂时省略,在4.3最终效果中展示)
d.RStudio中的设置渲染引擎:Tools -- Global Options -- Sweave --Typeset LaTeX into PDF using: XeLaTex,引擎选择后可以正常输出为 PDF 文档,但中文无法显示。这个主要是 LaTex 的配置问题。
e.使用WinEdt新建header.tex文件,目的是通过在文件头中引入 LaTex 文件进行配置解决中文内容渲染问题。具体操作是:在与编辑的RMD文档同一个文件夹下,用WinEdt(此软件包含在CTeX中)新建header.tex文件,并将如下一行代码写入header.tex文件,最后header.tex保存类型也为UTF-8。
\usepackage{ctex}
另外也可以使用如下代码在header.tex自定义字体:
\usepackage{xeCJK}
\setCJKmainfont[BoldFont=SimSun]{Microsoft YaHei} %字体雅黑可以更换
\parindent 2em %段首缩进
f.生成PDF文件:操作如下图