本书借助统计语言R来阐释量化金融领域的实用例子。写作本书的目的在于向读者介绍如何利用R来学习量化金融。本书涉及从基础到高级的众多话题。具体而言,我们会介绍统计学、时间序列分析、小波分析以及它们在算法交易中的应用。在本书中,我们还会尽己所能地解释机器学习、风险管理、最优化、期权定价等领域知识的应用。
第1章“R语言入门”介绍R语言相关的基础知识,逐一说明R和R程序包的安装、数据类型、数据框、循环等知识。本章还说明如何编写和调用函数以及如何从不同格式的文档导入数据到R。本章的目的在于向读者提供关于R语言的基础性说明。
第2章“统计建模”介绍如何进行探索性分析(如常用的概率分布、相关系数、趋中性度量、异常值侦测等)以更好地理解数据。本章还介绍数据抽样和数据标准化/归一化的技术,这有助于我们更好地为分析步骤准备数据。在本章的最后,我们还说明如何进行假设检验和参数估计。
第3章“计量分析与小波分析”解释简单线性回归模型和多元线性回归模型,它们是构成很多统计分析技术的支柱。本章还介绍ANOVA和特征选择的相关知识。最后,我们利用小波分析构建若干模型。
在第4章“时间序列建模”中,我们借助例子展示如何使用ts()
、zoo()
和xts()
等函数将数据转换为时间序列数据,这是时间序列预测建模的基础性工作。接着,我们讨论不同的预测技术,如AR、ARIMA、GARCH和VGARCH等,并使用例子说明它们在R中如何实现。
第5章“算法交易”包含多个算法交易领域的生动示例,涵盖动量交易以及使用多种方法的配对交易等。本章还涉及CAPM、多因子模型、投资组合构建等方面的知识。
第6章“基于机器学习的交易”展示如何使用资本市场的数据构建机器学习算法模型,具体包括监督型学习算法和非监督型学习算法。
第7章“风险管理”讨论度量市场风险和投资组合风险的技术,并解释计算VAR的常见方法。本章还给出银行业内度量信用风险的最佳实践示例。
第8章“最优化”展示金融领域应用最优化技术的不同例子,如动态再平衡、前行测试、网格测试、基因算法等。
第9章“衍生品定价”介绍如何用R进行衍生品定价。本章涵盖普通期权定价、奇异期权定价、债券定价、信用利差和信用违约互换等知识。本章相对复杂,要求读者具备关于衍生品的基础知识。
首先,确保电脑上已经安装好R软件。书中的例子全部都用R来实现,相关代码可在R编辑器或控制台上直接执行。R是开源软件,可免费从官网下载并安装到任何类型的操作系统中。在该网站上可找到安装指南。一旦安装好R软件后,你就可以从第1章开始学习。每个章节都会说明本章所需的R程序包以及如何把它们安装并加载到R的工作环境中。
写作本书的目的在于向目标读者对学习R语言及其应用感兴趣的读者介绍知识。书中所用例子来自金融领域。这些例子有的比较基础,有的相对复杂,所用到R代码的复杂性也有所不同。本书并不要求读者已经掌握R语言编程的知识,但读者要具备一些数学分析的概念。即使读者已经能够熟练使用R,本书中用到的众多来自数据分析领域(特别是资本市场)的生动例子对这些读者肯定也会大有裨益。
在本书中,你会发现多种用来区分不同类型信息的文本格式。以下是一些文本格式的示例以及相应说明。
正文中的代码、数据表名、文件夹名、文件名、文件扩展名、路径、URL、用户输入、推特标签等使用如下格式:“我们会多次用到quantmod程序包。”
代码块示例如下:
getSymbols("^DJI", src = "yahoo")
dji <- DJI[, "DJI.Close"]
当我们需要你关注代码块的某个特定部分时,相应的代码行会加粗显示:
corr<-rollapply (data, 252, correlation, by.column = FALSE)
为了方便读者直接复制并执行相应代码,本书中输出的代码行前没有R控制台的命令提示符>,长表达式的换行也不注明+,而执行代码的输出结果前有两个注释符号,即##。
新术语和关键词以粗体表示,例如以读者在屏幕上、菜单栏或对话框中看到的关键词在文中格式如下:“点击Next按钮进入下一界面。”