量化交易入门学习

目录

量化交易入门

量化交易系统组成

策略识别

回溯测试

交割系统

风险管理

常见十大量化投资策略

海龟交易策略

原理

策略思路

双均线策略

原理

策略逻辑

alpha对冲

CAPM模型(资本资产定价模型)

什么是alpha对冲策略

怎么对冲

策略要点

多因子选股

原理

Fama-French三因子模型

策略设计思路

网格交易

原理

指数增强

策略原理

R-Breaker

原理

注释

量化交易入门

量化交易系统组成

一个量化交易系统包括四个主要部分:

  • 策略识别:搜索策略、挖掘优势(对搜索到的多个策略进行对比,选择一个最佳的使用)、确定交易频率。

  • 回溯测试:获取数据、分析策略性能、剔除偏差。

  • 交割系统:连接经纪商、使交易自动化、使交易成本最小化。

  • 风险管理:最优资本配置、最优赌注或凯利准则、交易心理学。

策略识别

所有量化交易流程都肇始于一个初期研究。这个研究流程包括搜索一个策略、检验它是否适合你可能正在运作的策略组合、获取任何测试策略时所需数据、努力优化策略使其收益更高且(或)风险更低。

很多策略都可归入均值回归交易策略、趋势跟随或动量交易策略两类。均值回归策略试图利用这样一个事实:“价格序列”(如两个关联资产的价差)存在一个长期均值,价格对均值的短期偏离终将回归。动量交易策略则试图“搭上市场趋势的顺风车”,利用投资心理和大资金结构信息在一个方向积累动量,跟随趋势直至回归。

策略或策略集合一旦确定,就需要在历史数据上测试其盈利能力,这就进入了回溯测试的工作范围。

回溯测试

回溯测试的目标是提供证据,佐以证明通过以上流程所确定的策略,无论是应用于历史(训练)数据还是测试数据4均可盈利。它可以反映该策略未来在“真实世界”中的预期表现。由于种种原因,回溯测试不能保证一定成功,因为量化交易中包含有大量的偏差。

对于历史数据,人们主要关心的问题,包括数据精度或清洁度、幸存者偏差、应对如分发红利、拆分股票等公司行为的调整。

精度与数据整体质量有关,无论数据是否包含错误,有时错误容易识别,比如使用一个窄带滤波器就可以找出时间序列数据中的“窄带”并更正他们。其他时候,错误又很难甄别,经常需要根据多个数据供应商提供的数据进行对比检查。

幸存者偏差通常是免费数据集或廉价数据集的一个特征。对于一个带有幸存者偏差的数据集,它不包含已经不再交易的资产数据。不再交易的证券,则表示已经退市或破产公司的股票。如果数据集中含有此类偏差,策略在此数据集上的测试表现可能比在真实情况里表现的更好,因为历史赢家已经被预先筛选出来,作为训练数据使用。

公司行为即公司开展的常引发原始价格阶梯形变化逻辑活动,它不应该计入价格收益。公司分发红利和拆分股票行为是引发调整的两个常见行为,二者无论发生哪一种,都需要进行一个”回调“的流程。千万不要把股票拆分和真实收益混为一谈。 

定量策略的业界标准度量为最大资金回挫与夏普比率。

  • 最大资金回挫表示一段时间(通常一年)内账户资金曲线从波峰至波谷的最大跌幅,尝试用百分比表示。由于大量的统计因素,LFT策略比HFT策略的资金回挫更高。历史回测会显示过去的最大资金回挫,它能够较为贴切地反映策略的未来资金回挫情况。

  • 第二个度量指标是夏普比率5,它被启发式地定义为“超额收益均值与超额收益标准差的比值”。这里,超额收益表示策略收益超出某个预定基准,如标普500或三月期短期国债(收益)的额度。注意人们通常不使用年化收益指标,因为它忽略了策略波动性的影响,而夏普比率却考虑到了这一点。

如果经过回测,策略的夏普比率很高且其最大资金回挫已经最小化,则可以认为它趋于无偏,下一步就是搭建一个交割系统。

交割系统

交割系统是一个方法集合,用它来控制交易策略生产的交易列表的发送和经纪商的交割行为。事实上,交易可以半自动、甚至全自动生成,而执行机制可以手动、半自动(“即点击一次交割一项”)或者全自动。对于LFT策略,手动和半自动技术比较常见;对于HFT策略,则必须创建一个全自动交割机制,由于策略和技术彼此依赖,还要经常与交易指令生成器紧密相接。

在搭建交割系统时,需要考虑几个关键因素:连接经纪商的接口、交易成本最小化、实时系统与回溯时系统性能的差异。

连接经纪商的接口一般通过一个全自动高性能的应用程序接口实现。如果要实现真正的HFT,就必须要构造一个用高性能语言(如C++)编写的内部交割系统。不过,在一家大型的基金管理公司,交割系统的优化通常不在量化交易员的工作范围;但若是在小型的公司或高频交易公司,交易员就是交割人,因此优化交割系统的能力也是不可缺失的。

另外一个属于交割系统的重要问题是交易成本最小化。一般地,交易成本由三部分构成:

  • 佣金(或税收):向经纪商、交易所和证券交易委员会(或类似政府监管机构)支付的费用。

  • (滑动)损耗:是预期交割价位与真实交割价位的差值。

  • 价差:待交易证券的卖出价与买入价之差。

交易成本是决定一个策略是高夏普比率且盈利丰厚,还是低夏普比率且极不盈利的关键。根据回溯测试正确预测未来的交易成本很具有挑战性,需要根据策略频率,及时获取带有卖出价与买入价信息的历史交易数据。

交割系统最后一个主要问题关系到策略的实时性能与回溯性能的差异,这种差异由多种因素造成,比如之前提到前窥偏差6和最优化偏差7。还比如,市场可能受到继交易策略部署后的一场政变的影响,而新的环境可能导致现实市场表现与回溯测试表现得差异,从而造成策略盈利性上的分歧。

风险管理

风险包含之前谈论的所有偏差,覆盖了几乎所有可能干扰到交易实现的因素。

风险管理还包括投资组合理论的一个分支,即所谓的“最优资本配置”,涉及到如何将资本分配给一组策略、如何将资本分配给策略内不同交易的方法。最优资本配置与投资策略杠杆通过凯利准则8建立联系。

风险管理的另一个关键成分涉及到交易员自身心理因素的处理。交易员在交易时,可能会掺杂许多认知偏差。一个常见的偏差时厌恶规避,当人们发现损失已成定局时,其所带来的痛苦可能会麻痹人的行为,导致不能做到及时抛盘止损;类似的,由于太过忧心已经到手的收益可能赔掉,人们可能也会过早抛盘收利。另外一个常见的偏差是所谓的近期偏好偏差:交易员太看重近期事件而非长远的看待问题。

常见十大量化投资策略

  • 海龟交易策略

  • 阿尔法策略

  • 多因子选股

  • 双均线策略

  • 行业轮动

  • 跨品种套利

  • 指数增强

  • 网格交易

  • 跨期套利

  • 高频交易策略

海龟交易策略

原理

建仓资金

海龟交易法将建仓资金按照一定比例划分为若干个小部分,每次建仓头寸1和加仓规模都与波动量N(又称平均真实波动振幅,ATR)有关。ATR是日内指数最大波动的平均振幅,由当日最高、最低价和上一交易日的收盘价决定。

  • ATR

    其中PDC是前一交易日的收盘价,ATR就是TR在N天内的均值

  • 价值波动量

    利用N值来体现价值波动量DV:

    其中每点代表的价值量是指每一个指数点所代表的价格

    每一次开仓交易合约数unit的确定是将总资产的1%除以DV得到的

入市信号

海龟交易法使用的是一个以理查德唐奇安的通道突破系统为基础的入市系统。唐奇安通道分为系统一和系统二,对应短期突破和中长期突破。其中,短期突破系统是以20日(最高价或最低价)突破为基础,当价格突破20日价格即为入市信号;中长期系统是当盘中价格突破过去55日价格为入市信号。

加仓和止损

海龟交易法的加仓规则是当捕捉到入市信号后建立第一个交易单位的头寸,市价继续向盈利方向突破时加仓。

止损位为,同加仓一样采用平均真实振幅N值为止损单位。每加仓一次,止损位就提高。

止盈

短期:多头2头寸在突破过去10日最低处止盈离市,空头3头寸在突破过去10日最高价处止盈离市。

中长期:多头头寸在突破过去20日最低处止盈离市,空头头寸在突破过去20日最高价处止盈离市。

策略思路

  1. 获取历史数据,计算唐奇安通道和ATR。

  2. 当突破唐奇安通道时,开仓。

  3. 计算加仓和止损信号。

双均线策略

原理

均线的前世今生

从统计角度来说,均线就是历史价格的平均值,可以代表过去N日股价的平均走势。

1962年,Granville提出了Granville八大买卖法则,只利用股价和均线即可进行择时。八大法则中,有四条用于判断买进时机,另外四条是用于判断卖出时机。买进和卖出法则一一对应,分布在高点的左右两侧(除买4和卖4以外)。法则内容如下所示:

  • 买1:均线整体上行,股价由下至上上穿均线,此为黄金交叉,形成第一个买点。

  • 买2:股价出现下跌迹象,但尚未跌破均线,此时均线变成支撑线,形成第二个买点。

  • 买3:股价仍处于均线上方,但呈现急剧下跌趋势。当跌破均线时,出现第三个买买点。

  • 买4:(右侧)股价和均线都处于下降通道,且股价处于均线下方,严重远离均线,出现第四个买点。

  • 卖1:均线由上升状态变为缓慢下降的状态,股价也开始下降。当股价跌破均线时,此为死亡交叉,形成第一个卖点。

  • 卖2:股价仍处于均线之下,但股价开始呈现上涨趋势,当股价无限接近均线但尚未突破时,此时均线变成阻力线,形成第二个卖点。

  • 卖3:股价终于突破均线,处于均线上方。但持续时间不长,股价开始下跌,直至再一次突破均线,此为第三个卖点。

  • 卖4:(左侧)股价和均线都在上涨,股价上涨的速度远快于均线上涨的速度。当股价严重偏离均线时,出现第四个卖点。

均线理论为什么有效

Shiller在研究中发现,资产的长期价格呈现均值恢复的特征,即从长期来看,资产的价格会回归均值。这也是均线理论被广泛应用的前提。

均线理论的缺陷

均线归根到底时一种平均值,平均值在应用过程中存在的最大的问题就是其滞后性,最佳时机早已过去。举例来说,如果A股票最新价格出现了较大的涨幅,股价和均线都上涨,但均线的速度慢于股价上涨速度。此时,从形态上来看,金叉出现,为买入信号。次日,股价回调,股价下降的速度快于均线下降的速度,形成死叉,为卖点。这样一买一卖不仅没有盈利,反而出现亏损。

均线理论的改进

  • 对均线的计算方法进行改正。

    加权移动平均线是在移动平均线的基础上按照时间进行加权。越靠近当前日期的价格对未来价格的影响越大,赋予更大的权重;越远离当前日期的价格,赋予越小的权重。

  • 调整均线周期

    利用不同周期均线得到的结果也不相同。许多有经验的投资者发现,在不同的市场中,有些均线的效果显著优于其他周期均线。有些长线投资者还会将股价替换成短周期均线进行趋势判断。

MACD指标

MACD称为异同移动平均线,是从双指数移动平均线发展而来的,由快的指数移动平均线(EMA12,当天的12日指数移动平均值)减去慢的指数移动平均线(EMA26,当天的26日指数移动平均值)得到快线DIF,再用2*(快线DIF-DIF的9日加权移动均线DEA)得到MACD柱。

MACD的意义和双移动平均线基本相同,即有快、慢均线的离散、聚合表征当前的多空状态和股价可能的发展变化趋势,但阅读起来更方便。

策略逻辑

  • 第一步:获取数据,计算长短周期均线。

  • 第二步:设置交易信号

alpha对冲

CAPM模型(资本资产定价模型)

资本资产定价模型中,资本资产主要指的是股票资产,而定价则试图解释资本市场如何决定股票收益率,进而决定股票价格。

CAPM模型由William Sharpe等人提出,他们认为,假设市场是均衡的,资产的预期超额收益率就由市场收益超额和风险暴露决定的。如下式所示:

根据CAPM模型可知,投资组合的预期收益由两部分组成:一部分为无风险收益率,另一部分为风险收益率。而风险收益率(即公式中的)才是投资股票等的前提。而具体的收益是由决定的,是用来衡量股票风险的指数。

在应用过程中发现,CAPM模型表示的是在均衡状态下市场的情况,但市场并不总是处于均衡状态,个股总会获得超出市场基准水平的收益,即在CAPM模型的右端总是存在一个项。

为解决上述问题,提出了詹森指数9(alpha指数)来描述这个项。计算方式为:

β是由市场决定的,属于系统性风险,与投资者管理能力无关,只与投资组合与市场的关系有关。当市场整体下跌时,β对应的收益也会随着下跌(假设beta为正)。alpha收益与市场无关,是投资者自身能力的体现。投资者通过自身的经验进行选股择时,得到超过市场的收益。

什么是alpha对冲策略

所谓的alpha对冲不是将alpha收益对冲掉,恰恰相反,alpha对冲策略是将beta收益对冲掉,只获取alpha收益。

量化交易入门学习_第1张图片

α对冲策略将市场性风险对冲掉,只剩下α收益,整体收益完全取决于投资者自身的能力水平,与市场无关。

怎么对冲

alpha对冲策略常采用股指期货做对冲。在股票市场上做多头,在期货市场上做股指期货空头。当股票现货市场亏损时,可以通过期货市场弥补亏损;当期货市场亏损时,可以通过股票现货市场弥补亏损。

策略要点

α对冲策略能否成功,主要取决于以下几个要点:

  • 获取到的α收益是否足够高,能否超过无风险利率以及指数。

  • 期货和现货之间的基差变化。

  • 期货合约的选择。

α对冲只是一种对冲市场风险的方法,在创建策略时需要结合其他理论一起使用,怎样获取到较高的α收益才是决定策略整体收益的关键。

多因子选股

原理

多因子策略是最广泛应用的策略之一。CAPM模型的提出为股票的收益提供了解释,但随着各种市场异象的出现,使得人们发现股票存在超额收益,这种收益不能为市场因子所解释,因此,出现了多因子模型。

多因子模型最早是由Fama-French提出,包括三因子和五因子模型。Fama认为,股票的超额收益可以由市场因子、市值因子和账面价值比因子共同解释。随着市场的发展,出现许多三因子模型难以解释的现象。因此,Fama又提出了五因子模型,加入了盈利水平、投资水平因子。

此后,陆续出现了六因子模型、八因子模型等,目前多少个因子是合适的尚无定论。

市场上常用的多因子模型包括如下几个。量化交易入门学习_第2张图片

Fama-French三因子模型

在CAPM模型的基础上,加入了HML和SMB两个因子,提出了三因子模型:

为构建价值因子和规模因子,Fama选择BM和市值两个指标进行双重排序,将股票分为大市值组B和小市值组S;按照账面市值比将股票分为BM高于70%分位数的H组,BM低于30%分位数的L组,BM处于二者之间的记为M组。如表所示。量化交易入门学习_第3张图片

得到上述分组以后,就可以构建规模和价值两个因子。

上述式子解释一下可以发现,规模因子是三个小市值组合的等权平均减去三个大市值组合的等权平均;价值因子是两个高BM组合的等权平均减去两个低BM组合的等权平均。

策略设计思路

在用三因子模型估算股票预期收益率时,经常会发现并非每只股票都能严格吻合式1,大部分股票都会存在一个alpha截距项。当存在alpha截距项时,说明股票当前价格偏离均衡价格。基于此,可以设计套利策略。

alpha < 0时,说明股票收益率低于均衡水平,股票价格被低估,应该买入。 alpha > 0时,说明股票收益率高于均衡水平,股票价格被高估,应该卖出。

因此,可以获取alpha最小并且小于0的10只的股票买入开仓。

网格交易

原理

什么是网格交易法

网格交易法是一种利用行情震荡进行获利的策略。在标的价格不断震荡的过程中,对标的价格绘制图格,在市场价格触碰到某个网格线时进行加减仓操作尽可能获利。

网格交易法属于左侧交易的一种10。与右侧交易不同,网格交易法并非跟随行情,追涨杀跌,而是逆势而为,在价格下跌时买入,价格上涨时卖出。

怎样设计网格

投资者可以随意设置网格的宽度和数量。既可以设置为等宽度,也可以设置为不等宽度的。设置等宽度网格可能会导致买点卖点过早,收益率较低。设置不等宽度网格能够避免这个问题,但如果行情出现不利变动,可能会错失买卖机会。

网格交易的盈利情况

量化交易入门学习_第4张图片

 量化交易入门学习_第5张图片

可以看到,无论行情上涨还是下跌,已平仓的部分均为正收益,未平仓的部分需要等下一个信号出现再触发交易。

即使网格交易能获得较为稳定的收益,但也存在一定的风险。如果行情呈现大涨或大跌趋势,会导致不断开仓,增加风险敞口。这也是为什么网格交易更适用震荡行情,不适合趋势性行情。

核心

网格交易主要包括以下几个核心要点:

  • 挑选的标的最好是价格变化较大、交易较为活跃的

    网格交易是基于行情震荡进行获利的策略,如果标的不活跃,价格波动不大,则很难触发交易。

  • 选出网格的压力位和阻力位

    确定适当的压力位和阻力位,使价格大部分时间能够在压力位和阻力位之间波动。如果压力位和阻力位设置范围过大,会导致难以触发交易;如果压力位和阻力位设置范围过小,则会频繁触发交易。

  • 设置网格的宽度和数量

    设定多少个网格以及网格的宽度可根据投资者自身喜好自行确定。

指数增强

策略原理

在进行股票投资时,有一种分类方法是将投资分为主动型投资和被动型投资。被动型投资是指完全复制指数,跟随指数的投资方式。与被动型投资相反,主动型投资是根据投资者的知识结合经验进行主动选股,不是被动跟随指数。主动型投资者期望获得超越市场的收益,被动型投资者满足于市场平均收益率水平。

指数增强是指在跟踪指数的基础上,采用一些判断基准,将不看好的股票权调低或平仓,将看好的股票加大仓位,以提高收益率的方法。

之所以不直接买入看好的股票,而是采取买入指数的方式,是为了在注重获取超越市场的收益的同时兼顾降低组合风险,注重收益的稳定性。如果判断失误,只买入选中股票而非指数会导致投资者承受巨大亏损。

和alpha对冲策略类似,指数增强仅仅是一个思路,怎样选择好股还需投资者结合自身经验判断。

R-Breaker

原理

原理

R-Breaker是一种日内回转交易策略,属于短线交易。日内回转交易是指当天买入或卖出标的后于当日再卖出或买入标的。日内回转交易通过标的的短期波动盈利,低买高卖,时间短,投机性强,适合短线投资者。

R-Breaker主要分为反转和趋势两部分。空仓时进行趋势跟随,持仓时等待反转信号反向开仓。

反转和趋势突破的价位点根据前一交易日的收盘价、最高价和最低价数据计算得出,分别为:突破买入价、观察卖出价、反转卖出价、反转买入价、观察买入价和突破卖出价。计算方法如下:

指标计算方法
中心价位P = (H+C+L) / 3
突破买入价 = H + 2 * P - 2 * L
观察卖出价 = P + H - L
反转卖出价 = 2 * P - L
反转买入价 = 2 * P - H
观察买入价 = P - (H - L)
突破卖出价 = L - 2(H - P)

触发条件

空仓时:突破策略

  • 空仓时,当盘中价格>突破买入价,则认为上涨趋势还会继续,开仓做多

  • 空仓时,当盘中价格<突破卖出价,则认为下跌趋势还会继续,开仓做空

持仓时:反转策略

  • 持多单时,当日内最高价>观察卖出价后,盘中价格回落,跌破反转卖出价构成的支撑线时,采取反转策略,即做空

  • 持空单时,当日内最高价<观察买入价后,盘中价格反弹,超过反转买入价构成的支撑线时,采取反转策略,即做多

底层逻辑解析

  • 反转卖出价和反转买入价

    根据公式推导,发现这两个价格和前一日最高最低价没有确切的大小关系。

  • 观察卖出价和观察买入价

    观察卖出价>前一交易日最高价;观察买入价<前一交易日最低价。

  • 突破买入价和突破卖出价

    突破买入价>观察卖出价>前一交易日最高价,突破卖出价<观察买入价<前一交易日最低价。

    用K线形态表示,则知:

    • 前一交易日K线越长,下影线越长,突破买入价越高。

    • 前一交易日K线越长,上影线越长,突破卖出价越高。

由此可知R-Breaker的底层逻辑:

  • 当今日的价格突破前一交易日的最高点,形态上来看会是上涨趋势,具备一定的开多仓条件,但仅此还不够。若前一交易日的下影线越长,说明多空方博弈越激烈,多方力量越强大。因此可以设置更高的突破买入价,一旦突破说明多方力量稳稳地占据了上风,那么就有理由相信未来会继续上涨。同理可解释突破卖出价背后的逻辑。

  • 持有多仓时,若标的价格持续走高,则在当天收盘之前平仓获利离场。若价格不升反降,跌破观察卖出价时,此时价格仍处于前一交易日最高价之上,继续观望。若继续下降,直到跌破反转卖出价时,平仓止损。

  • 持有空仓时,若标的价格持续走低,则在当天收盘之前平仓获利离场。若价格不降反升,升至观察买入价时,此时价格仍处于前一交易日最低价之下,继续观望。若继续上涨,直到升至反转买入价时,平仓止损。

注释

[1]  头寸,指银行、钱庄等所拥有的款项。

[2]  多头:是指投资者对股市看好,预计股价将会看涨,于是趁低价时买进股票,待股票上涨至某一价位时再卖出,以获取差额收益。

[3]  空头:投资者认为某种商品、股票、债券等的价格要下跌,于是卖出,希望在跌价后再买回或补进,获取差额利益。投机者在卖出后至未买回或补进前,手中并无实物,故称“空头”。

[4]  常将历史数据分割成多份,最简单的是分成两份,一份作为训练样本,另一部分作为测试数据。

[5]  夏普比率,又称夏普指数,是基金绩效评价标准化指标。夏普比率在现代投资理论的研究表明,风险的大小在决定组合的表现上具有基础性的作用。风险调整后的收益率就是一个可以同时对收益与风险加以考虑的综合指标,长期能够排除风险因素对绩效评估的不利影响。理性的投资者将选择并持有有效的投资组合,即那些在给定的风险水平下使期望回报最大化的投资组合,或那些在给定期望回报率的水平上使风险最小化的投资组合。

[6]  前窥偏差:又称先窥偏差。由于利用历史数据回溯时,策略在实际运作中使用的信息与历史数据回测时使用的信息不同,比如策略“日均价达到10元时卖出”,在实际运作时,由于只能得到开盘价至当前的价格数据,从而无从获得日均价的数据。这样的问题属于典型的先窥偏差。

[7]  最优化偏差:又称数据窥视偏差,从机器学习的角度来看,就是过拟合。由于过度优化,策略在历史数据测试集上表现不错,但在实际运用中却差强人意。

[8]  凯利准则:是一个在期望净收益为正的独立重复赌局中,使本金的长期增长率最大化的投注策略,可以用来计算每轮游戏中应投注的资金比例。若赌局的期望净收益为零或为负,凯利公式给出的结论是不赌为赢。

[9]  詹森指数:又称阿尔法系数,是衡量基金超额收益大小的一种指标,这一指标综合考虑了基金收益与风险因素,比单纯的考虑基金收益大小要更科学。

[10]  左侧交易:又称逆向交易。在市场上涨末期,以顶部为界,凡在顶部尚未形成的左侧高抛或者做空,属左侧交易;而在顶部回落后的杀跌,属右侧交易。在市场下跌末期,以市场底部为界,凡在底部左侧就吸低或者做多,属左侧交易;而在见底回升后的追涨,属右侧交易。一个能持续战胜市场的法则应该是中长期趋势必须坚持左侧交易而短期趋势必须坚持右侧交易。

你可能感兴趣的:(学习)