CAPM、Fama-French 三因子、Barra模型

一、CAPM模型

1.1 模型

CAPM(Capital Asset Pricing Model),资本资产定价模型。模型形式为

r_{n}-r_{f}=\beta (r_{m}-r_{f})+\varepsilon_{n}

其中 r_{n} 代表股票 n 的收益率; r_{m} 代表市场组合的收益率,在实践中可以用大盘收益率代替; r_{f} 代表无风险收益率,实践中可以用国债收益率代替;\varepsilon_{n} 代表随机因素

1.2 模型求解

显然,估计式中的 \beta 需要回归,那么是在时序上回归还是在截面上回归呢?

考虑截面回归,也就是等式左边是用某一天所有股票的 r_{n}-r_{f}  ,右边是某一天的大盘收益率。但是某一天的大盘收益率是一个常数!这意味着拿一个变量与一个常量作回归,没有意义,因此应当是在时序上回归

时序回归,也就是等式左边是用某一支股票在过去一段时间内(比如一年)每一天的 r_{n}-r_{f}  ,等式右边是大盘在同一时期每一天的 r_{m}-r_{f} ,这样就避免了与常量回归的问题

究其本质,只能在时序上回归的原因是 r_{m}-r_{f} 对截面上的所有股票是一样的,因此只能在时序上回归

1.3 模型意义

翻译一下模型:股票收益率只与大盘收益率相关,这种关系是线性的

很显然,如果 CAPM 模型是正确的,那么意味着选股是没有意义的——因为股票收益率只与大盘收益率相关,在截面上大盘收益率对所有股票是相同的,股票在截面上的收益率差异完全是由随机因素决定的。这显然与实践中观察到的情况不符

1.4 误区

首先,模型中是没有截距项(alpha)的!

其次,CAPM 模型在实践上并不正确!更不能作为炒股的指导!

再次,CAPM 模型的伟大之处在于其理论意义,也就是在满足一系列严苛的模型假设后,CAPM 模型是正确的。或者说,CAPM 模型是理想市场环境下股市应有的样子

二、Fama-French 三因子模型

1.1 模型

Fama-French 三因子模型,模型形式为

r_{n}-r_{f}=\beta_{1} (r_{m}-r_{f})+\beta_{2}SMB+\beta_{3} HML+\alpha _{n}+\varepsilon_{n}

其中 r_{n} 代表股票 n 的收益率; r_{m} 代表市场组合的收益率,在实践中可以用大盘收益率代替; r_{f} 代表无风险收益率,实践中可以用国债收益率代替;\varepsilon 代表随机因素;SMB(small minus big) 代表规模风险溢价(size premium),HML(high minus low)代表价值风险溢价(value premium);截距 \alpha_{n} 代表定价错误(pricing error),如果模型正确这项应与 0 无显著差异

SMB 跟 HML 的计算方式:

先根据流通市值将股票分为 1:1的大市值(B)和小市值(S)股票;根据账面市值比数据将股票分为3:4:3的高中低(H/M/L)三组;这样我们就有了2×3共计6种投资组合(SL/SM/SH/BL/BM/BH)。然后我们通过市值加权平均的方式求得各组的收益率,最后就是求SMB和HML了:

SMB=\frac{1}{3}(SH+SM+SL)-\frac{1}{3}(BH+BM+BL)

HML=\frac{1}{2}(BH+SH)-\frac{1}{2}(BL+SL)

其本质是,SMB :流通市值占后 50% 的小市值股票加权平均收益率 - 流通市值占前 50% 的大市值股票加权平均收益率

HML:流通市值占前 30% 的高价值股票加权平均收益率 - 流通市值占后 30% 的高价值股票加权平均收益率

1.2 模型求解

像 CAPM 模型一样,Fama-French 三因子模型是在时序上回归

1.3 模型意义

翻译一下模型:股票收益率只与大盘收益率、市值、市净率相关

相对于 CAPM 模型,Fama-French 三因子模型加入了市值、市净率两个新的因子,分别代表规模跟价值,这是在实践中广泛认同的两个因子,因此在实践中比 CAPM 模型的效果要好

但是其因子的构造过程(强行构造两个资产组合)在理论上缺乏依据

1.4 误区

首先,对于价值因子,有些资料上写的是账面市值比,有些资料上写的是市净率。其实账面市值比与市净率互为倒数

其次,划分股票时是以流通市值为依据的!不是以公司个数为依据的!

再次,计算平均收益率时是以流通市值为权重的!不是简单平均!

三、Barra 模型

1.1 模型

Barra 模型,模型形式为

r_{n}-r_{f}=f_{C}+X_{I_{1}}f_{I_{1}}+...+X_{I_{P}}f_{I_{P}}+X_{S_{1}}f_{S_{1}}+...+X_{S_{Q}}f_{S_{Q}}+u_{n}

其中 r_{n} 代表股票 n 的收益率; r_{f} 代表无风险收益率,实践中可以用国债收益率代替;u_{n} 代表特异性收益率(specific return);f_{C} 代表国家因子收益率;f_{I_{1}} 到 f_{I_{P}} 代表 P 个行业因子收益率;f_{S_{1}} 到 f_{S_{Q}}​​​​​​​ 代表 Q 个风格因子收益率;对应的 X 代表因子暴露

所有股票在国家因子上的暴露均为1;如果股票属于行业 I_{i} ,则 X_{I_{i}}=1 ,其余行业因子暴露为 0

1.2 模型求解

Barra 模型的求解是在截面上进行的,也就是已知因子暴露求因子收益率

那么因子暴露是什么呢?Barra 模型与 Fama-French 模型不同,它没有人为构造一个资产组合,而是直接把标准化后的变量值作为因子暴露。比如风格因子 S1 是市盈率,那么股票在市盈率上的暴露就是股票本身的市盈率的标准化

将上述模型写成矩阵形式:

r=Xf+u

注意到,国家因子与行业因子之间存在完全共线性,即 1=X_{I_{1}}+...+X_{I_{P},所以需要对矩阵 X 加一个约束,即:

f_{I_{1}}s_{I_{1}}+...+f_{I_{P}}s_{I_{P}}=0,其中 s_{I_{i}} 代表行业 i 的流通市值。这个约束的意义是:行业因子收益率的市值加权为 0

将此式代入后可以消掉 f_{I_{P}},解决完全共线性的问题

在这个回归求解中,还涉及到异方差的问题,即 u_{n} 的方差互不相同。实践中认为 u_{n} 的方差与 \sqrt{s_{n}} 成正比,因此最终进行的是加权最小二乘,权重是 \frac{\sqrt{s_{n}}}{\sum \sqrt{s_{i}}}

对上述带约束的方程求取加权最小二乘,可以解得因子收益率向量

1.3 模型意义

Barra 模型是一个典型的多因子模型。其创新点有四

一是引入了国家因子,并解决了国家因子与行业因子的多重共线性问题。宏观经济因子全部被国家因子所代表,经济周期则被行业因子所代表

二是使用的是加权最小二乘,解决了回归中的异方差问题

三是直接使用标准化后的变量值作为因子暴露,而非人为构造资产组合,这种模型更加自然

四是标准化可以使得因子暴露的方差为 1,所以求出的因子收益率是可以比较的

1.4 误区

首先,风格因子中不应该有 r_{m}-r_{f} 这种在截面上对于所有股票都相同的因子——这些因子都被涵盖在国家因子中了

其次,前二个模型均是当期与当期数据的回归,barra 模型中的 X 是上一期的,而 r是当期的,也就是因变量与自变量之间隔了一期

再次,barra 模型不是用于预测股票收益率的!虽然 barra 模型中的 X 是上一期的,而 r是当期的,看似可以用来预测股票收益率,但是求出的因子收益率向量f也是上一期的,预测股票收益率必须假设因子收益率向量 f在时序上平稳,而这与实践不符

那么 barra 模型是用来作什么的呢?答案是用来探究因子的性质的。在每个截面上都可以求得一个因子收益率 f,这样就有了每个因子的收益率序列,可以从中筛选出稳定的因子,也可以探究因子之间的相关性,进而探究股票之间的相关性,起到降维的作用

你可能感兴趣的:(量化投资,量化交易,capm,BARRA,统计学)