CAPM(Capital Asset Pricing Model),资本资产定价模型。模型形式为
其中 代表股票 n 的收益率; 代表市场组合的收益率,在实践中可以用大盘收益率代替; 代表无风险收益率,实践中可以用国债收益率代替; 代表随机因素
显然,估计式中的 需要回归,那么是在时序上回归还是在截面上回归呢?
考虑截面回归,也就是等式左边是用某一天所有股票的 ,右边是某一天的大盘收益率。但是某一天的大盘收益率是一个常数!这意味着拿一个变量与一个常量作回归,没有意义,因此应当是在时序上回归
时序回归,也就是等式左边是用某一支股票在过去一段时间内(比如一年)每一天的 ,等式右边是大盘在同一时期每一天的 ,这样就避免了与常量回归的问题
究其本质,只能在时序上回归的原因是 对截面上的所有股票是一样的,因此只能在时序上回归
翻译一下模型:股票收益率只与大盘收益率相关,这种关系是线性的
很显然,如果 CAPM 模型是正确的,那么意味着选股是没有意义的——因为股票收益率只与大盘收益率相关,在截面上大盘收益率对所有股票是相同的,股票在截面上的收益率差异完全是由随机因素决定的。这显然与实践中观察到的情况不符
首先,模型中是没有截距项(alpha)的!
其次,CAPM 模型在实践上并不正确!更不能作为炒股的指导!
再次,CAPM 模型的伟大之处在于其理论意义,也就是在满足一系列严苛的模型假设后,CAPM 模型是正确的。或者说,CAPM 模型是理想市场环境下股市应有的样子
Fama-French 三因子模型,模型形式为
其中 代表股票 n 的收益率; 代表市场组合的收益率,在实践中可以用大盘收益率代替; 代表无风险收益率,实践中可以用国债收益率代替; 代表随机因素;SMB(small minus big) 代表规模风险溢价(size premium),HML(high minus low)代表价值风险溢价(value premium);截距 代表定价错误(pricing error),如果模型正确这项应与 0 无显著差异
SMB 跟 HML 的计算方式:
先根据流通市值将股票分为 1:1的大市值(B)和小市值(S)股票;根据账面市值比数据将股票分为3:4:3的高中低(H/M/L)三组;这样我们就有了2×3共计6种投资组合(SL/SM/SH/BL/BM/BH)。然后我们通过市值加权平均的方式求得各组的收益率,最后就是求SMB和HML了:
其本质是,SMB :流通市值占后 50% 的小市值股票加权平均收益率 - 流通市值占前 50% 的大市值股票加权平均收益率
HML:流通市值占前 30% 的高价值股票加权平均收益率 - 流通市值占后 30% 的高价值股票加权平均收益率
像 CAPM 模型一样,Fama-French 三因子模型是在时序上回归
翻译一下模型:股票收益率只与大盘收益率、市值、市净率相关
相对于 CAPM 模型,Fama-French 三因子模型加入了市值、市净率两个新的因子,分别代表规模跟价值,这是在实践中广泛认同的两个因子,因此在实践中比 CAPM 模型的效果要好
但是其因子的构造过程(强行构造两个资产组合)在理论上缺乏依据
首先,对于价值因子,有些资料上写的是账面市值比,有些资料上写的是市净率。其实账面市值比与市净率互为倒数
其次,划分股票时是以流通市值为依据的!不是以公司个数为依据的!
再次,计算平均收益率时是以流通市值为权重的!不是简单平均!
Barra 模型,模型形式为
其中 代表股票 n 的收益率; 代表无风险收益率,实践中可以用国债收益率代替; 代表特异性收益率(specific return); 代表国家因子收益率; 到 代表 P 个行业因子收益率; 到 代表 Q 个风格因子收益率;对应的 X 代表因子暴露
所有股票在国家因子上的暴露均为1;如果股票属于行业 ,则 ,其余行业因子暴露为 0
Barra 模型的求解是在截面上进行的,也就是已知因子暴露求因子收益率
那么因子暴露是什么呢?Barra 模型与 Fama-French 模型不同,它没有人为构造一个资产组合,而是直接把标准化后的变量值作为因子暴露。比如风格因子 S1 是市盈率,那么股票在市盈率上的暴露就是股票本身的市盈率的标准化
将上述模型写成矩阵形式:
注意到,国家因子与行业因子之间存在完全共线性,即 ,所以需要对矩阵 X 加一个约束,即:
,其中 代表行业 i 的流通市值。这个约束的意义是:行业因子收益率的市值加权为 0
将此式代入后可以消掉 ,解决完全共线性的问题
在这个回归求解中,还涉及到异方差的问题,即 的方差互不相同。实践中认为 的方差与 成正比,因此最终进行的是加权最小二乘,权重是
对上述带约束的方程求取加权最小二乘,可以解得因子收益率向量
Barra 模型是一个典型的多因子模型。其创新点有四
一是引入了国家因子,并解决了国家因子与行业因子的多重共线性问题。宏观经济因子全部被国家因子所代表,经济周期则被行业因子所代表
二是使用的是加权最小二乘,解决了回归中的异方差问题
三是直接使用标准化后的变量值作为因子暴露,而非人为构造资产组合,这种模型更加自然
四是标准化可以使得因子暴露的方差为 1,所以求出的因子收益率是可以比较的
首先,风格因子中不应该有 这种在截面上对于所有股票都相同的因子——这些因子都被涵盖在国家因子中了
其次,前二个模型均是当期与当期数据的回归,barra 模型中的 X 是上一期的,而 r是当期的,也就是因变量与自变量之间隔了一期
再次,barra 模型不是用于预测股票收益率的!虽然 barra 模型中的 X 是上一期的,而 r是当期的,看似可以用来预测股票收益率,但是求出的因子收益率向量f也是上一期的,预测股票收益率必须假设因子收益率向量 f在时序上平稳,而这与实践不符
那么 barra 模型是用来作什么的呢?答案是用来探究因子的性质的。在每个截面上都可以求得一个因子收益率 f,这样就有了每个因子的收益率序列,可以从中筛选出稳定的因子,也可以探究因子之间的相关性,进而探究股票之间的相关性,起到降维的作用