量化投资中的因子是什么?因子是如何分类的,包括哪些?

量化投资中的因子是什么?因子是如何分类的,包括哪些?_第1张图片

因子就是对个股有解释的因素。因子的种类很多,不同类别的因子从不同的维度对个股收益进行解释。比如基本面因子的数据来源方面有很大一部分是财务报表,从估值、成长、盈利能力等多个方面对股票收益进行解释。量价因子是围绕价格、成交量等技术指标构建的因子。

一般来说,因子可以分成三大类:
反映外部影响的因子、代表资产特点的截面比较因子、纯内部因子或者统计因子。

1 反映外部影响的因子

很明显,外部经济力量与股票市场间应该存在明确的联系。相关的因子便试图抓住这种联系。这些因子包括但不限于通货膨账系数、石油价格变动、汇率变化、工业生产量变化等、这些因子通常又被称为宏观因子。宏观因子有时非常有效,但其也有如下三方面的缺陷。
第一个缺陷是,必须通过回归分析或者类似的方法来估计资产收益对这些因素的反应系数。如果我们需要估计 3000 只股票,那么每个月都需要进行 3000 次时间序列回归。这将会产生估计误差。
第二个缺陷是,我们的估计通常是建立在对历史数据的估计基础之上的,比如说5年。这些估计虽然可能能够比较精确地描述历史情形,但未必能够精确描述当前或者未来的情况。也就是说,这些反应系数是不稳定的。
第三个缺陷是,这些宏观经济数据的质量较差,收集过程可能会存在错误和延迟。而且有的数据可能因为频率较低而没有太大的使用价值。

2 资产截面因子

资产截面因子用于比较股票自身的特征,与宏观经济无关。截面因子通常也可以分为两类:基本面特征和市场特征。基本面特征包括诸如派息比例、每股收益、股票市值等,市场特征则包括过去一段时期的收益率、波动率、成交量、换手率等。

3 统计因子

统计因子是一类因子,这些因子有可能与股票收益率相关,虽然其中并不存在明显的金融经济学逻辑,但是从统计上可以得到很好的解释效果。一般来说,我们要回避统计因子,因为统计估计往往会得出一些虚假相关性,而且统计因子往往还非常难以解释。
一般来说,我们需要挑选具有经济意义,可解释,而且具有统计意义的因子。典型的因子包含两类:行业因子和风险因子。行业因子用于衡量不同行业股票的不同行为,风险因子用于衡量其他的非行业尺度上不同股票的不同行为。

3.1 行业因子

股票所属行业是一项非常重要的特征。不过有的公司涉及多种行业,所以对股票进行业分类需要一个标准。A 股票的行业的分类标准有很多种,比如申万行业分类、证监会业分类等
其中,申万行业在业内使用得较多。股票分类又分为一级行业分类、二级行业分类等谓一级行业分类就是比较粗的分类,二级行业分类相当于一级行业分类的子分类。
在进行回归分析的时候,行业的头才一般设为 0或1的哑变量,主要目的是检测因子的表现是否有明显的行业倾向。

3.2 风险因子

风险因子可以分为如下几个大类。
(1)波动率 (volatility):根据波动率的不同来区分股票,是股份一项十分重要的特征。

(2)动量(momentum):根据股票当前的绩效来进行区分。学术中曾有实证研究,动量效应确实是存在的,即处于涨势的股票总是会倾向于上涨得更多,处于跌势中的股票也倾向于跌得更多。

(3)规模 (size):股票的规模一般会使用市值来表示。著名的 Fama-French 三因子模型中就有市值的因子。

(4)流动性 (liquidity):流动性也是股票一项非常重要的指标,一般使用股票的交易量来表示。

(5)成长性(growth):根据过去的和预期的收益成长性来进行区分。

(6)价值(value):根据股票的一些基本面数据来区分股票。比如股息、现金流、账面价值等

(7)财务杠杆 (financial leverage):根据净资产负债率和利率风险来进行区分。每一个大类通常都会包含几个特定的度量尺度,这些特定的度量尺度称为描述符(descriptors)。例如,波动率包括近期每日收益率波动率、期权隐含的波动率、近期价格范围等。尽管同一类别中的各个描述符通常都是相关的,但是每一个描述符都描述了风险因子的某一个方面。我们也可以在某大类因子的不同描述符中分配头才权

你可能感兴趣的:(金融量化,分类,数据挖掘,量化投资,因子,因子投资)