情绪因子|XenonDB情绪因子2019-2021年单因子回测

一、背景

1. XenonDB数据库简介

XenonDB数据库是专业的经济金融时间序列数据库。应用自然语言分析和分布式计算技术,我们对大规模混乱的市场数据进行识别和分析,生成市场和企业各个维度的实时数据,向工业,商业,经济,金融,政务,教学和科研领域的专业人员提供高质量的结构化数据,快速的信息检索,和基于API的高频数据调用。

2. 产品概述:情绪因子

提供多维度依据

以时间为序列,不同等级满足不同需求

超广度覆盖面,深挖数据价值

情绪因子|XenonDB情绪因子2019-2021年单因子回测_第1张图片

实时更新,锁定信息价值

情绪因子|XenonDB情绪因子2019-2021年单因子回测_第2张图片

精确定位优质资产:top10选股样本

情绪因子|XenonDB情绪因子2019-2021年单因子回测_第3张图片

产品示例

情绪因子|XenonDB情绪因子2019-2021年单因子回测_第4张图片

二、结果

情绪因子|XenonDB情绪因子2019-2021年单因子回测_第5张图片

图例为2019年-2021年情绪因子回测累计收益曲线,对比沪深300指数

• 数据来源:股吧 (http://www.eastmoney.com),采集文本包括发帖内容,浏览量,评论量

• 过滤条件:浏览数大于5000,发帖数大于2,评论数大于2

• 用自然语言处理(Natural Language Processing) 量化文本所包含的情绪,按正、负面的程度进行打分,得分即为即情绪指数(范围为0-1)

• 量化策略:

选股:情绪指数前一天(t-1)排名前10的股票

配仓:按照情绪指数加权满仓配额

交易:在第一个交易日开盘价买入,收盘价卖出,不考虑交易成本

三、业绩评估

统计口径:

• 以一年250个交易日为年化标准

• 以沪深300指数为整体市场

• 无风险收益率为4%

1. 交易统计

情绪因子|XenonDB情绪因子2019-2021年单因子回测_第6张图片

交易统计主要描述了策略的执行效果,本策略实行单日换仓情绪值前10股票,并按情绪指数加权分配仓位,由于筛选条件使得平均持仓标的数不到10。我们可以看到情绪因子的正收益日平均盈利与负收益日平均亏损之和,与沪深300一样都为0.02%,说明该策略选股与大盘较为贴合,情绪因子能够很好的反应市场整体的情绪。在此基础上,日收益率的绝对值和胜率都被放大了,使得最终平均交易收益高出大盘近两倍之多,由此可见情绪因子在反映市场整体情绪基础上还具有一定的选股能力,这种效应会随着投资周期的增长而被指数性放大。

2. 风险性

情绪因子|XenonDB情绪因子2019-2021年单因子回测_第7张图片

贝塔系数:策略对市场整体风险的贡献度

在风险方面,情绪因子的最大回撤和波动率都要略高于沪深300,这可能是由于以情绪指数为权重分配仓位,从而情绪波动越大的股票仓位越重,使得整体策略偏激进。

情绪因子|XenonDB情绪因子2019-2021年单因子回测_第8张图片

由上图也可以看到,19年至20年期间策略整体走势与大盘基本一致,并在幅度上有所增大。然而策略与大盘相关系数和贝塔值均低于1,也就是策略与大盘并非完全正相关并且风险低于大盘,在图例的21年数据上我们能寻找到答案。

情绪因子|XenonDB情绪因子2019-2021年单因子回测_第9张图片

可以看到21年市场整体在经历熊市和横盘,但策略整体却在走牛,与市场方向相反,情绪因子在对抗熊市能力方面表现尤其出色,从而使得策略对于市场有了一定的风险对冲的能力。

3. 收益性

情绪因子|XenonDB情绪因子2019-2021年单因子回测_第10张图片

阿尔法系数:主动超额收益

夏普比率:单位整体风险收益

特雷纳比率:单位系统性风险收益

信息比率:单位非系统性风险收益

本文并非简单地去分析策略整体的收益率,而是特意选取了四个维度的指标,意在由浅入深地展示情绪因子信息价值所产生的收益以及收益的构成。选取阿尔法系数来作为情绪因子所产生的超额收益是因为对主动管理的偏股型基金而言,阿尔法系数就是基金经理通过选股、择时等带来的主动收益,反映的是基金经理的主动投资能力,因此,阿尔法越大通常说明基金经理的选股能力越强,而该策略的主要选股依据就是情绪指数。

情绪因子|XenonDB情绪因子2019-2021年单因子回测_第11张图片
情绪因子|XenonDB情绪因子2019-2021年单因子回测_第12张图片
情绪因子|XenonDB情绪因子2019-2021年单因子回测_第13张图片

为了具有横向对比性,本文选取了两个三年晨星评级为五星的量化基金,以及一个三年之内业绩前十的主动型股票基金来进行对比。可以发现我们的阿尔法系数和夏普比率都远超于同类产品,并且2.08的夏普比率能达到所有基金中前十的水平。高额的单位风险收益究竟是由市场整体上涨时我们抓住了市场情绪较为集中的股票所带动的,还是我们真的能在混乱的市场中,通过情绪因子发现优质的资产?于是我们将整体风险拆分成了系统性(市场)风险和非系统性风险,并分别用特雷纳比率和信息比率来衡量其单位收益率,并重点关注信息比率,因为信息比率是衡量通过获取不对称信息所产生的超额收益的重要指标,能够集中地表现情绪因子的信息价值。从构成上来看,信息比率是特雷纳比率将近三倍,由此可见本策略的主要超额收益都来源于情绪因子的信息价值。同时,如下图,策略的信息比率也远高于定性分析基金的信息比率,说明了人为选股能力很难赶超大数据水平。

情绪因子|XenonDB情绪因子2019-2021年单因子回测_第14张图片

四、结论和问题

1. 结论

• 以情绪因子为单因子的选股模型,在正常情况下能很好的与大盘表现一致,情绪因子能够很好的反映市场整体的情绪。

• 情绪因子在熊市时展现出了较高的价值,不仅能够对冲风险,甚至可以帮助使用者在市场整体低迷时精准地定位优质资产,获得较高超额收益。

• 通过对收益的层层剖析,发现策略之所以能够获得如此高收益,离不开情绪因子信息价值的贡献,情绪因子不管在牛市还是熊市都有着较强的择股能力。

2. 问题

• 如何考虑交易成本问题。

• 负收益率平均较高,胜率相较于大盘没有明显优势,如何对情绪因子进行筛选进一步提高其择股能力。

• 如何修改策略在不降低收益前提下,降低波动,使得收益具有稳定性。

五、相关产品推荐

投资者投资组合数据

情绪因子|XenonDB情绪因子2019-2021年单因子回测_第15张图片

你可能感兴趣的:(金融,语言模型,人工智能)