导读:很长一段时间以来,主观投资和人工智能的量化投资都在彼此领域获得Alpha。量化投资的强项在于高频交易,有大量的数据来源,能够从中甄别“人性”。在量化投资的眼中,股票价格短期的“随机漫步”,可能背后能够找到确定性的规律。而主动管理投资的强项在于长期定价,能够通过深度的基本面研究,挖掘长期价值具有成长性的公司。
而塞帕思的创始合伙人梁黄炫告诉我们,量化和主观投资“井水不犯河水”的时代即将结束,他们研发的AI量化模型已经进入了低频领域,能够在过去几年获得非常稳定的超额收益。AI量化基本面投资的优势在于数据分析,能够比人更有效率地分析大量的财报数据,找到财报中的“蛛丝马迹”。特别是上市公司数量不断增加后,量化的覆盖面优势变得越来越明显,能挖掘到一大批出现业绩反转的冷门股。那么这是不是会进入一个新时代呢?量化投资如同先进的机关枪,而主观投资更像大刀长矛。相信每个人都会有自己不同的看法。
以下我们先分享一些来自梁黄炫的投资“金句”:
1.过去几年的模型研究成果发现,将高频AI和基本面财报结合以后,能够在公募的换手率级别上获得相对主动管理投资非常显著的超额收益
2.同样研究报表,人很难打败机器,而且机器还没有能力圈的限制
3.高频AI已经进入低频主观领域。过去是“井水不犯河水”,未来可能会看到一片巨大的蓝海市场
4.量化的第一个好处是能挖掘到一些很少见的逻辑,比如说AI挖掘到应付职工报酬与净利润这个数据呈现背离时,系统就会给出一个高分
5.量化的第二个好处是,这套模型经常能找到一些反转股,这些公司都是主观市场关注度比较低的股票,但是从报表分析显示基本面即将出现反转
6.当高频和低频信息结合在一起之后,不但能从基本面挖掘信息量,还能从量价层面挖掘市场情绪,产生很不错的化学反应,起到1+1>2的作用
AI量化已经进入低频选股领域
朱昂:先说说你们目前开发的量化模型吧?
梁黄炫 了解我们团队的都知道,我们在2015年团队初建时就已经作为市场最早一批使用AI高频技术挖掘股票价值的团队获得了超过年化30%超额收益的市场优势。而随着市场的演变,我们开始思考更深入的变革。过去基于AI的量化投资基本上集中在高频量价方面,但是从我们过去几年的模型研究成果发现,将高频AI和基本面财报AI结合以后,能够在低频选股上获得相对主动管理投资非常显著的超额收益。AI量化投资已经进入到了低频领域。
过去大家对于私募量化低频的理解,最大到一个月换一次仓的频率,今天我们的低频已经到了最低八个月这样的换手频率,接近公募基金的换手频率。这得益于我们的模型比第一代量化模型有了质的进化。第一代量化基本面模型主要通过线性累加几百个基本面因子。到了第二代的AI系统,会使用更强的神经网络提取这些因子,并成千倍扩充因子,并加入大量技术面因子。这些技术过去只用在AI高频交易上面。而第一代AI高频模型则没有基本面信息,难以降低交易频率。我们的第二代AI低频模型综合两者的优势,弥补两者的不足,完成了质变的进化。
我们在去年就认为,高频交易变得越来越拥挤,市场玩家之间呈现零和博弈的趋势。高频收益的超额分布从过去的高胜率低波动逐渐演变为低胜率高波动,潜在风险加大。而且由于交易成本的存在,一旦模型失效,将会永远亏下去。而低频策略只要足够分散,最差结果也只是指数程度。这促使我们思考有没有更新的玩法。一开始我们以为量化基本面研究是一片红海,后来却发现把AI用到低频的基本面上,效果非常好。过去在高频领域,AI要训练很久才会出现一个好的结果,今天在低频领域AI很快能得到一个非常好的结果。在那一个时刻,我们就知道低频AI量化投资未来已至,市场必将发生剧变。
从原理上讲,通过将AI高频技术引入到财报分析中,意味着我们可以继承AI高频时间序列的研究方法,在横向和纵向都能研究,突破主观以及传统基本面量化的人工因子主要研究横截面信息的局限性,自然结果就会比两者要更好。逻辑上也是相通的,同样研究报表,人很难打败机器,而且机器还没有能力圈的限制。
主观投资会聚焦在自己能力圈的少数股票及领域上,但是对于AI来说没有这些限制,AI每天可以同时研究3000只股票。这意味着,这个模型可以把全市场的公开信息全部捕捉到,等于在和几十个深入不同领域的主观基金经理干同样的事情,并综合他们的成果,模型面对的是一个很广阔的市场。
对于主观经理来说,能力圈可能只允许基金经理对10个股票有深度研究,持仓10个股票。但是我们的AI模型能够每天对所有股票建立深度研究,每天精选不同的10个最好的股票,再通过大量不同的交易日买入每天不同的精选个股,使持仓数量极多且覆盖领域丰富,完成行业和风格中性,因此结合了主观精选个股和量化广泛覆盖个股两方面各自的优势。
相比而言,主观基金经理对我们的优势来自调研信息,这是我们比较难处理的。但是只要是同时面对财报和数据研究,AI原则上是不可能比人弱的。数据分析是AI绝对的强项。而主观的调研信息优势,并没有强大到覆盖其他领域的劣势。况且,AI具有更加分散化的特点,能够确保超额收益的稳定性,因此还能使用各种对冲工具,这是主观经理一般做不到的事情。
那么实现这个策略的难度是什么呢?我认为第一个是避免出现“选茅台”事件。比如说,AI算法去找到在市场上有效的若干基本面指标,这些因子能够帮我刻画出茅台这样的过去非常好的股票,于是我的策略就变成了一个用几个因子寻找“茅台”这种过去优异但是未来不确定的股票本身。这不是我们需要的策略目标,但这也不是过拟合这种模型过复杂问题,因此是其他行业的AI算法所不会面对的问题,不能简单套用各种常见AI网络设计,因此这是实现这类策略的难题之一。第二个是由于基本面数据少,因子却更多,导致了模型设计难度的激增。一个强大的计算机团队才能有效解决这类问题,这需要更深度地结合金融与计算机技术。我们团队主要由坚实的计算机背景出身的人组成,并佐以金融背景人才,因此有足够的能力解决这类问题。
总而言之,这是一条很少人玩的赛道,把原本高频领域的量价分析AI用在低频基本面财务选股上,数据科目就比以前多了100倍,因子数量也扩充到10^5级别。但是由于财报是低频数据,数据数量变少了,两相叠加导致问题的复杂程度可能扩大了许多倍。这里面还有许多需要解决的问题,因此需要设计出精妙的神经网络。不过我们的模型已经较为有效地解决这些问题,因此高频AI已经进入低频主观领域。过去是“井水不犯河水”,未来则AI低频模型可能面对着的是一片巨大的蓝海市场。低频领域赚的是企业成长的钱,同行之间不是竞争关系而是共赢关系,不再是零和博弈,互相之间可以一起获利,类似主观经理之间的关系,因此策略有效性就比高频策略稳健得多。基于基本面的AI对冲也可以实现成分对冲,利用IH和IF降低基差成本,完成对冲产品类别的扩充。
朱昂:我们也聊过许多主动管理的基金经理,大家都认为和量化相比,主观的能力在于定价。比如茅台到底值3万亿还是4万亿,是通过基本面分析做出定价,你觉得量化能在哪里战胜主动的专业投资者?
梁黄炫量化也有自己的分析方法。量化的第一个好处是能挖掘到一些很少见的逻辑,比如说AI挖掘到应付职工报酬与净利润这个数据呈现背离时,系统就会给出一个高分。去反推这个数据背后的逻辑是,当管理层愿意为员工支付更高的工资,意味着高管是看好这个公司的,即使净利润下跌,市场不认可,股价下跌也无所谓。这类数据又是主观投资不太容易挖掘到的逻辑。反而是一些大家常见的因子,我们的模型不会那么关注。比如说市盈率指标,我们的AI模型就不怎么关注。我们发现AI模型挖掘出来的因子,都是超出人们的想象,并且能迅速发现这个因子的价值与使用场景。这就是量化基本面模型的能力之一:通过更高维的思考去突破传统主观经理的投资极限,找到不一样的定价角度。
量化的第二个好处是,这套模型经常能找到一些反转股,这些公司都是市场关注度比较低的股票,但是从报表推算出基本面即将出现反转。当我们去关注的时候,这些股票的交易量很低,这类低关注度公司,公募基金也没有去正确定价。AI模型就有能力去挖掘出一批这样的低关注度反转股,能获得很大的Alpha。全市场定价是AI模型的最基本功底。
模型赚钱原因无非两个,一个是找到业绩低估,一个是发掘估值错估。一个代表当下的价值,另一个代表未来的成长性。模型通过其超越人类的分析能力,从基本面信息中捕捉到人类难以察觉的信息,并通过技术面信息的辅佐,选出适合当下的基本面市场风格。相比主观经理,AI量化低频能更全面地捕捉技术面信息也是一大优势。
那么相比主观,我们到底是靠什么在赚钱?我认为是通过苛刻的数据分析以及数据回测的能力校验去赚钱,这个问题就是仁者见仁智者见智了。
低频量化的周胜率更高
朱昂:你们实盘跑下来,低频量化和高频量化的净值曲线有什么差异吗?
梁黄炫高频量化的曲线,大部分时候并不平稳,会有一段时间很赚钱,大部分时间很平稳。我们这一套低频量化选股模型不同,不是依靠任何风格赚钱,基本上每一天都有超额,收益率曲线比高频量化要稳定很多。我们运作下来,26周的周胜率在92%左右,超额收益非常稳定,这个数据还是不包含打新和T0的。毕竟这种策略是各种风格都买,不会出现高频交易那种风格切换的问题,也不强依赖于市场交易行为。
朱昂:但是A股市场风格切换很厉害,一段时间的收益率基本上来自风格和市场匹配,你怎么做到周胜率那么高?
梁黄炫 一方面,我们买了所有的基本面风格,因为大量不同的交易日选出的风格是不一样的,持仓组合的因子是多样性的。另一方面,相对于公募基金的主观投资来说,这个模型还有大量量价分析的维度,因为我们本来就是做AI高频出身的,结合AI技术面高频是很自然的事情。当高频和低频结合在一起之后,不但能从基本面挖掘信息量,还能从量价挖掘,产生很不错的化学反应,因此不受到能力圈的限制的含义也包括这一层面,即不会固守在一个固定的基本面风格内。
朱昂:这个策略回测的结果如何,会在哪些时间段更有效?
梁黄炫我们看到2018、2019和2020三年回测下来,每年都有最具竞争力的稳定超额收益,收益水平上与我们过去的高频收益近似,这三年其实市场风格切换了很多次。2017年会相对差一些,因为这一年出现了一个巨大的风格切换,模型需要时间适应。
更重要的是,高频赚的是很拥挤的钱。这个钱我赚了,你就不能赚,交易优势只有最先的人具有,趋于零和博弈。我们在期货市场上已经看到了这个现象,基本上外资高频把整个高频期货市场都占领了。低频是赚企业成长的钱,我赚了这个钱,你也能赚。这意味着低频策略的稳定性会比高频要高,容量上限更大,我们也有理由相信未来能维持稳定。AI低频量化,是赚业绩预测的钱,不是赚交易情绪的钱,这个钱无论什么时候都是可以赚的。交易风格就说不准了,可能过一段时间大家又不喜欢当下流行的趋势了。模式的创新永远是最大的创新。
我觉得这个模型的总体思路有点像彼得林奇,去找冷门业绩反转的公司,不那么喜欢往人多的地方钻。但是也不绝对,取决于挖掘出的当下市场风格。
朱昂:会不会有流动性问题,很多股票的流动性很差,像美国和香港有许多几乎没有流动性的公司,就算被低估也难以价值回归?
梁黄炫这个不会的,我们看美股的罗素2000,里面个股的流动性还是很不错的。除非像国内新三板市场那种另一个市场的流动性,低到不可思议的地步,才会导致因为流动性缺失,长期的估值低估。流动性和关注度是不一样的,关注度高的市场只有短暂的流动性缺失,不存在长期的流动性缺失。
况且,一旦我们的模型找到业绩反转的公司,这类公司的关注度提升之后,流动性也会出现好转。像我们此前挖掘过的一个公司,交易量最低的时候只有百万级别,但是报表出来后,交易量一下子到了几个亿的级别,这也说明公司流动性缺失都是短暂的,只要业绩反转,流动性就能改善。只要都在A股市场内,就不缺乏关注度,也就不缺乏流动性。
这个问题的另一面是,当流动性越来越集中的时候,收益可能会越来越集中到少数个股,这对高频模型来说是有劣势的。高频模型每天要买大量的股票,导致难以捕捉少数个股的收益,而低频模型每天买的个股少,当市场收益集中在少数个股时,每天低频模型选股就会自动聚合,捕捉少数优势个股。
量化进入主动选股领域必然是未来方向
朱昂:这个策略,是只在A股有效,还是在海外也会有效?
梁黄炫如果这个策略海外没有人在做,那么一定是未来的方向。我们并没有做过海外市场,所以也不知道有没有人在做。这个模式一定是代表了未来的方向,兼具了量化和主观的很多优势。
朱昂:能不能理解,相比于普通的基金经理选股,你就像机关枪和大刀长矛的区别?
梁黄炫可以这么理解,我原本以为基本面量化是一片红海,但通过我们的研究发现,机器可以开放出来的空间很大,数据意义上,人是比不过机器的,这是一个确定的事情。主观有许多不确定性,导致了结果的差异。但我知道,只要面对单纯的数据,一定是机器比人强太多了。
所以过去高频量化和低频主观,井水不犯河水。你赚高频的钱,我赚低频的钱。现在AI已经进入到低频领域,那么长期看大概率改变这个行业的生态。如果研究上没有特殊之处,人是不可能打赢机器的。就像过去高频交易中,还有各种散户能赚钱,现在基本上不可能了,都是量化在赚钱。但是反过来说,由于低频的容量很大,可能这一套模型要达到很大规模以后,才会真正影响主观投资。
朱昂:你觉得还有其他量化也在进入这一块吗?
梁黄炫据我所知还没有,因为其他量化可能还在月级别的低频,我们已经到了季度级别、半年级别的低频。
朱昂:你们会不会有容量的问题?
梁黄炫 理论上,这种低频策略的容量可以做得比较大。这里面就有取舍的问题了。做到一个什么样的规模下,单家机构能够维持30%的超额收益率?我觉得差不多在100到200亿之间,规模再大一些,有可能会稀释收益率。
朱昂:你们的平均换手率是多少?
梁黄炫我们从低频到高频都有,最高250倍,最低2.5倍。这个低频策略对应的是20倍以下的换手率。高频策略主要是为了作为对比参考,我们发现现在的市场越低频越容易赚钱。
我们团队是一个很注重创新的团队,从2015年市场第一批创造AI高频模式到今天同样第一批创造AI低频模式,团队一直在创新的道路上不断地开拓。