机器学习、数据科学与金融行业 系列四:智能投顾、量化投资与机器学习

机器学习、数据科学与金融行业

机器学习、数据科学与金融行业 系列四:智能投顾、量化投资与机器学习_第1张图片

系列四:智能投顾、量化投资与机器学习

难点不在于没有新思维,而在于无法摆脱陈旧思想的束缚。—— 巴菲特

历史不会重演,但却有韵律。—— 马克吐温

我可以计算出天体的运动和距离,却无法计算出人类内心的疯狂。—— 牛顿

    2017年Statista的官方报告中指出:智能投顾产品管理着超过2240亿美元的资产,且这个数字预计会每年增长47.5%,而在2021年会超过1万亿。该报告估计会有1亿人在接下来的四年中会使用智能投顾服务。美国目前有超过200个智能投顾产品。

    本系列文章中的第二篇:《智能投顾》中介绍了智能投顾产品的基本形态和主要技术方向,并提到了AI技术必将会深入应用到智能投顾的产品中。
    顾名思义,智能投顾扮演着投资和顾问两种角色,此篇文章就智能投顾中的投资部分探讨人工智能的核心技术(机器学习)与传统量化投资的结合应用。
本文主要围绕以下三个核心点展开:

  1. 智能投顾所采用的主要量化投资模型和技术。
  2. 智能投顾主流产品现状和学术界现状。
  3. 量化投资和机器学习(深度学习)结合的可行性。

注:量化投资是一个比较宽泛的概念,读者可能还听说过量化交易和算法交易等名词。简单梳理一下,我们可以认为一切投资都会转化为交易,从交易频率上可以划分为组合策略和交易策略,组合策略(投资组合管理)投资周期较长,交易频率较低;而交易策略(算法交易)则正相反。所有这些都可以基于量化技术。这样划分不是完全准确,只是为了简化这些概念。本文主要讨论组合策略所涉及的量化策略。

一. 量化投资模型和技术

 一个宏观视图
 两个核心要素
 三个基础理论
 五个主流策略

  1. 一个宏观视图
    机器学习、数据科学与金融行业 系列四:智能投顾、量化投资与机器学习_第2张图片

  2. 两个核心要素
    机器学习、数据科学与金融行业 系列四:智能投顾、量化投资与机器学习_第3张图片

  3. 三大基础理论
    机器学习、数据科学与金融行业 系列四:智能投顾、量化投资与机器学习_第4张图片
        CAPM(Capital Asset Pricing Model)资本资产定价模型是由美国学者Jack Treynor、William Sharpe、John Lintner等人在资产组合理论和资本市场理论的基础上发展起来的,并于1990年获得了诺贝尔经济学奖。CAPM主要研究证券市场中资产的预期收益率与风险资产之间的关系,以及均衡价格是如何形成的。虽然CAPM理论的成立依赖于一些与现实有出入的假设条件,但由于其简洁性和效用依然广泛应用于金融投资理论。
        MPT(Modern Portfolio Theory)现代资产组合理论‌是由美国纽约市立大学巴鲁克学院的经济学教授马柯维茨提出的,其论文中将概率论和线性代数的方法应用于证券投资组合的研究,探讨了不同类别的、运动方向各异的证券之间的内在相关性。MPT主要论证了分散原理以及相关系数对证券组合风险的影响。该理论成为了西方投资理论的基石并获得了诺贝尔经济学奖。
        APT(Asset Pricing Theory)资产定价理论是由金融经济学家Stephen Ross在1976年提出的,是金融经济学最重要的主题之一,它试图解释不确定条件下未来支付的资产价格或者价值,这里资产通常是指金融工具或某种证券,而价格是其市场均衡时的价格,即由市场需求与供给决定的价格。APT理论将金融资产的预期收益表示成各种不同的因子或者市场指数的线性模型,该理论认为如果价格偏离预期,套利会使其回归均值。

  4. 五个主流资产管理策略
    机器学习、数据科学与金融行业 系列四:智能投顾、量化投资与机器学习_第5张图片
        MVO (Mean Variance Optimization)均值方差优化模型主要是基于马柯维茨(Markowitz)的MPT理论的。
        BL Model (Black-Litterman Model) 是由Fisher Black和Robert Litterman在1992年首先提出,是基于金融行业对马可威茨(Markowitz)模型数十年的研究和应用的基础上的优化。
        Risk-Based(基于风险)策略只对风险进行建模,例如Risk Parity(风险平价)、Risk Budget(风险定价)和最大多元化等。
        Factor-Based(基于因子)策略是建立在APT理论基础之上的,例如Fama 3因子、BARRA、BIRR等。
        Return-agnostic(收益无关)策略并不对未来的预期收益做任何假设,通过简单的方式实现多元化投资和风险控制。例如投资共同基金常用的Core-Satellite方案,权重均衡策略等。
    笔者将会在后续系列的理论技术篇中对上述的基础理论和主流策略做详尽的解释和刨析。

二. 量化投资、智能投顾与机器学习产品和学术界现状

工业界现状
    桥水基金、文艺复兴技术、2-Sigma等知名对冲基金公司已经开始使用人工智能和机器学习技术来帮助它们构建投资策略。
    AI和ML可以处理非结构化数据,例如新闻、公司财报和社交媒体信息等。这些技术可以帮助投资决策者更好的了解公司的运营状况,商品流通以及金融资产。主要目的在1)得到更高的alpha收益2)建立更精确的预测分析和智能告警。3)提供市场行为建模。
下表总结了比较知名的投资机构采用机器学习技术的现状:
机器学习、数据科学与金融行业 系列四:智能投顾、量化投资与机器学习_第6张图片
    同时,在智能投顾领域,大多数机构在投资策略上采用机器学习技术显得比较谨慎,其原因在后面会阐述。据目前所知和笔者调查结果,较大机构基本还是采用以前文所述的三大基础理论为主的五个主流策略的某种实现,其中MVO是最多采用的组合策略。例如:
    Betterment增加了黑石基金的Target Income Portfolio,
    Goldman Sachs的Smart-Beta系列策略,还有最近兴起的Socially Responsible Investing(SRI)策略。
    Gravity投资公司主推其基于多元化投资组合优化策略。
    Wealthfront,最近发布了在其PassivePlus投资套件中增加的基于Risk Parity的策略。

注:谈到量化投资不得不提的是华尔街的传奇人物西蒙斯和他的文艺复兴技术公司,这个数学维布伦(Veblen)奖获得者通过建立数学模型来进行投资交易,创造了比巴菲特还要辉煌的战绩。他的策略完全黑盒,根据他自己的描述,业界普遍称为“壁虎投资法”。笔者推测应该是一种中高频的信号交易策略。

学术界
    金融投资市场在很多方面类似于一个博弈问题,而在博弈游戏领域:如AlphaZero等人工智能解决方案对比于人类显示出比较明显的优势。不少研究学者认为人工智能必定可以在这方面也发挥同样的优势,所以他们也开始研究如何用机器学习的相关技术替代传统的方案应用于投资领域以取得更好的成果。
    目前,学术界在这个问题上的研究可归纳为三个方向:强化学习、深度学习和其他,总结如下表:
机器学习、数据科学与金融行业 系列四:智能投顾、量化投资与机器学习_第7张图片
    我们可以看到,机器学习技术应用于量化投资主要集中在深度学习和强化学习,且主要应用于中高频的交易策略,相比之下在资产配置策略上应用较少。
    强化学习对于投资决策来说是比较完美的模型,最多使用的方法是Q-learning配合动态规划;而图方法主要分两种:贝叶斯推理和K最佳路径算法,后者是对强化学习求解难题的一种变通。
    同时,采用深度学习大概分为三个方向:
    首先,利用自然语言处理技术来处理金融相关新闻事件和舆情信息,通过知识图谱技术来进行知识建模,从而来辅助投资决策。这种方法工程量较大,但通常也较为有效。
    其次,采用分层的学习算法组合来对问题建模,例如正交变换(如小波变化)对时序信号降噪,然后通过自编码器来进行特征抽取和降维,最后再使用长短期神经网络训练以求解问题。
    最后,可以借助机器学习算法来辅助时序分析和参数估算,例如采用因子机来提炼因子,或用FIGARCH算法来对不规则布朗尼运动建模以估算其波动性和相关性等。
    总的来看,在这个领域应用机器学习和深度学习可谓百花齐放,但最主要还是用于交易策略,而且目前还没有哪一个策略长期有效且被公布。试想一下,如果某机构真的研究出非常有效的策略,笔者认为它也不会公开其算法。

三. 与机器学习结合的可行性

    证券分析之父Benjamin Graham曾经说到:金融市场短期表现像是一个投票机,而长期表现像是一个称重机。意思是说短期来看,恐惧、贪婪和其他情绪驱动了市场的波动,致使公司的股票的价格和其价值存在偏离,而长期来看,公司的基本面最终会使其价格收敛到其价值。
    在最近的一篇文章中,WIRED.com声称:机器越来越智能,通过分析市场价格和宏观数据,结合会计审核,这些AI引擎将做出自己的市场预测,并做出最好的选择。
    传统的算法交易引擎主要依靠代码和公式执行交易,当某个触发事件发生时。而AI引擎只是接受一个关于目标的泛化指令,并持续做两件事:(1)从多种方法中寻找最佳方案以实现目标。(2)从错误中学习以提高概率意义上的准确度。
下表是Eurekahedge公布的采用AI技术的投资策略与传统策略的对比结果:
机器学习、数据科学与金融行业 系列四:智能投顾、量化投资与机器学习_第8张图片
    从数据上看,机器学习引擎总的来看是优于传统方法的,相比于五年的夏普比率,2、3年显得更具优势,这意味着机器学习算法在不断优化和进步中。
    来自工业界和学术界的声音都告诉我们机器学习在投资领域可以大展拳脚,但是也有一些反对的话语,例如有学者认为机器学习在这个领域不会有太大帮助,模型拟合的越好,将来亏得越惨,因为历史不代表未来,金融市场是不可能被充分预测的,投资者应该做的是控制风险。
    我们需要思考:机器学习会有作用吗?在哪些方面?智能投顾产品是否可以采用?
    金融工程的本质问题是风险控制,如果希望获得超额收益,其核心问题是预测,传统方法比较擅长于前者,而机器学习比较擅长于后者。但笔者认为,目前的机器学习主要的方法论是归纳法,也就是说通过归纳历史数据发现规律从而进行预测。如果这个规律在金融市场上存在,则可以被算法发现,但是如果这个规律不存在或者不能在有效时间之内存在,那么机器学习就不能起到决定性的作用。而人类做决策和分析所采用的演绎法和推理法等非常有效的方法论,机器学习现在还难有大的突破。所以,机器学习在短时间内更多还是辅助作用,例如参数估算,用NLP技术抽取市场事件等等。
    在智能投顾产品所采用的资产组合策略中大部分还是以前文所讨论的三大理论和五种策略为基础,主要原因是智能投顾产品目前主要是针对长尾用户,主要解决自动化投资的问题,超高收益并不是其主要目标,而且机器学习目前主要应用于交易策略,在资产组合上似乎无用武之地。但笔者相信机器学习在资产选择上可以起到助推的作用,例如基金公司和基金经理的信息和关系的自动挖掘、金融相关新闻的自动抽取等。
    从前文中所罗列的学术界的研究我们发现,机器学习应用于投资领域主要是深度学习和强化学习。这就涉及到黑盒问题,也就是说假如一个深度学习模型不可解释它的变现为什么好,也就意味着某个条件成立的时候,它可能非常差。在这种情况下投资机构肯定会非常谨慎使用。

总结:

    本文总结了量化投资在资产组合管理领域应用于智能投顾的主要理论依据和策略,并给出了工业界和学术界在量化投资和机器学习结合的现状。现阶段由于机器学习主要是应用在交易策略上,所以还是只能起辅助作用,智能投顾产品并未大规模采用。
    笔者这里提出一个问题供大家思考:其实本质上主动投资是需要解决有效预测问题,金融市场的有效预测一直都是个难题,它需要大量的数据和高精尖的数据科学方法。如果有一家非常有实力的组织,它因为具备预测问题上的随机优势可以打败其他所有竞争对手。那么结果就是几乎所有投资人都把资产投在这家企业,也就意味着投资者的投资策略都相同。如果这种情况发生的化,会是一个什么结果呢?最后到底是因为它预测地准而大量资金投给它,还是因为握有大量资金而使其预测更准呢?

你可能感兴趣的:(金融科技)