资产配置之熵池模型
目录
一、简介
二、香农熵
三、最小化相对熵
四、熵池模型资产配置
五、各类型观点融入
六、熵池模型求解
七、熵池模型与各模型对比
一、简介
在之前的文章中,整理了一系列资产配置模型,有马科维茨均值方差模型、风险平价模型、风险预算模型和BL模型,本文对另一资产配置模型进行详细介绍,算是对之前文章的一个补充。此模型为熵池模型,是应用熵池理论进行资产配置。其是BL模型的泛化,懂得BL模型的推导,可以很容易理解熵池模型。
BL模型是使用贝叶斯收缩的思想,其过程是:将市场均衡收益的概率分布当成先验分布,将投资观点分布当成条件分布,使用贝叶斯公式,获得后验分布,反解配置权重。
在这个过程中会有两个问题,其一观点必须是线性的收益观点,且BL模型不能考虑观点的相关性,其二先验分布只能是市场均衡点收益的的先验分布,市场均衡点一般情况不存在,且模型拘泥于收益分布,不能使用风险或者其他指标分布。
基于以上存在的问题,提出了BL模型的泛化模型---熵池模型。
熵池模型是使用熵池理论进行资产配置,其过程是:先找一个已知先验分布的参考模型,在再满足观点规则的空间里面找一个与先验分布相对熵最小的分布生成后验分布。最后通过先验分布和后验分布的池化得出资产的价格分布,根据资产的价格分布,再结合相应的约束和优化问题,反解出配置权重。
下面从香农熵开始,一点一点进行详细介绍。
二、香农熵
香农熵
在通信领域,对于一个信息所含得信息量,进行数学量化是见很难得事情,香农引入了香农熵得概念,彻底解决了这一问题,香农引入的这一概念,不光可以解决信息中含有信息量得量化问题,还可以计算在数据和信息压缩时的临界值,而且在数学和机器学习领域,这一概念还可以衡量随机变量,随机变量越不确定,起熵值越大。
也是因为上面所说的最后一个用途,导致这一概念在数学和机器学习领域大放光彩。
香农在推导香农熵表达式时,先描述了如下性质,认为所要得到的量,必须满足以下性质:
单调性,即发生概率越高的事件,其所携带的信息熵越低。极端案例就是“太阳从东方升起”,因为为确定事件,所以不携带任何信息量。从信息论的角度,认为这句话没有消除任何不确定性。
非负性,即信息熵不能为负。这个很好理解,因为负的信息,即你得知了某个信息后,却增加了不确定性是不合逻辑的。
累加性,即多独立随机事件同时发生存在的总不确定性的量度是可以表示为各事件不确定性的量度的和。
香农证明了,满足以上三个性质的公式是唯一的,表达式如下:
其中C为常数。X为随机变量或者随机事件,为事件x发生的概率。
当C=1时,H(X)被称为香农熵,单位为bit。
条件熵
由上面香农熵的概念可得到条件熵(X|Y)的概念,其定义为在给定条件 下,X 的条件概率分布的熵对 Y 的数学期望:
其表示随机变量或者信息Y在已知的条件下,随机变量或者信息X的不确定性。
互信息
两个随机变量或者信息之间的相互依赖,可以使用互信息来度量。其定义如下:
其中H(X,Y)为联合熵。
互信息的用处非常大,如果我们最大化两个随机事件的互信息,就是最大化两个随机事件的相关性。当两个X=Y时,有:
所以在机器学习中,理想情况下,当数据集中数据拟合出的分布和真实分布的互信息最大,可以认为从数据集中拟合出来的随机变量的概率分布与真实分布相同。
香农熵、互信息、条件熵的关系如下图所示:
KL散度(相对熵)
上面给出的互信息已经可以衡量两个随机变量的分布的差异,但是在机器学习中,更多的使用KL散度(相对熵)来衡量样本分布和真实分布之间的距离,从而不停优化样本分本。
KL散度定义如下:
其中p(x)时真实分布,q(x)时样本分布,可以通过不停的训练,使得越来越小,从而使样本分布更接近真实分布。
交叉熵
对上面KL散度进一步化简,可得:
因为H(p(x))仅仅与真实分布有关,所以在机器学习模型的优化时,这个是一个定值。只能优化后面一个部分。
其后面这部分就被称为交叉熵:
三、最小化相对熵
最大熵原理
最大熵原理是 1957 年由美国统计学家、物理学家E.T.Jaynes 提出的,观点将带来新的信息量,因而后验分布的熵一定小于先验分布,而
满足观点约束的后验分布有无穷多个,“最大熵原理”是指在这些分布中选择熵最大,最具有不确定性的那一个,尽量不加入多余假设和结构。
根据最大熵原理,我们如果对一个先验分布增加信息,得到的后验分布应该时这些后验分布中熵最大的一个,也就是我们加入的信息产生的后验分布应该和原来的先验分布有最小的相对熵。这就是为什么要进行最小化相对熵。
四、熵池模型资产配置
BL 模型
因为熵池模型时BL模型的泛化和推广,所以,我们先回顾以下BL模型的推导。
BL模型里面,先假设市场均衡收益服从如下分布:
构造观点收益分布为:
根据BL模型的推导,使用贝叶斯收缩,得到,最后的收益分布为:
上面正态分布均值为:
上面正态分布方差为:
由可以反解出配置权重.相信推导过程可参考<<金融模型——资产配置模型>>
熵池模型
我们仿照上面BL模型的过程,推导熵池模型.
这里是分成五步:
第一步:构建参考模型
所谓的参考模型就是风险因子X的先验联合分布,可以用概率密度函数来表示:
其中是一种分布的概率密度函数。
可以看到,原始的BL模型中,第一步是确定均衡收益的正态分布,熵池模型不需要限定在均衡收益上,可以是任意的风险因子X,而且这个X不需要服从正态分布,可以是任何分布。
这里一定要注意,我们由风险因子X一定可以通过一种方式求出资产配置的权重W。因为我们最后要求的就是W。理解这个地方也是理解整个模型最困难的地方,熵池模型用到的先验分布和后验分布不是资产配置的权重分布,我们如果要求得所需要的资产配置权重,要根据熵池模型用到的先验分布或者后验分布再另外引入优化算法,求解其最优配置权重。
一般由风险因子X分布确定权重的方法是构造以为自变量的满意度函数,也就是效用函数S。使的效用函数最大化,反解W。
即:
其中C为资产配置权重解空间。这就是上面所说的另外引入的求解资产配置权重的优化算法。
第二步:添加观点信息
由上面的参考模型,我们已经可以反解配置权重了,但是观点信息没有考虑进去,这里采用的是熵池理论,最小化相对熵算法,将观点信息加入到分布中。
最小化相对熵算法是贝叶斯收缩的泛化形式,为了更好泛化,这里的风险因子可以看成是原始风险因子X的一个函数g(X),则g(x)也是一个随机变量,其也服从已知的参考模型的分布。
即:
我们在V上添加观点信息。让其满足观点,那么我们的分布就会被更新成,记:
我们如果把第一步中满意度函数S中的替换成,那么我们使用最优化算法,也可以反解出配置权重W.
但是,我们不能直接替换,因为,我们不知道,或者说,满足条件的太多了。
那我们如何挑选一个最合适的呢,我们挑选的要满足两点,一是X必须满足观点信息,二是X仅仅
满足观点信息,不能夹杂任何其他多余的信息。
第三步:最小化相对熵算法
如何选取满足条件的, 刚刚好就是最大熵原理,我们只需要最小化与的相对熵,就可以找到最有的。
即:
其中为分布与分布的相对熵。
这里可以证明BL模型所用的贝叶斯收缩是最小化相对熵算法的一种特例。
这样,我们就把观点信息引入到配置模型中,而且从推到的过程我们看到,此观点没有做任何的限制,可以是风险的观点,可以是收益的观点,可以是非线性的观点,比起BL模型的现象观点已经做了很大的泛化。具体观点的引入形式,在第五小结--各类型观点融入讲解。
而且,因为使用了最大熵原理,添加的观点信息如果是有效的,那么模型得到的分布的熵一定是递减的,添加的观点信息如果是无效的,得到的分布的熵一定是不变的。这一点比BL模型好多了,BL模型即使无效的信息,后验分布的熵也会变小。
第四步、池化
熵池模型比起BL模型多一步,就是池化的一步,所谓池化,就是根据对观点信息的信心程度,对参考模型和加了观点的优化模型做一个加权处理。
即:
若存在着多个不同信心的观点,也可通过对100%信心的后验分布进行信心加权的方式进行融合,比如假设有S名专家分别对各自的()输入了他们的观点,那么我们可以得到S个 100%信心后验分布。最终后验分布即为:
至此,熵池模型的推导结束。整个熵池模型的示意图如下:
第五步、求解配置权重
截止第4步,熵池模型的推导是结束了,但是我们只得到了风险因子在观点下的后验分布,并没有得到我们想要的资产配置权重。我们可以根据风险因子在观点下的后验分布,可以得到资产价格的分布,另外引入优化模型(一般是构造效用函数),确定其资产配置权重。
五、各类型观点融入
上面的推导中可以看出,熵池模型比BL模型灵活的一点是,观点的类型很多,这一节,我们分别看看个类型的观点如何融入到模型中。
对于融入的观点类型包括:均值、中位数、分位数、Var值、波动率、协方差、相关系数、尾部相关性、CVaR、边缘分布、联合分布、Copula等。
对于融入的观点形式包括:等式、不等式、排序等。
均值
均值观点可以表达为:
这里的k代表第k个证券。是观点里面对第k个证券给定的值,是风险因子X的的函数.
其展开形式为:
其中J为历史界面样本个数,为资产k,历史上在第j期因子v的权重,同上。
中位数、分位数、VAR
对于n-分为数的观点:
其中为分布的n-分为数。
定义排序函数s(i)为风险因子中低i小的持续统计量。即的T期值从小到大排序,低i个值对应的下标。
定义序号合集:
则n-分为数的观点可表达为:
资产排序
对于资产排序的观点:
其中E为取期望,这里不一定是期望,可以是任意的函数,K是资产数量。
可以进行如下表达:
其他的观点形式不一一推到,可以证明,所有的观点都可以表述成一下模式:
其中就是我们想要得到的后验分布。a,b为观点给的信息。
上面所有的内容都是关于一些熵池模型的理论知识,下面给出熵池模型在实际应用时如何求解,并且给出一个实际的例子。
六、熵池模型求解
在求解BL模型时,可以通过数学推导,解出模型的解析解,但是在熵池模型里面,我们很难得到解析解,但是比较好的是,熵池模型的数值解非常简洁。
下面我们就给出熵池模型的数值解。注意再强调一次,这里的解还是得到的后验概率,不是资产配置的权重,资产配置的权重需要用后验概率另外建模求解。
第一步、选取样本点或者蒙特卡洛模型分布
首先我们对K个需要配置的资产,选取J个历史区间,统计每个历史区间上每个资产的风险因子X(或者是风险因子的函数V=g(X)),假设风险因子有M个,则
我们就形成了一个JXM的矩阵。此矩阵的每一行代表一个历史区间,此矩阵的每一列代表一个风险因子的边缘分布。
这里如果我们知道每个风险因子X的联合分布,我们不用去历史上截取J个区间,我们直接可以使用蒙特卡洛模拟法在这个联合分布里面采样。
第二步、构建参考模型
由定价公式,我们认为风险因子X和t期的观点信息可以确定t+1期的资产价格,即:
其中Price为一个函数。
根据定价公式,我们可以把上面矩阵的每一行加上对应当期的观点信息,映射成一个下一期的资产价格,因为资产有K个,所以可以把上面矩阵映射成一个JXK的矩阵。其矩阵的每一行还是一个历史区间,其矩阵的每一类代表一个资产。矩阵中元素为资产价格。
我们最终的目标其实是利用定价公式,求出资产的价格,这里我们构建参考模型,假设我们预测的下一期资产的价格是历史每期价格的加权平均,即:
其中k是第k个资产,J样本历史总区间数,是第j个区间上价格的权重(概率),为第k个资产在第j个样本区间上的价格。
那么就是我们的初始参考模型。这一参考模型一般认为是等权,即
等权意义就是,在没有任何观点信息的时候,我们认为当前价格应该等于历史每一期价格的均值。
第三步、观点引入
由上面的论述,所有的观点都可以表述成一下模式:
其中,A为一个矩阵,为需要求的带有观点的后验分布,
所以,我们只需要求解以下优化问题即可。
第四步、最小化相对熵算法
承接上面论述,我们需要解决以下优化问题。
这是典型的凸优化问题,使用拉格朗日乘数法,将其转换为拉格朗日对偶问题,可轻松解决,相信推导查看本人SVM的相关文章。
同SVM一样,转化成拉格朗日对偶问题后,问题回变得很简洁,不论J取多大,要求的阐述和J的惯性都不大,计算量也不会增加。
第五步、池化
根据观点信息的信心程度,确定c,代入池化公式。
第五步、求解资产配置
我们知道了最后的概率分布,这一概率分布是历史价格的一个权重,我们根据历史价格和这一概率分布,可以算出资产的价格,同理我们可以算出资产的收益率和风险。其计算方法就是马科维茨均值方差的计算方法。
我们得到每一个资产的价格分布,从而我们可以计算出每一个资产的收益、风险、var之类的指标,从而引入其他优化问题,解出资产配置的权重。
七、熵池模型与各模型对比¶
熵池模型作为BL模型的泛化,与其他均值方差模型相比,有以下有点:
1、 可融合几乎任意形式的观点(线性与非线性、等式与非等式);
2、 可对任意分布进行观点融合;
3、 可以幂集映射的方式融入观点间的相关性;
4、 观点的影响具有整体性,会对相关资产做全局调整;
5、 利用最大熵原理避免不必要的假设和结构;
6、 情景表达法下无需重定价,计算速度更快。
熵池模型作为新兴的一种资产配置模型,正在慢慢的普及,相信在未来会更加大众化。