如何比较两组应收款哪一个更分散——降序比例截断样本估计分散度区间

一、前言

在信评实际工作中,通常会遇到以下问题:在存在部分披露的情况下,如何比较两组应收账款的分散程度?通常采用的指标是前10名或前5名所占百分比。但是,前N名合计占比这个指标不能完全衡量分散程度。例如,有以下两组应收款:

序号 占比(%) 累计占比(%)
1 30 30
2 30 60
3 30 90
4 5 95
5 5 100
序号 占比(%) 累计占比(%)
1 70 70
2 14 84
3 6 90
4 5 95
5 5 100
  • 情况1:披露时,都只披露前3名的情况。

    此时,披露出的部分占比都是90%,无法比较谁的分布更集中,但是显然后者更集中,前者更分散。

  • 情况2:完全披露应收款的分布情况

    采用前3名合计占比这个指标来衡量,则二者分散度的度量结果相同,无法比较,但是显然后者更集中,前者更分散。

  • 情况3:前者只披露出前3名,后者全部披露

    无法直接比较二者的分散程度

本文的目的在于:提出一种通用的度量,可以比较两组应收款的分布哪一个更分散。

同时,本文提出的分散程度度量方法,其适用的范围更广,可以将一组完全披露、一组不完全披露的两组应收款来比较其分散度。由于它是借用Markowitz均值-方差模型的想法构建的,因此暂称之为-度量。

二、原理、方法论与假设

本文提出度量应收款分散度的思路如下。化用Markowitz均值-方差模型的想法,在Markowitz均值-方差模型的假设下,应收款越分散,合计违约金额这个随机变量的方差就越小。因此,合计违约金额的方差的大小,可以作为应收款分散度的一个度量方式。

具体来说,即假定应收款中:

  • 每笔债务违约与否相互独立
  • 每笔债务违约的概率都是
  • 每笔债务回收金额为0

三、σ-度量的计算方法、性质及含义解读

1、计算方法

设实际的应收款百分比降序列为,其中,前项为报表附注中注明,通常是前5大债务人,或前10大;为实际上有多少笔应收款。因此有。记。采用度量区间来度量,其中

其中,对于未知的部分的计算方式如下:

取,

    • 则另取,
  • 否则取,
      • 则取,2
    • 否则取,
      • 若,
        • ……依此类推

例:有不完整的降序百分比列:80%, 7%, 3%

计算:

计算:还应再指定的值

不完整百分比例之外,还有1-(80%+7%+3%)=10%,因此取,,

2、性质(与应用无关,可跳过)

  1. 对于披露完全的,有,即区间段收缩成一个数,记为

  2. 分布越集中,、越大;反之越小

  3. 、的最大值为1,最小值为,其中为实际上应收账款的笔数

    这一条也说明,-度量对于应收账款笔数也是有所反映的,不像前N名合计占比,对应收账款笔数不敏感

  4. 是假定未知的部分达到最分散的状态时,σ-度量如何;是假定未知部分达到最集中的状态时,σ-度量如何

  5. 开二次根号完全是为了数字看上去舒服,不会太过接近于1,类比于方差与标准差而生产,无其他实际用途

3、解读

计算出的、本身没有意义,通过与另一个区间进行比较才有意义。

  • 对于计算出的两个区间,解读方法是:

    • 若,即两区间没有重合,则小者表示分布更分散,大者表示分布更集中

    • 若,即两区间有重合,则认为不可判断。对于“轻微接触”的情形,可视“轻微程度”来解读。

      如,,相交的部分是,长度为0.01,认为可以忽略,认为后者比前者更分散

      如,后者包含着前者,则认为完全无法判断

  • 对于计算出的一个区间、一个数,解读方法是:

    • 若,则小者表示分布更分散,大者表示分布更集中
    • 若,则看是否特别接近和,如果不是特别接近,则认为无法判断,否则根据大小可以粗略判断

4、另一种使用方法

在计算出和后,可以寻找与之分散度最为接近的项等值,即利用解出的值。此时,的值代表着可将这样的分散程度,视作几等分的分散度。

四、计算举例

1、前言中的例子

利用上述度量,比较前言中情形3的两个应收账款分散度。

上表:,

下表:

下表的71.99%在区间(51.96%, 52.92%]的右侧,因此下表的分布更集中,上表的更分散。

2、无法直观比较出的分散度举例

例1:虚拟的例子

应收款1 应收款2
第1名 27.49 34
第2名 12.96 7.5
第3名 7.18 5
第4名 4.15 3.95
第5名 3 3.94
前5名合计占比 54.78 54.39

上表为两组应收款,各按其中债务主体进行汇总,排序为金额占比由大到小,其中的数字表示该债务人占总应收款的比重。用肉眼观察,前5名合计占比二者差不多;第1组应收款的第1名占比小,但是2~4名占比大。因此,无法用直观地看出哪一组应收款更分散。

用本文提出的方法计算,得到:

应收款1 应收款2
31.65 35.61
33.71 38.00

其中,应收款1中:

因为,从而有

应收款2的计算同理。

观察上表,可知:应收款1的区间整体都在应收款2的左侧,因此,应收款1更分散。

例2:易事特集团股份有限公司应收款分散度分析

2017Q1
2017Q3

将以上两张表的占比部分提取出来,得到下表:

2017Q1应收款 2017Q3应收款
第1名 27.49 26.88
第2名 12.96 13.24
第3名 7.18 6.88
第4名 4.15 4.05
第5名 3 3.94
前5名合计 54.78 54.99

现在需要分析该企业这两次报告期的应收账款分散度如何变动。

经计算,得到:

2017Q1应收款 2017Q3应收款
31.65 31.26
33.71 33.92

两区间基本是重叠在一起的(2017Q3的区间是包含着Q1的区间的),相交的部分长度为2.06,两区间长度为2.06、2.66,因此认为,两期的应收账款分散度没有变化。

通过以上两个例子,可以看出,用肉眼直接观察、用前N名占比和这些指标,是无法准确判断出两组应收款谁更分散的。

五、与熵、Theil指数的比较

1、定义

借用本文的符号,用熵来度量分散度是

用Theil指数度量是

其中,是第个个体的收入。

2、问题

熵度量的问题在于,对于任何一张未尽的、截断的应收账款占比的表(记剩余未展示的百分比为),其最分散情况都是:

从而,无法区分最分散的情况下,谁更分散。

Theil指数的问题在于,当时,

也就是说,对于一个三等分的应收款分布,和一个一百等分的应收款分布,Theil指数认为二者的分散程度是一样的,然而这显然是不正确的(当然,这对于收入分配来讲,3人均分和100人均分,应该是等价的,所以Theil才用于衡量收入均等化的程度)。

六、结论、拓展及展望

1、结论

本文提出了一种衡量应收账款分散程度的指标——-度量。对于一张完整的应收账款明细表,可以计算出其分散程度;对于截断的应收账款降序表(如前5大应收账款占比表),可以充分利用表内的信息,估计出其分散程度的范围。可比性方面,完整表-缺失表、完整表-完整表、缺失表-缺失表之间的分散程度度量,都可以进行比较。

此方法避免了用肉眼观察以及一些简单指标使用时带来的误判。

另外,需要指出的是,与应收款分布类似的,即可以等价于一组非负的、和为1的数的情形,都可以用此方法计算其分散程度。如:

  • 股权分布是否分散(前十大股东的持股比例表)
  • 其他就收款的分布是否分散
  • 企业的业务是否多元(企业某一期各板块营业收入占总营业收入比重的表)
  • 企业的业务是否趋于集中(企业历期各板块营业收入占总营业收入比重的表)
  • ……

2、拓展

A、用于GDP分项(细分程度不同)分散度的度量

对于成组缺失的,比如比较A、B两个地区的产业分布,A只公布了一二三产业的产值,B公布得更详细,公布了几个具体行业大类的产值,如:沈阳和济南

沈阳GDP分项 济南GDP分项

由于细项之和即大项,如:工业=采矿业+制造业+电力、燃气及水的生产和供应业,因此,取二者分类之最细,分别计算沈阳和济南的分散度。由于济南的GDP分项的每一项都比沈阳的要细,因此,济南的分散度计算出来应为一个数,而沈阳为2个数。

沈阳GDP分项的分散度计算过程,即:设各细项之比例,但已知一些细项之和的比例,计算这些未知比例变动时,使得分散度达到的最大值(上确界)和最小值(下确界)。当所有的分项都取所属大分项的平均值时,分散度达到最小(最分散)(证明:取向量和,利用欧氏空间Cauchy不等式可得);当所有已知分项组中,只有1个值非零,其他值全为0时,分散度达到最大(最集中)(证明:利用附录中的引理1可得)。

例:设非负,之和为1,已知,未知,但是已知,求分散度

3、展望

本文提出的方法,基于以下前提假设:

假定应收款中:

  • 每笔债务违约与否相互独立

  • 每笔债务违约的概率都是

  • 每笔债务回收金额为0

引申到更广的层次,就是:

假定各个份额都满足:

  1. 互不相关
  2. 只有零和满两个状态

其中第2条的意思是,每个份额都只有“非此即彼”两种状态,如:

  • 应收账款表
    • 零:违约,回收金额为0
    • 满:不违约,全额回收
  • 股东表
    • 零:表决时同意
    • 满:表决时不同意
  • 主营业务比例表
    • 零:板块不景气
    • 满:板块景气
  • 地区GDP分项表
    • 零:行业不景气
    • 满:行业景气

而且,本文方法的根本想法是风险代表分散度。也就是说,不能用风险代表的分散度,就不能用本文的方法来度量。如收入分配是否足够分散(即平均分配),更适合用Theil指数来度量,而不适宜用本文的方法来度量。

而这些,也正是本方法需要改进的地方:

  1. 风险无法代表的分散度,如何度量?如:
    • 收入分配是否均匀
    • 一个地区的创新创业活力
      • 一般团队越多,创业越可能成功
      • 成功一个好项目,就能带动起一个地区的发展(即预期收益不是各分项的平均收益之和,即孵化出了3个项目,3个都搞搞;而是:孵化出了3个项目,只选一个最有前景的)
  2. 份额之间存在相关性,怎么办?如:
    • 应收账款:某几个债务人同属一个行业
    • 股东表:存在一致行动人
    • 主营业务比例表:一些板块之间存在联动,如发电和电解铝(上下游)、环保发电设备与环保电厂运营(上下游)、汽油和柴油的生产(原料同是燃料油或原油)
    • 地区GDP分项表:细项之间相关联,如邮政业-航空运输业,一些快递就是通过飞机运输的,二者为紧密相关
  3. 每个份额存在不止2种状态,还存在其他中间态,如:
    • 应收账款:收回8成的本金
    • 股东表:不参与经营
    • 主营业务比例表:板块景气度还存在一般这个状态
    • 地区GDP分项表:行业景气度还存在一般这个状态

附录:推导

记为第笔应收款违约,且收回金额为0,为第笔应收款不违约。

则所有应收款可收回的金额占总应收金额的百分比为,期望

其方差为(随机变量独立性)

不妨记,则上式为

类似于Markowitz的“分散投资带来风险降低”的核心思想,投资组合的风险可以拆解成“分散度单项资产风险”。去除掉违约概率的影响,剩下的便是分散度的度量。因此,上式除以单项资产的波动,得到应收款分散度的度量

遗憾的是,我们也许不能通过报表附注得到全部的,只能得到前面的一部分。有时是前5大应收款,有时是前10大。为了充分运用报表给出的信息,以得到一个统一的对于应收款分散度的度量,因此通过上式求得该分散度,并估计期最大最小值,即可对不统一的应收款分布进行统一比较。

  • 命题1: 取最小值时,比例未知的部分取 。令,则在不确定的取值时,下确界为
  • 命题2:取最大值时,比例未知部分尽量堆得更“集中”。

    所谓“集中”,指:剩余未知项占比,至多有一项的占比小于已知的最后一名的占比,如:

    例1:剩余部分比例为,且,则后续序列尽量往前堆,即取 。

    例2:剩余部分比例为,且,则后续序列必须小于,因此持续未知序列至少有3项。取,,

命题1证明:

设 ,则有,

根据詹森不等式有 :


当且仅当 ,等号成立。

,随递减。当,,故的下确界为

# 证毕

命题2证明:

证明:当未知部分占比当且仅当满足以下条件A时,取到最大值:

条件A:小于且大于0的个数至多有1个

一、先证明:只有未知部分占比小于且大于0的个数至多有1个时, 才可能取到最大值(即条件A为必要条件)

反设:存在:未知部分占比小于且大于0的个数大于等于2的,可以取到 的最大值

记,则有 。

取其中介于两项,, ,分情况讨论:

  1. 试以新的两项 取代

    此时 ,不会对其他项产生影响。

    作差

    所以

    即以 取代 能令 的取值更大,

    即此时 并未取到最大值。

  2. 试以新的一项 分别取代

    显著地,

    即以 取代 能令 的取值更大,

    即此时 并未取到最大值。

至此假设被推翻,即:当存在2个及以上的、取值在之间的项时,无法取到最大值。

因此当中至多存在1个介于项时,才有可能取到最大值。

二、再证明:条件A为充分条件、存在最大值

任取不满足条件A的,记之为,对应的为

则从中取出,其中,记,,其他项沿袭,即:,由此得到,以及该序列的。由必要性证明部分可知,。

依此类推,得到,对于任何,每经过一步,序列中都会多出1个为的项。而对于任何未知部分占比,其中等于的项是有限多个。因此,从任何有限项的,都可以经过有限步(记步数为),得到,且满足条件A,且此条件下对应的所有都相同,记为。

因此,有

任取满足条件A的,其特点是:

  1. 只有项,其中表示对向上取整,如

    证明:反设。则:

    即,与题设矛盾。

  2. 所有项都为;或者只有一项不为,其值为,其余项都为

因此,其值都相同,记为

综上,当满足条件A时,成立

即当满足条件A时,达到最大值

# 证毕

你可能感兴趣的:(如何比较两组应收款哪一个更分散——降序比例截断样本估计分散度区间)