个人对于“数字”的局限性的理解

2018年5月31日 Lee公子 文 于杭州
自己的工作内容与数字的交集算是比较多——在商业项目中,往往需要大量的数字证明来提供给各类人士决策(上级领导、集团管理层、外部投资人、政府部门等),结合长期量化分析的工作体会,谈谈自己对“数字”和“量化”的局限性理解。

第一,任何数字拿出来说事儿,必须要有充分的前提假设,不说前提,只说数字结论的,除非是沟通双方早已经明确了前提假设条件,否则统统是胡说八道。
第二,任何数字的意义,都来源于比较,因此一定有一个潜在的比较标准物或者标准值,不说这个比较值的,统统没有意义。而这个比较值的选择,却绝不是客观的和唯一的,出于各种目的或者立场,可以主观选择各种值作为比较值,完全可以让数字的意义变得千差万别,公说公有理,婆说婆有理。
第三,任何数字,都有其测定数据的时空范围——超过测定数据空间范围和时间范围的东西,数字就没有意义了。不说清楚数字背后涵盖的时间周期和空间范围,数字就是胡说八道。
第四,数字的意义存在于变化和比较中,没有变化,静态的数字其实根本没有什么用。
第五,数字测量一定要有算法,而算法实际上是非常主观的东西。

算法这种东西,完全取决于计算者的立场,要给什么人看,以及要达到的目的,其实相当主观,而且是越复杂的算法越主观,我甚至还有一个体会,越是高段位的专业人士,其算法越主观,越是体现其个人意志。
加减乘除是最简单直接的算法,也是相对来说最客观的算法,但是对于一个大项目的财务模型或者投资模型,就需要一套非常复杂的算法,这个算法中,要向阅读者表达和突出哪些数字,要给内部人看还是给外部人看,要让这个项目成立还是不成立,都是计算者可以有足够余地“操之在我”的事情。
由于“设计算法”属于有较高专业门槛的工作,一般人能够接触到复杂算法的机会不多,未必能够真正理解我说的“算法的主观性”。我没有进入过编程或者物理等领域,仅仅是从商业领域来理解,“算法的主观性”绝对是“客观”存在的。

第六,数字的测量需要依靠各种仪器、设备、技术手段来获取,而这些东西的精准度和测量方法却不见得客观。

举几个例子:

  • 我给家里父母买了智能测血压的手环,手环从来显示我父亲的血压都是正常的,但是我父亲根据其他血压计测量结果和自身感受,血压是偏高的;
  • 我买了激光测距仪,和传统的工程卷尺测出来的结果比较,还是有一定的差异,我并不清楚是我的激光测距仪不准,还是卷尺不准,还是测试时候方法产生的误差。
  • 两块手表,如果时间对不上,你就会完全搞不清楚所谓的“准确时间”到底是什么。
  • 我还听说这种段子,某北方高污染城市,为了不让PM2.5数值爆表,减少政府的舆论压力,安排在采集数据的几个区域的街道上,频繁洒水——市民看到的PM2.5数据怎么可能有客观性?
第七,数字的解读其实是非常主观的东西。

数字的解读完全看解读者的目的,除了更换标准参照物可以完全改变数字的意义之外,还可以用很多带有感情或者渲染色彩的形容词赋予数字某种意义。

第八,数字的呈现方式其实是需要精心设计的,包含了表达者的主观意图。

无论是在宣讲的PPT中还是宣传广告中,数字的呈现方式都是需要精心设计的,其中一定传递了表达者的意图。
例如,一组数据为了突出市场巨大,可能要用对比强烈的柱状图来表现,而不用饼图或者列表来表现;一个数据为了突出其特殊意义,让观众看到,可能会被特意加粗、变红、放大、居中……

第九,量化是一种对于被描述的客体的“降维”过程,客体的丰富属性在量化或者数字化的过程中被剥夺和极端简化,被量化的东西其实都是被降维简化的东西,并不真实。

要真正理解这一点不太容易,不过我可以举一个例子:一个梨和一个苹果其实无法直接相加或者相减,因为他们有“梨”和“苹果”这样的具体自然属性(或者个性)相互区别;但是如果把“梨”和“苹果”降维简化为“水果”,那么他们就可以相加变成两个“水果”,个性被消除了,你理解和记住他们变得容易了,但是这样的量化结果却离真实很远。
再比如,钱就是一些量化的数字,但是做投资的人,最重要的思维就是要还原这些量化数字背后的属性,必须把钱分出结构,分出属性,分出轻重缓急,分出好坏善恶,分出贵贱,分出长短期……你只有把抽象成一维的这些资金的数字,还原为具体的时空场景下的对应事物,你才能够真正理解资金,才能进一步掌握它。
只会看数字这种低维信息的人,理解力也会被“降维打击”。
区分投资高手和庸手之间的区别,关键就在于是否能够对数字进行正确的“升维还原”,看清真相,掌控现实,而不是唯“数字论”,用各种“率”各种“值”各种“百分比”来理解现实。
要提醒一点,越是复杂度高的领域,其被强行量化后得出的结论的可信度越低,因为在量化过程中被“降维”抽象掉的属性会越多——复杂的东西被量化后只是方便人理解和记忆,方便观点的传播,但是这种东西根本不是真相,甚至远离真相。例如,把一个国家的经济发展水平简化为GDP,把一个城市的房地产市场简化为房价指标,把国际经济趋势简化为看美元指数,把国际贸易兴衰简化为看一个波罗的海干散货指数等等,根本都不靠谱。

第十,数据统计不能做因果判断,只能提供相关性证明。

在医学和生物学领域,最为搞笑的科学统计便是日均食盐摄入量与高血压发病率的关系。"科学"的"统计数据"除了能揭示这两者间存在相关性,再不能说明任何实质问题。借助于统计学,我们确实可以将食盐摄入过多解释为高血压的致病原因。但是同样根据统计学,中医们也可以说因为某些西医们不懂的原因,比如"肾虚",人们会出于生理本能而在不知不觉当中加大了食盐的日常摄入,并且最终会因为"肾虚"而非盐分过多才导致血压增高。这种中西医基础观念的有趣博弈教育了我们:千万别迷信统计学的种种因果判断,统计学仅提供相关性的证明。

你可能感兴趣的:(个人对于“数字”的局限性的理解)