数据的判断

共读《随机漫步的傻瓜》

——第9章:买卖证券⽐煎蛋容易

1、 为什么能⼒⽋佳的经理⼈中,仍然有少数⼈的绩效记录很好?

因为是幸存者偏差的影响,造成这样错觉,我们每年统计的时候只看到会获利的经理人,以此类推,等到五年后,我们看到存活下来的经理人,只占原始群体的2%不到。这些2%的人是万众瞩目的焦点,而没有人去提另外的98%。

2、 原始样本量在其中发挥什么作⽤?

我们所关心的绩效记录的最大期望值,受原始样本的大小影响较大,受每位经理人的运气影响较小。我们根本不关心平均绩效记录,我们只看到表现最好的经理人,而不是所有的经理人。

我们评估绩效记录的有效性,原始群体的规模非常重要,如果原始群体只有10个经理人,不用考虑就把自己的一半积蓄交给这样的经理人;如果原始群体有10000名经理人,对这样的操作成果会不以为然。

  所以,原始样本量的多少对我们判断其投资的成功概率有重要作用。

3、 想想为什么⼈们沉迷于数据挖掘技术?

人们喜欢沉迷于数据挖掘技术,喜欢无巧不成书的感觉,对机缘巧合持有偏见,喜欢寻找关联。如:

1)生日悖论 

    随便找一个人,你和他的生日碰巧是同一天的概率是1/365.25,如果在一个房间内,任意两人的同一天概率是50%,因为是我们没有指明那两人必须同一天生日,任意两人都可以。

  2)世界真小

一个人在万万想不到的地方偶然遇见亲朋好友,感觉世界真小,感觉碰到的概率很高,其实是我们没有想过在某时某地遇见某人的概率到底是多少?在将来任何地方巧遇自己过去认识的人的概率将会比我们所说的偶遇概率高得多。

统计学家观察资料、测试某种特定关系总是把数据交给计算机来处理,以虚假的关联性来寻找任何关系。如股市的涨跌和妇女的裙摆高度相关。

3)圣经密码

数据挖掘在神学领域,一位不曾受过任何统计学训练的新闻记者,发现圣经在统计学意义上有很多不规则性,借解读圣经密码来预测以色列总理拉宾遇刺。这本书卖得很好具有讽刺性,说明人对类似事件的预测喜欢寻找关联性。

  4)数据探索

    根据历史价格数据库,观察不同的操作法则能够产生什么样的绩效,在一组可能行得通的操作法则中寻找幸存者,人们喜欢拿法则去套用数据,这件事称为数据探索。

一个随机系列总会呈现某种可察觉的状态。今天通行的法则之所以获得成功,有可能是幸存者偏差的结果。

4、 对你的启发是什么?

  通过本章的学习我们对幸存者偏差有更深刻的理解,特别是在医学领域,我们往往看到吃了某种药物治愈好的癌症患者,而没有注意到大量没有被治愈的患者,舍弃了有科学根据的治疗方法,结果丧失宝贵的生命。

  我们在投资领域,我们看到业绩优秀的经理人,是有可能时靠运气产生的结果,由于随机性的存在,不要过分强调以往的业绩,以为其成功全是实力造就的,这样我们往往会造成投资失败。

5、 印象深刻的⼀句话是哪句话?

由于缺乏更多的信息,我宁可不做任何判断。这样比较安全。

你可能感兴趣的:(数据的判断)