统计学悖论

1.骗人的“平均数”

M:吉斯莫先生有一个小工厂,生产超级小玩意儿。

M:管理人员由吉斯莫先生、他的弟弟、六个亲戚组成。工作人员由5个领工和10个工人组成。工厂经营得很顺利,现在需要一个新工人。

M:现在吉斯莫先生正在接见萨姆,谈工作问题。

吉斯莫:我们这里报酬不错。平均薪金是每周300元。你在学徒期间每周得75元,不过很快就可以加工资。

M:萨姆工作了几天之后,要求见厂长。

萨姆;你欺骗我!我已经找其他工人核对过了,没有一个人的工资超过每周100元。平均工资怎么可能是一周300元呢?

吉斯莫:啊,萨姆,不要激动。平均工资是300元。我要向你证明这一点。

吉斯莫:这是我每周付出的酬金。我得2400元,我弟弟得1000元,我的六个亲戚每人得250元,五个领工每人得200元,10个工人每人100元。总共是每周6900元,付给23个人,对吧?

萨姆:对,对,对!你是对的,平均工资是每周300元。可你还是蒙骗了我。

吉斯莫;我不同意!你实在是不明白。我已经把工资列了个表,并告诉了你,工资的中位数是200元,可这不是平均工资,而是中等工资。

萨姆:每周100元又是怎么回事呢?

吉斯莫:那称为众数,是大多数人挣的工资。

吉斯莫:老弟,你的问题是出在你不懂平均数、中位数和众数之间的区别。

萨姆:好,现在我可懂了。我……我辞职!

统计学的解说可能是极富逆论性的,常常被完全误解。关于吉斯莫工厂的故事揭示出,误解产生的一个共同根源是不了解平均数、中位数(中值)和众数之间的差别。

“平均”这个词往往是“算术平均值”的简称。这是一个很有用的统计学的度量指标。然而,如果有少数几个很大的数,如吉斯莫的工厂中少数高薪者,“平均”工资就会给人错误的印象。

读者还可考虑一些类似的引起误解的例子。譬如,报纸上报道有个人在一条河中淹死了,这条河的平均深度仅只2尺。这不使人吃惊吗?不!你要知道,这个人是在一个10多尺深的陷坑处沉下去的。

一个公司可能报告说它的策略是由股东们民主制订的,因为它的50个股东共有600张选票,平均每人12票。可是,如果其中45个股东每人只有4票,而另外5人每人有84张选票,平均数确实是每人12票,可是只有那5个人才完全控制了这个公司。

还有一个例子:为了吸引零售商到一个城里来,商会吹嘘道:这个城市每个国民的平均收入非常高。大多数人看到这个就以为这个城的大多数市民都属于高收入阶层。可是,如果有一个亿万富翁恰好住在该城,其他人就可能都是低收入的,而平均个人收入却仍然很高。

统计学的报告有时甚至更加使人糊涂,这因为有时“平均”这个词不是指算术平均值,而是指中值或众数。中值(中位数)是按大小顺序排列的数值表中中心位置对应的数值。如果表中数值有奇数项,则中值就简单地是中间项的值。如果有偶数项,中值往往取中间两项的算术平均值。

中 值对萨姆来说比算术平均值重要,但就是中值也使人对这个工厂的工资情况得出歪曲了的印象。萨姆反正要知道的是“众数”——表中段常出现的数。在这里,众数 是发给工厂中数目最多的人的工资数。有时候这叫做典型情况,因为它比其他任何情况出现次数都多。在上面最后一个例子中,那个城里一个典型家庭代表收入为众 数的家庭,它也许很穷,但由于有少数亿万富翁,这个城的平均收入也还非常高。

2.某年的母亲英雄

M:这一年年底,萨姆的妻子接受了这个城的市长的奖赏。她被命名为这一年的母亲英雄。

M:地方报纸刊登了萨姆,他的妻子和他们的13个孩子的照片。

M:主编对这张照片很满意。

主编:干得好,巴斯康。我有一个新任务,你给我弄一张这个城里平均大小的家庭的照片来。

M:巴斯康无法做到这一点。为什么?因为这个城里没有一个家庭具有平均的人数。算出的平均数是一家有两个半孩子。

关于“平均”的又一个错误概念就是平均的实际范例必然存在。看了这一段故事之后,我们就知道不存在平均有两个半孩子的家庭,现在读者不难想象出平均数不存在的其他例子。

这里的一些问题有助于学生加深他们对算术平均值、中位数和众数的理解。

1)如果主编要一张“典型家庭”的照片,根据众数的意义,摄影记者是否总能找到这样的家庭?(能,典型情况显然是存在的)。

2)有没有可能众数多于1个?例如两个孩子的家庭和3个孩子的家庭能不能都是众数的实例?(可以,如果这个城里有1476家有两个孩子,还有1476家有3个孩子,而所有其余的家庭的孩子数要么比它们多,要么比它们少,上述两种家庭是最多数的,那么,这个城市就有两种典型家庭,每—个都是正规的众数)。

3)如果主编想要—张中值家庭的照片,他是否总能得到?(常常可以得到,但不—定总是能得到。正如我们上而所见,如果这个城里有偶数个家庭,其居中的两个家庭孩子数目不等,这时中位就不一定是整数了)。

3.轻率的结论

M:统计资料表明.大多数汽车事故出在中等速度的行驶中,极少的事故是出在大于150公里/小时的行驶速度上的。这是否就意味着高速行驶比较安全?

M:绝不是这样。统计关系往往不能表明因果关系。由于多数人是以中等速度开车,所以多数事故是出在中等速度的行驶中。

M:统计数字还表明,在亚利桑那州死于肺结核的人比其他州的人多。这是否就意味着亚利桑那州的气候容易生肺病?

M:正好相反。亚利桑那的气候对害肺病的人有好处,所以肺病患者纷纷前来,自然这就使这个州死于肺结核的平均数升高了。

M:有一个调查研究说脚大的孩子拼音比脚小的孩子好。这是否是说一个人脚的大小是他拼音能力的度量?

M:不是的。这个研究对象是一群年龄不等的孩子。它的结果实际上是因为年龄较大的孩子脚大些,他们当然比年幼的男子拼得好些。

这三个片断着重说明了,在你听到一种统计关系时,切勿轻率地对其因果关系作结论。下面再举几个例子;

1)常常听说,汽车事故多数发生在离家不远的地方,这是否就意味着在离家很远的公路上行车要比在城里安全些呢?不是,统计只不过反映了人们往往是在离家不远的地方开车,而很少在远处的公路上开车。

2)有一项研究表明其一个国家的人民,喝牛奶和死于癌症的比例都很高。这是否说明是牛奶引起癌症呢?不!这个国家老年人的比例也很高。由于癌症通常是年龄大的人易得,正是这个因素提高了这个国家癌症死亡者的比例。

3) 一项研究表明在某个城市心力衰竭而死亡的人数和啤酒的消耗量都急剧升高。这是否表示喝啤酒会引起心脏病发作?不!两种情况的增加是人口迅速增加的结果。若 按同样的理由,心脏病发作还可见归咎于上百个其他因素,如咖啡消耗量增加,嚼口香糖的人增多,玩桥牌更加盛行,更多的人看电视,等等。

4)一项研究显示出,欧洲某个城市的人口大量增加,同时鹳鸟窝也大量增加。这是否就支持了鹳鸟送来婴儿这一信念?(欧洲有一种说法,称婴儿是鹳鸟送来的,常用鹳鸟来临表示婴儿降生)。不!它反映的事实是这个城市内的房屋增多,鹳鸟就有更多地盘来筑窝了。

5)最近一项研究显示,大多数杰出的数学家是大儿子。这是否意味着头生子比以后生的儿子数学才能高些?不!这只是简单地反映出一个事实:大多数的儿子是头生子。

这可以引起一些有趣的课堂活动:

1)学生们是否做过一项调查?看他们年级的男孩子是否多一半是大儿子?或者对女孩子作了调查,是否多一半是大女儿?

2)请你们考虑100个有两个孩子的家庭的情况。男孩(或女孩)是大儿子(或大女儿)的比例是多少?(答案:3/4)(注意:一儿一女时,儿子和女儿都算老大)。当100个家庭,每家有三个孩子时,计算大儿子(或大女儿)的比例。(回答7/12)。不用说,在只有一个孩子的家庭,这个孩子总是老大。

同一性别的孩子中,老大的比例显然随家庭中孩子的多少而变,不过对多数家庭而言,这个比例都大于1/2

上述例子也许能启发大家找出其他一些统计论述的实例,证明统计学论述在联系到因果关系时很容易建成误解。现代的广告,尤其是很多电视的商业广告正是以这种统计误解为其根基的。

4.小世界的悖论

M:近来很多人相信巧合是由星星或别的神秘力量引起的。

M:譬如说,有两个互不相识的的人坐同一架飞机。二人对话:

甲:这么说,你是从波士顿来的啰!我的老朋友露茜·琼斯是那儿的律师。

乙:这个世界是多么小啊!她是我妻子最好的朋友!

M:这是不大可能的巧合吗?统计学家已经证明并非如此。

很多人在碰到一位陌生人,尤其是在远离家乡的地方碰到一个生人,而发现他与自己有一个共同的朋友时,他们都会成到非常惊讶。在麻省理工学院,由伊西尔领导的一组社会科学家对这个“小世界悖论”作了研究。他们发现,如果在美国随便任选两个人,平均每个人认识大约1000个人。这时,这两个人彼此认识的概率大约是1/100000,而他们有一个共同的朋友的概率却急剧升高到1/100。而他们可由一连串熟人居间联系(如上面例举的二人)的概率实际上高于百分之九十九。换言之,如果布朗和史密斯是在美国任意选出的两个人,上面的结论就表示:一个认识布朗的人,几乎肯定认识一个史密斯熟识的人。

最 近心理学家斯坦利·米尔格拉姆用一种方法逼近小世界的问题,学生们很容易试一试它。他任意地选择了一组“发信人”,给每一个人一份文件,让他发给一个“收 信者”,这个收信者是他不认识的,而且住在这个国家另外一个很远的地方。做法是过他把信寄给他的一个朋友(是一个他没有深交的朋友),也许他很可能认识那 个收信者,这个朋友再接着发信给另一朋友,如此下去,直到将文件寄到认识收信者的某人为止,米尔格拉姆发现,在文件达到收信者手中之前,中间联系人的数目 从210不等,其中位数是5。当你问别人这到底需要多少中间联系人时,他们多数猜想大约要100人。

米 尔格拉姆的研究说明了人与人之间由一个彼此为朋友的网络联结得多么紧密。由于这一结果的启示,两个陌生人在离家很远的地方相遇而有着共同的熟人就不足为怪 了。这种关系网络还可解释很多其他不寻常的统计学现象,例如流言蜚语和耸人听闻的消息不胫而走,新的低级趣味的笑话很快四处蔓延,同样地,一条可靠的情报 也在料想不到的短时间里就为很多人知道了。

5.你属于哪一宫

M:这四个人第一次见面。如果他们四个至少有两个人属于黄道十二宫中的同一宫,这岂不是非常巧的偶合吗?[*]你也许以为,这是非计凑巧的事,而实际上这种巧合在十次中就会大约发生四次。

假定每个人都以相同的概率出生在十二宫之一,那么四个人中至少有两个人属于同一宫的概率是多少?

让我们用一副牌来模拟这种情况。先抽掉四张K。这副牌现在就是四种花色,每种12张。我们用一种花色代表一个人,每个点数代表一个宫。如果我们从每一种花色中任抽一张牌,四张牌里至少两张点数一样的概率是多少?很明显,这就和四个陌生人中至少两人有同样的黄道宫的概率一样。

解决这个问题最简单的方法是先算出没有两张牌的点数相同的概率,再把它从1中减去,就得到我们所要的概率。

如果我们考虑两个花色,譬如说黑桃和红心,由于一张红心和十二张黑桃中的一张配对,只有一对是同点数的,故点数不同的概率是11/12。而一张梅花与黑桃、红心这两张牌的点数都不同的概率就是10/12,一张方块又不同于这其余三张脾的概率是9/12。这三个因子的乘积就是四张牌的点数彼此都不相同的概率,结果是55/96。用1减去这个数得到41/96,大约是4/10,它也既是四个人中至少有两个是属于同一宫的概率。这差不多是1/2,因此这种巧合毫不足怪。

这肯定是著名的生日悖论的翻版。如果有23个人无意中碰到一起,至少有两个人的生日是同一天的概率稍小于1/2。其计算过程类似于上面的黄道宫的算法,不过这里相乘的有22个因子:

乘积是0.5073+,或者说稍大于1/2(所求概率则稍小于1/2)。用小型计算器计算这个数是一个再好不过的练习了。如果人数多于23个,则生日相同的概率会迅速升高。如果你们班的同学有40人,那么至少有两人生日一样的概率是7/10。如果有100个学生,则至少有两人生日相同的概率比之谁的生日不一样的概率是30000001

建议作一些实际练习:

1)美国有几位总统的生日相同?有几个逝世的日期—样?这些结果与理论预计比较如何?(詹姆斯·波尔克和沃伦·哈丁的生日都是112号。托马斯·杰斐逊、约翰·亚当期和詹姆斯·门罗都逝于74日)。

2)一组人,若要求其中至少有两人生日在同一个月的概率大于1/2,这组人的人数最少是几?(回答是5。此时有两人生在同一个月的概率是89/144,大约是0.62)。

3)一组人,若要求至少有两人生于同一个星期数的概率大于1/2,那么这个组最少要由几个人?(回答:4,此时相应的概率是223/343,大约是0.65)。

4)若要求你所遇到的人中至少有一人和你的生日在同一天的概率大于1/2,你最少要遇到多少人?(回答:253。不是183,如果每个人只有一个生日而不会还有一个的话,就是如此。)

[*] 西方占星学将天体运行带以黄道为中心划分为十二宫:白羊宫、金牛宫、双子宫、巨蟹宫、狮子宫、处女宫、天平宫、天蝎宫、半人马宫、摩羯宫、宝瓶宫和双鱼宫,认为每个人根据出生而属于其中某一宫。在中国,我们可以代之以每个人的属相,恰好也有十二个。——译者


6.圆周率π中的数字结构

M:π的数字排列是无规则的,可是让我们看看从第710154个数以下的数字是怎样排列的:一连串排有73

π的数字从它是随机产生的这一点来讲,它不是没有规律的,可是从它的数字排列规律是“无章可循”这一点来讲,又是没有规律的。数学家对π的小数位不断增加作了很多试验,看是有什么“规律性”,可是毫无结果。π的小数位数字就像一个旋转圆盘可以旋到09任何一个数字那样毫无规律。

实际上,像这样一串73的数字在π中出现机会是很多的。但由于从某—位开始,出现一串73的概率是10-7,因此当π中从第710161位以后出现73时,乍一看是很觉惊奇的。可是,如果我们的注意力放在由7个数字组成的不寻常排列的话,就会发现这种特定排列的概率变得相当高。比如说,我们可以见到象44444448888888,或1212121,或1234567,或7654321,或其他引人吃惊的这类数字排列。由于我们预先并不知道下一次会出现什么样的7个数字组,所以猜一猜下一组数是什么是很有趣的。就像亚里斯多德曾经说过的,最不可能的事也是极可能的事。

7.错综的群体

M:就是在洗牌时也会出现巧合。比如,几乎总是有67张牌是同一颜色的。

M:恒星成群聚集称为星座,豌豆撒在桌面汇成小群。有一个古老的俗话说:“祸不单行”。

随机事件以各种不同形式“成群”出现是熟识的现象,已经有很多关于统计学上称为“成群理论”的书。π中连续73就是随机成群的例子。如果你不断抛掷一枚硬币,或者老是旋转轮盘赌的圆盘,记下结果,你就会发现有时竟会一连串出现很长的同样结果。

密 执安大学的一位工程师穆尔发现,有一个证明事件成群的惊人实验,你不妨试一试。穆尔因该实验使用了大量糖果,就称之为“糖果花纹”。这种糖果是一种制成球 形的上了色冰糖、或球形彩色水果糖。取相当数量的红色球糖,相当数量的绿色球糖,将两种同样数量的糖放入玻璃瓶中。不断摇这个瓶子,直至两种色糖完全混合 均匀为止。

注 视瓶子的一边。你大概估计会看到两种色糖已均匀打散了,可是你看到的图案都是不规则的,大片红糖图案中点缀着许多小群的绿糖,且二者总面积相等。图案是如 此出人意料,甚至数学家在乍看到时也会相信,大概有某种静电效应使得一种颜色的球糖粘住另一领色球糖。实际上起作用的是偶然性。花纹是随机成群的正常结 果。

如果你们不愿相信这一点,你们可以用一张制图纸产生出同样的花纹。画一个20×20的方格图。用红绿二色来填每一小格,方法是用抛掷硬币来选颜色。在400个小格都用颜色填满时,你将会看到类似上述糖果瓶边所出现的那类图案。

成 群过程中往往有一些非数字的因素。如果小汽车在高速公路上随机地分布着,我们从直升飞机上往下看,就会觉得这些汽车是成群结队的,但是实际上成群的原因远 不能用偶然性来解释,因为司机一般不愿意老按同样的速度开车,当前面有很长距离没有汽车时,他们加大马力快开起来。地图上城镇的位置,下雨天接连不断,草 地上三叶草、海蓬子等成块,除此以外还有很多其他成群事例都超过用偶然性可说明的程度。你可以试一试找出其他成群例证来说明有些是纯属偶然的原因,有些则 是非偶然的因素造成的集群。

8.奇异的纸牌把戏

M:这里有一个与成群理论有关的惊人的纸牌悖论。先拿一副扑克牌,使它黑红相间。

M:把这副牌分成两叠,要让每叠牌的最底下那张的颜色互不相同。

M:现在将两叠牌洗到一起。

M:从这叠洗过一次的牌上部一对一对地拿牌。不管你原先是怎样洗牌的,你拿的每对牌都是一红一黑!

这个不寻常的纸牌把戏是一个实例,说明一种潜在的数学结构会怎样进入随机集群之中,并产生看上去似乎神秘的结果。魔术师都知道这是吉尔布雷德原理,是数学家兼业余魔术师诺尔曼·吉尔布雷德在1958年发现的,自那以后根据这一原理就引出了几百种巧妙的扑克把戏。

下 面是对这一原理的作用机制的一个非正式的归纳证明。这副黑红相间的牌分成两叠后须两张底牌一黑一红。在洗这两叠牌时,第一张牌离开拇指落下贴在桌面后,左 右手中两叠底牌就是一色的了,这两张牌都与已落下的那张牌颜色不同。往后无论这两张底牌落下哪张都与桌上那张构成颜色不同的一对。现在手中的牌又与还未落 下任何一张牌时的情况一样。剩下两叠牌的底牌颜色不同。不管哪张牌落下,手中剩下的两张底牌均与之不同色,故接着落下的第二对牌也必然是颜色不同的。依此 类推可知余下的牌将反复出现上述现象。这是向学生介绍用数学归纳法证明问题的技巧的极好方法。

你可以把这套把戏在你朋友面前玩一玩,不过你要事先把扑克牌弄成红黑相间再开始。让一位朋友把这副扑克从上面一张一张往一边拿,使拿过来的叠成一叠,数到26张 时便停止(这样做就可以保证底下的两张牌颜色不同)。现在让他把两叠牌洗到一起。你把“洗过”的这叠牌放到桌子下面,使谁也看不到牌,包括你也看不到牌。 你这时就可以说你能用手指摸出牌的颜色来,并且把牌一对一对地亮出,使每对牌都是一红一黑。自然,你只不过是从这副牌的上面一对—对取牌就行了。

学生们一定会对这套把戏感到好奇,急于想知道这个原理是否能推广到产生其他把戏。可以让他们试试下面的做法。把四种花色的牌按一适当顺序排好,例如,黑桃、红心、梅花、方块;黑桃、红心、梅花、方块;黑桃、红心、梅花、方块;等等。从上面开始拿牌,拿出的叠成一叠,到大约26张为止(是否严格26张没关系!)。这种拿法正好使黑桃、红心、梅花、方块的次序颠倒。现将两叠牌洗到一起。然后从这叠牌上面每四张一取,则每四张牌的花色必然互不相同!

第二个实验,你可以先将一副牌分成四叠,每叠的次序是A2345678910JQK,而不管它们花色是否相同。像上面几次一样拿牌和洗牌。从上面取13张牌,每一手则仍然是从A23一直到JQK所有点数都有的牌。

最后一个实验,用两副牌,使一副牌的顺序与另一副完全相同,再将其中一副放在另一副上面,然后从上面一张一张地取牌,每取一张就放在前一张上面,直到大约52张时为止。把两副牌洗到—起,然后将这104张牌严格分成两份。

这时每一份正好是一副牌。

9.选举悖论

M:假定有三个人—阿贝尔、伯恩斯和克拉克竞选总统。

M:民意测验表明,选举人中有2/3愿意选A不愿选B,有2/3愿选B不愿选C。是否愿选A不愿选C的最多?

M:不一定!如果选举人像图中那样排候选人,就会引起一个惊人的逆论。我们让候选人来说明这一点。

甲(男):我是阿贝尔。选举人中有2/3喜欢我,不喜欢伯恩斯。

乙(女):我是伯恩斯小姐。2/3的选举人喜欢我,超过克拉克。

丙(男):我是克拉克。2/3的选举人欢迎我超过阿贝尔!

这个逆论可追溯到18世纪,它是一个非传递关系的典型,这种关系是在人们作两两对比选择时可能产生的。学生们也许已经很熟悉传递关系的概念。它适用于诸如“高于”、“大于”、“小于”、“等于”、“先于”、“重于”等关系。一般讲,如果有一个关系R使得xRy(即xyR关系)、yRz成立时,则xRz成立,这时R就是可传递关系。

选举悖论使人迷惑,是因为我们以为“好恶”关系总是可传递的,如果某人认为AB好,BC好,我们自然就以为他觉得AC好。这条悖论说明事实并不总是如此。多数选举人选A优于B,多数选举人选B优于C,还是多数选举人选C优于A。这种情况是不可传递的!

这条悖论有时称为阿洛悖论,肯尼思·阿洛曾根据这条悖论和其他逻辑理由证明了,一个十全十美的民主选举系统在原则上是不可能实现的,他因此而分享了1972年诺贝尔经济学奖金。

假定有三个对象,而且具有三种可以比较的指数,当我们将它们两两比较按各指标排列,再从中选择一个时,就可能出现上述矛盾。假定ABC是向一位姑娘求婚的三个人。上面图中那种排列情况可解释为这个姑娘就三个方面比较这三个人优劣的次序,例如第—列是智慧,第二列是容貌,第三列是收入。如果两两相此,这个可怜的姑娘就发现,她觉得AB好,BC好,C又比A好!

数学家保罗·哈尔莫斯提出用ABC代表苹果酱馅饼(一种类似馅饼的果饼)、浆果酱馅饼和樱桃酱馅饼。一个饭店每次只供给两种。上面图中ABC的三种排列表示一个顾客从饼的味道、新鲜程度和大小对三种饼的排列次序。对这位顾客而言,认为苹果比浆果好、浆果比樱桃好、樱桃比苹果好,这就是最完美的理解。

这个悖论还可以在产品检验中出现,一个统计学家也许发现,有2/3的美国家庭妇女喜好润肤霜A超过B2/3的喜好B超过C。化学公司得知这一结果后也许就将润肤霜C作为最不受欢迎的一种而降低产量,岂不知第三个统计可能会表明还有2/3的人喜欢C超过A呢。

10.罗尼哈特小姐找朋友

M:罗尼哈特小姐——一位统计员——独自在家中坐腻了。

罗:但愿我能认识一个未婚的男子。我想要加入一个为单身人组织的小组。

M:罗尼哈特小姐加入了两个这种小组。一天晚上,两个小组都在“悖论俱乐部”举办联欢会。一个组在东厅集会,一个组在西厅集会。

罗:有些人蓄着胡子,有些人没有蓄:有些人放荡不羁,有些人循规蹈矩。今晚,我想认识一个风流潇洒的小伙子。我是不是应该找留胡子的人呢?

M:罗尼哈特对东厅的人作了一番统计研究:她发现,留胡子的人中风流人物的比例是5/1135/77。不留胡子的人中,风流人物的比例小一些,是3/733/77

罗:所以,如果我参加东厅的联欢会,我就会结识留胡子的人。

M:她对两厅组的人作的统计是类似的。留胡子放荡不羁的人占84/126。这要大于没有胡子的风流人物比例81/126

罗:多简单呀!不管我参加哪个组的联欢会,我只要找留胡子的,就比较容易结识风流潇洒的人物。

M:当罗尼哈特小姐到达“逆论俱乐部”时,这两个组已经决定联合举行联欢了。所有人都到北厅去了。

罗:现在我怎么办?如果两个组中都是留胡子的人多数使我满意,那么现在还应该是留胡子的人适合我要求的机会多些。不过,为保险起见我最好还是把联合集会的人核对一下。

M:当她作完这个新的图表时,她大吃一惊。比例改变了。现在要对上她的心思最好是找不留胡子的人!

罗:我得改变我的策略。可我还是不明白,怎么会成这样?

这个异常的悖论很容易用扑克牌来模拟。红牌表示风流人物,黑牌表示刻板人物。牌的背面用x表示留胡子的人,没有x表示不留胡子的人。

在五张红牌和六张黑牌背面标上x。在这些牌中加上三张红牌和四张黑牌,上面没有标x。总共是十八张牌。它们代表东厅的人。

把这十八张牌洗过,使之背向上摊在桌上。如果你想使你拿到红牌的机会最大,你应该拿有x符号的还是没有x符号的?很容易算出各自的比数,为了拿到一张红牌,你最好拿有x符号的牌。

在西厅的人用同样的方法模拟。在六张红牌和三张黑牌背面标上x。在这些牌中另加背面没有x的九张红牌和五张黑牌。总共是23张牌。洗牌后再摊放桌上。同样,很容易证明,如果你想拿到一张红牌,你拿有x符号成功的机会较大。

现在把两套牌合成四十一张的一套。洗牌后摊开。使人很难相信,但你要是计算一下就会相信,如果你想拿到—张红牌,这时你选没有x符号的牌比较容易成功!

当统计学家分析像药物试验结果这类数据时就会产生上述那样的悖论。比如,让牌表示参与两种研究试验的人。让x表示服用药物的人,没有x的 牌表示服用安慰药(无实际药效)的人。红牌表示情况好转的人,黑牌表示情况没有变化的人。如果分开来分析,每一个试验均表明药物比安慰药有明显好的效果。 可是当两个试验结果合到一起时,分析却表明安慰药有明显好的效果!这个逆论说明,要设计出一种试验,使其统计分析结果总是可信的有多么困难。

11.亨普尔关于乌鸦的悖论

M:有一个关于黑乌鸦的著名悖论,它说明罗尼哈特小姐遇到的问题并不是罕见的。甚至有些专家也还在力求搞清它。

M:如果看到有34只乌鸦是黑色的,那么说“所有乌鸦都是黑色的”,这条科学定律的证据是不充分的。如果看到上百万只乌鸦都是黑的,这条定律的证据就比较充分。

甲:嘎!嘎!我不是一只黑乌鸦。只要他们发现了我,他们就会知道他们的定律是错的。

M:一条黄色的毛毛虫起什么作用?它可不可以当作这条定律的一个例证呢?

M:要回答这个问题,让我们首先把这条定律改成在逻辑上仍然等价的另一个形式吧,“凡是不黑的东西都不是乌鸦。”

乙:嘿!我已经找到一个不黑的东西了,它肯定不是只乌鸦,所以它证实了这条定律:“凡是不黑的东西都不是乌鸦。”所以它必然也证实了等价的定律:“凡是乌鸦都是黑的。”

M:很容易找到成千上万不黑的又不是乌鸦的东西。它们是否也证实了定律:“凡是乌鸦都是黑的。”?

M:卡尔·亨普尔教授设计了这条著名的悖论,他确信一条酱紫色的奶牛实际上使“所有乌鸦都是黑色的”概率稍为增大了一点。其他哲学家不同意这一点。你的看法如何?

这是近来发现的在证实理论方面的很多悖论中最惹人头痛的一个。尼尔森·古德曼(见下—条逆论的介绍)说道;“坐在屋里不用出去受风吹雨淋就可以研究飞禽学这一前景是这样吸引人,使得我们知道其中必然有值得探讨的地方。”

问题是要把关键找出来。卡尔·亨普尔相信,一个不是乌鸦的客体不是黑的这件事实际上是证实了“所行乌鸦都是黑的”这个论断,不过只是在极微小的程度上得到证实。试想我们来做一个客体数量很小的假设检验,比如有10张扑克牌向下扑放在桌子上。我们假设所有黑牌都是黑桃。我们开始一张一张翻牌。显然,每当我们翻开一张黑桃时,我们就得到一个证实假设的例证。

现在,我们把这个假设用不同形式改述为:“所有不是黑桃的牌都是红的。”两次我们翻出的牌不是黑桃时,它是红的,这肯定也像前面一样证实了我们的假设。确实,如果第一张牌是黑桃,其余9张都是红色的非黑桃牌,我们就知道我们的假设成立。

亨 普尔说,当我们把上述过程用到乌鸦上,从不是乌鸦的客体不是黑的来证实我们的假设时,使人觉得别扭,其原因就在于地球上不是乌鸦的客体比起乌鸦来实在太多 了,因而我们用上述说法来证实假设是不足取的。再则,如果我们环顾室内来找寻乌鸦,我们本已知道室内根本没有乌鸦,那么在这里找不到任何不黑的乌鸦是毫不 足怪的。

要是我们还没有上述这种补充知识,那么当我们发现了一个不黑的不是乌鸦的东西时,从理论意义上讲,它就算作证明“所有乌鸦都是黑的”的一个例证了。

亨 普尔的反对者常要指出,按他这个理由,发现一条黄色的毛毛虫或一条酱紫色的奶牛肯定也是“所有乌鸦都是白的”这条“规律”的例证。那末,一个同样的事实怎 么会同时证实“所有乌鸦那是黑的”和“所有乌鸦都是白的”的例证呢?关于亨普尔悖论的文章多不胜数;这个悖论在关于知识的证实方面的辩论中起着中心作用, 而这正是后面的参考资料:韦斯利·萨尔蒙的论文所讨论的课题。

12.古德曼的“蓝绿”悖论

M:关于证实理论的另一条著名的悖论所依据的事实是,很多客体在某一个时候会改变颜色。绿色的苹果成熟变红,头发在年老时变白,银子变得黯然无光。

M:尼尔森·古德曼把一个满足两个条件的客体称为“蓝绿”。第一,它直到本世纪末都是绿色的;第二,在那以后就是蓝色的了。

M:现在试想两种说法:“所有的绿宝石都是绿的”和“所有绿宝石都是蓝绿的。”哪一种说法最有依据?

M:奇怪的是,两种说法都被证实了,上面的两个条件都是上面说法中的任何一种的例证,谁也不会看到有相反的例证!要想解释清楚只一种说法可以接受,另一种说法不能接受是很困难的。

M:亨普尔逆论和古德曼悖论向我们表明,我们对于将统计学纳入科学方法的准确途径了解得是多么少。我们确实知道,如果没有统计学这一不可估价的手段,科学将不能持续不断地探索那些支配看我们这个神秘宇宙的规律。

尼 尔森·古德曼的著名的“蓝绿”悖论也是很多哲学杂志文章讨论的课题。它就像亨普尔悖论一样,表明要以统计资料为依据来判定一个科学理论是多么“好”这是一 件多么困难的事情。古德曼悖论证明,只有我们弄清楚了两个理论各有多少已观察到的证据之后,我们才可以比较二者的优劣。

在 古德曼悖论中,“所有绿宝石都是绿的”和“所有绿宝石都是蓝绿的”得到同等数量例证的支持。我们比较喜欢头一种说法,因为在某种意义上讲,它此第二种要 “简单些”。可是,我们现在就得解释“简单些”是什么意思。迄今为止,当哲学家或科学家面临两个理论均有同等数量的例证时,还没有谁能在寻找一种好办法来 测度某种简单性方面取得进展,以便使我们定出一条定律,从这两个理论中选取—个。

这种关于证实理论的悖论看上去微不足道。但是正如逻辑悖论在发展现代演绎逻辑中起了重要作用一样,证实性悖论在力图为科学总结出“归纳”逻辑中也起了重要作用。在将来,这样一种逻辑兴许会成为科学家对支配我们宇宙的规律作永无止境的探索中的—个有价值的工具。


你可能感兴趣的:(数学悖论)