你问我怎么用贝叶斯公式鉴定渣男?

夜半

风扇的轰鸣转动,但微不足到的风吹到了皮肤上就被汗水的热气温热。汗水浸湿了床单,黏糊糊。(自己想象很热的场景)

小明光着身子趟在床上,被灼热的夏气浓重裹着。

突然,他从梦中醒来。

这已经不是第一次了。在起初,他以为夏天到了,天气闷,睡不着理所当然。不过以前这些都不是什么问题。想想小时候,每当晚上睡不着,家里的大人就会唱鬼故事,到这时,就不觉得冷了。不过,即使这样,家里都是大人,也不至于害怕,晕晕乎乎就睡下去了。

可是现在,自己独自一人在寝室。室友有女友的去找女友开房,有的去打工,有的去看电影。唯独他自己一个人,停电之后,摸黑冲了一个澡,喝了大口凉水,急匆匆上了床。本想着洗完澡,更好睡觉。只是没想到,在寂静的午夜,他又醒了。

一股尿意袭来,他从床上模索着下了床。今天十五,月亮似乎出奇的大,惨白月光穿过空荡荡的阳台。

他低头找拖鞋,「嘭」一声,什么东西掉在了阳台。

是一只黑猫。

猫的影子从阳台流了进来,停在他脚下。没听到猫叫,也没看到它要离开,它四脚撑地,看着阳台的角落没有动静。

小明不喜欢猫,特别是黑色的猫。有些时候,和猫对视,总感觉那不是一种野兽,更像是一个人,不说话的人。就只是静静地看着你。他听说猫爱盯着人的眼睛看,当人死时,眼神失去光泽,猫就不再当他是人,而是食物。

不过这只猫并没有看过来,这一点到还好。

他回过头,往门口边的独立厕所走。突然,猫叫了一声。小明猛地一回头,发现那只猫在盯着自己!发光的两只眼睛好像玻璃球,没有丝毫生气。

小明有些害怕。猫不会吃人,也不会无缘无故咬人,但现在的环境,小明总觉得眼前的这只猫会从阳台上跳下来,亮着眼睛一点一点靠近,然后跳起来,咬出他的脖子。但更令它害怕的,这只猫会不会只是其中一只?另一只猫就在自己的身后,等自己看阳台的时候,露出自己的尖牙。

「砰!」身后一声巨响。

「啊!!!」

「呀!同学你叫什么啊?」身后的门被推开,回过头,两个宿管阿姨站在门口,拿着手电筒照了进来。「你太吓人了!最近有外人进寝室偷东西,晚上睡觉记得锁门啊。」

这话应该我来说才对吧?小明有点生气,但有一丝人息,总算没那么害怕了。「阿姨你们才是要吓死我了,敲门不要那么用力啊。」

「这不是怕你们听不到?」

当门关上后,小明又回头看了一下阳台,猫不见了,应该也被吓跑了吧。急匆匆上完厕所,锁上门,趁着还有点人气,小跑回到了床上。被一只猫吓到也真是够怂的。他拉起床帘,重重躺到床上。

「喵」

猫又叫了,原来没有走啊。小明有点生气,这只猫胆子也太大了,怕是没被人打过哦?他伸手抓床帘,准备给猫来一个口水爆击。

突然,阳台发出什么声响,那只猫随着发出了凄惨的叫声,之后,声音远去,猫离开了。

但是,小明却起了一身鸡皮疙瘩,阳台那是什么声音?为什么阳台会有声音?

说起来,最开始,那只猫为什么盯着阳台地角落?

并不应该怕猫,猫再可怕,好歹是小动物。比起猫,阳台上是不是有什么东西!

他的室友都不在,那阳台上的是谁?

小明伸到床帘上的手僵住,现在那怕一点声音,在他耳朵里,都如雷声贯耳。他担心自己一动,床帘就被掀开,头发盖在脸前面的人,拿着菜刀就站床前。

他以自己最小的动作慢慢躺下去,他安慰自己,只要不被发现,那个人会自己走掉吧。

过了许久,没什么动静。那人也应该走了吧。

「叮」

随着清胞的响声,手机屏幕也亮了起来。是垃圾短信!

阳台上也传来了衣服摩擦的声音。那个人要过来了!短信的声音吸引他了吗?

小明感觉自己的呼吸已经停止。那个人的脚步声越来越近。

「叮」妈的,又是一条!

那个人的脚步声也停了下来。

现在那个人就站在小明床边,他在干吗?是咧着嘴笑?还是什么都看不见,就面无表情地站在这里?

汗水再一次袭来,不过,这一次,感觉不到一点热气。

不吓人的

「所以说,你就被吓尿了?」

「当时的情况真的很恐怖哇!」

现在正值早上十点,太阳已经升到半空,图书馆自习室里,我拿着手机和坐在前面的女孩描述着恐怖的夜晚。「你看啊,就是这些短信。」。

「那还不是你自己吓自己。」坐在对面的女孩扎着丸子头,五官不突出,脸还有点小肥,但整体看上去却也很吸引人目光的那种少女。

「刚才跟你白说了呀。小英。」

昨晚的经历是有点吓人,不过,比起我,那个小偷更是怕地要死。先是一只猫死死盯着他,然后不知从哪里传出来的恐怖铃铛声。当他冲到门口时,想要跑时,发现门打不开,吼叫地推来推去。好不容易推开门了,门外的阿姨看到他后又喊又叫,被没睡的其他同学制服。一个男人被好几个裸男压在身下,有多可怕可以想像。

「你好歹也是个20多岁的人了,还怕一个人睡的吗?那今晚要不要姐姐陪你睡?」

「咦,你真可怕。先不说这些,你有没有办法帮我把这些短信给干掉?」我向她指了指手机。

「嗯。。。办法倒是很多,看你要用哪种了?」

「最简单的那种。越快越好。」

「换张新卡。」

「久了还不是又会过来。」

小英闭着眼,一手托腮帮,一手「咚咚咚」敲桌子。从小到大的经验,当她做这个动作时,问题差不多就可以解决了。

「帮不了你。」

「别呀,你不是神奇小英嘛,这点问题你一定会帮我的。」

「你来问我有什么用,我又不会写程序,你为什么不问问神奇的贝叶斯公式呢?」

「贝叶斯公式?贝叶斯公式和这个有什么关系啊?」

为何是贝叶斯

小英转起笔,另一支手托着脸,「在你看来,为什么会有概率呢?」。

虽然现在说不合适,但这个姿势的小英,的确有一点夏日少女的感觉。「概率不就是像抛硬币这种,50%的概率抛出正反面?还是有其它的说法。」

「不是的哦,我问的不是概率的。而是为什么会出现概率这种东西。比如说,你为什么会认为抛出的硬币有50%的概率是正面呢?」

「因为抛出硬币后,虽然一开始会不明确,但抛的越多,正反面出现的次数就越来越接近总次数的一半,所以就会觉得50%的概率出现正面啰。」

突然有一瞬间,看到小英脸上露出了浅浅的坏笑。「说的对。」小英停下了手中的笔,像是抓出破绽一样,眼神里充满了自信。「你说了「觉得」两个字。」

「这怎么了吗?」

她正坐了起来,「明天下雨的概率是30%。。。。这些概率和你刚刚说的有什么不同呢?」

「没什么不同啊。数字不一样?」

「错!」

她说完,在我的笔记上快速地划了个 X。

「这有点难懂,给点提示呗?」

「哼,是次数。」

「次数?」

「明天下雨也好,比赛的胜率也好,它和抛硬币的最大不同,就是它们不是重复的事情。」她似乎有点兴奋,「「明天下雨的概率为30%」的说法就很奇怪,如果用你的说法,硬币正反的概率为50%可以理解为抛了 10000 次后,有 4999 次是正面,因此通过 4999 次比上 10000 次,得到了 50% 的概率。可是,明天无论如何只有一次,从来没有人在不同的宇宙之间做重复的实验来得到 「降雨30 %」 这个数据啊!」

一瞬间,脑袋有如一道闪电劈过,这种说法我还是第一次听说过。「概率就是通过重复的测量中得到的」这一概念在过去十多年中,理所当然的植入了大脑。而小英的这一句话让这棵大树开始有点摇晃。

还没缓过神,小英又接着说,「你自己也说了,只有大量的抛硬币,概率才慢慢变成了50%,也就是说,在最开始时只丢五六次时,正反面出现的概率并非对半,可为什么越来越多就会变得更正确了呢?照此说来,如果我再抛 10 万次,概率会不会变成 60%了呢?」

「这。。。只要有硬币的材质均匀这个信息,在大量的测量下,它只会变得越来越接近50%,根本不会变成什么 60%!」虽然小英说得不无道理,但男人的尊严没可不会让我停下来。

「哈!要的就是这句话!」小英的眼里仿佛看到了咬到钩的鱼。

有点跟不上她的脑袋。「我说了什么了吗?」

「你提到了「信息」这一个词。」

「什么意思?」

小英双手交插,翘起二郎腿向后靠,「看来你真的不懂啊。」

「我承认我笨好吧。」

「如果我发现硬币的另一边注了铅,这下概率还会是50%吗?」

「那当然不是啦!」

「为什么不是了?它不还是硬币,不还是还是抛了 10000 次吗?」

「因为材质均匀这个信息已经。。。信息变了。」小明突然想起了什么。

「没错」小英弹了一个响指。「因为信息变了!不是因为它是硬币,所以它存在 50% 的概率,而是因为我们通过观察到了它的信息,所以猜测了它的概率!也就是说,是人创造了概率!」

人创造了概率?这种说法闻所未闻,怎么人除了能改变电子自旋,还多了一个改变概率的能力?

「嘛,这样说是有点夸张就是了。可是你看,明明是 50% 概率的正反面,在我们得到了新信息「另一边注了铅」之后,概率立马发生了变化,不再是对半分了。也就是说——新信息改变了概率。从另一方面看,如果没有发现新信息,我们就一直赋予了硬币一个错误的概率不是吗?这是不是意为着,得到所有的信息,我们才有可能确定硬币的正反概率。」小英顿了一下,缓缓说到,「可人类何得何能得到所有信息?」

「那岂不是。。。」

「对,人类在没得到所有的信息之前,就已经给硬币赋予不属于它的概率。我们强行赋予了事物概率。30% 的降雨率也好,60%的胜率也好,是猜来的。不过不是盲目的猜测,而是给予了一个事件,我们认为的概率,不过,这并不是它们真正的概率,因为一旦出现新的信息,我们便开始修正先前所做的猜测。概率就发生了变化。从这点看来,概率就是人类所想像出来的东西罢了。」

「但是。。。」

「举个例子,再举个例子,下一界泰国总理是马尔斯的概率有多大?马尔斯这个人之前从没竞选过总理,也不可能安排多个宇宙来进行重复试验,那么他当总统的概率是多少呢?」

「这个和我们要讨论的问题不在同一个点上吧。虽然不能通过实验来得到概率,但对大量的民众进行调研,分析泰国最近两年的政治风向,不就。。。等等,这些东西岂不就是。。。」

「没错」,小英弹了个响指,「这些就是信息!」

如何解决

「举个例子。」小英边说着,在本子上画了一个表格。「你看好这个表格。」

\ 一个微信 两个微信
渣男 2人 4人
老实人 3人 1人

「渣男。。。小英,这是什么鬼啊?」,她纠竟经历了多少啊?

「不要关注这些。」她摆了摆手,「在这里,我们可以看到总人数有10人,老实人有 4 个,渣男有 6 个。可以写成概率 p(老实人)=0.4,p(渣男)=0.6。之后渣男中,有 4 个有两个微信,也就是 4/6,而与之相对的,老实人只有 1 个有两个微信,也就是 1/4。」说完,她又在本子上画了一个方格。「这张图和我刚才说的东西是一样的。」

image

「嗯嗯。」

「现在,有有两个微信号的男人走进了图书馆,呐,我问你,你的另一个号。。。啊不,他是渣男的概率是多少?」

「4/5?不对,因为有的渣。。。渣男有的也只有一个微信。话说,你刚刚是想问什么吗?」

「想得不错。的确,不能从外在判断一个人。」

以貌取人说的是你才对吧?

小英接着说:「因为他有两个微信,所以,我们把只有一个微信的部分涂掉。图变成了这样。」

image

「这没完,因为这两个图并不成比例,它们的和并不为 1。不为 1 的话,就说明还有其它可能。但我们可以动手归一化。」

小英「看,通过简单地计算,来两个微信的,80%是渣男哦。」

我「你跟微信有什么仇啊?」

小英「不然你说,你藏着另一个微信号是准备做什么?」

我「我有自己的工作啦,不对,你怎么知道我有两个微信号?」

小英「哇,还真被我说中了,渣男。」

「不要用看虫子的眼神看着我啊。」这话说的,好像我没做过什么对不起你的事吧?「咳咳,然后,可这是什么?和贝叶斯有什么关系?」

「并没完哦。你等一下。」她把笔记本夺了回去。

什么没完啊?是我的另一个微信还是贝叶斯算法?

「你看这里。」

「还记得我先前跟你说过的信息的事情吗?」

「记得,你说过,因为信息,所以概率发生了变化。」

「没错。」她圈起了等式左边的 0.6。「还记得我先前说的,你们这种人出现的概率是多少吗?」

「0.6。。。」

小英「对,没错,这就是在不知道你有两个微信号前,判断一个男人是不是渣男的概率。姑且称它,先验概率。」

「等一下,主语用错了啊。我不渣啊。」

「这边,」她没理我,自顾自地讲了下去,同时圈起了右边算出来的答案。「这是刚才我们算出来的,在知道一个你有两个微信号之后,是渣男的概率。」

「所以说。。。」

「发现了吗?」

「发现什么?」

她用笔敲了敲答案,「你是渣男的概率,变了」。


概率发生变化了。因为得到了新的信息,所以概率产生了变化。从最早的0.6,变成了 0.8。这是是所谓的,信息改变概率?

「把刚才的数字,换成数学上的写法,再对调一下等式两边的问置。」

「当我知道你有两个微信号的时候,想要算你是渣男的概率就可以用这个公式了。现在左边这个东西,姑且叫做后验概率。」

啊,有点过份了呢,小英。

「啊,你说了我半天,我怎么知道你是不是渣女呢?」

「听听,这是人说的话吗?先别打断我说话。」她用力拍了我的脑袋,「现在这个东西只能算渣男,如果想算渣女的话,就换成这样。」说完,她在本子上划了划。

「因为渣女和渣男做的事情可能不太一样,所以我把两个微信号换成了特征这个词。」顿了顿,她接着说,「而且,这个渣女也可以换掉,换成某个通用的词,比如说类别这个词。」

写完这个,她嘴角微微一笑,「这个,就是大名鼎鼎的贝叶斯公式

后验变先验

小英「上面的式子,你可以这样看。」

「用比较专业的说话,也可以写作。」

啊,用文字来说明之后,突然觉得式子变得好理解了。就如小英说,旧的概率得到新信息后,就会发生新的变化。可是,还有点问题。

「但这样是不是太果断了?」就凭两个微信,就把所有好男人,像我这样的好男人打死,是不是太不公平了啊?

「说的也是,就 0.8 的概率是显然不够的。因为还有 0.2 的人会被冤枉。那再加一条。」

她将椅子搬到我旁边,在离我不到一拳的距离,在本子上写着。靠得有点近,总觉得有股软软的香味。

\ 女性朋友少 女性朋友多
渣男 2人 4人
老实人 3人 1人

她抬起脸看我,「这是新的信息,你来考虑该怎么利用吧。」

本子上记载的信息啊。。。怎么总觉得不太对劲。不不不,这是错觉而已,才不会是争对我。

现在仔细看一下。在这个表里,可以看出来,渣男和老实人比例是一样多的,分别是 0.6 和 0.4。同时,渣男有很多女性朋友的比例是 4/6,而老实人的则是 1/4,这和刚才的比例是一样的。如果按刚才的计算方式,得到的结果不就一样了?渣男的概率还是 0.8 ?

「怎么样?」

她好奇地向我这边凑,白净的额头就在我的眼前,只要再往前一点,嘴唇就会与她的鼻梁碰上。

我赶忙将本子放回桌上,拉开一点距离「如果单单靠这些信息的话,得到的结果还是和刚才算的一样。。。」

白净的额头缩了回去,然后摇了摇头,「不行,这还不够。」,她在本子上,在记录渣男微信表格的地方点了点,「你得利用上它们。不如,你也试着画画图。」

啊,对啊,之前算出来的东西还没用上。在刚才那张图的基础上,加上刚刚得到的新信息。

image

新的信息中,并没有说明,女性朋友多的男人,是否有两个微信号,因此,在上面的图中,两部分都加上了。

看我画出了图,点了点头,问:「现在知道这个男人有两个微信号,同时,他的女性朋友还很多,那么,请问,他是渣男的概率是多少?」

「啊,那就把只有一个微信的部分去掉,同时也把女性朋友少的部分去掉,同时再归一化。」

image

啊,这个概率上升了!虽然图上的区域在变小,但事实上,概率在一点一点上升。

「很棒哦,做出来了呢。发现了吗?如果仅仅只有一个信息的话,可能还不能说得不太准,但如果同时出现了两个特征的话,那就辩解的地步就更少了呢。」

说这些话的时候,不要看着我说了啦。

「如果现在,」没给我辩解的机会,她接着说。「如果我说,我忘了前面做的计算,只能说这个人是渣男的概率是 0.8,同时再给你贝叶斯公式和这张女性朋友很多的表格,你再来算算概率。」

「忘记前面的计算,也就是说,并不知道他有两个微信号,但闺蜜告诉你,这个男人是渣男的可能性是 0.8,是这个意思吗?」

小英点了点头,「你很有经验嘛。」

「。。。」

好吧,我再来试试。也就是说,直接用上贝叶斯公式就可以了吗?

咦?计算下来的结果和刚才得到是完全一样的。

「不是巧合,将微信那部分得到的后验概率,变成女性朋友这部分的先验概率,得到的结果和我们计算到的结果一模一样,这并不是巧合哦。你可以试试其它例子,但最后的结果还是一样的。」

我有点摸不着头脑。这样看来,在画图时,我先用第一条信息切割,再用第二条信息切割,再进行归一化,才得到了后验概率。

可是,在后的计算时,我并不知道第一条信息的存在,只知道第一条信息所得到了概率,并把它当成第二条信息的先验概率。这样下来,根本就不用知道第一条信息的存在,只要知道它的概率,就可以继续计算下去。就这样,在一次一次地计算下去之后,哪怕已经忘记做过什么,只要还记得先验概率,就还有办法再计算下去。

「这样计算,有点像人类啊。」

是的,人类不也是这样思考的吗?做题时,看到某个选项会觉得它就是错的,哪怕说不出缘由,便就是觉得错的概率会很大。还有,看到某个人做了令自己讨厌的事情,在心中会修改对他的评价,今后虽然忘记他做过的事,但厌恶的心情却还留着。

「是的呢。贝叶斯公式就具有这么特殊的能力。它,有学习的能力。从另一个角度来看,经验之谈这个词不就是最好的诠释吗?多年行医的医生,在做手术前就能知道成功率是多少。征战多年的士兵,在瞬间就能感知敌人的存在。这并不是怪谈哦。」

「啊,我懂你的意思了。」

在听完小英给我讲的贝叶斯公式,总算从另一个角度理解了概率这种东西。不确定,依赖主观意识,信息改变概率。

「知道了这些,你可以去完成你的垃圾信息分类器了。在没有数据的情况下,搜集大量的垃圾短信,和正常短信,进行词频统计,比如,A 词在垃圾短信出现的概率,和在正常短信出现的概率。之后就套在贝叶斯公式上。」她合上本子,收进书包。「至于怎么分词,你可以去看看隐马尔克夫模型,也许会大吃一惊呢。」

粉色的雨

讨论完无聊的问题之后,小英和我收拾好书包,走出图书馆,外面天已经暗了下来。

「啊,糟了,下雨了。」抬头看着快速落下的雨丝,小英叹了口气。

「你不会是没带伞吧?我以为女生都是离不开伞的生物呢。还是你不是。。。啊。」话没说完,肋下就遭到一下重击。

「雨还不大,快点跑回去。」她准备冲进雨线里。

我赶忙拉住她,「跑回去啊?寝室离图书馆那么远,就算跑回去书也湿了吧?等雨小一点再走吧。」

「图书馆也要关门了,那现在我们做什么呀?」

「还能干什么,看雨吧。」

于是我们一言不发地站在图书馆的阶梯上,看着其他人打着伞陆陆续续地离开。站在这里看下去,阶梯下的伞群就像烟花一样,升到天空,散开 ,然后消失。

「。。。」

「。。。小英。。。我们认识的时候,也是下着这样的雨吧?」

「。。。嗯。。。小学放学的时候。」

「那次我们谁都没带伞,其他同学都走光了,只剩下我们俩个。」

「我还记得,你那会儿还急哭了,哈哈哈哈」

「在下雨天,只剩下自己回不了家,是个小孩都会急哭的吧?倒是你,从小时候就像个大姐姐一样,什么都不怕。」,不过,脸蛋倒一直像小孩子一样可爱,小明想了想,没说出来。

「啊,看来从那时就白赚了个弟弟啊。」

「从那时候起,就像孽缘一样,无论升学到哪,总会遇到你。」无论什么时候,只要转过头,就会看到她的脸,好像这一切都是理所当然的一样。就像现在这样。

「。。。你说这些做什么?」

「不过你什么都比我厉害,无论是在高中时成绩,还是上大学后参加各种数学竞赛,这些都是我做不到的事情。上次在图书馆看到你参加数学建模比赛,顾不上吃饭的样子,觉得,这样的你有点难以追上。总有一天,你会在我到达不了的地方,做着我无法想像的事情吧。」

「。。。」

「可是,我太喜欢你获奖那时的表情了。看到你追求数学时的样子,看到你眼睛发光,看到你兴奋的拍桌子,听你讲数学的故事。。。我相信你对数学的热爱,你对数学的想法一定会传到世界的每一角落。」

「。。。」

小英没有说话,我也不知道该怎么说下去了。在她看来,我这样子很啰嗦吧。

「所以你就放心地前进吧。倩倩和我会一直在你身后,为你加油。。。」

「你,你,你怎么话那么多啊?还有还有,怎么叫倩倩叫得那么亲切?你跟我家倩倩什么关系?」拳头就在我胸口乱拍着。

哎呀,我好不容易酝酿出来的感情。

等到她停下来之后,我们又站在门口,看着一对一对情侣走过。

(上面的部分再多一点回忆。下面的部分再多一点冲突)

「小明,有点话我想问你。。。」

「啊,小明,你又背着我偷女人了。」身后传来成熟女性的声音,打断了小英的话。

「学。。。学。。。学姐!」

站在我们背后的人有着令大多数女孩羡慕的身姿,该凸的凸,一席长发散发着噬人的黑色魔力。

「这是谁啊,小明。」捏着我的腰的,身材较为贫弱的小英,问道。

「这是我话剧社的学姐。学姐,这是小英。」小英瞪了我一眼,我说错了什么了吗?

「啊我刚才站在这听你们聊了好久了呢,真是可爱的青梅竹马。呵呵呵。」学姐妖媚地笑了笑,「什么时候也来我们剧社玩玩啊。这里有很多小帅哥呢。」

「不,不需要。」没安好气地回复着,「我想先走了。」,在走之前,我的小腿被踢了一脚。

「啊,这里有把伞,只能撑一个人,你着急可以先借你,我和小明在后面多等一会儿吧。」学姐从手提包里抽出一把伞,想要递给小英。

小英头也没回就走进了雨中,留着学姐悬在空中的伞。

「学姐你干嘛啦,说得好像我们是情侣一样。」

「哈哈哈,越来越喜欢这小女孩了。哈哈哈哈」

单身老学姐不会连小学妹都不放过吧?

「小明,上次你问我的问题,已经解出来了。下次来社团我告诉你。」

「哦哦哦,太谢谢学姐了。」

「再来一次,好好的,一整晚地享受计算机的美妙世界吧。」

「我拒绝。」

后记

回到寝室之后,洗完澡,给小英打了电话,跟她解释学姐的问题。虽然听起来像是渣男的辩解,但无论如何,请一定相信我。

不过,我和小英的关系似乎也不需要解释吧。

挂断电话,回忆起图书馆里,小英给我讲的,关于概率的看法,关于贝叶斯公式的推导和运用,不禁感叹前人所做的努力。贝叶斯概率,平凡,而又奇妙。将复杂的规律变成所有人都能运用的数学公式,这也许就是数学的魅力之一吧。

我坐回桌前,看着空白的草稿纸。

「不如,来算一算学姐有男朋友的概率吧。」

你可能感兴趣的:(你问我怎么用贝叶斯公式鉴定渣男?)