导读:算法真的能帮助你找到灵魂伴侣吗?当你访问OKCupid时,会看到一条带着些许骄傲情绪的标题——“我们用数学为你找到约会对象”。
作者:马库斯·杜·索托伊(Marcus du Sautoy)
来源:大数据DT(ID:hzdashuju)
这些婚恋交友网站使用“匹配算法”对个人资料进行检索,并根据个人的喜好、性格特点等进行配对。它们似乎做得不错!
从某种程度上讲,这些算法选择的结果会比我们自己去相亲的结果更好:最近发表在《美国国家科学院院刊》(Proceedings of the National Academy of Sciences)的一项调查研究表明,以在2005~2012年结婚的1.9万人为研究对象,其中通过婚恋网站结识的伴侣相处得更幸福,婚姻也更稳定。
1962年,由两位数学家大卫·盖尔(David Gale)和劳埃德·沙普利(Lloyd Shapley)共同提出了史上第一个获得诺贝尔奖的算法——他们使用了一个匹配算法来解决“稳定婚姻问题”。
遗憾的是,盖尔于2008年去世,没能参加颁奖典礼。沙普利在2012年与经济学家埃尔文·罗斯(Alvin Roth)共同获得了这个奖项。罗斯认为,这个算法不仅对人际关系问题的研究具有重要意义,对一些社会问题,包括医疗资源和学校招生名额分配等,也具有重大价值。
当时沙普利就被这个奖项逗乐了,他说:“我认为我是一个数学家,而这个奖是颁给经济学家的。”很显然,他对委员会的决定感到惊讶,他说:“我一生中从未上过经济学课程。”但是,他编写的数学算法已经对经济和社会产生了深远的影响。
沙普利和盖尔一起研究的稳定婚姻问题,感觉跟前沿经济理论没什么联系,更像是一个填字游戏。为了准确地描述该问题,我们假设有性取向正常的四位先生和四位女士,并按照他们的兴趣喜好对四名异性进行排序。
该算法的难点在于如何给他们配对,并实现建立稳定婚姻关系的目的。稳定的婚姻关系意味着使所有的人获得较为满意的伴侣,不应该有任何一位成员因不满意算法分配的伴侣而选择在某个时刻离开,与其他人私奔。乍一看,即便只有四对关系,也很难安排得妥妥当当。
我们举个实例来看看盖尔和沙普利是如何利用系统和算法的方式来保证稳定的配对关系。这四位先生分别用扑克牌中的K来表示,黑桃K、红桃K、梅花K和方块K;同样地,四位女士分别用Q来表示。每一位K和Q都列出了自己的偏好和习惯等参数。
对于K来说,选择方案如图1所示:
▲图1
对于Q来说,选择方案如图2所示:
▲图2
现在,假设提议每个K与同花色的Q配对。这肯定是不稳定的配对关系,为什么呢?梅花Q把梅花K列为她的末选对象,她和其他三个K在一起都会很开心。
我们再来看看红桃K的列表:红桃Q是末选对象,方块Q是他的首选对象。在这种局面下,我们都可以想象到:某一日,风和日丽,梅花Q和红桃K私奔了。显然,同花色的配对关系不是稳定的婚姻方案。
我们该如何配对,才不会有私奔的状况出现呢?下面就是盖尔和沙普利所做的:利用多轮分析找到最终的稳定配对。
第1轮中,Q都向其首选对象求婚:
黑桃Q首选为红桃K
红桃Q首选为梅花K
方块Q首选为黑桃K
梅花Q首选为红桃K
似乎红桃K更受欢迎,有两个Q向其求婚。而红桃K选择他更青睐的梅花Q,所以拒绝了黑桃Q。因此,这一轮有三个待选和一个拒绝。
第1轮结果如图3所示:
▲图3
被拒绝的Q必须放弃她的首选K,并在下一轮中向她的次选对象黑桃K求婚。这时,黑桃K有两个选择,第一轮中待选的方块Q以及新求婚的黑桃Q。对于黑桃K来说,他更偏爱黑桃Q,所以他会残忍地拒绝方块Q。
第2轮结果如图4所示:
▲图4
接下来是第3轮。每一轮中被拒绝的Q都会向下一位K求婚,K们总是会选择相对更好的Q,所以这一轮,被拒绝的方块Q向方块K求婚(方块K一直孤单地等待,像是一个没有被选入足球队的孩子)。尽管方块Q在方块K的选项中排名很低,但他也没有更好的选择,因为其他三个Q更喜欢其他的K。
第3轮结果如图5所示:
▲图5
我们用了一个可爱的Q与K配对的游戏来展现这个算法。最终,每个人都配对成功,所有的婚姻关系都很稳定,很圆满的大结局!
这个算法目前在世界各地广泛使用:
在丹麦用于小朋友匹配幼儿园;
在匈牙利用于学生择校;
在纽约用于给犹太教堂分配拉比;
在中国、德国和西班牙用于大学招生和学生择校;
在英国被英国国家医疗服务体系(National Health Service)用于病人与器官捐赠配对,挽救了许多病人的生命。
在盖尔和沙普利研究的基础模型上,我们建立了婚恋交友网站用于配对分析的现代算法。当然,由于信息不完整,个人偏好会随时间、经历等因素而变化,实际情况中面临的问题会比这个复杂得多。从本质上讲,这些算法试图利用人们的偏好来进行匹配,从而形成稳定、幸福的婚配关系。
有证据表明,这些算法很可能比人类的直觉更靠谱。
对于盖尔和沙普利开发的算法,你可能已经发现了一个有趣的不对称:让Q向K求婚。如果我们让K向Q求婚会怎样呢?相当引人注目的是,事实确实会跟我们想象的一样,即如果通过交换K和Q来应用该算法,将会得到一个完全不同的稳定配对。
方块Q最终会成为红桃K的伴侣,梅花Q会和方块K成为夫妇。这两个Q居然交换了伴侣,选择了优先级更低的对象。虽然两次不同的求婚都能形成稳定的配对关系,但Q向K求婚会给Q带来更好的结局。反之亦然,K去求婚,结果对K更有利。
这个算法在美国用于给医学院的毕业生分配工作。当毕业生意识到这样的配对方式不利于自己的就业时,发起了寻求公平对待的抗议活动。迫于各方压力,医院逆转了算法的选择方向,最终,毕业生得到了更好的有利于自己的分配结果。
这是一个重要的警示:我们的生活对算法的依赖越多,对算法的工作原理及运行过程的深入理解就变得越重要。否则,你很可能会被算法“坑”了。
关于作者:马库斯·杜·索托伊(Marcus du Sautoy),英国皇家学会院士、美国数学学会院士、牛津大学西蒙尼公众理解科学教授、大英帝国勋章获得者、英国皇家学会迈克尔·法拉第奖获得者、伦敦数学协会贝维克奖获得者。
本文摘编自《天才与算法:人脑与AI的数学思维》,经出版方授权发布。
延伸阅读《天才与算法》
点击上图了解及购买
转载请联系微信:DoctorData
推荐语:美、英两国双料院士马库斯·杜·索托伊先生作品。我们即将进入一个由算法主导世界,AI将在绘画、音乐、写作等向人类发起挑战,作者用数学帮我们理解算法及创造力的本质。
有话要说????
Q: 学习算法和找对象,哪个更难?
欢迎留言与大家分享
猜你想看????
自动驾驶、人工智能将把你的未来生活变成什么样?
被新基建点名的大数据,有哪些书最值得读?
为什么中文分词比英文分词更难?有哪些常用算法?(附代码)
73页PPT,教你从0到1构建用户画像系统(附下载)
更多精彩????
在公众号对话框输入以下关键词
查看更多优质内容!
PPT | 读书 | 书单 | 硬核 | 干货
大数据 | 揭秘 | Python | 可视化
AI | 人工智能 | 5G | 中台
机器学习 | 深度学习 | 神经网络
合伙人 | 1024 | 大神 | 数学
据统计,99%的大咖都完成了这个神操作
????