先声明一下:本文纯属七夕应景娱乐之作。如果有人因为遵循本模型提出的择偶理论而导致失恋或单身,除了同情,我不能补偿更多。
在中国的传统节日里,七夕可能是起源最神秘、内涵最深刻的一个了。当然,这不是本文的重点,我们的核心问题是:在七夕这个特有纪念意义的日子,你真的想好了要向TA表白吗?TA真的是你唯一正确的选择吗?这个婚介模型,也许对你有一些启发。
我的婚介所生意兴隆,无数想找到理想伴侣的单身人士都来光顾。根据颜值、人品、能力、财富等因素,我给每位客户确定了一个素质指数(Quality Index),简写为qidx。统计发现,qidx呈现均值8.0、标准差0.5正态分布。
下面是1万客户的qidx统计分布图,可以看出绝大多数单身人士的qidx位于7.0~9.0之间,评价较为负面的和非常优秀的,都属于少数派。
import numpy as np
import matplotlib.pyplot as plt
singles = np.random.normal(loc=8.0, scale=0.5, size=10000)
plt.hist(singles, bins=8, histtype='step')
plt.show()
一般情况下,我的客户缴费1次,将获得10次选择机会。我向客户推荐目标的策略基于“门当户对”,总是选择和客户的qidx相适应的异性,具体说就是以客户的qidx为均值,以0.1的方差,按照正态分布随机生成。
通常,客户有两种方式从我为他们推荐的目标中做出选择。第一种是基于传统的择偶观念,具体规则如下.
第二种匹配方式则是基于“麦穗理论”,听起来很高大上。这里省略了关于麦穗理论的讲解,感兴趣的同学可以自行检索。具体说,就是客户在前4次的推荐中,不做出选择,只记下其中的最高的qidx;从第5次开始,只要遇到大于或等于前4次最高qidx的推荐目标,就做出选择。
下面,我分别用两种匹配方式为1万名顾客选择配偶,结果会怎样呢?
# -*- encoding: utf-8 -*-
import numpy as np
class Single:
def __init__(self, qidx, times):
self.times = times # 婚介所提供的匹配次数
self.counter = 0 # 当前匹配次数
self.qidx = qidx # 客户的qidx
self.spouse = None # 匹配成功的配偶的qidx
self.histroy = list() # 基于麦穗理论的前times/e次的推荐对象的qidx
def math_classical(self, spouse):
self.counter += 1
if np.random.random() < 0.1:
self.spouse = spouse
if spouse - self.qidx >= 0.2:
if np.random.random() < 1-0.05*(10-self.counter):
self.spouse = spouse
elif spouse - self.qidx > 0:
if np.random.random() < 0.8-0.05*(10-self.counter):
self.spouse = spouse
elif self.qidx - spouse >= 0.2:
if np.random.random() < 0.18-0.02*(10-self.counter):
self.spouse = spouse
elif self.qidx - spouse >= 0:
if np.random.random() < 0.7-0.05*(10-self.counter):
self.spouse = spouse
def match_technical(self, spouse):
self.counter += 1
if self.counter < self.times/np.e:
self.histroy.append(spouse)
elif spouse >= max(self.histroy):
self.spouse = spouse
def main(math_mode, total=10000, times=10):
# 生成总数为total的客户,其qids有正态随机函数生成
singles = [Single(np.random.normal(loc=8.0, scale=0.5), times) for i in range(total)]
for p in singles:
for i in range(10):
if p.counter < 10 and not p.spouse:
spouse = np.random.normal(loc=p.qidx, scale=0.1)
getattr(p, math_mode)(spouse)
matched = np.array([(p.qidx, p.spouse) for p in singles if p.spouse])
diff = matched[:,0] - matched[:,1]
print('----------------------------------')
print('成功匹配%d人,成功率%0.2f%%'%(matched.shape[0], matched.shape[0]*100/total))
print('客户qidx均值%0.2f,配偶均值%0.2f'%(np.sum(matched[:,0])/matched.shape[0], np.sum(matched[:,1])/matched.shape[0]))
print('匹配方差%0.2f,匹配标准差%0.2f'%(diff.var(), diff.std()))
print()
if __name__ == '__main__':
print('基于传统方式择偶的统计结果')
main('math_classical')
print('基于麦穗理论择偶的统计结果')
main('match_technical')
比较两种方案的匹配成功率、匹配成功的客户的平均qidx、匹配成功的客户配偶的平均qidx、客户和配偶的qidx的方差等,你会发现,这个结果真的有点意思。
基于传统方式择偶的统计结果
----------------------------------
成功匹配10000人,成功率100.00%
客户qidx均值8.00,配偶均值8.02
匹配方差0.01,匹配标准差0.10
基于麦穗理论择偶的统计结果
----------------------------------
成功匹配7138人,成功率71.38%
客户qidx均值8.00,配偶均值8.11
匹配方差0.00,匹配标准差0.07