本章主要是从数据分析的长期预测方法:概率模型BTYD 模型的角度进行学习。
模型研究案例背景:
组织
公共广播电台主要由听众的贡献支持
挑战
观察听众关于他们是否每年给出的历史,我们可以预测他们未来的模式是什么?
焦点捐助者
研究课题
在接下来的6年里重复捐款的预测研究。
a)捐赠者失效(即离开捐赠者池)
b)捐赠者处于休眠状态(即决定不给那一年,不考虑捐赠等)
c)我们不知道,但可以建立一个模型来提出“最佳预测”。
答案:c)我们永远不知道捐赠者是否失效; 根据他的捐赠的新近度和频率,我们可以对堕落的可能性做出有根据的猜测,因此我们可以决定在哪里投入资源。
根据我们对“死亡”概率和捐赠倾向的最佳猜测,我们可以计算每个捐赠者未来捐赠的预期频率。
我们采用“BTYD”模式来预测未来的捐赠行为
该模型仅使用三个输入:
1.新近度(R)
2.频率(F)
3.每个R / F组合的人数
这需要少量数据并提供更容易使用的结构(即,数据从个人级别汇总到R / F组),通过假设捐赠者倾向的某些概率分布,我们可以构建一个易于在Excel上实现的健壮模型,这种“BTYD”建模方法在各种不同领域都有成效。
模型的大概研究方法如下:
1.Bob(R:6,F:6)预计在2002年和2006年之间共有3.75次机会,出乎意料的是,他的捐赠率为100%。
2.Mary和Chris拥有相同的RF(6,4),因此他们预期的捐赠数量是相同的。
虽然Mary和Chris的F低于Sharmila,但他们的R越高表明他们是活着的,因此他们比Sharmila的价值高出50%
3.尽管捐赠率很高,但Sharmila(5,5)可能已经失效。
4.具有非常低的R和F的Sarah已经失效和/或非常轻的捐赠者(很难说)。
模型的有效性分析
该模型可以很好地预测未来的捐赠行为,因为有条件的预期与实际的保持期数据非常吻合(2002 - 2006)
总体而言,该模型非常擅长拟合历史数据以及保持期数据(即模型预测与2002年至2006年之间的实际捐赠数量)
使用来自不同非盈利公司的更大数据集,我们创建了一个“热图”,显示哪些RF组合可能会产生最有价值的捐赠者。
有许多模型可以预测未来的捐赠行为; 我们相信我们的方法不同/优越,因为:
1.与需要大型数据集的其他模型(通常是详细的个人级特征,例如人口统计特征)相比,该模型需要非常少量的数据(新近度和频率)。
2.该模型已经证明了强大的样本外验证。
3.该模型可以推广到其他类型的行为;它不会过度定制捐赠。
4.该模型可以在Excel上轻松实现;它不需要任何专有或专业软件。
现在回归,正如我所提到的,只是做出需求预测的一个例子。 这是理解需求驱动因素的好工具, 做出需求预测,谈论最优价格。回归分析是一个简单易懂而且短期有效的工具。