14:回归类问题阈值如何确定

 在用逻辑回归做潜在用户挖掘时,阀值(Z)的选取是一个头疼的问题。取太高,查全率虽然高了,但是查询条件过于严格,挖掘出的潜在用户过少。取的太低,资源浪费的太多。对于一般的营销而言,这个问题很好解决,只要按照预算,从高往下选取就可以了。但对于其他没有预算约束的情况就比较麻烦。
希望下面的公式可以给予一些启发
Z=Ln((qc)/(QC))
q-发生显性结果的先验概率,比如信用卡用户发生违约的以往概率
Q-不发生显性结果的先验概率
c-范第一类错误的成本,即信用卡用户对银行造成的损失,就是不能收回的比例
C-范第二类错误的成本,即应该发放信用卡而没有发放所遭受的损失,就是存贷款差价 
--------------------- 
作者:心雨心辰 
来源:CSDN 
原文:https://blog.csdn.net/xidianliutingting/article/details/75088296 
版权声明:本文为博主原创文章,转载请附上博文链接!

你可能感兴趣的:(技术面试,机器学习)