博客笔记二: [京东白条,美团] 用户评分卡,在线广告模型

*后者是前者遇到问题搜索看到的,放一起了。前一阵址wayfair猛搞一通积累了8,9篇。这两天有点乱了,还是要集中精力。 先把netflix看完,从marketing开始看, 而且要深入。注意和自己实在不相干的就不要强迫自己看了。

1. 线性模型会遇到两个问题:

  • 一是非线性特征的学习,比如年龄。一般使用的方法是进行变量离散化,把年龄分成不同的段或者使用稀疏编码或者自编码等算法对品类或者其他信息进行重构。
  • 二是交互影响,例如收入特征和年龄特征的交叉。高收入的中年人是干爹和干妈,高收入的年轻人是高富帅和白富美,两者的特点完全不一样。所以我们也会使用Xgboost等模型加工非线性特征,或使用FM/FFM类算法学习交叉特征,以此提升模型拟合能力。
    作者:京东白条
    链接:https://www.zhihu.com/question/37405102/answer/194312368
    来源:知乎
2. ctr与cvr预测模型

在计算广告领域,点击率CTR(click-through rate)和转化率CVR(conversion rate)是衡量广告流量的两个关键指标。准确的估计CTR、CVR对于提高流量的价值,增加广告收入有重要的指导作用。预估CTR/CVR,业界常用的方法有人工特征工程 + LR(Logistic Regression)、GBDT(Gradient Boosting Decision Tree) + LR[1][2][3]、FM(Factorization Machine)[2][7]和FFM(Field-aware Factorization Machine)[9]模型。在这些模型中,FM和FFM近年来表现突出,分别在由Criteo和Avazu举办的CTR预测竞赛中夺得冠军[4][5]。
https://tech.meituan.com/deep-understanding-of-ffm-principles-and-practices.html
深入FFM原理与实践, 美团del2z, 大龙

3. 个人感受

根据一个金融公司的朋友说,他们的金融产品基本还是逻辑回归。根据知乎张大万,金融公司的逻辑回归的模型评估多是ks。

你可能感兴趣的:(读博客笔记,官方博客笔记)