面试总结(360)

搜索广告岗位 一面挂

  1. 聊项目
  2. msn新闻的数据怎么体现商业价值?
  3. 问Trainer细节
  4. LR模型怎么防止过拟合?
    a. 做特征选择;b.加入正则项,在特征维数很多的时候效果更明显; c. 增大样本数量; d. 交叉验证;e. 特征离散化; f.去除异常值,LR对异常值敏感。
  5. 一个高维特征怎么挑选出最有效的Top K特征。
    a. 贪心方法,每次去掉一维特征后比较效果; b. 随机挑选含有k个元素的子集,在模型上验证效果,选择效果最好的一组; c.计算每一个特征的信息增益,信息增益越大,这个特征月重要; d. 通过树模型做特征选择。e. 过滤式方法Relief计算一个“相关统计量”来度量特征的重要性,卡一个阈值,把对于阈值的特征过滤掉。
  6. 对于AUC的物理含义是怎么理解的?(参考:https://blog.csdn.net/mimi9919/article/details/80691277)
    auc的直观含义是任意取一个正样本和负样本,正样本得分大于负样本的概率;或者理解成样本预测后按得分排列,正样本排在负样本前面的概率。
    现在假设有一个训练好的二分类器对10个正负样本(正例5个,负例5个)预测,得分按高到低排序得到的最好预测结果为[1, 1, 1, 1, 1, 0, 0, 0, 0, 0],即5个正例均排在5个负例前面,正例排在负例前面的概率为100%。然后绘制其ROC曲线,由于是10个样本,除开原点我们需要描10个点,如下:
    面试总结(360)_第1张图片
    描点方式按照样本预测结果的得分高低从左至右开始遍历。**从原点开始,每遇到1便向y轴正方向移动y轴最小步长1个单位,这里是1/5=0.2;每遇到0则向x轴正方向移动x轴最小步长1个单位,这里也是0.2。**不难看出,上图的AUC等于1,印证了正例排在负例前面的概率的确为100%。
    我们不妨再举个栗子,预测结果序列为[1, 1, 1, 1, 0, 1, 0, 0, 0, 0]。
    面试总结(360)_第2张图片
    计算上图的AUC为0.96与计算正例与排在负例前面的概率0.8 × 1 + 0.2 × 0.8 = 0.96相等,而左上角阴影部分的面积则是负例排在正例前面的概率0.2 × 0.2 = 0.04。
  7. C++的map底层实现?红黑树和普通平衡二叉树的区别?
    (https://github.com/julycoding/The-Art-Of-Programming-By-July/blob/master/ebook/zh/03.01.md)
  8. 堆内存和栈内存的区别
    (https://blog.csdn.net/xzsfg6825/article/details/80887015)
  9. C++智能指针的作用?实现原理?
    (https://www.cnblogs.com/wxquare/p/4759020.html)
  10. (写题)在一个排序数组中找到target数字第一次出现的索引

你可能感兴趣的:(找工作)