百度机器学习岗位面试经验总结

1、面试的小组主要负责百度商务搜索部移动广告策略
应聘要求:
  • 海量信息的分类、聚类和关联规则的挖掘 
  • 网页特定内容提取和分析 
  • 参与百度凤巢广告等策略研究 
任职要求: 
  • 精通C/C 语言编程,精通数据结构和算法设计 
  • 熟练掌握数据挖掘或自然语言处理的基础理论和方法 
  • 有大规模的文本或网页处理经验优先考虑 
  • 具有良好的分析问题和解决问题的能力,对解决具有挑战性问题充满激情 
  • 计算机/数学相关专业本科及以上学历

2、面试题目总结:
百度(机器学习——一面)这次这个面试官表述不清楚、所以一定要正确的理解题意
  • 首先叙述一下项目经验(网页结构分析、网页正文抽取、布隆过滤器)
  • 叙述推荐系统(隐语义模型、SVD、梯度下降)
  • C++中栈中对象的删除、Stl的基础知识 (应该是考察stl的内存分配机制)                                                                                                                                              
    • STL中引入了allocator这个东西,提供给各个组件进行统一的内存管理。stl的内存管理主要分为2级进行配置:
    • 1级配置,用于处理大块的内存分配,直接使用malloc和free来进行处理。
    • 2级配置,使用了一个内存池,对小量的内存分配和释放进行优化。
  • 快排的改进——减少递归调用
  • 字符串中找到最大的无重复的字串(首先找到可能是最大无重复的字串,然后使用某种机制将他转化为一种key,写入hash表,一直进行下去,信息指纹非常非常重要)
  • linux中C++的调试
  • python传参的机制
  • linux中一下基础的指令
百度(机器学习——二面)
  • 首先是一个大数据的问题,1T的数据,100万个子字符串(长度小于10),计算每一个子字符串出现次数;
  • 建堆的时间复杂度
  • 有一系列的区间,求最长重复区间(使用分治法的思想)
  • 各种项目的知识(写简历时一定要写自己熟悉的算法)
百度(机器学习——三面)
  • 项目经验——你认为你所做的项目中有哪些创新点;
  • 你认为你的优势是什么?(知之者不如好之者,好之者不如乐之者);
  • 给你一个query,你如何揣摩用户的意图;
  • 要学会关心他人。

你可能感兴趣的:(面试)