神经网络 推荐

神经网络 推荐_第1张图片

苹果手机个性化推荐要不要打开?

数据挖掘工程师一般都做什么?

数据挖掘工程师是做什么的?数据挖掘,从字面上理解,就是在数据中找到有用的东西,哪些东西有用就要看具体的业务目标了AI爱发猫 www.aifamao.com

最简单的就是统计应用了,比如电商数据,如淘宝统计过哪个省购买泳衣最多、哪个省的女生胸罩最大等,进一步,可以基于用户的浏览、点击、收藏、购买等行为推断用户的年龄、性别、购买能力、爱好等能表示一个人的画像,就相当于用这些挖掘出来的属性来刻画一个人,这些还是最简单的东西,更深层次的比如预测(股票预测),但是比较难。

数据挖掘往往与机器学习离不开。比如分类、聚类、关联规则挖掘、个性化推荐、预测、神经网络、深度学习等。

数据挖掘 = 业务知识 + 自然语言处理技术(NLP)+ 计算机视觉技术(CV)+ 机器学习/深度学习(ML/DL)(1)其中业务知识具体指的是个性化推荐,计算广告,搜索,互联网金融等;NLP,CV分别是处理文本,图像视频数据的领域技术,可以理解为是将非结构化数据提取转换成结构化数据;最后的ml/dl技术则是属于模型学习理论;(2)在选择岗位时,各个公司都没有一套标准的称呼,但是所做的事情无非2个大方向,一种是主要钻研某个领域的技术,比如自然语言处理工程师,计算机视觉工程师,机器学习工程师等;一种是将各种领域技术应用到业务场景中去解决业务需求,比如数据挖掘工程师,推荐系统工程师等;具体的称呼不重要,重要的是平时的工作内容;PS:在互联网行业,数据挖掘相关技术应用比较成功的主要是推荐以及计算广告领域,而其中涉及到的数据主要也是文本,所以NLP技术相对来讲比较重要,至于CV技术主要还是在人工智能领域(无人车,人脸识别等)应用较多,本人了解有限,相关的描述会较少;数据挖掘岗位需要具备的3种基本能力1.    工程能力(1)编程基础:需要掌握一大一小两门语言,大的指C++或者Java,小的指Python或者shell脚本;需要掌握基本的数据库语言;建议:MySQL+python+C++;语言只是一种工具,看看语法就好;推荐书籍:《C++primerplus》(2)开发平台:Linux;建议:掌握常见的命令,掌握Linux下的源码编译原理;推荐书籍:《Linux私房菜》(3)数据结构与算法分析基础:掌握常见的数据结构以及操作(线性表,队,列,字符串,树,图等),掌握常见的计算机算法(排序算法,查找算法,动态规划,递归等);建议:多敲代码,多上OJ平台刷题;推荐书籍:《大话数据结构》《剑指offer》(4)海量数据处理平台:Hadoop(mr计算模型,java开发)或者Spark(rdd计算模型,scala开发),重点推荐后者;建议:主要是会使用,有精力的话可以看看源码了解集群调度机制之类的;推荐书籍:《大数据spark企业级实战》2.    算法能力(1)数学基础:概率论,数理统计,线性代数,随机过程,最优化理论建议:这些是必须要了解的,即使没法做到基础扎实,起码也要掌握每门学科的理论体系,涉及到相应知识点时通过查阅资料可以做到无障碍理解;(2)机器学习/深度学习:掌握常见的机器学习模型(线性回归,逻辑回归,SVM,感知机;决策树,随机森林&#x

你可能感兴趣的:(神经网络,人工智能,数据挖掘)