未来 3~5 年内,哪个方向的机器学习人才最紧缺?

来源:https://www.zhihu.com/question/63883507/answers/updated?page=1

编辑:深度学习与计算机视觉

声明:仅做学术分享,侵删

关于哪个方向的机器学习人才最紧缺,小编整理了一些小伙伴的答案,尤其是,有些回答是2017年和2018年的,小编摘录并标注了一下时间,让大家看看3年前的回答,做一下对比。没标注回答时间的都是最近两年的情况哟。对这个话题感兴趣的,可以仔细看下。

作者:刘炳源
https://www.zhihu.com/question/63883507/answer/227526120

(2017.09回答)目前最欠缺的是懂机器学习的产品人才,把技术真正落地。引用初敏老师的一段话:“最后,我觉得现在非常缺少产品设计方面的人才。之前说人工智能技术人员很欠缺,现在产品人员更欠缺。现在如果你想做一个人工智能产品,如果你自己没有技术,外接第三方的技术都能满足。所以在这种情况下缺的是什么样的人呢?是能将各个技术的各个应用信手拈来的人,知道技术的局限在哪里,能够扬长避短,以客户的角度思考问题,设计产品的人。”

作者:京东肖军
https://www.zhihu.com/question/63883507/answer/229554558

(2017.09回答)我觉得有两类人才最紧缺,一是能够快速提供正确的解决方案的机器学习工程师,二是研究前沿问题的 机器学研究者,身处工业界,因此我主要说下第一类。

一.能够快速提供正确的解决方案的机器学习工程师

关于机器学习方面的研究有很多,但是真正能实现营收的是能够使机器学习落地的项目,这些工程师熟 悉多种语言,API和数据格式,以便能够使用任何开源代码或者是第三方代码。知道在什么样的人力资源 和项目时间的条件下,什么技术最有用。而这一类人才同时需要具备数据分析、算法选择、特征工程、交叉验证和解决问题的能力。因此,这一类人才需要具以下几个技能:
1.Python/C++/R/Java:精通这些语言,Python对于机器学习来说,是最重要的语言,而C++主要用来提升代码速度。
2.概率统计:机器学习的一大部分是基于这个理论,比如贝叶斯、高斯混合模型等等,都需要对概率有 一个确切的理解。
3。应用数学和算法:对于像支持向量机这样的判别模型,你需要对算法理论有一个深刻的理解。即使你 可能永远也不需要从头开始实现一个SVM,但它有助于理解算法是如何工作的。需要了解像凸优化,梯度 下降,拉格朗日,偏微分方程等。
4.分布式计算:目前大多数机器学习工作需要使用大型数据集。不能在一台机器上处理这些数据,必须 在整个集群上分发它。

二.研究前沿问题的机器学习研究者

这一类人才通常是解决一些不寻常的问题,他们会在现有算法的基础上,提出更好的解决方法。能够为 技术做出卓越的贡献。

作者:王晋东不在家
https://www.zhihu.com/question/63883507/answer/507677856

(2018.10回答)第一个,我觉得应该是全栈式人才。现在缺少能够把需求、模型、算法、高效工程实现、部署和优化这些步骤扎实地做好的人。现在太多搞模型的,或者偏重某一方面的,距离解决实际问题是远远不够的。The devils are in the details!

另一个方面,我认为是AutoML。也许过几年,大多数常见的机器学习任务如检测、分类、分割、理解等都会有非常成熟易用的AutoML包。这时候就不太需要那些调模型的人了。此时应该重点关注对细致需求的理解力和抽象能力。当然,如果你本身就做AutoML,那更好了。

第三个方面,不可不谈的AI芯片。如果你对计算机软硬件结合有非常深的造诣,那应该在未来会比较稳妥。承接第一点,全栈式不仅指软件,还包括硬件。如果你能从底层出发,针对特定应用,自己开发,优化,部署你的方法,那才是软硬通吃,无敌手。

最后一点,也是最重要的,不管做哪个方面,能紧跟学术和工业界动向,快速入手新领域,才是我们立于不败之地的最大资本。

作者:星空键盘手
https://www.zhihu.com/question/63883507/answer/508276210

(2018.10回答)长远的看,机器学习是要回归到工程师的工具箱中的一个常用工具的位置(AUTOML是会加速这一进程的)。个人觉得3到5年还是蛮久的。

以业界工程师的标准来看,和前端/后端/网络安全/大数据等等同样重要。一个合格的机器学习工程师当然要和其它方向的工程师以同一个标准要求:完成完整的应用组件的开发。具体来说也就是大家提到的需求、开发、测试、部署、维护、升级等等。

至于学界的标准,比如新算法、新框架等的研究,和工业界其它的方向一样,依托于企业的实验室和科研机构,针对特定的问题/数据提出局部更优的解决方案。

所以需要的人才也没有什么差别,对于工程师重要的是有交付能力的人才,对于做研究的当然是有高质量科研产出的人才。

作者:vitu
https://www.zhihu.com/question/63883507/answer/1217846431

来说说工业界的观点,工业界说白了就需要跨领域能够把机器学习落地的人才

因为,只有万分之一做算法的顶级计算机科学家可以做理论和框架上的深入研究(大部分都会开源),大部分人最好的道路就是做特定领域的专家

下面这个图很生动的说明了

跨领域能够把机器学习落地的人才的核心技能:

1.对特定领域知识的深入理解

例如量化投资,你如果又懂公司基本面分析,又懂机器学习,那么在做alpha策略研究时就很有优势

例如反欺诈,你对审计有深入理解,又懂机器学习,那么做反欺诈模型就会游刃有余

2. 能够把学术模型变成工业模型

工业界,不仅需要建模,还需要模型的生产化,在这块有很多工程上的工作需要做,如果这块能够深入,那么必然是不可多得的人才

例如像抖音的推荐系统,你如何解决海量用户的推荐问题,工程上有非常多的工作要做,这个也是不可多得的人才

作者:宝珠道人
https://www.zhihu.com/question/63883507/answer/1212425356

机器学习短期内最缺的肯定是应用型人才。

对于机器学习领域的人才,笼统分为两大类:一类是研究型人才、一类是应用型人才。

研究型人才侧重于算法设计、优化、发明等创新性工作,比如高校院所毕业的博士生以及少数毕业前手握N篇顶会文章的硕士研究生,毕业之前就被各大公司疯抢;应用型人才侧重于算法实现和落地,但现阶段由于成本、模型泛化能力等原因,机器学习算法在落地过程中还存在一系列的困境,同时由于各行业之间背景知识差异导致关于机器学习算法落地尝试比较少。

举一个老师们都有切身体会的例子。很多学校的财务科财务人员,她们在抱怨每天处理发票、报销单等这些琐碎的事情,需要将纸质单号一个一个输入电子系统里。我当时就特别困惑,高校及科研单位研究计算机视觉、文字识别、目标检测的团队枚不胜数,为什么还需要每天做这些占据大量时间的重复性工作呢?后来,我慢慢意识到,大多数研究机器学习算法(至少CV是这样)的人更多关注的是模型性能、准确率以及是不是能够SOTA,却很少关注该算法适用对象以及如何将该方法应用到具体场景中,该问题在其他应用领域也普遍存在。因此,算法实现能力和落地转化能力显得尤为重要。

这也是为什么现在机器学习在工业界跑在前面的原因。高校院所的研究,大部分不会追求产品化;而企业需要追求效率和收益,迫使更好的落地。AI时代,尤其需要应用型人才将好的研究成果落地。

如何能够成为一名合格的机器学习应用型人才?对于刚刚接触机器学习以及想要转到机器学习领域的朋友,我简要给出以下三个方向建议。

1、首先对于刚入门机器学习的本科生、研究生而言,一定要重视自己的算法实现能力,打好机器学习基础,增强自己代码实现能力。每当涌现新的论文,能够尝试在较短时间内读懂核心思想,并尽可能将其实现。此外,如果能够对某个领域具有一定了解,如上面例子提到文字识别、目标检测等,然后可以结合自己算法能力将其转化为具体应用并不断优化,现在大多数公司都喜欢这样的人才。

2、其次对于半路出家转行至机器学习的朋友来说,你可能不一定很懂机器学习算法,对于其中的数学原理知识仅限了解,但却熟知如何将算法应用到某个场景中去。其实对于开发者来说算法只是一个工具,类似于函数的接口,大致了解其中的输入、输出。例如,一个发票检测系统,图像检测、数字识别只是其中的一小部分,更重要的是整个系统结构、资源调度以及和用户的交互等。

3、跨领域的知识很重要。对任何一个行业都应该心生敬畏,每个行业都有其特殊的特点。不要以为会一些算法,就把其他某个领域的落地想当然。又懂工程实现,又懂跨行业特点,是很容易脱颖而出的。

中国每天产生着大量的数据,有着丰富的使用场景,各种传统行业都面临着巨大的机遇和挑战。在相当长的一段时间内,能够将机器学习算法落地和转化的人才都会是市场最为紧需的。

作者:胡斐
https://www.zhihu.com/question/63883507/answer/1211753992

前段时间,组内入职了一位博士,本着八卦主义精神,我搜了下这位博士的Google Scholar引用量。

然后我就献出了膝盖,毕业两年paper引用量近千,虽然引用量不能完全衡量一个博士的科研水平,但也是一个重要体现了。然后就是顺藤摸瓜的视奸大佬的paper,本以为大佬是会有许多ACL、NIPS、EMNLP等顶会文章,看了一圈,都是和遥感相关的一些文章,原来大佬博士期间的研究方向是这个啊。

然后就是过文章,博士很好地把一些机器学习、深度学习的方法迁移到了遥感领域,做出了几篇高引用的成果。

再结合这几年层出不穷的医疗图像识别、法律智能、司法助手等等应用,不禁心生慨叹:

只要有数据,在多少细分领域,都可以执牛耳啊,而不用在主战场,就着NLP、CV的各种典型任务刷刷刷,无底洞一般。

想起来毕业前一位博士师兄,好像是拿了NLP的方法在工控领域做了一些工作,前段时间听说他已经开题了,那这个成果也应该是被接收了。

作者:ddwang

https://www.zhihu.com/question/63883507/answer/1209935141

交叉领域的人很缺。

理解技术与商业的关系和界限的人

知道如何利用技术实现商业价值的人

还有那些既有坚实的理论基础,同时也能够工程上落地的人。

作者:Top量化猎头Junco
https://www.zhihu.com/question/63883507/answer/1209045288

其他方向的我不敢说,但是量化对冲基金这个方向的机器学习人才目前非常紧缺。从2018年开始到现在,我们的客户(国内外top量化对冲基金)对机器学习人才的需求越来越旺盛。

我直接这么说吧,我们合作的客户10家里面,至少有7家都需要机器学习人选。

有的偏好同行量化行业经验的,也有的偏好BAT华为/字节跳动/拼多多/头部AI人工智能科技公司等大厂背景出来的。

作者:波罗申科
https://www.zhihu.com/question/63883507/answer/1207859985

人才的话,哪个方向都缺。学院里认识的所有博士生都能找到很好的实习,说明工业级很需要有自主科研能力,解决问题能力的人才。

而普通的毕业生则完全不一样,未来3-5年一定不是学个西瓜书就能成为机器学习工程师的年代,而是对机器学习从业者要求日渐变高的年代。

目前机器学习的学生已经趋近于饱和,甚至挤占了其他计算机学科方向的生存空间。学院的搞机器学习的研究生,有一半以上都在搞计算机视觉,还有一些搞与生物和物理的交叉学科的,而申请者的竞争一年比一年激烈。而系统方向(比如计算机安全或者编译器研究)的申请则简单很多。

所以在未来3-5年内,如果你有机器学习任何方向的顶会或者优秀期刊的文章,那么恭喜你,你就是行业炙手可热的人才。

如果只是想通过上课或者自学,拿到机器学习相关的高薪工作,那么请做好过独木桥的准备,高薪工作一定意味着竞争激烈。首先数学,传统算法和机器学习的算法是一定要掌握的,这是解决问题的基础。其次,了解当下流行的框架和网络结构,多看最近几年的顶会论文。最后,如果还能在现有的框架基础上做点小小的创新就更好了,这样面试起来也有的聊。

归根结底,不管学术还是业界,急需的人才都是有很强的自主解决问题的能力的人,而这个优秀品质需要打好数学和算法基础,以及多思考。

如果非要说一个业界最紧缺的,那还是计算机视觉和机器学习算法的相关岗位会多一些。


作者:机器学习入坑者
https://www.zhihu.com/question/63883507/answer/1206619282

工业界:理论+实践+跨界型的人才。

学术界:会写论文的人才。

理论指的是模式识别、自然语言、图像处理、泛函、凸优化等知识。

实践指的是pytorch、tensorflow、sklearn等框架,python、C++等编程能力,调参能力。

跨界是指能够融合不同学科的知识,比如医学、生物、化学等。

机器学习方向的人才目前普遍流向3个方面:

  • 互联网公司研究院、研发组

  • 计算机较强的高校

  • 创业型AI公司

也就是说,一半人才留在学术界写论文,一半人才留在工业界做项目+写论文。

对于学术界的人才来说,只要会写论文依旧可以拿到基金、项目、投资,几篇顶会就能评职称。

对于工业界来说,智慧医疗、智慧城市等概念不断兴起,AI和多学科交叉研究越来越多,仅仅会写代码推导公式是不行的,还必须具有跨学科的学习和实践能力。比如最近比较火热的医学图像分割和肿瘤检测等,要求从业者具备机器学习和医学的交叉知识。

对于机器学习从业者来说,层出不穷的算法令人眼花缭乱,加上各种新兴领域的不断冲击。需要尽量保持学习的状态,才能成为人才,而不是被人才挤出局。

作者:King James
https://www.zhihu.com/question/63883507/answer/1153485014

站在2020.4月份这个时间点来回答这个问题,正好目前在机器学习AI独角兽做这方面的工作,硕士时的专业是Data Science。自己经历了找机器学习方向的工作,和大家分享一下自己的理解。以下我们按照岗位来分析。

1.机器学习技术人才

1.1 数据科学家(Data Scientist)

数据科学家目前是最紧缺的,未来3-5年还是缺。在各个领域应用机器学习建模。比如金融领域构建反欺诈模型、零售领域构建推荐模型、销量预测模型等等。我司目前面临的问题就是给甲方做项目,科学家不够且项目成本高。很多小客户预算有限,一整套建模做下来按照客户的预算,我们根本不赚钱。工业界培养一个优秀的数据科学家需要大量的落地项目来实操,而这方面有经验的人才目前很稀缺。

  • 要求:我直接放JD了,下图是我司对数据科学家的要求

下图是谷歌对Data Scientist的要求

学历都是硕士起步,谷歌倾向于博士。如果在上述基础上,对工程层面还有比较深刻的了解,那你将会很吃香。只做算法和模型的算法工程师不算合格的工程师,工程师首先还是要了解“工程”。熟悉工程,很多时候就可以提前帮工程层面避免很多坑。

  • 待遇:这个在国内的话,前几年应届生可以开到很高的Package,因为当时国内完全对口的专业很少,国外也没有大量学Data Science或者Artifical Intelligent 的回国,国内也没有兴起算法热。18,19年开始,国内学生去国外读这两个专业的数量大幅增加,我申请King‘s的时候是17年,中介和我反馈申请难度已经明显增加。到了19年难度更大了。2019年降温了,受到整个经济大环境的影响,差不多硕士Package均价也就在35万了。大厂的Offer或者SP offer我们不参与讨论,比如字节跳动、阿里等,字节跳动给写前端的都可以开到30万Package,主要人家大小周休息,工作强度很大。像拼多多这种996(其实是10,12,6)的我们不讨论它的Package,因为Package里面很大一部分是辛苦钱。国外的话,我了解一个朋友去了Amazon做Data Scientist,年Package 20万美刀,不过是博士。

1.2 AutoML 算法工程师

这个职位不能说最紧缺,但是最吃香,未来3-5年还是这样。AutoML干的一件事情就是替代算法工程师和数据科学家,机器自动建模,机器自动做特征工程,自动调参,通过暴力计算的方式,经过很多轮运算找出效果最好的模型出来。也就解决了我1.1里面提到的目前市场上欠缺优秀的数据科学家这一问题。

  • 要求:除去对机器学习算法工程师的基本要求外,就是需要对AutoML领域有过一定的研究,如果发过一定的Paper更好。具体的JD我看了猎聘和拉勾网都没有公司发布相关岗位,头部做机器学习的国外如谷歌、微软,国内第四范式也都没有找到。只找到了阿里发布的一个:

一方面可能是因为目前市场上做这方面研究的人确实很少,即使招聘也找不到合适的人,都从内部培养开始;另一方面可能还是AutoML在实际工业界的应用效果还有待提高,虽然建模快,但是在数据量大,特征复杂的情况下是否可以达到工业界应用标准还有待商榷。

  • 待遇:华为之前针对做AutoML的博士开到了200万的Package,这个方向相对于Data Scientist只会更好,而且好很多,当然前提是你得在 AutoML领域有一定建树。

1.3 图像&视觉算法工程师

目前市场上做计算机视觉的公司太多了,国内CV四小龙:商汤、旷视、依图、云从,个个都是在融资市场风生水起。虽然商汤和旷视今年都上市失败了,但之前融资都是融得钵满盆满。融资市场质疑的是它们能否形成规模化的商业落地,而不是质疑它们的技术以及CV技术在工业界的应用。CV技术在安防、城市大脑、零售线下门店数字化、工业质检等领域应用十分广泛。CV领域的AI公司应该也是AI领域最多的,同时很多甲方公司也在招对应的人才。这方面的人才未来3~5年还是紧缺的。

  • 要求:下图是旷视科技的招聘要求,但是正常AI明星公司或者互联网大厂要求都很高。

  • 待遇:目前行情差不多应届硕士毕业生均价也就是Package 35-40万左右吧,大厂会更高。很多小厂也在招这方面算法工程师,薪资可能Package 25万左右。

1.4 NLP&知识图谱 算法工程师

我将NLP和知识图谱合并在一起了,因为做知识图谱肯定要懂NLP的知识。同样单纯只做NLP,方向也比较窄,一般都会涉及到知识图谱的内容。国内AI公司专门做这个领域的,我了解到的只有“达观数据”这一家,其他的公司都是涉及到部分NLP和知识图谱领域。其实NLP真正做的厉害就是实现真正的智能客服,AI客服可以像人一样去聊天沟通,不过目前还很远。但是在CV领域,AI对于人脸、图片等的识别已经超过了人类,当然二者的难度系数不一样。目前NLP&KG主要应用在教育领域、文本领域等,应用NLP做各种分析与提取。从事这方面研究的人才其实不算多,公司相关团队也不会特别大,但对于真正的人才还是渴望的。

  • 要求:下图是字节跳动对于NLP算法工程师的要求。

  • 待遇:目前市场上做算法的硕士应届生均价都是在30万以上,这个领域如果是真正的大牛也是可以开到很高的Package,认识一个朋友PhD,年薪资差不多接近了100万。

1.5 强化学习算法工程师

强化学习其实是我很看好的一个领域,Alphgo就是强化学习的产物,但是目前工业界应用的蛮少的。我了解到在自动驾驶领域貌似应用多一些,我司的业务基本没有接触到应用强化学习的。但学术界已经将强化学习应用到供应链配送的运筹优化上,同时腾讯发表的王者荣耀AI的几篇paper都是关于强化学习的。所以未来强化学习的应用场景会越来越多,而市面上相应的人才却很少。

  • 要求:只找到了一家做自动驾驶公司的招聘要求,说明目前市场上对于此类人才的需求还不是很大。但未来3~5年肯定会有比较大的人才缺口,光游戏这一个领域就会有比较大的需求。

2.复合型人才

其实除了上述的专业性人才,机器学习领域还非常缺复合型的人才。就是除了对机器学习很了解之外,还对某一专业领域业务知识很了解的人才。比如

  • 生物行业

研究生的一个室友本科是清华学生物的,她给我们的反馈就是生物领域非常缺懂写代码的人才,IT技术可以大幅提高生物领域的效率。但是很多生物专业的人只懂生物,计算机专业的人又难以理解晦涩的生物知识。此时我仿佛看到了四大天坑专业“生化环材”毕业生的出路,就是研究生再去读一个计算机的Master。然后再回到“生化环材”领域,用计算机带动该领域的进步。看到这里,我想“生化环材”领域的学子不禁留下两行热泪。。。我TM又回来了。

  • 医疗行业

认识一些猎头朋友,她们在给一些生物制药公司或者医疗器械公司招聘数据科学家时,公司就倾向招聘有一定行业背景的科学家。因为这些领域的专业性还是比较强的,需要一定的学习成本。其实Nature上发表了很多篇关于AI在生物,医疗方向应用的论文。所以如果你既懂这些领域知识,又会机器学习,那将会很吃香。当然这部分人才实在是太少了,因为这样的人才最终发现还是专门搞计算机最赚钱。。。。。一不小心说出了真相。

3. 业务产品型人才

除了上述提到了两类人才外,其实该市场还非常缺懂机器学习的产品型人才。大家都知道在互联网最兴盛的那段时间,市场上非常缺产品经理。其实目前市场上产品经理人才很多,但是对机器学习了解熟悉的很少。能够分清楚什么是监督学习、无监督学习,每一类算法适合处理什么场景,每一种评估方法适合评估什么场景,搞清楚机器学习建模每一步,同时自己还可以写写Sql和Python的AI产品经理太少了。

在互联网时代,产品经理就因为不懂技术,和研发人员造成各种针锋相对。到了AI时代更是这样,产品经理如果对机器学习、AI等一窍不通,那简直是灾难。因为不懂机器学习,所以很难提出一个合理的需求。我司的机器学习产品经理都是研发背景转岗或者是本硕学计算机相关的,对机器学习有一定了解的,不然很难上手,内部也会有各种培训。

产品Sense很重要,但是在AI时代做机器学习产品经理不懂技术,很难说是一个优秀的产品经理。优秀的产品经理,即使他最开始不懂,当他从事了这个方向,我想好奇心和学习能力都会促使他去弄懂自己设计的这个产品背后到底是个啥。所以你如果想做AI产品经理,最好还是学习一些机器学习的知识,这个对你的工作会很有帮助,甚至决定你工作的上限。

综上,从2020年来看,未来3~5年不仅缺技术性人才,也缺复合型人才和综合能力强的产品型人才。

如果你是真正的技术大牛,大 你 ,你所在的方向就是行业的风向标;

如果你不是“大牛”,选择好未来的职业技术方向还是很重要的,以上供你参考。

作者:图灵的猫
https://www.zhihu.com/question/63883507/answer/995447481

题主问的是“最紧缺”而不是学术重要/工资最高/前景更好,我觉得这几点还是有区别的。

紧缺指的是学习这个方向的人不多,但行业需求可能会增加,并在未来3~5年内打破当前供需平衡,出现哄抢人才的现象。以前我可能会回答CV、NLP或者语音识别,但如今时代不同了。

现在是2020年,站在这个时间节点上,未来的机器学习方向已经很明朗了。我说一句实话,可能有些打击大家的信心:

  • 如果你是顶尖人才——Best Paper/ACM洲金,不管你做哪个方向,你永远都是“紧缺”的。

  • 如果你只是想找一份工作,甚至都不是科班,不管你做哪个方向,你永远都是“不紧缺”的。

真正的紧缺,从来都不是由学生决定,而是由市场,由企业成本决定。如果你不是出于兴趣,而是单纯为了选一个好找工作、未来需求量大的方向,那么先考虑一下机会成本和自己的投入产出比。

看到这里你可能以为这又是我在劝退了。并不是,我只是陈述一个事实:

未来的紧缺方向已经不再是某个领域,不是特定领域的机器学习专家不是交叉学科的应用专家,而是机器学习管理专家。

目前所有领域,CV、NLP、搜索、推荐、语音、量化等,已经非常饱和,对于大厂来说人才过剩,太冷门的机器学习方向不过剩,却也几乎没有企业会做——市场规模太小。而一窝蜂往算法岗涌入的后果就是,很多算法部门人员庞杂,方向很杂,今天试试这个算法,明天改进那个模型,有的部门甚至在重复同一个工作,即使有效果了,怎么落地也是个老大难的问题。

未来,可预见的是入行者会越来越多,矛盾会越来越明显。作为一个算法部门的管理者,既要有底层算法岗的工作经验,也要有多部门协调能力,还要有和产品等非技术岗位的沟通能力,以及承上启下的管理能力。这4样都能做到顶尖的,阿里高P不是问题。但现在部分大厂、绝大部分中小厂都非常缺这样的人。到未来机器学习的落地应用越来越广,这样的人会更加紧缺。

那要怎么样才能变成紧缺的人才呢?我不知道,我只是观测到了一个事实,却不知道怎么解决问题。以我目前的能力,只能给大家一个建议:

沉淀技术的同时,不要让技术局限了你的眼光,尝试着提高你的非技术能力。

作者:初夏七夕晴
https://www.zhihu.com/question/63883507/answer/875399365

我看好多人提到了工业界,我是完全同意的。当然,这也恰恰说明,目前机器学习在工业界,是应用落地最为成熟的领域。反而你看看消费端、金融科技这些,别说一定规模的产品,到现在都是通用的底层技术支撑,凑了个表面热闹。

先说痛点吧,比起工业领域,无论是庞大的消费端,还是金融、教育、医疗等,首先数据就难以抓取,样本量虽然多,但是杂、非标、不典型,有的领域还对时间流比较敏感,需要算力的同步配合。反而工业,数据类型大多同构,虽然情况多,但是经验为先,覆盖百分十八九十还是比较容易的。这在目前以数据为驱动的机器学习下,显然工业端更容易建立/抄袭算法模型,产品更容易标准化;其次,工业界更容易变现/被买单。无论是势不可挡的IOT趋势,还是产业相对集中紧密的特点,甚至是在标准化之上的小部分订制,都让工业端的改革/创新更容易实现;再加上工业大呀,各种细分领域,在容易实现、愿意尝新、短期内就能看到好处,甚至可能直接创造利益的情况下,自然工业界是应用更多。

回到问题,3-5年内,我们从19年算吧,五年不好说,但三年,就算有比尔盖茨说的,我们低估了某件事对未来一年的影响,我也敢说,机器学习三年内,这个鬼样子好转不了多少。完成的是基础设施的建设,产品迭代大多在实际应用中的完善,或者结合实际的优化,而不是底层技术的创新。那从这一点看,工业,确实是未来3-5年内,人才最缺、也洗牌更规范的领域。

定位完事,我们说人。赶上风口,跟对方向,个人技能还是要跟上的。透过招聘热闹,我们看待遇本质,看看到底缺什么人才?

1.学术深耕型高端人才,目前机器学习虽然是以数据驱动,但不代表底层算法不重要。样本筛选、黑盒解释、无监督/半监督学习等等,这些高端人才的紧缺不言而喻;

2.全栈式解决方案人才,我们知道,实际应用中,产品有硬件软件环境等的干扰,明明理论上完美,实际永远也不知道bug出在哪。。如何一站式测试出问题所在,拥有全流程的实操经验,自然很紧缺。

3.具有某一行业丰富经验的机器学习人才。机器学习虽然是通用技术,工程师也基本是计算机出来的,但落地需要具体到行业应用,如何结合行业实操,解决实际问题,绝对不仅仅是产品经理的技能,也需要从底层设计就考虑到。以上。

作者:milo chena
https://www.zhihu.com/question/63883507/answer/790271625

我向在这里说一个机器学习需要应用的商业领域,这样我们就能从其中找到适合的模式。


今天介绍从两个角度来介绍机器学习的商业领域的产品应用:

- 横向领域:在不同类型的业务中执行的操作。即涉及营销的一切。

- 垂直领域:在企业内部或供应链或流程中所做的事情。

横向应用

几乎每家公司都必须尝试向客户销售更多产品,因此营销很重要。因此,下图每个框都是人们在市场营销中使用机器学习的一些例子:

我们举个例子 - Churn,是公司流失预测,是预测谁将要离开的公司模型。比如一些电信公司试图找出在一家大型手机公司中哪些客户将要离开。这个结论的意义已经不大了,比如说模型结果说杰瑞几乎肯定会在下个月离开,这个结果并不是一个决策建议,因为如果这个人几乎肯定要离开离开,那么公司 HR 就可能没有什么可以做的 - 这个结果发现就已经太晚了。

因此,为了构建一个更好的模型(尤其是商业模型),这里介绍一个有用的小框架。在其中,描述了如何将机器学习模型变成赚钱的东西的经验。分为以下四个步骤:

定义目标

实际上将机器学习项目变成实际有用的东西的出发点是知道,我想要实现什么,这不是那种在ROC曲线下实现高区域或者试图在类之间作区分的目标。而是,例如出售更多书籍的目标,或者我正在努力减少下个月离开的客户数量目标,或者我正在尝试更早地发现肺癌的目标。因此,目标绝对是公司或组织实际想要的东西。没有任何公司或组织由于没有明确的目标,所以无法创建更准确的预测模型。目标是最重要的事情。如果你不知道你建模需要完成的目标,那么你就不可能做得好。

杠杆工具

杠杆工具是公司可以做的事情,而这些事情可以实现目标。让我们以流失人员建模为例。公司可以使用什么杠杆工具来减少离开的客户数量?他们可以打电话给某人并说:“你快乐吗?我们能做什么?“如果他们下个月购买价值20美元的产品,他们可以免费得到附赠的一支笔。或者,公司可以给他们特价。所以这些都是杠杆工具。每当数据科学家工作时,不断回头思考我们想要实现的目标(我们是公司)以及我们如何努力实现,“我们可以做些什么才能实现这一目标“。因此,建立一个模型绝不是一个杠杆工具,但它可以帮助你挑选杠杆工具。

数据

那么接下来的步骤就是,哪些数据可能有助于他们设定实现该目标以及杠杆工具。所以这不是他们在你启动项目时给你的数据。但从第一原则的角度考虑一下 - 我们可用的数据,无论数据库中的数据是什么,我们实际可以使用的数据经常存在约束。因此,我们需要知道我想要实现的目标,该公司实际上可以做些什么来改变结果,以及在做出决策时,他们拥有或可以收集哪些数据。

模型

那么我把它们放在一起的方式就是模型。这不是预测模型意义上的模型,而是仿真模型。因此,我在本文中提出的一个主要例子是,当我花了很多年时间建造一个保险公司改变其价格的时候,这对他们的盈利能力有何影响。因此,通常仿真模型包含许多预测模型。例如,我有一个称为弹性模型的预测模型,该模型针对特定客户说,如果我们向特定产品收取特定价格,那么他们在新业务和一年后都会愿意继续付费的概率是多少(他们续约的概率是多少)。然后还有另一个预测模型,即他们要提出索赔的概率是多少,以及该索赔要多少。然后你可以将这些模型组合在一起,然后预测,如果我们通过将每个人减少10%来改变我们的定价,我们可以通过这些模型运行它,将它们组合成一个模拟然后对我们的整体影响。10年时间的市场份额是X,我们的成本是Y,我们的利润是Z等等。

垂直领域应用

除了这些基本适用于每家公司的横向应用程序外,还有一大堆专门针对世界各地的应用程序。对于那些最终从事医疗保健的人来说,你们中的一些人将成为这些领域中的一个或多个领域的专家。像再入院风险一样。那么这名患者回到医院的概率是多少。根据管辖区的详细信息,当重新接纳某人时,它可能是医院的灾难。如果您发现该患者再入院的可能性很高,您会怎么做?

同样,预测模型本身也很有用。它建议我们不要把它们送回家,因为它们会回来。但是,如果我们通过模型解释了解其中某些分析特征对结果影响很大,就能解释并且告诉我们他们处于高风险的原因是因为我们没有他们在入院之后作心电图(EKG)。如果没有作EKG,这个病人就很可能继续返回医院,那么我们最好给他作一个心电图。所以这是解释和预测准确性之间的相互作用。

最后给一张商业数据应用全景图。

作者:吃个小烧饼
https://www.zhihu.com/question/63883507/answer/619991547

写一个回答,算是总结一下自己的经验教训和所得。

既然是问最紧缺,而不是如何学,那么我的回答重点就放在方向上了,而不是高赞答案的那些入门知识上。

首先一点,对机器学习、深度学习的应用,请有信心一点。我之前也认为小厂主要靠骗钱为生,大厂主要是锦上添花,后来了解过不少,面试过不少公司,也面试过不少候选人,其实感觉大家都在认认真真做事。比如nlp,我之前还以为小厂就是搞一下像微软小冰一样完全没用的toy,后来也发现有公司在做车载对话系统,其实都和实业靠得很近。视觉是我的老本行了,现在做的公司很多,而且大家也都做的挺认真,安防衍生的跟踪,识别,视频结构化,etc,还有一些做芯片的,不得不说大家做的都很认真……

好了,吹了一波,现在说说我的意见,那就是,视觉、nlp每个分支都有前途,想去大公司多学nlp,想去创业公司多学视觉(按比例);除此之外保证机器学习每个基础算法都玩的比较6。对于互联网公司,他们可以完全没有cv团队,但是必然会有nlp的应用,原因懒得讲。而cv则是创业的好下手点,所以这部分创业团队会多些。所以学好一个方向真的就够用了。

至于说为啥要学一些经典算法,其实也挺简单的。最简单的,nlp一般希望一个batch里的句子长短尽可能一样,所以聚类分析一下长短好做下一步实验有问题吗?做目标检测的时候希望初始anchor匹配的尽可能好,负样本不要太多,所以分析一下这个任务里的目标大中小、长宽比例,有问题吗?而出现这种任务的核心是我们希望我们有限的训练数据尽可能地向我们所希望的方向走,所以对数据的深刻理解就是必须的。当然,这个有点难,因为这是ml/dl中为数不多的依靠经验积累的东西,不过扎实地掌握一些经典算法,是个不错的开始。

感觉今天写的还是不够好,回去再思考一下,希望可以写的有条理一点。

作者:支蔽跃
https://www.zhihu.com/question/63883507/answer/546096538

看来题主真的是对机器学习非常感兴趣了,不然也不会提出这么有针对性的问题。刚好我在这方面有那么一点小研究(捂脸),过来班门弄斧了,可别笑我。我觉得下面这两种类型的人才将会在近3~5年内成为机器学习方面的紧缺型人才。

1、神经语言程序员

随着企业云的快速发展,华为等许多家企业也越来越重视通过网络来倾听用户的反馈,及时和用户进行沟通。神经语言程序员可以帮助企业更好地总结用户对于个性化产品的需求信息。搜索公司大量需要这样的职位来处理相关的工作,在研发机构也设有神经语言程序的研究岗位。

2、图像处理工程师

在大数据兴起时,更多的互联网公司开始设立图像处理的岗位。在未来几年内,随着技术的突破和外围配套(包括法规或者硬件等)的成熟,图像处理的岗位会有大的爆发,不论是在公司内部的提升,还是未来创业,图像处理工程师的发展机会都会越来越多。

最后要多说一句,机器学习的路上没有捷径,想要成为机器学习的技术大咖,必须脚踏实地的抱住某项独特领域,努力学习才行。

☆ END ☆

你可能感兴趣的:(未来 3~5 年内,哪个方向的机器学习人才最紧缺?)