择业需谨慎!为何数据科学或许不值得?

全文共1859字,预计学习时长6分钟

 

择业需谨慎!为何数据科学或许不值得?_第1张图片

图源:simplilearn

 

从某种程度上说,数据科学已经成为一片红海了。所谓的21世纪最热门的工作可能并没有那么受欢迎。即使现在,人们和公司都利用它来创造价值和赚取金钱,但这真的是未来的职业吗?

 

虽然这个观点可能存在一定的偏见,每个人所在的国家地区、所具有的技能也不尽相同,不一定适合所有人,但笔者看来,这个观点仍然有一定的道理。

 

如果你正在做与软件相关的工作,或许你已经考虑过转换到数据科学领域的选择。为什么不呢?该领域的工作遍处都有,其薪水通常比软件开发工作的薪水更高,而在工作职称中加上“科学家”一词会更令人骄傲。

 

但这也许不是最后一份工作。在领域内工作了一段时间之后,探索了很多库和其他有趣的东西,写了约80篇与数据科学相关的文章,与此同时还探索了其他选项,我发现自己有能力消化关于该领域的积极内容和负面内容。

 

本文的焦点将主要集中于负面内容,互联网上充斥着“为什么要成为数据科学家”和“一个月内学习数据科学”这类文章。但或许数据科学并没有你看到的那么完美,它有好处也有缺陷,这些缺点你也应该了解。

 

择业需谨慎!为何数据科学或许不值得?_第2张图片

图源:Unsplash

 

 

1.数据科学正在实现自动化

 

如果是一些热门词汇引导你进入该领域,诸如预测建模,机器学习等之类,不要误会,很多事物在这里还无法实现自动化,但是其中很大一部分已经实现了自动化。

 

令人遗憾的是,尽管人们担心常规工作会变得自动化,但实际上我们已经将所有有趣的工作自动化了。

 

你目睹过专业的云环境吗?没有也没关系,因为实在不怎么样。可以使用的算法数量基本上是有限的,只要以正确的方式准备数据,知道的准确度越高,任何人都可以测试所有组合,最终得到一个不错的解决方案。

 

与有着10年以上经验的资深数据科学家相比,你的开发会逊色点。如果只是提高2%的准确性,它的重要程度该如何衡量呢?

 

尽量从雇员和雇主的角度来思考这一点。由数据科学家团队提供的略微好些的模型真的值得花费时间和金钱吗?对于一些公司来说,这是值得的,但是这些企业中的大多数会完全适应 “企业云环境”。

 

择业需谨慎!为何数据科学或许不值得?_第3张图片

图源:unsplash

 

 

2.数据科学很无聊

 

是的,你没有看错。大多数数据科学工作说到底就是从源表中提取数据,然后进行一些汇总和计算,将结果存储在适合分析的新表中。这完美地描述了ETL过程,而不是数据科学。

 

而且,你还得花费一些时间来清理和准备数据,这又与纯粹的数据科学无关。最后,处理预测建模的一个部分——该部分也不是新鲜事物,但是在最近几年中非常流行。

 

这三个组成部分结合在一起,再加上不错的演示和沟通技巧,这就是典型的数据科学家。

 

数据科学会不会改变世界?

 

既会也不会。会是因为专业人士将能够更好地完成工作,比如医生;而不会是因为你对ETL管道的兴趣绝对不会有人关注,与是不是“数据科学家”职位无关。

 

 

3.工作清单糟透了

 

进入最喜欢的工作清单网站并搜索数据科学的工作,你会期待出现SQL,Python,R语言,统计信息之类的技能。问题是,这只占到工作内容的30%!

 

其他一些可能包括常规编程,API,版本控制,甚至可能包括一些前端技能,糟糕极了。即使你有软件开发的经验而且掌握了所有涉及的技能,在数据科学领域也不一定能有你的一席之地。

 

来看看2020年5月16日Indeed.com上的列表,该列表仅适用于美国:

 

择业需谨慎!为何数据科学或许不值得?_第4张图片

数据科学 — 9474份工作

 

择业需谨慎!为何数据科学或许不值得?_第5张图片

软件开发员 — 66647 份工作

 

现在,情况大有不同。你现在可能会认为软件开发的前景比数据科学要广得多,所以有更多的工作可供选择。的确,这也是为什么笔者想在软件开发——Java开发员中寻找一个更狭小的领域。下面看看工作清单的数量:

 

择业需谨慎!为何数据科学或许不值得?_第6张图片

Java开发员— 29324

 

几乎多3倍。就算这个数据说服不了你,但另一个事实绝对可以:大多数数据科学的职位都是高级职位。

 

大多数中小型公司对数据科学家的需求与对软件开发人员的需求不同,他们甚至是在寻找自己公司的首位数据科学家。你真的认为他们会雇用一名实习生或一名初级人员来处理与数据科学相关的工作?劝各位三思而后行。

 

择业需谨慎!为何数据科学或许不值得?_第7张图片

图源:unsplash

 

也许笔者对数据科学有些苛刻。但也许事实就是如此——在做出如此重大的决定时,应该了解其利弊。

 

别误会,数据科学仍然很不错,就是大约90–95%的时间会要腾给ETL、数据处理和准备上,其余5–10%的时间做自己真正感兴趣的事情(预测模型)。

 

如果正在选择职业,笔者希望你能再次认真考虑。

 

一起分享AI学习与发展的干货
欢迎关注全平台AI垂类自媒体 “读芯术”

(添加小编微信:dxsxbb,加入读者圈,一起讨论最新鲜的人工智能科技哦~)

你可能感兴趣的:(人工智能,热点文章,AI)