【数据科学】数据科学职业生涯中需要避免的9个错误

如果你想开始从事数据科学的工作,你可以通过避免这9个昂贵的初学者错误来节省数天,数周甚至数月的挫败感。

如果你不小心,这些错误会吞噬你最宝贵的资源:你的时间,精力和动力。

我们将它们分为三类:

  • 学习数据科学时出错
  • 申请工作时的错误
  • 求职面试时的错误

在学习数据科学的同时

第一组错误是“卧底”,很难发现。他们缓慢但肯定地消耗你的时间和精力而不给你警告,并且他们从围绕这个领域的误解中产生。

 

1.在理论上花费太多时间。

许多初学者陷入了在理论上花费太多时间的陷阱,无论是数学相关(线性代数,统计学等)还是机器学习相关(算法,推导等)。

这种方法效率低下有三个主要原因:

  • 首先,它是缓慢和令人生畏的。如果你曾经感到不知所措,那么你很可能会陷入这个陷阱。
  • 其次,你也不会保留这些概念。数据科学是一个应用领域,巩固技能的最佳方法是练习。
  • 最后,如果你没有看到你正在学习的东西与现实世界的联系,那么你将失去更大的风险并放弃。

这种理论密集的方法传统上是在学术界教授的,但大多数从业者可以从更注重结果的思维方式中受益。

为了避免这个错误:

  • 通过为您提供实践练习的项目来平衡您的学习。
  • 学会熟悉部分知识。随着进步,你自然会填补空白。
  • 了解每件作品如何适应大局。

 

2.从头开始编写太多算法。

这个下一个错误也会导致学生错过树林。一开始,您实际上不需要从头开始编写每个算法。

虽然为了学习目的实现一些很好,但实际情况是算法正在成为商品。得益于成熟的机器学习库和基于云的解决方案,大多数从业者实际上从不编写算法。

今天,了解如何在正确的设置中(以正确的方式)应用正确的算法更为重要。

为了避免这个错误:

  • 选择通用机器学习库,例如Scikit-Learn(Python)或Caret(R)。
  • 如果您从头开始编写算法代码,那么这样做的目的是学习而不是完善您的实现。
  • 了解现代机器学习算法  的概况及其优缺点。

 

3.跳入深渊。

有些人进入这个领域是因为他们想要构建未来的技术:自动驾驶汽车,先进机器人,计算机视觉等等。这些技术由深度学习  和自然语言处理等技术提供支持。

但是,掌握基础知识非常重要。每个奥运会潜水员都需要先学习如何游泳,所以你也应该这样。

为了避免这个错误:

  • 首先,掌握“经典”机器学习的技术和算法,作为高级主题的构建模块。
  • 知道经典的机器学习仍然具有令人难以置信的未开发潜力。虽然算法已经成熟,但我们仍处于发现使用它们的有效方法的早期阶段。
  • 学习使用任何形式的机器学习解决问题的系统方法。

 

什么时候申请工作

下一组错误可能会导致您在求职过程中错过一些很好的机会。即使您是合格的,也可以通过避免这些打嗝来最大化您的结果。

 

4.简历中有太多技术术语。

许多申请人在撰写简历时犯的最大错误就是用技术术语来窒息。

相反,你的简历应该画一幅画,你的要点应该讲故事。您的简历应该提倡您可以为组织带来的影响,特别是如果您申请入门级职位。

为了避免这个错误:

  • 不要只列出您使用的编程语言或库。描述您如何使用它们并解释结果。
  • 少即是多。考虑最重要的技能,强调并通过消除其他干扰给予他们发光的空间。
  • 创建一个简历主模板,以便您可以分离为不同角色定制的不同版本。这使每个版本保持清洁。

 

5.高估学位的价值。

有时候,毕业生可能会高估他们的教育价值。虽然相关领域的强大程度肯定可以提高你的机会,但它既不充分也不是通常最重要的因素。

要说清楚,我们不是说毕业生很傲慢......

在大多数情况下,在学术环境中教授的内容与在企业中应用的机器学习完全不同。在最后期限,客户和技术障碍下工作需要在学术界不那么紧迫的实际权衡。

为了避免这个错误:

  • 使用真实数据集补充大量项目的课程作业  。
  • 学习用机器学习解决问题的系统方法。
  • 即使他们是兼职,也要参加相关的实习。
  • 联系LinkedIn上的本地数据科学家进行咖啡聊天。

 

6.搜索范围太窄。

数据科学是一个相对较新的领域,组织仍在不断发展以适应数据日益增长的影响。如果你只搜索“数据科学家”的开头,你就会限制自己。

许多职位没有被标记为“数据科学”,但它们将允许您以类似的角色发展类似的技能和功能。

为了避免这个错误:

  • 按要求的技能搜索  (机器学习,数据可视化,SQL等)。
  • 按工作职责搜索(预测建模,A / B测试,数据分析等)。
  • 按角色中使用的技术进行搜索(Python,R,Scikit-Learn,Keras等)。
  • 按职位扩展搜索(数据分析师,定量分析师,机器学习工程师等)。

 

访谈期间

最后一组错误是采访中遇到的绊脚石。你已经完成了这个步骤的艰苦工作,所以现在是时候结束了。

 

7.没有准备好讨论项目。

在您的投资组合中拥有项目是“如何”键入面试问题的主要安全网。你可以指出如何处理某些情况的具体例子,而不是在假设中说话。

此外,许多招聘经理将专门寻找您自给自足的能力,因为数据科学角色自然包含项目管理的要素。这意味着您应该了解整个数据科学工作流程,并知道如何将所有内容拼凑在一起。

为了避免这个错误:

  • 完整的端到端项目,允许您练习每个主要步骤(即数据清理,模型培训等)。
  • 组织您的方法。数据科学应该是刻意的,而不是偶然的。
  • 回顾和练习您从任何实习,工作或课程中描述过去的项目。

 

8.低估领域知识的价值。

技术技能和机器学习知识是登陆数据科学职位的基本先决条件。但是,要真正脱颖而出,您应该了解更多关于您将应用自己技能的特定行业。

请记住,数据科学永远不会存在于真空中。

为了避免这个错误:

  • 如果您正在面试银行职位,请了解一些基本的财务概念。
  • 如果您正在为财富500强中的战略职位进行面试,请进行一些案例访谈并了解盈利能力的驱动因素。
  • 如果您正在为一家初创公司进行面试,请了解其市场并尝试辨别它将如何获得竞争优势。
  • 简而言之,在这里采取一些额外的举措可以带来巨大的回报!

 

9.忽视沟通技巧。

目前,在大多数组织中,与开发人员团队或分析师团队相比,数据科学团队仍然非常小。因此,虽然入门级软件工程师通常会被高级工程师管理,但数据科学家往往会在更多跨功能环境中工作。

面试官将寻找您与各种技术和数学背景的同事沟通的能力。

为了避免这个错误:

  • 练习向非技术受众解释技术概念。例如,尝试向朋友解释您最喜欢的算法。
  • 准备子弹点对常见面试问题的回答  并练习提供答案。
  • 练习分析各种数据集,提取关键见解并展示您的发现。

 

结论

在本指南中,您学习了避免数据科学初学者犯下的9个最昂贵的错误的实用技巧:

  1. 在理论上花费太多时间。
  2. 从头开始编写太多算法。
  3. 过快地进入高级主题,例如深度学习。
  4. 在简历中有太多的技术术语。
  5. 高估学位的价值。
  6. 寻找工作太狭隘。
  7. 在面试中没有准备好讨论项目。
  8. 低估了领域知识的价值。
  9. 忽视沟通技巧。

 

原文链接:https://elitedatascience.com/beginner-mistakes

你可能感兴趣的:(Machine,Learning,机器学习算法理论与实战)