数据科学初学者九种常见错误

摘录:公众号-全球人工智能 2017-07-03 推送文章

学习数据科学时的错误

重视局部,忽略整体

  1. 花费太多时间在理论上
    数据科学是应用领域,巩固技能的最好办法是实践
    You should:
    平衡你的研究与项目实践
    学会适应局部知识,当你进步时,自然会填补空白
    了解每一部分如何适应大局

  2. 从头开始编写太多的算法
    算法正在成为一种商品,直接使用成熟的机器学习库及基于云的解决方案
    更重要: 了解如何在正确的设置中应用正确的算法
    You should:
    使用通用的机器学习库,如Python scikit-learn
    除非是为了学习而不是完善你的实现,你才从头开始编写一个算法
    理解现代机器学习算法的环境及其优缺点

  3. 急于深入更高的层次
    掌握基本原理很重要
    You should:
    首先掌握“经典”机器学习技术及算法,以此作为高级课题的基石
    发现、使用富有成效的方法
    学习一套系统的方法来解决任何形式的机器学习问题

求职时的错误

  1. 简历中太多专业术语
    简介明了,要点阐述清晰,展现你能给公司带来的影响
    You should:
    不要简单列出你所使用的编程语言或库,描述你如何使用它们并解释结果
    少即是多:考虑强调最重要的技能,并突出它们
    制作一个简历主模板,可以根据不同职位定制不同版本,并保持整洁
  2. 高估学位的价值
    很可能,学校学习的东西与企业中应用的机器学习完全不同
    You should:
    用真实数据集做项目实践
    参加相关实习
    学会使用机器学习的系统 方法
    向一流数据科学家学习
  3. 搜索内容太狭隘
    许多职位没有被称为“数据科学”,但它们需要类似的技能
    You should:
    按所需技能搜索:机器学习、数据可视化、SQL等
    按工作职责搜索:预测建模、A/B测试、数据分析等
    按所需技术搜索:Python、R、Scikit Learn、TensorFlow等
    按职位名称扩展搜索范围:数据分析师、定量分析师、机器学习工程师等

面试时的错误

  1. 没有事先做讨论项目的准备
    回答“你会如何”这类面试问题,以此作为主要的安全保障
    面试官会关注你独立自主的能力,因为数据科学的职位包含项目管理的要素,因此你要理解整个数据科学的工作流程,了解如何将所有内容整理在一起
    You should:
    完整的端到端项目,实践每一个主要步骤
    组织你自己的一套方法,数据科学是深思熟虑、严谨、充满逻辑性的
    回顾和实践过去的实习、工作或课程中所做的项目
  2. 低估领域知识的价值
    技术技能和机器学习知识是获得数据科学职位的基本前提
    要真正脱颖而出,你应该更多地了解你将运用技能的具体行业知识
    数据科学永远不会存在于真空中
  3. 忽视沟通的技巧
    数据科学团队比较小,数据科学家倾向于在更多跨功能的环境中工作
    注重你和不同技术背景和数学背景的同事交流的能力
    You should:
    向非技术受众讲解技术概念,锻炼相关能力
    为常见面试问题准备要点,并练习回答问题
    实践分析各种数据集,提取关键见解,并展示你的发现

你可能感兴趣的:(数据科学家)