机器学习和数据科学攻略

机器学习和数据科学攻略

    • 1 学习Python、数据科学工具和机器学习概念
    • 2 学习通过Pandas、Numpy和Matplotlib进行数据分析、操作和可视化
    • 3 借助 scikit-learn 学习机器学习
    • 4 学习深度学习神经网络
    • 5 其他课程和书籍
    • 6 答疑
      • 6.1 每一步需要多长时间?
      • 6.2 我在哪里可以学到这些技能?
      • 6.3 统计怎么办?数学怎么办?概率呢?
      • 6.4 证书?
    • 7 参考链接

1 学习Python、数据科学工具和机器学习概念

  • 人工智能要素 – 人工智能和机器学习主要概念概述
  • Coursera上的Python教程 – 从头学习Python
  • 通过freeCodeCamp学习Python – 一个视频涵盖了 Python 所有主要概念
  • Corey Schafer的Anaconda教程 – 一个视频学会 Anaconda(数据科学和机器学习需要的配置环境)
  • Dataquest的新手Jupyter Notebook教程 – 一篇文章学会启动和运行Jupyter Notebook
  • Corey Schafer的Jupyter Note教程 – 一个视频学会使用 Jupyter Notebook

2 学习通过Pandas、Numpy和Matplotlib进行数据分析、操作和可视化

  • Cousera上的Python应用数据科学 – 开始打磨数据科学方向的Python 技能
  • 10分钟入门pandas – 快速概览pandas库及其部分最有用的函数
  • Codebasics的Python pandas教程 – 该YouTube系列介绍了pandas的所有主要功能
  • freeCodeCamp的NumPy教程 – 一个YouTube视频学会NumPy
  • Sentdex的Matplotlib教程 – YouTube系列助你学会Matplotlib所有最有用的功能

3 借助 scikit-learn 学习机器学习

  • Data School的基于scikit-learn的Python机器学习 – 一个YouTube播放列表教你scikit-learn的所有主要函数
  • Daniel Bourk 对探索性数据分析的简要介绍 – 把你在上述两个步骤中学到的知识融合在一个项目中,提供代码和视频,助你开始第一个Kaggle竞赛。
  • Daniel Formosso的基于scikit-learn的探索性数据分析笔记 – 以上资源的更深入版本,附带了一个实践上述内容的端到端项目

4 学习深度学习神经网络

  • Cousera上Andrew Ng的deeplearning.ai – 商业上最成功的从业者之一讲授的深度学习课程
  • Jeremy Howard的fast.ai深度学习课程 – 工业界最好的实践者之一讲授的深度学习实际操作方法

5 其他课程和书籍

在你熟悉了如何使用不同的机器学习和深度学习框架之后,你可以尝试通过从头开始构建它们来巩固你的知识。你不必总是在生产或从事机器学习时这样做,但是从内部了解事情是如何工作的将有助于你建立自己的工作。

  • Daniel Bourke的如何开始你自己的机器学习工程 – 开始你自己的工程可能会很难,这篇文章可以给你一些指引
  • Jeremy Howard的fast.ai深度学习基础 – 自上而下学习后,本课程将帮助你从下往上填补空白
  • Andrew Trask的Grokking Deep Learning – 这本书将教你如何从头开始构建神经网络,以及为什么你应该知道如何构建
  • Daniel Bourke推荐的机器学习书籍 – 该YouTube视频整理了一些机器学习最佳书籍

6 答疑

6.1 每一步需要多长时间?

你可能会花6个月或更长的时间。别着急,学习新事物需要时间。作为一名数据科学家或机器学习工程师,你正在培养的主要技能是如何针对数据提出好的问题,然后使用你的工具来尝试寻找答案。

有时候你会觉得自己什么都没学到。甚至倒退。忽略它。不要以天为单位来衡量,看看你一年后有什么样的进步。

6.2 我在哪里可以学到这些技能?

我在上面列出了一些资源,它们都是在线的,而且大部分都是免费的,类似的资源还有很多。

DataCamp 是一个很好学习网站。另外,我的Machine Learning and Artificial Intelligence resources database整理了免费和付费的学习资料。

记住,作为数据科学家或机器学习工程师,很大一部分工作是要解决问题。通过你的第一个作业探索这里的每一个步骤,并创建你自己的课程来帮助学习。

如果你想知道一个自我引导的机器学习课程的例子是什么样子的,看看我的Self-Created AI Masters Degree。这是我在过去9个月内从零编码变成机器学习工程师的过程。它不是完美的,但是我的真实经历,因此你可以试试。

6.3 统计怎么办?数学怎么办?概率呢?

实践过程中你会学到这些东西的。先从代码开始。把代码运行起来。在运行代码之前,尝试学习所有的统计、数学、概率知识,就像是在试图煮沸大海。它会让你退缩。

如果代码不运行,统计、数学和概率都不重要。先运行起来,然后用你的研究技巧来验证它是否正确。

6.4 证书?

证书很好,但你不是为了证书而学习,而是为了提高技能。不要和我犯同样的错误,不要认为证书越多代表技能越多,并不是这样的。通过上述课程和资源建立知识基础,然后通过自己的项目完善专业知识(这些是课程无法传授的知识)。

7 参考链接

  • 五个给机器学习和数据科学入门者的学习建议
  • 5 Beginner Friendly Steps to Learn Machine Learning and Data Science with Python

你可能感兴趣的:(MachineLearning)