书评:使用Scikit-Learn和TensorFlow进行动手机器学习

Google Assistant,Amazon Alexa,Microsoft Cortana,Apple Siri或Facebook Messaging M之间的共同点是什么? 所有这些个人助手均由机器学习和人工智能(AI)推动。 根据Glassdoor和Upwork.com的说法 ,机器学习是2017年必不可少的技能,并且将持续多年

您将如何发展技能,成为下一位机器学习工程师?

机器学习入门

Udacity , Coursera , edX和其他资源提供了MOOC(大规模开放在线课程),并且Amazon.com列出了5,000多本有关机器学习的书籍。 这些标题中的许多标题都可以帮助您入门,并通过动手知识逐步将您带入更高的层次。 此外,前Google工程师,领导YouTube视频分类团队的AurélienGéron也写了一本很棒的书: 动手学习Scikit-Learn和TensorFlow 。 这是一本实用的指导书,用于动手机器学习和深度学习 (一类机器学习算法)。

这本书假定您对机器学习几乎一无所知。 但是,这本书还假设您具有一些Python编程经验,并且对大学水平的数学有一定的了解,包括线性代数,概率和统计量。 机器学习项目通常使用Python,R,Java / Scala和C / C ++作为编程语言。 Géron并没有让我们实现自己的机器学习算法的玩具版本,而是使用了可用于生产的Python框架scikit-learn和TensorFlow 。 两者都是积极开发的开源项目。

为什么要使用scikit-learn和TensorFlow?

scikit-learn项目是David Cournapeau于2007年发起的Google夏季代码项目。Scikit-learn致力于使用通用的高级语言(如Python)将机器学习带给非专业人员。 根据scikit-learn的推荐页面 ,Spotify将scikit-learn机器学习包用于音乐推荐,而Evernote则将其用于音符分类。 它提供了基本的机器学习算法的高质量,易于使用的实现,包括回归,分类,聚类等。 Scikit-learn是学习机器学习的很好的切入点,并且是GitHub上第二高星级的机器学习库。

TensorFlow是Géron评估的第二个项目。 从2011年开始,Google Brain构建了DistBelief ,这是一个基于深度学习神经网络的机器学习系统。 TensorFlow是Google Brain的第二代机器学习系统,于2015年作为开源软件发布。Google使用TensorFlow神经网络模型进行语音识别,而Snapchat使用它进行图像识别。 它提供了用于神经网络和深度学习的高级机器学习算法,并且是GitHub上使用最多的机器学习库。

端到端机器学习项目

该书的核心优势在于它专注于端到端机器学习项目。 一个典型的机器学习项目涉及八个步骤:

  1. 看大图
  2. 获取数据
  3. 可视化数据以获取见解
  4. 准备用于机器学习算法的数据
  5. 选择一个模型并训练
  6. 微调模型
  7. 提出解决方案
  8. 启动,监视和维护机器学习系统

样例项目:房价预测

该书使用加利福尼亚州的公共普查数据来预测整个地区的房价。 第一步,这本书有助于解决问题-这是带有多元回归的监督学习问题。 根据所需的精度,下一步是选择性能指标; 例如,系统价格预测的68%落在实际价值的50,000美元以内,而系统价格预测的95%落在实际价值的100,000美元以内。

Scikit-learn提供了一些工具来获取数据,浏览数据,清理数据以及为机器学习算法准备数据。 一旦完成,下一步就是选择和训练模型。 机器学习项目的一大挑战是选择正确的模型,这将提供更好的预测准确性。 经验丰富的机器学习专家会选择三到四个模型,然后根据结果的准确性选择其中一个模型。

对于房价预测,Géron选择线性回归 , 决策树和随机森林模型。 他发现随机森林在此问题上的表现优于其他两个模型。

本书涵盖了更多的机器学习算法及其相关性和用法,并且包括涵盖了监督学习,非监督学习,半监督学习和强化学习的代码示例。 您的机器学习问题可能是细分客户并为每个组找到最佳的营销策略,检测哪些交易可能是欺诈性的,并预测明年的收入。

阅读: 使用Scikit-Learn和TensorFlow进行动手机器学习

翻译自: https://opensource.com/article/17/4/book-review-hands-machine-learning-scikit-learn-tensorflow

你可能感兴趣的:(算法,编程语言,python,机器学习,人工智能)