Core ML框架详细解析(十二) —— 用scikit-learn开始机器学习(一)

版本记录

版本号 时间
V1.0 2018.10.16 星期二

前言

目前世界上科技界的所有大佬一致认为人工智能是下一代科技革命,苹果作为科技界的巨头,当然也会紧跟新的科技革命的步伐,其中ios API 就新出了一个框架Core ML。ML是Machine Learning的缩写,也就是机器学习,这正是现在很火的一个技术,它也是人工智能最核心的内容。感兴趣的可以看我写的下面几篇。
1. Core ML框架详细解析(一) —— Core ML基本概览
2. Core ML框架详细解析(二) —— 获取模型并集成到APP中
3. Core ML框架详细解析(三) —— 利用Vision和Core ML对图像进行分类
4. Core ML框架详细解析(四) —— 将训练模型转化为Core ML
5. Core ML框架详细解析(五) —— 一个Core ML简单示例(一)
6. Core ML框架详细解析(六) —— 一个Core ML简单示例(二)
7. Core ML框架详细解析(七) —— 减少Core ML应用程序的大小(一)
8. Core ML框架详细解析(八) —— 在用户设备上下载和编译模型(一)
9. Core ML框架详细解析(九) —— 用一系列输入进行预测(一)
10. Core ML框架详细解析(十) —— 集成自定义图层(一)
11. Core ML框架详细解析(十一) —— 创建自定义图层(一)

开始

首先看一下写作环境

Swift 4, iOS 11, Xcode 9

借助iOS 11,Apple发布了Core ML框架,允许您将经过训练的机器学习模型集成到您的应用程序中。 Apple提供了一种工具,可将许多模型格式转换为.mlmodel格式。 但是,您如何创建和训练机器学习模型? 在本教程中,您将通过使用scikit-learn创建自己的机器学习模型,并通过Apple的Core ML框架将其集成到iOS应用程序中。 在此过程中,您将学习如何:

  • 在macOS上安装流行的Python机器学习包。
  • 创建预测机器学习模型。
  • 将这些模型集成到您自己的iOS应用程序中。

打开准备的工程,编译并运行:

Core ML框架详细解析(十二) —— 用scikit-learn开始机器学习(一)_第1张图片

该应用程序有3个滑块,每个广告预算一个:电视广告,广播广告和报纸广告。 在过去几年中,您已经记录了广告支出的金额(以数千美元计算)以及您的销售额(以数千个单位显示)。

现在,您希望构建和训练机器学习模型,以帮助根据各种广告预算方案预测您的销售结果。 之后,您希望将模型方便地打包到iOS应用程序中,以便您和您的团队可以即时检查结果。

在本教程中,您将构建此模型并使用Core ML将其集成到应用程序中,以便在移动任何滑块时,销售预测将更新。

但首先,您需要安装必要的Python工具。


Installing Anaconda - 安装Anaconda

Anaconda是一个开源发行版。 它包含数千个预配置的软件包,使用户能够使用Python中最流行的Data Science and Machine Learning工具快速启动并运行。

在本教程中,您只会涉及Anaconda所提供的内容,因此我建议您查看anaconda.org以了解有关它的更多信息。

要安装Anaconda,请访问他们的downloads area,然后下载Python 2.7版本;Apple的coremltools仅适用于Python 2。

下载后,运行安装程序。 继续阅读IntroductionRead Me and License,直到进入Destination Select步骤。 安装Anaconda最简单,最干净的方法是进入本地项目。 为此,请选择在Install on a specific disk…,选择正确的磁盘,单击Choose Folder…,导航到您选择的用户目录,然后创建一个名为Beginning-Machine-Learning的新文件夹。

Core ML框架详细解析(十二) —— 用scikit-learn开始机器学习(一)_第2张图片

注意:如果安装程序跳过Destination Select步骤,请单击Installation Type步骤上的Change Install Location…以返回该目标。

Core ML框架详细解析(十二) —— 用scikit-learn开始机器学习(一)_第3张图片

选择目标后,单击Continue,然后单击Install,开始安装过程。 这应该需要大约10分钟。

要验证您的安装,请打开终端并将cd(更改目录)打开到安装了anacondaBeginning-Machine-Learning文件夹中。 然后,输入以下命令:

./anaconda2/bin/python --version

您将看到使用Python 2版本的成功响应,如下所示:

Core ML框架详细解析(十二) —— 用scikit-learn开始机器学习(一)_第4张图片

恭喜! Python与其最重要的data science/machine learning包一起安装。


Installing Core ML Community Tools - 安装Core ML通用工具

Anaconda不包含的一个工具是coremltools,这是Apple的一个Open Source,您稍后可以将scikit-learn模型转换为可在iOS应用中使用的格式。

在终端中,从Beginning-Machine-Learning目录运行以下命令:

./anaconda2/bin/pip install -U coremltools
Core ML框架详细解析(十二) —— 用scikit-learn开始机器学习(一)_第5张图片

Jupyter Notebook

安装好所有东西后,您就可以开始使用Jupyter Notebook;将Jupyter Notebook视为Swift Playgrounds,而不是Python

Beginning-Machine-Learning目录中,在Terminal中输入以下两个命令:

mkdir notebooks
./anaconda2/bin/jupyter notebook notebooks

在这里,您首先创建了一个名为notebooks的新文件夹。 然后,您从该新文件夹启动了Jupyter Notebook Server

您的默认浏览器应该打开Jupyter Notebook页面。 如果没有,您将在终端中看到页面的URL,以便您可以手动打开它;它应该看起来像这样:http:// localhost:8888 /?token = 7609a66aaffa819340a882f8ff88361db3f72667c07c764d

现在您需要创建一个新笔记本。 为此,请单击New,然后单击Python 2

Core ML框架详细解析(十二) —— 用scikit-learn开始机器学习(一)_第6张图片

给新笔记本一个更好的名字。 单击File,然后Rename…,并将名称更改为Advertising

Core ML框架详细解析(十二) —— 用scikit-learn开始机器学习(一)_第7张图片

单击floppy disk以保存更改。

注意:如果您在尝试保存笔记本时遇到问题,请确保您没有在页面上运行浏览器扩展程序;广告拦截器之类的东西可能会导致问题。

笔记本很像Swift Playgrounds。 您可以输入Python表达式,然后按Control-Enter执行它们并查看内联结果。

尝试输入类似2 + 2的内容并点击Control-Enter以获得结果。 此外,尝试使用Shift + Enter插入新单元格,以及执行当前单元格。

您还可以像在普通Python文件中一样创建函数和类:

Core ML框架详细解析(十二) —— 用scikit-learn开始机器学习(一)_第8张图片

如果要进一步了解界面,请通过选择菜单栏中的Help来查看User Interface Tour

准备就绪后,按住Shift键并单击每个单元格左侧的空白区域,然后使用dd快捷方式删除您在获取任何内容时所创建的任何单元格。

使用干净的notebook,您已准备好进行下一步:创建线性回归模型以预测广告收入。


Training and Validating a Linear Regression Model - 训练和验证线性回归模型

下载此示例广告数据并将csv文件放入您的notebooks文件夹中。

现在,在笔记本的第一个单元格中输入以下代码:

import pandas as pd

使用Shift-Enter运行单元格。 然后,将以下行添加到第二个单元格并运行该单元格:

adver = pd.read_csv("Advertising.csv", usecols=[1, 2, 3, 4])
adver.head()

首先,您导入了pandas库。 pandas是一个数据分析库,包含许多用于导入,清理和转换数据的工具。

实际数据不像样本广告数据那样随时可用。 您将使用pandas将其变形,以用作机器学习模型的输入。 在上面的代码中,您使用它来导入csv文件并将其转换为pandas的格式 - 数据帧,这是一种标准格式,大多数Python机器学习库(包括scikit-learn)将接受作为输入。

您应该看到笔记本中数据的前几行。 每行代表一个数据点:电视,广播和报纸广告花费了多少,以及特定时期的销售额。

Core ML框架详细解析(十二) —— 用scikit-learn开始机器学习(一)_第9张图片

首先,您需要从输出列中分离出数据中的输入列。 按照惯例,它们分别称为Xy。 在新单元格中输入以下代码并运行它:

X, y = adver.iloc[:, :-1], adver.iloc[:, -1]

要正确训练和验证模型,您需要将数据拆分为两组:

  • Training set - 训练集:用于训练模型。 这些样本用作机器学习算法的输入。
  • Testing set - 测试集:模型尚未见到,该集用于测试或验证模型。 由于测试集的销售已经知道且独立于训练集,因此测试集可用于获得使用训练集训练模型的程度的分数。

幸运的是,scikit-learn提供了一个易于使用的功能,可以将数据分成训练和测试集。 将以下内容添加到笔记本中的第一个单元格中,在pandas import下:

import sklearn.model_selection as ms

确保单元格具有焦点,然后使用Control-Enter运行它。 现在,在笔记本的末尾,将以下内容键入新单元格并运行该单元格:

X_train, X_test, y_train, y_test = ms.train_test_split(X, y, test_size=0.25, random_state=42)
Core ML框架详细解析(十二) —— 用scikit-learn开始机器学习(一)_第10张图片

该函数返回4个值:用于训练和测试的输入,以及用于训练和测试的输出。该函数采用以下参数:

  • X:我们从Advertisments.csv示例数据中读取的输入(支出金额)。
  • y:来自样本数据的输出(销售数量)。
  • test_size:用于测试的数据百分比,通常设置为25%到40%之间。
  • random_state:如果没有输入,该函数将随机选择用于训练和测试样本的行。在生产中,这正是您想要的,但对于像这样的开发和教程,获得一致的结果非常重要,这样您就可以知道出现问题时的位置。

在此处了解有关train_test_split功能的更多信息,请点击这里。

现在,数据按照您希望的方式进行拆分,现在是时候根据该数据创建和训练线性回归模型了。

注意:查看this wonderful tutorial精彩的教程,了解线性回归的工作原理和原因。

在包含pandassklearn.model_selection导入的单元格中,附加以下导入并运行单元格:

import sklearn.linear_model as lm

然后,在笔记本的底部,将以下行输入新单元格并运行它:

regr = lm.LinearRegression()  # 1
regr.fit(X_train, y_train)    # 2
regr.score(X_test, y_test)    # 3
Core ML框架详细解析(十二) —— 用scikit-learn开始机器学习(一)_第11张图片
  • 1) 在这里,您将创建一个线性回归模型对象(regr)
  • 2) 对于scikit-learn模型,fit方法总是训练模型,它接受训练输入列和输出列。
  • 3) 分数决定了模型的优秀程度。 大多数scikit-learn模型都有一个将测试数据作为参数的分数方法。 在线性回归的情况下,分数可以让您了解预测输出与测试数据的实际输出的接近程度。

你应该看到得分为0.89

现在,您可以使用线性回归对象来预测新输入值的销售额。 为此,请将以下内容添加到另一个单元格中并运行它:

X_new = [[ 50.0, 150.0, 150.0],
         [250.0,  50.0,  50.0],
         [100.0, 125.0, 125.0]]

regr.predict(X_new)
Core ML框架详细解析(十二) —— 用scikit-learn开始机器学习(一)_第12张图片

您应该看到以下输出:

array([ 34.15367536,  23.83792444,  31.57473763])

因此,如果您花费5万美元,15万美元和15万美元用于三个平台的营销,您可以预期销售34,150台!

您用于训练线性回归的三个步骤与绝大多数scikit-learn模型需要使用的步骤完全相同。

接下来,您将使用相同的三种方法来创建和训练支持向量机(SVM)模型。 SVM是最流行的机器学习工具之一。 因为它们是更复杂的模型,所以需要更长的时间才能正确训练和调整。


Training and Validating a Support Vector Machine Model - 训练和验证支持向量机模型

将另一个import添加到第一个单元格并重新运行它:

import sklearn.svm as svm

然后,将以下每个代码块添加到单元格中并运行它们:

svr = svm.LinearSVR(random_state=42)
svr.fit(X_train, y_train)
svr.score(X_test, y_test)
svr.predict(X_new)
Core ML框架详细解析(十二) —— 用scikit-learn开始机器学习(一)_第13张图片

您应该看到0.867的分数和一组新的预测。 您将看到SVM预测相似,但完全不同。 支持向量机以不同的方式工作,可能适合您的数据,也可能不适合您的数据。 机器学习中最难的部分之一是为该模型找到合适的模型和正确的参数,以获得最佳结果。

如果您想了解有关SVM的更多信息,请查看 scikit-learn.org上的文档。


Converting the Model to Apple’s Core ML Format - 将模型转换为Apple的Core ML格式

建立模型后,就可以将其导出到Core ML了。 您在本教程的开头安装了coremltools,因此请继续将导入添加到第一个单元格中,并最后一次运行:

import coremltools

现在,在笔记本的最后一个单元格中,输入以下代码并运行它:

input_features = ["tv", "radio", "newspaper"]
output_feature = "sales"

model = coremltools.converters.sklearn.convert(regr, input_features, output_feature)
model.save("Advertising.mlmodel")

coremltools.converters.sklearn.convert函数采用以下参数:

  • 1) 要转换的scikit-learn模型。
  • 2) Xcode将用于生成Swift类接口的输入和输出功能名称。

最后,save()接受导出的文件名。 保存模型时,应确保使用.mlmodel扩展名。

完成的笔记本看起来像这样:

Core ML框架详细解析(十二) —— 用scikit-learn开始机器学习(一)_第14张图片

如果查看存储笔记本的文件夹,您将看到名为Advertising.mlmodel的新文件。 这是Core ML模型文件,您可以放入Xcode! 你接下来会这样做。


Integrating the Core ML Model into Your App - 将Core ML模型集成到您的应用程序中

回到之前构建并运行的入门项目,将Advertising.mlmodelnotebooks目录拖到Xcode中的Project导航器中。

Core ML框架详细解析(十二) —— 用scikit-learn开始机器学习(一)_第15张图片

出现提示时,选中Copy items if neededCreate groupsAdvertising,然后单击Finish。 将模型导入Xcode项目后,在Project导航器中单击它,您将看到有关它的一些信息:

Core ML框架详细解析(十二) —— 用scikit-learn开始机器学习(一)_第16张图片

注意:如果您想知道为什么这个屏幕看起来有点乏味,那是因为在将内容转换为.mlmodel时没有添加任何额外的元数据。 如果要执行此操作,请查看Model Interface文档以查看可以提供的元数据。

片刻之后,您应该看到Automatically generated Swift model class。 点击上面的小箭头将带您进入Xcode从.mlmodel生成的界面。

打开ViewController.swift并在numberFormatter下添加一个新属性:

private let advertising = Advertising()

然后,向下滚动到sliderValueChanged(_ :),并替换以下行:

let sales = 0.0

let input = AdvertisingInput(tv: tv, radio: radio, newspaper: newspaper)

guard let output = try? advertising.prediction(input: input) else {
    return
}

let sales = output.sales

类似于scikit-learnpredict()方法,Core ML模型有一个prediction方法,它接受一个输入结构并返回一个输出结构,这两个结构都是Xcode之前生成的。

构建并运行应用程序。 请注意每当您更改其中一个输入参数时,销售预测是如何更新的!

Core ML框架详细解析(十二) —— 用scikit-learn开始机器学习(一)_第17张图片

请务必查看the scikit-learn documentation,特别是 the flowchart to choose the right estimator。 scikit-learn中的所有估算器都遵循相同的API,因此您可以尝试许多不同的机器学习算法来找到最适合您的用例的算法。

另请参阅此Python Data Science Handbook,其中包含有关机器学习的部分以及更多算法。


源码

1. Swift

首先看一下文档结构

Core ML框架详细解析(十二) —— 用scikit-learn开始机器学习(一)_第18张图片

看一下sb中的内容

Core ML框架详细解析(十二) —— 用scikit-learn开始机器学习(一)_第19张图片
1. ViewController.swift
import UIKit

final class ViewController: UIViewController {
  @IBOutlet private var tvSlider: UISlider!
  @IBOutlet private var radioSlider: UISlider!
  @IBOutlet private var newspaperSlider: UISlider!
  @IBOutlet private var tvLabel: UILabel!
  @IBOutlet private var radioLabel: UILabel!
  @IBOutlet private var newspaperLabel: UILabel!
  @IBOutlet private var salesLabel: UILabel!
  private let numberFormatter = NumberFormatter()
  private let advertising = Advertising()
  
  override func viewDidLoad() {
    super.viewDidLoad()
    
    numberFormatter.numberStyle = .decimal
    numberFormatter.maximumFractionDigits = 1
    
    sliderValueChanged()
  }
  
  @IBAction func sliderValueChanged(_ sender: UISlider? = nil) {
    let tv = Double(tvSlider.value)
    let radio = Double(radioSlider.value)
    let newspaper = Double(newspaperSlider.value)
    
    let input = AdvertisingInput(tv: tv, radio: radio, newspaper: newspaper)

    guard let output = try? advertising.prediction(input: input) else {
      return
    }

    let sales = output.sales
    
    tvLabel.text = numberFormatter.string(from: tv as NSNumber)
    radioLabel.text = numberFormatter.string(from: radio as NSNumber)
    newspaperLabel.text = numberFormatter.string(from: newspaper as NSNumber)
    salesLabel.text = numberFormatter.string(from: sales as NSNumber)
  }
}

后记

本篇主要讲述了用scikit-learn开始机器学习,感兴趣的给个赞或者关注~~~

Core ML框架详细解析(十二) —— 用scikit-learn开始机器学习(一)_第20张图片

你可能感兴趣的:(Core ML框架详细解析(十二) —— 用scikit-learn开始机器学习(一))