创建一个包含用于定义逻辑回归的 Python 代码的 Jupyter Notebook,然后使用 TensorFlow (tf.keras) 实现它
在本教程中,了解如何创建包含用于定义逻辑回归的 Python 代码的 Jupyter Notebook,然后使用 TensorFlow (tf.keras) 实现它。Notebook 在 IBM Cloud Pak® for Data as a Service on IBM Cloud® 上运行。IBM Cloud Pak for Data 平台提供了额外的支持,例如与多个数据源的集成、内置分析、Jupyter Notebook 和机器学习。它还通过跨多个计算资源分配进程来提供可扩展性。您可以选择在 Python、Scala 和 R 中创建资产,并使用已安装在 IBM Cloud Pak for Data as a Service 平台上的开源框架(例如 TensorFlow)。
虽然线性回归非常适合估计连续值(例如,估计房价或产品销售),但它并不是预测观察到的数据点所属类别的最佳工具。若要提供分类估计值,需要一些有关该数据点最有可能的类的指导。为此,您将使用逻辑回归。
线性回归找到一个函数,该函数将连续因变量 与某些预测变量(例如,自变量或 )相关联。简单线性回归假定以下形式的函数:y``x1``x2
y = w0 + w1 x x1 + w2 x x2 + ...
显示更多
它查找 、 和 的值。该项是截距项或常量项(如下公式所示):w0``w1``w2``w0``b
Y = W X + b
显示更多
逻辑回归是线性回归的一种变体,当观测到的因变量 时很有用。它生成一个公式,用于预测类标签作为自变量函数的概率。y
尽管名称为逻辑回归,但它实际上是一种概率分类模型。逻辑回归通过采用线性回归并使用以下函数将数值估计值转换为概率来拟合特殊的 S 形曲线:
=ℎ()=1+=()/(1+())=
显示更多
这将产生介于 0(接近减去无穷大)和 1(接近加无穷大)之间的 p 值。现在,这成为一种特殊类型的非线性回归。y``y
在这个等式中,是回归结果(变量之和乘以系数加权),是指数函数,是y``exp``theta(y)
物流功能,也称为逻辑曲线。它是一种常见的“S”形(S形曲线),最初是为模拟人口增长而开发的。
您可能之前在另一个配置中看到过此函数:
=ℎ()=11+−
显示更多
因此,逻辑回归通过逻辑/sigmoid 函数传递输入,但随后将结果视为概率。
遵循本教程需要满足以下先决条件:
IBM Cloud 帐户
IBM Cloud Pak for Data 或 IBM Watson® Studio
IBM Watson 机器学习服务
完成本教程大约需要 60 分钟。
创建 IBM Cloud 帐户并访问 IBM Cloud Pak for Data as a Service。
创建一个新项目。
将 Watson Machine Learning Service 与项目相关联。
将笔记本添加到项目中。
运行笔记本。
单击“添加到项目”,然后单击“笔记本”,将 Jupyter Notebook 添加到项目中。
选择“从 URL”,然后在“笔记本 URL”字段中输入以下 URL。
https://github.com/IBM/dl-learning-path-assets/tree/main/fundamentals-of-deeplearning/notebooks/Logistic_Regression_with_TensorFlow.ipynb
显示更多
为笔记本命名,然后单击“创建”。
加载笔记本后,单击“单元格”,然后选择“全部运行”以运行笔记本。
笔记本包含所有详细信息。花一些时间浏览笔记本的各个部分,以获得笔记本的概述。笔记本由文本(Markdown 或标题)单元格和代码单元格组成。Markdown 单元格提供有关代码设计用途的注释。
您可以通过突出显示每个单元格来单独运行单元格,然后单击笔记本顶部的“运行”或使用键盘快捷键运行单元格(Shift + Enter,但这可能因平台而异)。单元运行时,单元格左侧会出现一个星号 ()。当该单元格完成运行时,将显示一个序列号(例如,)。[*]``[17]
Notebook 提供了一个简单的逻辑函数示例,以帮助您了解 TensorFlow 背后的基本机制。
在本教程中,您学习了逻辑回归的基础知识,以及如何使用 TensorFlow 实现机器学习算法。您学习了如何在 IBM Cloud Pak for Data as a Service 上使用 Watson Studio 运行 Jupyter Notebook,以及如何在 IBM Cloud Pak for Data as a Service 平台中使用开源框架。