Andrew Ng Neural-networks-deep-learning 课程笔记一

Week1 Introduction to Deep Learning

  • Tips:在Andrew Ng的课程中,通常使用列向量构成的矩阵来表示一系列样本,如X.shape=(n_x,m),n_x为特征数,m为样本数

1.Neural Networks Basics

(1)Binary classification

  • 二分类问题

二分类问题中,结果为离散的两个值,通常为0,1

以“识别图片中是否为猫”为例:
目标是训练一个能够图片中的动物进行“是否为猫”的判断的分类器,是则输出1,否则输出0

Andrew Ng Neural-networks-deep-learning 课程笔记一_第1张图片

特征矩阵

在计算机中,图片以如图所示的三个分离的矩阵来存储,分别对应红绿蓝三个颜色通道,为了实现对于图像的识别,我们需要将三个分离的矩阵变换为特征矩阵,即一个代表图片中是否有猫的矩阵。

Andrew Ng Neural-networks-deep-learning 课程笔记一_第2张图片
为了构造这个特征矩阵,我们需要将原图片reshape为一个(64*64*3,1)的矩阵,因为原图片的分辨率为64*64

(2)Logistic Regression

Logistic Regression是一种机器学习算法,用于输出结果只有两种情况的问题,目标是最小化prediction和training data之间的error。

仍以识别图片中的猫为例:

给出输入矩阵X,logistic regression算法能够计算出图片中有猫的概率,即:
这里写图片描述

logistics regression算法的参数有:

  1. 输入矩阵X
  2. 训练标签label(一般为1,0)
  3. 权重矩阵W
  4. 阈值threshold(用于区分有无猫)
  5. 输出这里写图片描述
  6. 激活函数(Sigmoid,ReLu)

你可能感兴趣的:(deep-learning)