吴恩达机器学习课后作业--week3前馈神经网络

题目:

这部分,你需要实现一个可以识别手写数字的神经网络。神经网络可以表示一些非线性复杂的模型。权重已经预先训练好,你的目标是在现有权重基础上,实现前馈神经网络。
若已给定神经网络中的theta矩阵(需要用反向传播算法得出),实现前馈神经网络,理解神经网络的作用。
题目已给出a(1)为第一层输入层数据,有400个神经元代表每个数字的图像(不加偏置值);
a(2)为隐藏层,有25个神经元(不加偏置值);
a(3)为输出层‘,又10个神经元,以10个(0/1)值的向量表示;
theta1为第一层到第二层的参数矩阵(25,401);
theta2为第二层到第三层的参数矩阵(10,26)。

数据集:

mat文件
https://www.heywhale.com/mw/project/5da56d46c83fb4004202c42b/dataset
在这里插入图片描述
在这里插入图片描述
吴恩达机器学习课后作业--week3前馈神经网络_第1张图片

python代码实现:

import numpy as np
import scipy.io as io
from sklearn.metrics import classification_report  #sklearn是scikit-learn缩写,求评估率
#第一步 读取数据
data = io.loadmat('C:/Users/Administrator/Desktop/吴恩达机器学习数据集/week1/ex3data1.mat')
weight = io.loadmat('C:/Users/Administrator/Desktop/吴恩达机器学习数据集/week1/ex3weights.mat') #f反向传播求出的权重矩阵
theta1,theta2 = weight['Theta1'],weight['Theta2']
#题目中已给出theta1(25,401) theta2(10,26) 分别为隐藏层和输出层的theta
#theta矩阵的形状为(下层神经元个数,本层神经元个数+1),隐藏层仅一层,有25个神经元

#第二步  初始化数据
X = np.insert(data['X'],0,values=np.ones(data['X'].shape[0]),axis=1)#X增加一列1(5000,401)
X = np.matrix(X) #将X转化为矩阵
y = np.matrix(data['y'])
print("X,y的shape",X.shape, y.shape)

#第三步 设计sigmoid函数
def sigmoid(z):
    return 1/(1 + np.exp(-z))
a1 = X
z2 = a1 * theta1.T   #theta1为(25,401),X为(5000,401),z2为(5000,25)
a2 = sigmoid(z2)     #a2为(5000,25)
a2 = np.insert(a2, 0, values=np.ones(a2.shape[0]), axis=1)   #a2为(5000,26)
z3 = a2 * theta2.T   #z3为(5000,10)
a3 = sigmoid(z3)

#第四步 打印预测
y_pre = np.argmax(a3, axis=1) + 1    #argmax函数返回每一行10个数中最大值的索引,并加1,返回最大值
print(classification_report(y, y_pre))

吴恩达机器学习课后作业--week3前馈神经网络_第2张图片

你可能感兴趣的:(机器学习,神经网络,sklearn,机器学习)