UFLDL——Exercise: Softmax Regression (softmax回归)

实验要求可以参考deeplearning的tutorial,Exercise:Softmax Regression    ,softmax回归的原理可以参照之前Logistic and Softmax Regression (逻辑回归和Softmax回归)博文,本实验实现对手写数字0-9的识别(也就是分类)。

1. 神经网络结构:



2. 数据



UFLDL——Exercise: Softmax Regression (softmax回归)_第1张图片

3 过程:

之后的过程就是构建softmax回归的损失函数(loss function),通过BP算法计算偏导数,梯度检验,最后用L-BFGS算法进行优化,学习得到模型的参数。

4. 注意:

1.      在构造loss函数时,我们需要计算,如果该值比较大,指数函数会变得非常大,很有可能出现溢出(overflow)的情况。试验中,我们对每一个 减去最大的那个,是的最大值为0,这样就不会出现溢出的情况了。为什么可以这么做,证明如下。

 UFLDL——Exercise: Softmax Regression (softmax回归)_第2张图片

2.      梯度检测本身是一个非常耗时的过程,如果在6万个训练集上进行这个梯度检测,那将花去很长的时间。我们可以缩小训练集的大小,比如说10个,20个,如果在这个小的集上梯度检测的误差很小,锁门我们的BP实现是正确,通过这种方法可以大大缩短梯度检测时间。

5. 实验结果:


UFLDL——Exercise: Softmax Regression (softmax回归)_第3张图片


6. 部分代码


function [cost, grad] = softmaxCost(theta, numClasses, inputSize, lambda, data, labels)

% numClasses - the number of classes 
% inputSize - the size N of the input vector
% lambda - weight decay parameter
% data - the N x M input matrix, where each column data(:, i) corresponds to
%        a single test set
% labels - an M x 1 matrix containing the labels corresponding for the input data

% Unroll the parameters from theta
theta = reshape(theta, numClasses, inputSize);

numCases = size(data, 2);

groundTruth = full(sparse(labels, 1:numCases, 1));
cost = 0;

thetagrad = zeros(numClasses, inputSize);

%% ---------- YOUR CODE HERE --------------------------------------
%  Instructions: Compute the cost and gradient for softmax regression.
%                You need to compute thetagrad and cost.
%                The groundTruth matrix might come in handy.

A = theta*data;
M = bsxfun(@minus, A, max(A,[],1));
M = exp(M);
p = bsxfun(@rdivide,M,sum(M,1));

cost = -1/numCases * groundTruth(:)' * log(p(:)) + lambda /2 * theta(:)'* theta(:);

thetagrad = -1/numCases * (groundTruth - p)*data' + lambda * theta;

% ------------------------------------------------------------------
% Unroll the gradient matrices into a vector for minFunc
grad = [thetagrad(:)];
