最后为了能把训练集表示得更紧凑一点,我们会定义一个矩阵用大写的表示,它由输
入向量 (1)、 (2)等组成,如下图放在矩阵的列中,所以现在我们把 (1)作为第一列放在矩阵
中, (2)作为第二列, ()放到第列,然后我们就得到了训练集矩阵。所以这个矩阵有
列,是训练集的样本数量,然后这个矩阵的高度记为,注意有时候可能因为其他某些原
因,矩阵会由训练样本按照行堆叠起来而不是列,如下图所示: (1)的转置直到 ()的转
置,但是在实现神经网络的时候,使用左边的这种形式,会让整个实现的过程变得更加简单: