1、在实现前向传播和反向传播中使用的“cache”是什么?(D)
A.它用于跟踪我们正在搜索的超参数,以加速计算。
B.用于在训练期间缓存代价函数的中间值。
C.我们使用它传递反向传播中计算的变量到相应的前向传播步骤,它包含对于前向传播计算导数有用的变量。
D.我们使用它传递前向传播中计算的变量到相应的反向传播步骤,它包含对于反向传播计算导数有用的变量。
“缓存”记录来自正向传播单元的值,并将其发送到反向传播单元,这是链式求导的需要。
2、以下哪些是“超参数”?(ABEF)
A.隐藏层的大小
B.神经网络的层数
C.激活值
D.权重
E.学习率
F.迭代次数
G.偏置
3、下列哪个说法是正确的?(A)
A.神经网络的更深层通常比前面层计算更复杂的输入特征。
B.神经网络的前面层通常比更深层计算更复杂的输入特性。
4、向量化允许在L层神经网络中计算前向传播,而不需要在层(l = 1,2,…,L)上显式的使用for-loop(或任何其他显式迭代循环),正确吗?(B)
A.正确
B.错误
正向传播是层层传递的,尽管对于浅层网络,我们可能只需写下:
(a[2]=g[2](z[2])、z[2]=w[2]a[1]+b[2]…)
但我们不能避免在层上进行for循环迭代:
(a[l]=g[l](z[l])、z[l]=w[l]a[l−1]+b[l]…)
备注:上面的[]均为上标。
5、假设我们将n[l]的值存储在名为layers的数组中,如下所示:layer_dims = [n_x,4,3,2,1]。 因此,第1层有四个隐藏单元,第2层有三个隐藏单元,依此类推。 您可以使用哪个for循环初始化模型参数?(D)
A.
for(i in range(1, len(layer_dims)/2)):
parameter[‘W’ + str(i)] = np.random.randn(layers[i], layers[i-1])) * 0.01
parameter[‘b’ + str(i)] = np.random.randn(layers[i], 1) * 0.01
B.
for(i in range(1, len(layer_dims)/2)):
parameter[‘W’ + str(i)] = np.random.randn(layers[i], layers[i-1])) * 0.01
parameter[‘b’ + str(i)] = np.random.randn(layers[i-1], 1) * 0.01
C.
for(i in range(1, len(layer_dims))):
parameter[‘W’ + str(i)] = np.random.randn(layers[i-1], layers[i])) * 0.01
parameter[‘b’ + str(i)] = np.random.randn(layers[i], 1) * 0.01
D.
for(i in range(1, len(layer_dims))):
parameter[‘W’ + str(i)] = np.random.randn(layers[i], layers[i-1])) * 0.01
parameter[‘b’ + str(i)] = np.random.randn(layers[i], 1) * 0.01
6、下面关于神经网络的说法正确的是: neuralNetworkGraph
A.总层数L为4,隐藏层层数为3。
B.总层数L为3,隐藏层层数为3。
C.总层数L为4,隐藏层层数为4。
D.总层数L为5,隐藏层层数为4。
网络层数按隐藏层数+1计算。输入和输出层不算作隐藏层。
7、在前向传播期间,在层l的前向传播函数中,您需要知道层l中的激活函数(Sigmoid,tanh,ReLU等)是什么, 在反向传播期间,相应的反向传播函数也需要知道第l层的激活函数是什么,因为梯度是根据它来计算的。这样描述正确吗?(A)
A.正确
B.错误
不同激活函数有不同的导数。在反向传播期间,需要知道正向传播中使用哪种激活函数才能计算正确的导数。
8、有一些功能具有以下属性:
(i) 利用浅网络电路计算一个函数时,需要一个大网络(我们通过网络中的逻辑门数量来度量大小),但是(ii)使用深网络电路来计算它,只需要一个指数较小的网络。真/假?(A)
A.正确
B.错误
深层的网络隐藏单元数量相对较少,隐藏层数目较多,
如果浅层的网络想要达到同样的计算结果则需要指数级增长的单元数量才能达到。
9、在2层隐层神经网络中,下列哪个说法是正确的? (A,B,E,H,J,K)
A.W[1] 的维度为 (4, 4)
B.b[1] 的维度为 (4, 1)
C.W[1]的维度为 (3, 4)
D.b[1] 的维度为 (3, 1)
E.W[2]的维度为 (3, 4)
F.b[2] 的维度为 (1, 1)
G.W[2]的维度为 (3, 1)
H.b[2] 的维度为 (3, 1)
I.W[3]的维度为 (3, 1)
J.b[3] 的维度为 (1, 1)
K.W[3]的维度为 (1, 3)
L.b[3] 的维度为 (3, 1)
一般来说W[l]的形状是(n[l],n[l-1]),b[l]的形状是(n[l],1)
10、前面的问题使用了一个特定的网络,一般情况下, 与层l有关的权重矩阵W[l]的维数是多少?(A)
A.W[l]的维度是 (n[l], n[l−1])
B.W[l]的维度是 (n[l-1], n[l])
C.W[l]的维度是 (n[l+1], n[l])
D.W[l]的维度是 (n[l], n[l+1])