KQ.

“吴恩达深度学习”第三周编程代码汇总（实现一个神经网络）

前言

这篇博客主要记录"吴恩达depplearning系列课程"第三周编程作业代码+自己的补充理解的相关内容，以作为学习记录。学习过程中借鉴了各位大佬的代码，想要追根溯源的朋友可以看这几位大佬的博客：大树先生的博客(英文版)，何宽（中文版）
作为初学者，本文的代码是自己当前能做到的”终极满意缝合怪“，同时部分原搬的代码也加了很多注释，便于理解。

第一部分:需要准备的Packages
第二部分：加载和查看数据集
第三部分:查看简单的Logistic回归的分类效果
第四部分:搭建神经网络
- 4.1-定义神经网络结构
- 4.2-初始化模型参数
- 4.3-构造回路
- 4.4-计算成本函数
- 4.5-向后传播
- 4.6-更新参数
- 4.7-整合
- 4.8-预测
- 4.9-运行代码
- 4.10探索更改隐藏层节点数量
- 4.10【选做】探索更改隐藏层节点数量
第五部分:完整代码
第六部分:testCases.py文件内容
第七部分:planar_utils.py文件内容

第一部分:需要准备的Packages

让我们首先导入此任务期间需要的所有包。

numpy是使用Python进行科学计算的基本包。
sklearn为数据挖掘和数据分析提供了简单高效的工具。
matplotlib是一个用Python绘制图形的库。
testCases_v2提供了一些测试示例来评估函数的正确性（该文件放于文末第六部分）
planar_utils提供了用于此赋值的各种有用函数（该文件内容放于文末第七部分）

import numpy as np
import matplotlib.pyplot as plt
from testCases import *
import sklearn
import sklearn.datasets
import sklearn.linear_model
from planar_utils import plot_decision_boundary, sigmoid, load_planar_dataset, load_extra_datasets

np.random.seed(1) #设置一个固定的随机种子，以保证接下来的步骤中我们的结果是一致的。

第2部分:加载和查看数据集

首先，我们来看看我们将要使用的数据集，下面的代码会将一个花的图案的2类数据集加载到变量X和Y中。

X, Y = load_planar_dataset()
plt.scatter(X[0, :], X[1, :], c=Y, s=40, cmap=plt.cm.Spectral) #绘制散点图

# 上一语句如出现问题，请使用下面的语句：
plt.scatter(X[0, :], X[1, :], c=np.squeeze(Y), s=40, cmap=plt.cm.Spectral) #绘制散点图

使用matplotlib可视化数据集。数据看起来像一朵“花”，有一些红色（标签y=0）和一些蓝色（y=1）点。你的目标是建立一个模型来适应这些数据。

我们现在有：

包含特征的numpy数组（矩阵）X（x1，x2）
包含标签的numpy数组（向量）(红色：0, 蓝色：1).

首先让我们更好地了解我们的数据是什么样的。
练习：你有多少个训练例子？另外，变量X和Y的形状是什么？
提示：如何获得numpy数组的形状？

shape_X = X.shape
shape_Y = Y.shape
m = Y.shape[1]  # 训练集里面的数量

print ("X的维度为: " + str(shape_X))
print ("Y的维度为: " + str(shape_Y))
print ("数据集里面的数据有：" + str(m) + " 个")

运行结果为：

X的维度为: (2, 400)
Y的维度为: (1, 400)
数据集里面的数据有：400 个

第3部分:查看简单的Logistic回归的分类效果

在建立一个完整的神经网络之前，让我们先看看logistic回归如何处理这个问题。您可以使用sklearn的内置函数来实现这一点。运行下面的代码在数据集上训练logistic回归分类器。

#训练logistic回归分类器
clf = sklearn.linear_model.LogisticRegressionCV()
clf.fit(X.T,Y.T)

然后发现打印如下信息：

C:\Users\17876\AppData\Roaming\Python\Python38\site-packages\sklearn\utils\validation.py:63: DataConversionWarning: A column-vector y was passed when a 1d array was expected. Please change the shape of y to (n_samples, ), for example using ravel().
  return f(*args, **kwargs)

现在可以绘制这些模型的决策边界。运行下面的代码。

plot_decision_boundary(lambda x: clf.predict(x), X, Y) #绘制决策边界
plt.title("Logistic Regression") #图标题
LR_predictions  = clf.predict(X.T) #预测结果
print ("逻辑回归的准确性： %d " % float((np.dot(Y, LR_predictions) + 
		np.dot(1 - Y,1 - LR_predictions)) / float(Y.size) * 100) +
       "% " + "(正确标记的数据点所占的百分比)")

打印内容：

逻辑回归的准确性： 47 % (正确标记的数据点所占的百分比)

就像这样：

这一步修改代码为：

clf = sklearn.linear_model.LogisticRegressionCV()
clf.fit(X.T,Y.T)
plot_decision_boundary(lambda x: predict(parameters,x.T), X, np.squeeze(Y)) #绘制决策边界
plt.title("Decision Boundary for hidden layer size " + str(4))
LR_predictions  = clf.predict(X.T) #预测结果
print ("逻辑回归的准确性： %d " % float((np.dot(Y, LR_predictions) +
		np.dot(1 - Y,1 - LR_predictions)) / float(Y.size) * 100) +
       "% " + "(正确标记的数据点所占的百分比)")
plt.show()

准确性只有47%的原因是数据集不是线性可分的，所以逻辑回归表现不佳，现在我们正式开始构建神经网络
plot_decision_boundary:

def plot_decision_boundary(model, X, y):
    # 设置最大值和最小值，并给它们填充变量
    x_min, x_max = X[0, :].min() - 1, X[0, :].max() + 1
    y_min, y_max = X[1, :].min() - 1, X[1, :].max() + 1
    h = 0.01
    # 生成一个点的网格，它们之间的距离为h
    xx, yy = np.meshgrid(np.arange(x_min, x_max, h), np.arange(y_min, y_max, h))
    # 预测整个网格的函数值
    Z = model(np.c_[xx.ravel(), yy.ravel()])
    Z = Z.reshape(xx.shape)
    # 绘制等高线和训练示例
    plt.contourf(xx, yy, Z, cmap=plt.cm.Spectral)
    plt.ylabel('x2')
    plt.xlabel('x1')
    plt.scatter(X[0, :], X[1, :], c=y, cmap=plt.cm.Spectral)

第四部分:搭建神经网络

Logistic回归在“花数据集”上效果不佳。我们要训练一个只有一个隐藏层的神经网络。
模型如下：

数学表达式：

根据所有示例的预测，还可以按如下方式计算成本J：

提醒：建立神经网络的一般方法是：

定义神经网络结构（输入单元的#和隐藏单元的#等）。
初始化模型参数
构造回路：
- 实现前向传播
- 计算损失
- 实现反向传播以获得梯度
- 更新参数（梯度下降）

总之要将它们合并到一个我们称为nn_model（）的函数中。一旦构建了nn_model（）并学习了正确的参数，就可以对新数据进行预测。

4.1-定义神经网络结构

在构建神经网络之前，我们要先把神经网络的结构定义好：
定义三个变量：

n_x：输入层的数量
n_h：隐藏层的数量（设置为4）
n_y：输出层的数量

**提示：**使用X和Y的形状来查找n_x和n_y。另外，假设规定隐藏层的大小为4，即一层隐藏层有四个隐藏单元。

def layer_sizes(X , Y):
    """
    参数：
     X - 输入数据集,维度为（输入的数量，训练/测试的数量）
     Y - 标签，维度为（输出的数量，训练/测试数量）
    
    返回：
     n_x - 输入层的数量
     n_h - 隐藏层的数量
     n_y - 输出层的数量
    """
    n_x = X.shape[0] #输入层
    n_h = 4 #，隐藏层，硬编码为4
    n_y = Y.shape[0] #输出层
    
    return (n_x,n_h,n_y)

测试代码：

import numpy as np
import matplotlib.pyplot as plt
from testCases import *
import sklearn
import sklearn.datasets
import sklearn.linear_model
from planar_utils import plot_decision_boundary, sigmoid, load_planar_dataset, load_extra_datasets
np.random.seed(1) #设置一个固定的随机种子，以保证接下来的步骤中我们的结果是一致的。
X, Y = load_planar_dataset()


def layer_sizes(X, Y):
    """
    参数：
     X - 输入数据集,维度为（输入的数量，训练/测试的数量）
     Y - 标签，维度为（输出的数量，训练/测试数量）

    返回：
     n_x - 输入层的数量
     n_h - 隐藏层的数量
     n_y - 输出层的数量
    """
    n_x = X.shape[0]  # 输入层
    n_h = 4  # ，隐藏层，硬编码为4
    n_y = Y.shape[0]  # 输出层

    return (n_x, n_h, n_y)

#测试layer_sizes
print("=========================测试layer_sizes=========================")
X_asses , Y_asses = layer_sizes_test_case()
(n_x,n_h,n_y) =  layer_sizes(X_asses,Y_asses)
print("输入层的节点数量为: n_x = " + str(n_x))
print("隐藏层的节点数量为: n_h = " + str(n_h))
print("输出层的节点数量为: n_y = " + str(n_y))

运行结果：

=========================测试layer_sizes=========================
输入层的节点数量为: n_x = 5
隐藏层的节点数量为: n_h = 4
输出层的节点数量为: n_y = 2

4.2-初始化模型参数

练习：实现函数initialize\u parameters（）。
tips：

确保参数大小正确。如果需要，请参考上面的神经网络图。
需要使用随机值初始化权重矩阵。
- np.random.randn（a，b）*0.01随机初始化维度为（a，b）的矩阵，将偏移向量初始化为零。
- np.zeros（（a，b））用零初始化形状（a，b）的矩阵。

def initialize_parameters( n_x , n_h ,n_y):
    """
    参数：
        n_x - 输入层节点的数量
        n_h - 隐藏层节点的数量
        n_y - 输出层节点的数量
    
    返回：
        parameters - 包含参数的字典：
        W1 - 权重矩阵,维度为（n_h，n_x）
        b1 - 偏向量，维度为（n_h，1）
        W2 - 权重矩阵，维度为（n_y，n_h）
        b2 - 偏向量，维度为（n_y，1）

    """
    np.random.seed(2) #指定一个随机种子，以便你的输出与我们的一样。
    W1 = np.random.randn(n_h,n_x) * 0.01
    b1 = np.zeros(shape=(n_h, 1))
    W2 = np.random.randn(n_y,n_h) * 0.01
    b2 = np.zeros(shape=(n_y, 1))
    
    #使用断言确保我的数据格式是正确的
    assert(W1.shape == ( n_h , n_x ))
    assert(b1.shape == ( n_h , 1 ))
    assert(W2.shape == ( n_y , n_h ))
    assert(b2.shape == ( n_y , 1 ))
    
    parameters = {"W1" : W1,
	              "b1" : b1,
	              "W2" : W2,
	              "b2" : b2 }
    
    return parameters

测试代码：

#测试initialize_parameters
print("=========================测试initialize_parameters=========================")    
n_x , n_h , n_y = initialize_parameters_test_case()
parameters = initialize_parameters(n_x , n_h , n_y)
print("W1 = " + str(parameters["W1"]))
print("b1 = " + str(parameters["b1"]))
print("W2 = " + str(parameters["W2"]))
print("b2 = " + str(parameters["b2"]))

输出结果：

=========================测试initialize_parameters=========================
W1 = [[-0.00416758 -0.00056267]
 [-0.02136196  0.01640271]
 [-0.01793436 -0.00841747]
 [ 0.00502881 -0.01245288]]
b1 = [[ 0.]
 [ 0.]
 [ 0.]
 [ 0.]]
W2 = [[-0.01057952 -0.00909008  0.00551454  0.02292208]]
b2 = [[ 0.]]

4.3-构造回路

问题：实现前向传播

构造函数forward_propagation（）。
tips：

可以使用函数sigmoid（）。
你可以使用这个函数np.tanh(). 它是numpy库的一部分。

执行的步骤包括：

①使用字典类型的parameters（也就是**initializa_parameters( )**的输出）检索每个参数。
②实现正向传播。计算Z[1]、A[1]、Z[2]和A[2]（训练集中所有示例的预测向量）。
③反向传播所需的值存储在“cache”中，cache将作为反向传播函数的输入。

函数forward_propagation（）的实现：

def forward_propagation( X , parameters ):
    """
    参数：
         X - 维度为（n_x，m）的输入数据。
         parameters - 初始化函数（initialize_parameters）的输出
    
    返回：
         A2 - 使用sigmoid()函数计算的第二次激活后的数值
         cache - 包含“Z1”，“A1”，“Z2”和“A2”的字典类型变量
     """
    W1 = parameters["W1"]
    b1 = parameters["b1"]
    W2 = parameters["W2"]
    b2 = parameters["b2"]
    #前向传播计算A2
    Z1 = np.dot(W1 , X) + b1
    A1 = np.tanh(Z1)
    Z2 = np.dot(W2 , A1) + b2
    A2 = sigmoid(Z2)
    #使用断言确保我的数据格式是正确的
    assert(A2.shape == (1,X.shape[1]))
    cache = {"Z1": Z1,
             "A1": A1,
             "Z2": Z2,
             "A2": A2}
    
    return (A2, cache)

测试代码：

#测试forward_propagation
print("=========================测试forward_propagation=========================")
X_assess, parameters = forward_propagation_test_case()
A2, cache = forward_propagation(X_assess, parameters)
print(np.mean(cache["Z1"]), np.mean(cache["A1"]), np.mean(cache["Z2"]), np.mean(cache["A2"]))

输出结果：

=========================测试forward_propagation=========================
-0.000499755777742 -0.000496963353232 0.000438187450959 0.500109546852

4.4-计算成本函数

练习：实现compute_cost()来计算代价J的值。

交叉熵损失的实现方法有很多种，比如下述所示：

logprobs = np.multiply(np.log(A2),Y)
cost = - np.sum(logprobs)                # 不需要使用循环就可以直接算出来。

#构建计算成本的函数compute_cost()
def compute_cost(A2,Y,parameters):
    """
    按照上方提供的计算方程算出交叉熵成本，
    
    参数：
         A2 - 使用sigmoid()函数计算的第二次激活后的数值
         Y - "True"标签向量,维度为（1，数量）
         parameters - 一个包含W1，B1，W2和B2的字典类型的变量
    
    返回：
         成本 - 交叉熵成本给出方程（13）
    """
    
    m = Y.shape[1]
    W1 = parameters["W1"]
    W2 = parameters["W2"]
    
    #计算成本
    logprobs = np.multiply(np.log(A2), Y) + np.multiply((1 - Y), np.log(1 - A2))
    cost = -(1.0/m)*np.sum(logprobs)
    
    cost = np.squeeze(cost)
    #确保成本是我们期望的维度。
    assert(isinstance(cost,float))
    
    return cost

测试代码：

#测试compute_cost
print("=========================测试compute_cost=========================") 
A2 , Y_assess , parameters = compute_cost_test_case()
print("cost = " + str(compute_cost(A2,Y_assess,parameters)))

输出结果：

=========================测试compute_cost=========================
cost = 0.6929198937761266

使用前向传播期间计算的cache，现在可以利用它实现后向传播。

4.5-向后传播

反向传播通常是深度学习中最难(最数学化)的部分。为了帮助你们，这是关于反向传播的幻灯片。您将需要使用这张幻灯片右边的6个方程，因为您正在构建一个向量化的实现。

为了计算dZ^[1]，需要计算 g^[1]′(Z^[1])；
g^[1]’(……）是tanh激活函数，如果a = g^[1]’(z^[1] ) ,则g^[1]′(z)= 1-a²。
所以我们需要使用 (1 - np.power(A1, 2))来计算g^[1]′ (Z^[1]) 。

def backward_propagation(parameters,cache,X,Y):
    """
    使用上述说明搭建反向传播函数。
    
    参数：
     parameters - 包含我们的参数的一个字典类型的变量。
     cache - 包含“Z1”，“A1”，“Z2”和“A2”的字典类型的变量。
     X - 输入数据，维度为（2，数量）
     Y - “True”标签，维度为（1，数量）
    
    返回：
     grads - 包含W和b的导数的一个字典类型的变量。
    """
    m = X.shape[1]
    
    W1 = parameters["W1"]
    W2 = parameters["W2"]
    
    A1 = cache["A1"]
    A2 = cache["A2"]
    
    dZ2= A2 - Y
    dW2 = (1 / m) * np.dot(dZ2, A1.T)
    db2 = (1 / m) * np.sum(dZ2, axis=1, keepdims=True)
    dZ1 = np.multiply(np.dot(W2.T, dZ2), 1 - np.power(A1, 2))
    dW1 = (1 / m) * np.dot(dZ1, X.T)
    db1 = (1 / m) * np.sum(dZ1, axis=1, keepdims=True)
    grads = {"dW1": dW1,
             "db1": db1,
             "dW2": dW2,
             "db2": db2 }
    
    return grads

测试代码：

#测试backward_propagation
print("=========================测试backward_propagation=========================")
parameters, cache, X_assess, Y_assess = backward_propagation_test_case()

grads = backward_propagation(parameters, cache, X_assess, Y_assess)
print ("dW1 = "+ str(grads["dW1"]))
print ("db1 = "+ str(grads["db1"]))
print ("dW2 = "+ str(grads["dW2"]))
print ("db2 = "+ str(grads["db2"]))

输出结果：

=========================测试backward_propagation=========================
dW1 = [[ 0.01018708 -0.00708701]
 [ 0.00873447 -0.0060768 ]
 [-0.00530847  0.00369379]
 [-0.02206365  0.01535126]]
db1 = [[-0.00069728]
 [-0.00060606]
 [ 0.000364  ]
 [ 0.00151207]]
dW2 = [[ 0.00363613  0.03153604  0.01162914 -0.01318316]]
db2 = [[ 0.06589489]]

4.6-更新参数

实现更新规则需要使用梯度下降法。而为了更新(W1, b1, W2, b2)，必须使用(dW1, db1, dW2, db2)。
一般梯度下降规则（α是学习速率，θ代表一个参数）:

我们需要选择一个良好的学习速率，我们可以看一下下面这两个图(由Adam Harley提供)
学习速率好的(收敛)

学习速率差的(发散)梯度下降算法：

图片由Adam Harley提供。

def update_parameters(parameters,grads,learning_rate=1.2):
    """
    使用上面给出的梯度下降更新规则更新参数
    
    参数：
     parameters - 包含参数的字典类型的变量。
     grads - 包含导数值的字典类型的变量。
     learning_rate - 学习速率
    
    返回：
     parameters - 包含更新参数的字典类型的变量。
    """
    W1,W2 = parameters["W1"],parameters["W2"]
    b1,b2 = parameters["b1"],parameters["b2"]
    
    dW1,dW2 = grads["dW1"],grads["dW2"]
    db1,db2 = grads["db1"],grads["db2"]
    
    W1 = W1 - learning_rate * dW1
    b1 = b1 - learning_rate * db1
    W2 = W2 - learning_rate * dW2
    b2 = b2 - learning_rate * db2
    
    parameters = {"W1": W1,
                  "b1": b1,
                  "W2": W2,
                  "b2": b2}
    
    return parameters

测试代码：

测试一下update_parameters():

#测试update_parameters
print("=========================测试update_parameters=========================")
parameters, grads = update_parameters_test_case()
parameters = update_parameters(parameters, grads)

print("W1 = " + str(parameters["W1"]))
print("b1 = " + str(parameters["b1"]))
print("W2 = " + str(parameters["W2"]))
print("b2 = " + str(parameters["b2"]))

测试结果如下：



=========================测试update_parameters=========================
W1 = [[-0.00643025  0.01936718]
 [-0.02410458  0.03978052]
 [-0.01653973 -0.02096177]
 [ 0.01046864 -0.05990141]]
b1 = [[ -1.02420756e-06]
 [  1.27373948e-05]
 [  8.32996807e-07]
 [ -3.20136836e-06]]
W2 = [[-0.01041081 -0.04463285  0.01758031  0.04747113]]
b2 = [[ 0.00010457]]

4.7-整合

我们现在把上面的东西整合到nn_model()中，神经网络模型必须以正确的顺序使用先前的功能。

def nn_model(X,Y,n_h,num_iterations,print_cost=False):
    """
    参数：
        X - 数据集,维度为（2，示例数）
        Y - 标签，维度为（1，示例数）
        n_h - 隐藏层的数量
        num_iterations - 梯度下降循环中的迭代次数
        print_cost - 如果为True，则每1000次迭代打印一次成本数值
    
    返回：
        parameters - 模型学习的参数，它们可以用来进行预测。
     """
     
    np.random.seed(3) #指定随机种子
    n_x = layer_sizes(X, Y)[0]
    n_y = layer_sizes(X, Y)[2]
    
    parameters = initialize_parameters(n_x,n_h,n_y)
    W1 = parameters["W1"]
    b1 = parameters["b1"]
    W2 = parameters["W2"]
    b2 = parameters["b2"]
    
    for i in range(num_iterations):
        A2 , cache = forward_propagation(X,parameters)
        cost = compute_cost(A2,Y,parameters)
        grads = backward_propagation(parameters,cache,X,Y)
        parameters = update_parameters(parameters,grads,learning_rate = 0.5)
        
        if print_cost:
            if i%1000 == 0:
                print("第 ",i," 次循环，成本为："+str(cost))
    return parameters

测试nn_model():

#测试nn_model
print("=========================测试nn_model=========================")
X_assess, Y_assess = nn_model_test_case()

parameters = nn_model(X_assess, Y_assess, 4, num_iterations=10000, print_cost=True)
print("W1 = " + str(parameters["W1"]))
print("b1 = " + str(parameters["b1"]))
print("W2 = " + str(parameters["W2"]))
print("b2 = " + str(parameters["b2"]))

输出：

W1 = [[-3.89167767  4.77541602]
 [-6.77960338  1.20272585]
 [-3.88338966  4.78028666]
 [ 6.77958203 -1.20272574]]
b1 = [[ 2.11530892]
 [ 3.41221357]
 [ 2.11585732]
 [-3.41221322]]
W2 = [[-2512.9093032  -2502.70799785 -2512.01655969  2502.65264416]]
b2 = [[-22.29071761]]

参数更新完了我们就可以来进行预测了。

4.8-预测

通过构建predict()来使用您的模型进行预测。并使用正向传播来预测结果。
提示:
predictions = Ypredict

=1{activation >0.5}
=0{if 0.5>activation>0}
例如，如果您希望根据阈值将矩阵X的条目设置为0和1，您可以这样做:X_new = (X > threshold)

def predict(parameters,X):
    """
    使用学习的参数，为X中的每个示例预测一个类
    
    参数：
		parameters - 包含参数的字典类型的变量。
	    X - 输入数据（n_x，m）
    
    返回
		predictions - 我们模型预测的向量（红色：0 /蓝色：1）
     
     """
    A2 , cache = forward_propagation(X,parameters)
    predictions = np.round(A2)
    
    return predictions

#测试predict
print("=========================测试predict=========================")

parameters, X_assess = predict_test_case()

predictions = predict(parameters, X_assess)
print("预测的平均值 = " + str(np.mean(predictions)))

=========================测试predict=========================
预测的平均值 = 0.666666666667

4.9-运行代码

parameters = nn_model(X, Y, n_h = 4, num_iterations=10000, print_cost=True)

#绘制边界
plot_decision_boundary(lambda x: predict(parameters, x.T), X, Y)
plt.title("Decision Boundary for hidden layer size " + str(4))
plt.show()
predictions = predict(parameters, X)
print ('准确率: %d' % float((np.dot(Y, predictions.T) + np.dot(1 - Y, 1 - predictions.T)) / float(Y.size) * 100) + '%')

第  0  次循环，成本为：0.6930480201239823
第  1000  次循环，成本为：0.3098018601352803
第  2000  次循环，成本为：0.2924326333792647
第  3000  次循环，成本为：0.2833492852647411
第  4000  次循环，成本为：0.27678077562979253
第  5000  次循环，成本为：0.2634715508859307
第  6000  次循环，成本为：0.24204413129940758
第  7000  次循环，成本为：0.23552486626608762
第  8000  次循环，成本为：0.23140964509854278
第  9000  次循环，成本为：0.22846408048352362
准确率: 90%

4.10 更改隐藏层节点数量

我们上面的实验把隐藏层定为4个节点，现在我们更改隐藏层里面的节点数量，看一看节点数量是否会对结果造成影响。

plt.figure(figsize=(16, 32))
hidden_layer_sizes = [1, 2, 3, 4, 5, 20, 50] #隐藏层数量
for i, n_h in enumerate(hidden_layer_sizes):
    plt.subplot(5, 2, i + 1)
    plt.title('Hidden Layer of size %d' % n_h)
    parameters = nn_model(X, Y, n_h, num_iterations=5000)
    plot_decision_boundary(lambda x: predict(parameters, x.T), X, Y)
    predictions = predict(parameters, X)
    accuracy = float((np.dot(Y, predictions.T) + np.dot(1 - Y, 1 - predictions.T)) / float(Y.size) * 100)
    print ("隐藏层的节点数量： {}  ，准确率: {} %".format(n_h, accuracy))
    pass
plt.show()

打印结果

D:\Adobe\Anaconda3\python.exe D:/code/dataClassification/code/test.py
第  0  次循环，成本为：0.6930480201239823
第  1000  次循环，成本为：0.3098018601352803
第  2000  次循环，成本为：0.2924326333792647
第  3000  次循环，成本为：0.2833492852647411
第  4000  次循环，成本为：0.27678077562979253
第  5000  次循环，成本为：0.2634715508859307
第  6000  次循环，成本为：0.24204413129940758
第  7000  次循环，成本为：0.23552486626608762
第  8000  次循环，成本为：0.23140964509854278
第  9000  次循环，成本为：0.22846408048352362
隐藏层的节点数量： 1  ，准确率: 67.25 %
隐藏层的节点数量： 2  ，准确率: 66.5 %
隐藏层的节点数量： 3  ，准确率: 89.25 %
隐藏层的节点数量： 4  ，准确率: 90.0 %
隐藏层的节点数量： 5  ，准确率: 89.75 %
隐藏层的节点数量： 20  ，准确率: 90.0 %
隐藏层的节点数量： 50  ，准确率: 89.75 %

较大的模型（具有更多隐藏单元）能够更好地适应训练集，直到最终的最大模型过度拟合数据。
最好的隐藏层大小似乎在n_h = 5附近。实际上，这里的值似乎很适合数据，而且不会引起过度拟合。
我们还将在后面学习有关正则化的知识，它允许我们使用非常大的模型（如n_h = 50），而不会出现太多过度拟合。

4.11【选做】

当改变sigmoid激活或ReLU激活的tanh激活时会发生什么？
改变learning_rate的数值会发生什么
如果我们改变数据集呢？

# 数据集
noisy_circles, noisy_moons, blobs, gaussian_quantiles, no_structure = load_extra_datasets()

datasets = {"noisy_circles": noisy_circles,
            "noisy_moons": noisy_moons,
            "blobs": blobs,
            "gaussian_quantiles": gaussian_quantiles}

dataset = "noisy_moons"

X, Y = datasets[dataset]
X, Y = X.T, Y.reshape(1, Y.shape[0])

if dataset == "blobs":
    Y = Y % 2

plt.scatter(X[0, :], X[1, :], c=Y, s=40, cmap=plt.cm.Spectral)

#上一语句如出现问题请使用下面的语句：
plt.scatter(X[0, :], X[1, :], c=np.squeeze(Y), s=40, cmap=plt.cm.Spectral)

第五部分:完整代码

import numpy as np
import matplotlib.pyplot as plt
from testCases import *
import sklearn
import sklearn.datasets
import sklearn.linear_model
from planar_utils import plot_decision_boundary, sigmoid, load_planar_dataset, load_extra_datasets
np.random.seed(1) #设置一个固定的随机种子，以保证接下来的步骤中我们的结果是一致的。
X, Y = load_planar_dataset()

def layer_sizes(X, Y):
    """
    参数：
     X - 输入数据集,维度为（输入的数量，训练/测试的数量）
     Y - 标签，维度为（输出的数量，训练/测试数量）

    返回：
     n_x - 输入层的数量
     n_h - 隐藏层的数量
     n_y - 输出层的数量
    """
    n_x = X.shape[0]  # 输入层
    n_h = 4  # ，隐藏层，硬编码为4
    n_y = Y.shape[0]  # 输出层

    return (n_x, n_h, n_y)
def initialize_parameters(n_x, n_h, n_y):
    """
    参数：
        n_x - 输入层节点的数量
        n_h - 隐藏层节点的数量
        n_y - 输出层节点的数量

    返回：
        parameters - 包含参数的字典：
            W1 - 权重矩阵,维度为（n_h，n_x）
            b1 - 偏向量，维度为（n_h，1）
            W2 - 权重矩阵，维度为（n_y，n_h）
            b2 - 偏向量，维度为（n_y，1）

    """
    np.random.seed(2)  # 指定一个随机种子，以便你的输出与我们的一样。
    W1 = np.random.randn(n_h, n_x) * 0.01
    b1 = np.zeros(shape=(n_h, 1))
    W2 = np.random.randn(n_y, n_h) * 0.01
    b2 = np.zeros(shape=(n_y, 1))

    # 使用断言确保我的数据格式是正确的
    assert (W1.shape == (n_h, n_x))
    assert (b1.shape == (n_h, 1))
    assert (W2.shape == (n_y, n_h))
    assert (b2.shape == (n_y, 1))

    parameters = {"W1": W1,
                  "b1": b1,
                  "W2": W2,
                  "b2": b2}

    return parameters
def forward_propagation(X, parameters):
    """
    参数：
         X - 维度为（n_x，m）的输入数据。
         parameters - 初始化函数（initialize_parameters）的输出

    返回：
         A2 - 使用sigmoid()函数计算的第二次激活后的数值
         cache - 包含“Z1”，“A1”，“Z2”和“A2”的字典类型变量
     """
    W1 = parameters["W1"]
    b1 = parameters["b1"]
    W2 = parameters["W2"]
    b2 = parameters["b2"]
    # 前向传播计算A2
    Z1 = np.dot(W1, X) + b1
    A1 = np.tanh(Z1)
    Z2 = np.dot(W2, A1) + b2
    A2 = sigmoid(Z2)
    # 使用断言确保我的数据格式是正确的
    assert (A2.shape == (1, X.shape[1]))
    cache = {"Z1": Z1,
             "A1": A1,
             "Z2": Z2,
             "A2": A2}

    return (A2, cache)
def compute_cost(A2, Y, parameters):
    """
    计算方程（6）中给出的交叉熵成本，

    参数：
         A2 - 使用sigmoid()函数计算的第二次激活后的数值
         Y - "True"标签向量,维度为（1，数量）
         parameters - 一个包含W1，B1，W2和B2的字典类型的变量

    返回：
         成本 - 交叉熵成本给出方程（13）
    """

    m = Y.shape[1]
    W1 = parameters["W1"]
    W2 = parameters["W2"]

    # 计算成本
    logprobs = np.multiply(np.log(A2),Y) + np.multiply(np.log(1-A2), (1-Y))
    cost = -(1.0 / m) * np.sum(logprobs)
    cost = np.squeeze(cost)

    assert (isinstance(cost, float))

    return cost
def backward_propagation(parameters, cache, X, Y):
    """
    使用上述说明搭建反向传播函数。

    参数：
     parameters - 包含我们的参数的一个字典类型的变量。
     cache - 包含“Z1”，“A1”，“Z2”和“A2”的字典类型的变量。
     X - 输入数据，维度为（2，数量）
     Y - “True”标签，维度为（1，数量）

    返回：
     grads - 包含W和b的导数一个字典类型的变量。
    """
    m = X.shape[1]

    W1 = parameters["W1"]
    W2 = parameters["W2"]

    A1 = cache["A1"]
    A2 = cache["A2"]

    dZ2 = A2 - Y
    dW2 = (1 / m) * np.dot(dZ2, A1.T)
    db2 = (1 / m) * np.sum(dZ2, axis=1, keepdims=True)
    dZ1 = np.multiply(np.dot(W2.T, dZ2), 1 - np.power(A1, 2))
    dW1 = (1 / m) * np.dot(dZ1, X.T)
    db1 = (1 / m) * np.sum(dZ1, axis=1, keepdims=True)
    grads = {"dW1": dW1,
             "db1": db1,
             "dW2": dW2,
             "db2": db2}

    return grads
def update_parameters(parameters, grads, learning_rate=1.2):
    """
    使用上面给出的梯度下降更新规则更新参数

    参数：
     parameters - 包含参数的字典类型的变量。
     grads - 包含导数值的字典类型的变量。
     learning_rate - 学习速率

    返回：
     parameters - 包含更新参数的字典类型的变量。
    """
    W1, W2 = parameters["W1"], parameters["W2"]
    b1, b2 = parameters["b1"], parameters["b2"]

    dW1, dW2 = grads["dW1"], grads["dW2"]
    db1, db2 = grads["db1"], grads["db2"]

    W1 = W1 - learning_rate * dW1
    b1 = b1 - learning_rate * db1
    W2 = W2 - learning_rate * dW2
    b2 = b2 - learning_rate * db2

    parameters = {"W1": W1,
                  "b1": b1,
                  "W2": W2,
                  "b2": b2}

    return parameters

def nn_model(X, Y, n_h, num_iterations, print_cost=False):
    """
    参数：
        X - 数据集,维度为（2，示例数）
        Y - 标签，维度为（1，示例数）
        n_h - 隐藏层的数量
        num_iterations - 梯度下降循环中的迭代次数
        print_cost - 如果为True，则每1000次迭代打印一次成本数值

    返回：
        parameters - 模型学习的参数，它们可以用来进行预测。
     """

    np.random.seed(3)  # 指定随机种子
    n_x = layer_sizes(X, Y)[0]
    n_y = layer_sizes(X, Y)[2]

    parameters = initialize_parameters(n_x, n_h, n_y)
    W1 = parameters["W1"]
    b1 = parameters["b1"]
    W2 = parameters["W2"]
    b2 = parameters["b2"]

    for i in range(num_iterations):
        A2, cache = forward_propagation(X, parameters)
        cost = compute_cost(A2, Y, parameters)
        grads = backward_propagation(parameters, cache, X, Y)
        parameters = update_parameters(parameters, grads, learning_rate=0.5)

        if print_cost:
            if i % 1000 == 0:
                print("第 ", i, " 次循环，成本为：" + str(cost))
    return parameters


def predict(parameters, X):
    """
    使用学习的参数，为X中的每个示例预测一个类

    参数：
		parameters - 包含参数的字典类型的变量。
	    X - 输入数据（n_x，m）

    返回
		predictions - 我们模型预测的向量（红色：0 /蓝色：1）

     """
    A2, cache = forward_propagation(X, parameters)
    predictions = np.round(A2)

    return predictions



parameters = nn_model(X, Y, n_h = 4, num_iterations=10000, print_cost=True)
#绘制边界
plot_decision_boundary(lambda x: predict(parameters, x.T), X, Y)
plt.title("Decision Boundary for hidden layer size " + str(4))
plt.show()
predictions = predict(parameters, X)
print ('准确率: %d' % float((np.dot(Y, predictions.T) + np.dot(1 - Y, 1 - predictions.T)) / float(Y.size) * 100) + '%')

"""
plt.figure(figsize=(16, 32))
hidden_layer_sizes = [1, 2, 3, 4, 5, 20, 50] #隐藏层数量
for i, n_h in enumerate(hidden_layer_sizes):
    plt.subplot(5, 2, i + 1)
    plt.title('Hidden Layer of size %d' % n_h)
    parameters = nn_model(X, Y, n_h, num_iterations=5000)
    plot_decision_boundary(lambda x: predict(parameters, x.T), X, Y)
    predictions = predict(parameters, X)
    accuracy = float((np.dot(Y, predictions.T) + np.dot(1 - Y, 1 - predictions.T)) / float(Y.size) * 100)
    print ("隐藏层的节点数量： {}  ，准确率: {} %".format(n_h, accuracy))
    pass
plt.show()
"""

第六部分:testCases.py文件内容

#-*- coding: UTF-8 -*-
"""
# WANGZHE12
"""
import numpy as np

def layer_sizes_test_case():
    np.random.seed(1)
    X_assess = np.random.randn(5, 3)
    Y_assess = np.random.randn(2, 3)
    return X_assess, Y_assess

def initialize_parameters_test_case():
    n_x, n_h, n_y = 2, 4, 1
    return n_x, n_h, n_y

def forward_propagation_test_case():
    np.random.seed(1)
    X_assess = np.random.randn(2, 3)

    parameters = {'W1': np.array([[-0.00416758, -0.00056267],
        [-0.02136196,  0.01640271],
        [-0.01793436, -0.00841747],
        [ 0.00502881, -0.01245288]]),
     'W2': np.array([[-0.01057952, -0.00909008,  0.00551454,  0.02292208]]),
     'b1': np.array([[ 0.],
        [ 0.],
        [ 0.],
        [ 0.]]),
     'b2': np.array([[ 0.]])}

    return X_assess, parameters

def compute_cost_test_case():
    np.random.seed(1)
    Y_assess = np.random.randn(1, 3)
    parameters = {'W1': np.array([[-0.00416758, -0.00056267],
        [-0.02136196,  0.01640271],
        [-0.01793436, -0.00841747],
        [ 0.00502881, -0.01245288]]),
     'W2': np.array([[-0.01057952, -0.00909008,  0.00551454,  0.02292208]]),
     'b1': np.array([[ 0.],
        [ 0.],
        [ 0.],
        [ 0.]]),
     'b2': np.array([[ 0.]])}

    a2 = (np.array([[ 0.5002307 ,  0.49985831,  0.50023963]]))

    return a2, Y_assess, parameters

def backward_propagation_test_case():
    np.random.seed(1)
    X_assess = np.random.randn(2, 3)
    Y_assess = np.random.randn(1, 3)
    parameters = {'W1': np.array([[-0.00416758, -0.00056267],
        [-0.02136196,  0.01640271],
        [-0.01793436, -0.00841747],
        [ 0.00502881, -0.01245288]]),
     'W2': np.array([[-0.01057952, -0.00909008,  0.00551454,  0.02292208]]),
     'b1': np.array([[ 0.],
        [ 0.],
        [ 0.],
        [ 0.]]),
     'b2': np.array([[ 0.]])}

    cache = {'A1': np.array([[-0.00616578,  0.0020626 ,  0.00349619],
         [-0.05225116,  0.02725659, -0.02646251],
         [-0.02009721,  0.0036869 ,  0.02883756],
         [ 0.02152675, -0.01385234,  0.02599885]]),
  'A2': np.array([[ 0.5002307 ,  0.49985831,  0.50023963]]),
  'Z1': np.array([[-0.00616586,  0.0020626 ,  0.0034962 ],
         [-0.05229879,  0.02726335, -0.02646869],
         [-0.02009991,  0.00368692,  0.02884556],
         [ 0.02153007, -0.01385322,  0.02600471]]),
  'Z2': np.array([[ 0.00092281, -0.00056678,  0.00095853]])}
    return parameters, cache, X_assess, Y_assess

def update_parameters_test_case():
    parameters = {'W1': np.array([[-0.00615039,  0.0169021 ],
        [-0.02311792,  0.03137121],
        [-0.0169217 , -0.01752545],
        [ 0.00935436, -0.05018221]]),
 'W2': np.array([[-0.0104319 , -0.04019007,  0.01607211,  0.04440255]]),
 'b1': np.array([[ -8.97523455e-07],
        [  8.15562092e-06],
        [  6.04810633e-07],
        [ -2.54560700e-06]]),
 'b2': np.array([[  9.14954378e-05]])}

    grads = {'dW1': np.array([[ 0.00023322, -0.00205423],
        [ 0.00082222, -0.00700776],
        [-0.00031831,  0.0028636 ],
        [-0.00092857,  0.00809933]]),
 'dW2': np.array([[ -1.75740039e-05,   3.70231337e-03,  -1.25683095e-03,
          -2.55715317e-03]]),
 'db1': np.array([[  1.05570087e-07],
        [ -3.81814487e-06],
        [ -1.90155145e-07],
        [  5.46467802e-07]]),
 'db2': np.array([[ -1.08923140e-05]])}
    return parameters, grads

def nn_model_test_case():
    np.random.seed(1)
    X_assess = np.random.randn(2, 3)
    Y_assess = np.random.randn(1, 3)
    return X_assess, Y_assess

def predict_test_case():
    np.random.seed(1)
    X_assess = np.random.randn(2, 3)
    parameters = {'W1': np.array([[-0.00615039,  0.0169021 ],
        [-0.02311792,  0.03137121],
        [-0.0169217 , -0.01752545],
        [ 0.00935436, -0.05018221]]),
     'W2': np.array([[-0.0104319 , -0.04019007,  0.01607211,  0.04440255]]),
     'b1': np.array([[ -8.97523455e-07],
        [  8.15562092e-06],
        [  6.04810633e-07],
        [ -2.54560700e-06]]),
     'b2': np.array([[  9.14954378e-05]])}
    return parameters, X_assess

第七部分:planar_utils.py文件内容

import matplotlib.pyplot as plt
import numpy as np
import sklearn
import sklearn.datasets
import sklearn.linear_model

def plot_decision_boundary(model, X, y):
    # Set min and max values and give it some padding
    x_min, x_max = X[0, :].min() - 1, X[0, :].max() + 1
    y_min, y_max = X[1, :].min() - 1, X[1, :].max() + 1
    h = 0.01
    # Generate a grid of points with distance h between them
    xx, yy = np.meshgrid(np.arange(x_min, x_max, h), np.arange(y_min, y_max, h))
    # Predict the function value for the whole grid
    Z = model(np.c_[xx.ravel(), yy.ravel()])
    Z = Z.reshape(xx.shape)
    # Plot the contour and training examples
    plt.contourf(xx, yy, Z, cmap=plt.cm.Spectral)
    plt.ylabel('x2')
    plt.xlabel('x1')
    plt.scatter(X[0, :], X[1, :], c=y, cmap=plt.cm.Spectral)


def sigmoid(x):
    s = 1/(1+np.exp(-x))
    return s

def load_planar_dataset():
    np.random.seed(1)
    m = 400 # number of examples
    N = int(m/2) # number of points per class
    D = 2 # dimensionality
    X = np.zeros((m,D)) # data matrix where each row is a single example
    Y = np.zeros((m,1), dtype='uint8') # labels vector (0 for red, 1 for blue)
    a = 4 # maximum ray of the flower

    for j in range(2):
        ix = range(N*j,N*(j+1))
        t = np.linspace(j*3.12,(j+1)*3.12,N) + np.random.randn(N)*0.2 # theta
        r = a*np.sin(4*t) + np.random.randn(N)*0.2 # radius
        X[ix] = np.c_[r*np.sin(t), r*np.cos(t)]
        Y[ix] = j

    X = X.T
    Y = Y.T

    return X, Y

def load_extra_datasets():  
    N = 200
    noisy_circles = sklearn.datasets.make_circles(n_samples=N, factor=.5, noise=.3)
    noisy_moons = sklearn.datasets.make_moons(n_samples=N, noise=.2)
    blobs = sklearn.datasets.make_blobs(n_samples=N, random_state=5, n_features=2, centers=6)
    gaussian_quantiles = sklearn.datasets.make_gaussian_quantiles(mean=None, cov=0.5, n_samples=N, n_features=2, n_classes=2, shuffle=True, random_state=None)
    no_structure = np.random.rand(N, 2), np.random.rand(N, 2)

    return noisy_circles, noisy_moons, blobs, gaussian_quantiles, no_structure

你可能感兴趣的:(吴恩达课程学习笔记,深度学习,深度学习,神经网络,python)

因果推断与机器学习—因果表征学习与泛化能力樱花的浪漫因果推断机器学习学习人工智能深度学习自然语言处理计算机视觉
近十年来，深度学习在多个领域取得了巨大成功，包括机器视觉、自然语言处理、语音识别和生物信息等。这些成功为机器学习技术的进一步发展和应用奠定了基础。表征学习是深度学习的核心技术之一。在机器学习问题中，其主要目的是从观测到的低级变量中提取信息，进而学习到能够准确预测目标变量的高级变量。这种从低层次到高层次变量的学习过程，有助于模型更好地理解数据和进行预测。以德国马克斯-普朗克研究所的BernhardS
python模块与包管理使用(pip与virtualenv) 步入烟尘 python 包管理工具开发语言
本文已收录于《Python超入门指南全册》本专栏专门针对零基础和需要进阶提升的同学所准备的一套完整教学，从基础到精通不断进阶深入，后续还有实战项目，轻松应对面试，专栏订阅地址：https://blog.csdn.net/mrdeam/category_12647587.html优点：订阅限时19.9付费专栏，私信博主还可进入全栈VIP答疑群，作者优先解答机会（代码指导、远程服务），群里大佬众多可以
【python基础-12】字符串查找，替换，合并华东算法王（原聪明的小孩子小孩AI-python基础 python 开发语言
在Python中，字符串提供了多种查找、替换和合并的功能。通过这些操作，可以轻松地处理和修改字符串内容。下面是常见的字符串查找、替换和合并操作。1.字符串查找（find,index）1.1.find()方法find()方法用于查找指定子串在字符串中第一次出现的位置。如果找到了子串，它返回子串的起始索引；如果没有找到，返回-1。text="Hello,World!"position=text.fin
券商系统接口是否存在？不同券商的接口情况有何差异？股票程序化交易接口量化交易股票API接口 Python股票量化交易券商系统接口差异功能接入方式股票量化接口股票API接口
Python股票接口实现查询账户，提交订单，自动交易（1）Python股票程序交易接口查账，提交订单，自动交易（2）股票量化，Python炒股，CSDN交流社区>>>券商系统接口的存在性在现代金融市场中，券商系统接口是必然存在的。随着金融科技的不断发展，为了满足投资者多样化的需求，如自动化交易、量化投资等，券商需要提供系统接口。这有助于提高交易效率，使得投资者能够更迅速地进行买卖操作。也方便了第三
基于深度学习的植物病害检测系统 A等天晴计算机视觉深度学习人工智能
引言背景介绍植物病害对农业生产的影响不容忽视。随着全球人口的增长和气候变化的影响，农作物病害问题变得更加严峻。传统的植物病害检测方法往往依赖于人工检测，不仅耗时费力，而且对检测者的专业知识要求较高。深度学习技术，尤其是YOLO（YouOnlyLookOnce）模型，在图像识别和目标检测领域取得了显著的成果。YOLO模型可以在实时情况下检测并识别图像中的多个目标，为植物病害的快速检测提供了新的途径。
Django框架的全面指南：从入门到精通 MdlForward django sqlite 数据库
Django是一个强大且受欢迎的PythonWeb框架，它提供了一种高效的方式来构建可扩展的Web应用程序。本文将带你从入门到精通，逐步介绍Django框架的重要概念和用法，并提供相应的源代码示例。1.安装和创建Django项目首先，你需要安装Django。你可以使用pip命令来安装最新版本的Django：pipinstallDjango安装完成后，你可以使用以下命令创建一个新的Django项目：
【2025年】全国CTF夺旗赛-从零基础入门到竞赛，看这一篇就稳了！白帽黑客鹏哥 web安全 CTF 网络安全大赛 python Linux
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包目录一、CTF简介二、CTF竞赛模式三、CTF各大题型简介四、CTF学习路线4.1、初期1、html+css+js（2-3天）2、apache+php（4-5天）3、mysql（2-3天）4、python(2-3天)5、burpsuite（1-2天）4.2、中期1、SQL注入（7-8天）2、文件上传（7-8天）3、其他漏洞（14-15
毕业设计基于python的boss直聘数据可视化系统 2301_79916833 python 信息可视化开发语言
可运行的完整项目,如有需要课私信联系爬虫部分importjsonimporttimefromseleniumimportwebdriverfromselenium.webdriver.common.byimportByimportcsvimportpandasaspdimportosimportdjangofromselenium.webdriver.chrome.serviceimportSer
Python版的Mybatis ORM：mybatis-py（类似java的mybatis） moontourse python orm python mybatis java
入门mybatis-py是一个和mybatis很相似的轻量级的半自动的ORM，它的功能如下：主要功能如下：1、半自动化的ORM；2、支持像mybatis那样的动态SQL；3、支持类似mybatis注解的装饰器；4、支持LRU缓存，支持缓存过期机制；5、尽可能地使用Preparedstatement，避免SQL字符串拼接，能有效地防止SQL注入；6、预防大对象机制，避免OOM。7、支持mysql和p
Django框架的全面指南：从入门到高级孤客网络科技工作室 python Django django 数据库 sqlite
Django框架的全面指南：从入门到高级目录引言Django简介安装与配置创建第一个Django项目Django的MVT架构模型（Model）视图（View）模板（Template）URL路由表单处理用户认证与权限DjangoAdmin高级主题总结引言Django是一个高级PythonWeb框架，它鼓励快速开发和干净、实用的设计。Django遵循“Don’tRepeatYourself”（DRY）
Python queue 模块 Lee木木 Python python
Pythonqueue模块1、Queue2、Queue&Threading--13、Queue&Threading--21、QueueInitsignature:queue.Queue(maxsize=0)Docstring:Createaqueueobjectwithagivenmaximumsize.Ifmaxsizeisq.put(random.randint(1,100))q.put(ra
Python queue模块 tlqwanttolearnit Python模块使用 python 开发语言
在python3中，新增了内置模块queue，模块实现了三种类型的队列，它们的区别仅仅是条目取回的顺序，分别由3个类进行表示，Queue，LifoQueue，PriorityQueue，并且可以很方便地自定义自己的队列并扩展。queue简介要理解python中的queue这种结构，我们就要先理解队列。队列作为一种先入先出的数据结构，通常用来解决有先后关系的数据，或者存在数据间共享变量，需要先后一一
python操作ES的三种办法 go&Python #ElasticSearch elasticsearch python 大数据
python操作ES的三种办法1使用requests模块importrequestsdata={"name":"大娘子","age":18,"from":"sheng","desc":"肤白貌美，娇憨可爱","tags":["白","富","美"]}res=request.put('http://127.0.0.1:9200/lqz/_doc/6',json=data)print(res.text
大模型应用开发课程上新！人工智能
在人工智能快速发展的今天，大模型应用已逐渐渗透到各个行业，对我们的工作和生活产生了深远的影响。越来越多的企业和开发者渴望深入探索大模型落地应用，然而却缺少高质量且专业的培训课程及学习途径。为满足企业和开发者在实际场景中使用大模型、创建大模型应用的需求，百度智能云千帆AI加速器近日推出线上加速营。针对各行业普遍适用的大模型功能场景，如逻辑编排、文件撰写等，采用案例实操讲解的方式授课。企业和开发者可以
os.makedirs world=hello 函数砂锅函数
官方说明文档：Link解释下面的代码：os.makedirs(os.path.join(args.output_dir,'sample_images'),exist_ok=True)os.makedirs()：这是一个用于递归创建目录的Python函数。如果中间级目录（目录链中的所有目录）不存在，它会自动创建这些目录。与mkdir()类似，但是mkdir()只会创建单层目录；而makedirs()
python操作ES（pythonRestClient）大宁哥BigData python elasticsearch jenkins
Elasticsearch提供了官方的Python客户端库elasticsearch-py，它是与Elasticsearch进行交互的主要工具。这个库允许你通过Python代码来执行Elasticsearch的各种操作，包括索引、搜索、更新和删除文档等。安装elasticsearch-py首先，你需要安装elasticsearch库。你可以使用pip进行安装：pipinstallelasticse
NeuralCF 模型：神经网络协同过滤模型 Lewis@ 神经网络人工智能深度学习
实验和完整代码完整代码实现和jupyter运行：https://github.com/Myolive-Lin/RecSys--deep-learning-recommendation-system/tree/main引言NeuralCF模型由新加坡国立大学研究人员于2017年提出，其核心思想在于将传统协同过滤方法与深度学习技术相结合，从而更为有效地捕捉用户与物品之间的复杂交互关系。该模型利用神经网
算法第五期——贪心法（Python）小叶pyか算法贪心算法 python
目录贪心法例子：最少硬币问题贪心和动态规划例题：快乐司机思路：代码：例题：旅行家的预算思路：代码：例题：翻硬币思路代码例题：防御力思路代码贪心习题贪心法是一种算法思想，主要思想是每一步都选择局部最优。【算法优点】容易理解：“走一步看一步，不是通盘考虑”操作简单：在每一步都选局部最优时间效率高：复杂度常常是O(1)的【算法缺点】不一定得到正确结果：局部最优不一定是全局最优不易联想到贪心解法
AI 图像生成器，如何使用 Janus-Pro 和 Janus， Deepseek 的 Janus-Pro、Janus 和其他领先工具的比较知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek janus pro
介绍人工智能(AI)彻底改变了数字艺术和设计领域，使创建高质量图像变得前所未有的简单，而且只需付出最少的努力。人工智能驱动的图像生成器使用深度学习算法将文本描述转换为逼真或艺术化的视觉效果，可满足营销、广告、游戏和内容创作等各种行业的需求。在本综合指南中，我们将探索一些最流行的AI图像生成器，包括DeepSeek的Janus-Pro和Janus，以及DALL·E3、Midjourney、Stabl
用 Python 微调 DeepSeek R1 程序员
用Python微调DeepSeekR1阅读时长：15分钟发布时间：2025-02-05近日热文：全网最全的神经网络数学原理（代码和公式）直观解释欢迎关注知乎和公众号的专栏内容LLM架构专栏知乎LLM专栏知乎【柏企】公众号【柏企科技说】【柏企阅文】微调前的准备工作在正式开始微调大语言模型之前，我们先来了解一下技术前提条件和设置要求。Python库和框架微调大语言模型需要用到以下Python库和框架：
深度学习篇---深度学习框架图像预处理&各部分组件 Ronin-Lotus 深度学习篇程序代码篇深度学习人工智能 Python 机器学习 pytorch paddlepaddle 深度学习框架
文章目录前言第一部分：图像预处理PaddlePaddle图像预处理PyTorch图像预处理第二部分：框架各部分组件PaddlePaddle1.卷积层(ConvolutionalLayer)2.池化层(PoolingLayer)3.全连接层(FullyConnectedLayer)4.激活函数(ActivationFunction)5.优化器(Optimizer)6.归一化(Normalizatio
【Python】Python 中的`os.makedirs` 深入解读与最佳实践丶2136 python python 文件创建
目录引言一、什么是`os.makedirs`?二、`os.makedirs`函数的参数解析三、如何使用`os.makedirs`创建目录示例1：创建单一目录示例2：创建多级目录示例3：设置目录权限示例4：忽略已存在目录四、常见错误与解决方案错误1：`FileExistsError`错误2：`PermissionError`错误3：`OSError`五、使用场景示例场景1：自动创建项目目录结构场景2
Python 和 Java 区别是什么？哪个运行效率高？为什么？海姐软件测试经验分享面试笔记职场和发展其他
一、Python和Java的区别1.编程风格•Python是一种解释型动态编程语言，语法简洁、灵活，代码较为简洁直观，注重代码的可读性和简洁性，使用缩进来表示代码块。•Java是一种编译型静态编程语言，语法相对严谨，代码风格较为规范，需要明确声明变量类型，使用大括号来表示代码块。2.内存管理•Python有自动的内存管理机制，开发者不需要手动管理内存的分配和释放，减少了内存泄漏的风险，但可能在某些
python元组和列表区别 weixin_30436891
元组可以简单认为是一个只读的列表tuper=constlist转载于:https://www.cnblogs.com/Mysterious/p/7376638.html
PyTorch中的 torch.nn.GRU 彬彬侠自然语言处理 GRU PyTorch Python NLP 自然语言处理
PyTorch中的torch.nn.GRUGRU（GatedRecurrentUnit）是循环神经网络（RNN）的一种变种，常用于处理序列数据。与传统的RNN相比，GRU引入了门控机制，旨在解决长序列训练中的梯度消失问题，并提高了训练效率和性能。在PyTorch中，torch.nn.GRU是一个非常方便的模块，用于构建和训练GRU网络。1.torch.nn.GRU的定义GRU是torch.nn中的
Python 3 不支持元组参数解包，如何处理？完美代码 python 开发语言 Python
Python3不支持元组参数解包，如何处理？在Python2中，我们可以使用元组参数解包来将元组中的值映射到函数的参数上。例如：defmy_function(a,b,c):print(a,b,c)my_tuple=(1,2,3)my_function(*my_tuple)#注意星号但是，在Python3中，这种用法已经被弃用了，并且会引发语法错误。那么，我们应该如何处理这个问题呢？一种解决方案是使
机器学习，深度学习，神经网络，深度神经网络武昌库里写JAVA 面试题汇总与解析 java 学习开发语言课程设计 spring boot
人工智能包含机器学习，机器学习包含深度学习（是其中比较重要的分支）。深度学习源自于人工神经网络的研究，但是并不完全等于传统神经网络。神经网络与深度神经网络的区别在于隐藏层级，通常两层或两层以上隐藏层的网络叫做深度神经网络。一般隐藏层越多，精确度越高。深度学习的算法又分很多种，比较典型的四种：卷积神经网络—CNN,循环神经网络—RNN,生成对抗网络—GANs,深度强化学习—RL。机器学习和深度学习的
Conda|python包和版本管理利器 qq_21478261 #Python数据分析精进 python conda 包版本控制
本文续上篇，介绍Anaconda的强力管家Conda、Conda可灵活管理python的包package和环境environment。Conda简介多种编程语言的包package和虚拟环境environment的管理；非常简单的完成package的安装、运行、更新、删除、依赖问题；可操作repo.anaconda.com上7,500+packages；非常简单的完成不同环境的构建、保存、加载及切换
Python中的决策树算法探索基本原理 myCOTB Python 算法 python 决策树
Python中的决策树算法探索决策树是一种简单而直观的机器学习算法，广泛应用于分类和回归任务中。它通过对数据进行分割，构建一个树形结构，从而做出决策。本文将探讨决策树的基本原理，并演示如何使用Python中的scikit-learn库实现决策树算法。决策树的基本原理决策树的基本思想是通过对数据进行分割，逐步缩小数据的范围，从而使得每个叶节点（终节点）中的样本属于同一类别或具有相似的特征。决策树的构
基于深度学习的车牌检测识别系统 —— 使用YOLOv5实现车牌检测与识别 2025年数学建模美赛深度学习 YOLO 人工智能分类 ui
目录引言项目背景与目标1.1项目背景1.2项目目标系统设计与架构2.1系统功能概述2.2系统架构数据准备与处理3.1数据集选择与收集3.2数据标注3.3数据集划分YOLOv5模型训练与优化4.1YOLOv5配置文件4.2安装YOLOv5并开始训练4.3模型评估与优化车牌识别与推理5.1加载模型进行推理5.2UI界面设计总结与展望引言车牌识别（LicensePlateRecognition，LPR）
二分查找排序算法周凡杨 java 二分查找排序算法折半
一：概念二分查找又称折半查找（折半搜索/ 二分搜索），优点是比较次数少，查找速度快，平均性能好；其缺点是要求待查表为有序表，且插入删除困难。因此，折半查找方法适用于不经常变动而查找频繁的有序列表。首先，假设表中元素是按升序排列，将表中间位置记录的关键字与查找关键字比较，如果两者相等，则查找成功；否则利用中间位置记录将表分成前、后两个子表，如果中间位置记录的关键字大于查找关键字，则进一步
java中的BigDecimal bijian1013 java BigDecimal
在项目开发过程中出现精度丢失问题，查资料用BigDecimal解决，并发现如下这篇BigDecimal的解决问题的思路和方法很值得学习，特转载。原文地址：http://blog.csdn.net/ugg/article/de
Shell echo命令详解 daizj echo shell
Shell echo命令 Shell 的 echo 指令与 PHP 的 echo 指令类似，都是用于字符串的输出。命令格式： echo string 您可以使用echo实现更复杂的输出格式控制。 1.显示普通字符串: echo "It is a test" 这里的双引号完全可以省略，以下命令与上面实例效果一致： echo Itis a test 2.显示转义
Oracle DBA 简单操作周凡杨 oracle dba sql
--执行次数多的SQL select sql_text,executions from ( select sql_text,executions from v$sqlarea order by executions desc ) where rownum<81; &nb
画图重绘朱辉辉33 游戏
我第一次接触重绘是编写五子棋小游戏的时候，因为游戏里的棋盘是用线绘制的，而这些东西并不在系统自带的重绘里，所以在移动窗体时，棋盘并不会重绘出来。所以我们要重写系统的重绘方法。在重写系统重绘方法时，我们要注意一定要调用父类的重绘方法，即加上super.paint(g)，因为如果不调用父类的重绘方式，重写后会把父类的重绘覆盖掉，而父类的重绘方法是绘制画布，这样就导致我们
线程之初体验西蜀石兰线程
一直觉得多线程是学Java的一个分水岭，懂多线程才算入门。之前看《编程思想》的多线程章节，看的云里雾里，知道线程类有哪几个方法，却依旧不知道线程到底是什么？书上都写线程是进程的模块，共享线程的资源，可是这跟多线程编程有毛线的关系，呜呜。。。线程其实也是用户自定义的任务，不要过多的强调线程的属性，而忽略了线程最基本的属性。你可以在线程类的run()方法中定义自己的任务，就跟正常的Ja
linux集群互相免登陆配置林鹤霄 linux
配置ssh免登陆 1、生成秘钥和公钥 ssh-keygen -t rsa 2、提示让你输入，什么都不输，三次回车之后会在~下面的.ssh文件夹中多出两个文件id_rsa 和 id_rsa.pub 其中id_rsa为秘钥，id_rsa.pub为公钥，使用公钥加密的数据只有私钥才能对这些数据解密 c
mysql : Lock wait timeout exceeded; try restarting transaction aigo mysql
原文：http://www.cnblogs.com/freeliver54/archive/2010/09/30/1839042.html 原因是你使用的InnoDB 表类型的时候, 默认参数:innodb_lock_wait_timeout设置锁等待的时间是50s, 因为有的锁等待超过了这个时间,所以抱错. 你可以把这个时间加长,或者优化存储
Socket编程基本的聊天实现。 alleni123 socket
public class Server { //用来存储所有连接上来的客户 private List<ServerThread> clients; public static void main(String[] args) { Server s = new Server(); s.startServer(9988); } publi
多线程监听器事件模式(一个简单的例子) 百合不是茶线程监听模式
多线程的事件监听器模式监听器时间模式经常与多线程使用,在多线程中如何知道我的线程正在执行那什么内容,可以通过时间监听器模式得到创建多线程的事件监听器模式思路: 1, 创建线程并启动,在创建线程的位置设置一个标记 2,创建队
spring InitializingBean接口 bijian1013 java spring
spring的事务的TransactionTemplate，其源码如下： public class TransactionTemplate extends DefaultTransactionDefinition implements TransactionOperations, InitializingBean{ ... } TransactionTemplate继承了DefaultT
Oracle中询表的权限被授予给了哪些用户 bijian1013 oracle 数据库权限
Oracle查询表将权限赋给了哪些用户的SQL，以备查用。 select t.table_name as "表名", t.grantee as "被授权的属组", t.owner as "对象所在的属组"
【Struts2五】Struts2 参数传值 bit1129 struts2
Struts2中参数传值的3种情况 1.请求参数绑定到Action的实例字段上 2.Action将值传递到转发的视图上 3.Action将值传递到重定向的视图上一、请求参数绑定到Action的实例字段上以及Action将值传递到转发的视图上 Struts可以自动将请求URL中的请求参数或者表单提交的参数绑定到Action定义的实例字段上，绑定的规则使用ognl表达式语言
【Kafka十四】关于auto.offset.reset[Q/A] bit1129 kafka
I got serveral questions about auto.offset.reset. This configuration parameter governs how consumer read the message from Kafka when there is no initial offset in ZooKeeper or
nginx gzip压缩配置 ronin47 nginx gzip 压缩范例
nginx gzip压缩配置更多 0 nginx gzip 配置随着nginx的发展，越来越多的网站使用nginx，因此nginx的优化变得越来越重要，今天我们来看看nginx的gzip压缩到底是怎么压缩的呢？ gzip(GNU-ZIP)是一种压缩技术。经过gzip压缩后页面大小可以变为原来的30%甚至更小，这样，用
java-13.输入一个单向链表，输出该链表中倒数第 k 个节点 bylijinnan java
two cursors. Make the first cursor go K steps first. /* * 第 13 题：题目：输入一个单向链表，输出该链表中倒数第 k 个节点 */ public void displayKthItemsBackWard(ListNode head,int k){ ListNode p1=head,p2=head;
Spring源码学习-JdbcTemplate queryForObject bylijinnan java spring
JdbcTemplate中有两个可能会混淆的queryForObject方法： 1. Object queryForObject(String sql, Object[] args, Class requiredType) 2. Object queryForObject(String sql, Object[] args, RowMapper rowMapper) 第1个方法是只查
[冰川时代]在冰川时代,我们需要什么样的技术? comsci 技术
看美国那边的气候情况....我有个感觉...是不是要进入小冰期了? 那么在小冰期里面...我们的户外活动肯定会出现很多问题...在室内呆着的情况会非常多...怎么在室内呆着而不发闷...怎么用最低的电力保证室内的温度.....这都需要技术手段... &nb
js 获取浏览器型号 cuityang js 浏览器
根据浏览器获取iphone和apk的下载地址 <!DOCTYPE html> <html> <head> <meta charset="utf-8" content="text/html"/> <meta name=
C# socks5详解转 dalan_123 socket C#
http://www.cnblogs.com/zhujiechang/archive/2008/10/21/1316308.html 这里主要讲的是用.NET实现基于Socket5下面的代理协议进行客户端的通讯，Socket4的实现是类似的，注意的事，这里不是讲用C#实现一个代理服务器，因为实现一个代理服务器需要实现很多协议，头大，而且现在市面上有很多现成的代理服务器用，性能又好，
运维 Centos问题汇总 dcj3sjt126com 云主机
一、sh 脚本不执行的原因 sh脚本不执行的原因只有2个 1.权限不够 2.sh脚本里路径没写完整。二、解决You have new mail in /var/spool/mail/root 修改/usr/share/logwatch/default.conf/logwatch.conf配置文件 MailTo = MailFrom 三、查询连接数
Yii防注入攻击笔记 dcj3sjt126com sql WEB安全 yii
网站表单有注入漏洞须对所有用户输入的内容进行个过滤和检查，可以使用正则表达式或者直接输入字符判断，大部分是只允许输入字母和数字的，其它字符度不允许；对于内容复杂表单的内容，应该对html和script的符号进行转义替换：尤其是<,>,',"",&这几个符号这里有个转义对照表： http://blog.csdn.net/xinzhu1990/articl
MongoDB简介[一] eksliang mongodb MongoDB简介
MongoDB简介转载请出自出处：http://eksliang.iteye.com/blog/2173288 1.1易于使用 MongoDB是一个面向文档的数据库，而不是关系型数据库。与关系型数据库相比，面向文档的数据库不再有行的概念，取而代之的是更为灵活的“文档”模型。另外，不
zookeeper windows 入门安装和测试 greemranqq zookeeper 安装分布式
一、序言以下是我对zookeeper 的一些理解： zookeeper 作为一个服务注册信息存储的管理工具，好吧，这样说得很抽象，我们举个“栗子”。栗子1号：假设我是一家KTV的老板，我同时拥有5家KTV，我肯定得时刻监视
Spring之使用事务缘由(2-注解实现) ihuning spring
Spring事务注解实现 1. 依赖包： 1.1 spring包： spring-beans-4.0.0.RELEASE.jar spring-context-4.0.0.
iOS App Launch Option 啸笑天 option
iOS 程序启动时总会调用application:didFinishLaunchingWithOptions:，其中第二个参数launchOptions为NSDictionary类型的对象，里面存储有此程序启动的原因。 launchOptions中的可能键值见UIApplication Class Reference的Launch Options Keys节。 1、若用户直接
jdk与jre的区别（_） macroli java jvm jdk
简单的说JDK是面向开发人员使用的SDK，它提供了Java的开发环境和运行环境。SDK是Software Development Kit 一般指软件开发包，可以包括函数库、编译程序等。 JDK就是Java Development Kit JRE是Java Runtime Enviroment是指Java的运行环境，是面向Java程序的使用者，而不是开发者。如果安装了JDK，会发同你
Updates were rejected because the tip of your current branch is behind qiaolevip 学习永无止境每天进步一点点众观千象 git
$ git push joe prod-2295-1 To git@git.dianrong.com:joe.le/dr-frontend.git ! [rejected] prod-2295-1 -> prod-2295-1 (non-fast-forward) error: failed to push some refs to 'git@git.dianron
[一起学Hive]之十四-Hive的元数据表结构详解 superlxw1234 hive hive元数据结构
关键字：Hive元数据、Hive元数据表结构之前在 “[一起学Hive]之一–Hive概述，Hive是什么”中介绍过，Hive自己维护了一套元数据，用户通过HQL查询时候，Hive首先需要结合元数据，将HQL翻译成MapReduce去执行。本文介绍一下Hive元数据中重要的一些表结构及用途，以Hive0.13为例。文章最后面，会以一个示例来全面了解一下，
Spring 3.2.14，4.1.7，4.2.RC2发布 wiselyman Spring 3
Spring 3.2.14、4.1.7及4.2.RC2于6月30日发布。其中Spring 3.2.1是一个维护版本(维护周期到2016-12-31截止)，后续会继续根据需求和bug发布维护版本。此时，Spring官方强烈建议升级Spring框架至4.1.7 或者将要发布的4.2 。其中Spring 4.1.7主要包含这些更新内容。

“吴恩达深度学习”第三周编程代码汇总（实现一个神经网络）

前言

目录

第一部分:需要准备的Packages

第2部分:加载和查看数据集

第3部分:查看简单的Logistic回归的分类效果

第四部分:搭建神经网络

4.1-定义神经网络结构

4.2-初始化模型参数

4.3-构造回路

4.4-计算成本函数

4.5-向后传播

4.6-更新参数

4.7-整合

4.8-预测

4.9-运行代码

4.10 更改隐藏层节点数量

4.11【选做】

第五部分:完整代码

第六部分:testCases.py文件内容

第七部分:planar_utils.py文件内容

你可能感兴趣的:(吴恩达课程学习笔记,深度学习,深度学习,神经网络,python)