BrightLampCsdn

纯Python和PyTorch对比实现门控循环单元GRU及反向传播

摘要

本文使用纯 Python 和 PyTorch 对比实现门控循环单元GRU及其反向传播.

正文

1. GRUCell 类

文件目录 : vanilla_nn/grucell.py

import numpy as np


def sigmoid(x):
    return 1 / (1 + np.exp(-x))


class GRUCell:
    def __init__(self, weight_ih, weight_hh, bias_ih, bias_hh):
        self.weight_ih = weight_ih
        self.weight_hh = weight_hh
        self.bias_ih = bias_ih
        self.bias_hh = bias_hh

        self.dh_prev = None

        self.weight_ih_grad_stack = []
        self.weight_hh_grad_stack = []
        self.bias_ih_grad_stack = []
        self.bias_hh_grad_stack = []

        self.x_stack = []
        self.dx_list = []

        self.h_prev_stack = []
        self.h_next_stack = []
        self.dh_prev_list = []

        self.reset_gate_stack = []
        self.update_gate_stack = []
        self.cell_gate_stack = []

    def __call__(self, x, h_prev):
        xw_vector = np.dot(x, self.weight_ih.T) + self.bias_ih
        hv_vector = np.dot(h_prev, self.weight_hh.T) + self.bias_hh

        h_size = np.shape(h_prev)[1]

        reset_gate = sigmoid(xw_vector[:, h_size * 0:h_size * 1]
                             + hv_vector[:, h_size * 0:h_size * 1])

        update_gate = sigmoid(xw_vector[:, h_size * 1:h_size * 2]
                              + hv_vector[:, h_size * 1:h_size * 2])

        cell_gate = np.tanh(xw_vector[:, h_size * 2:]
                            + hv_vector[:, h_size * 2:] * reset_gate)

        h_next = (1 - update_gate) * cell_gate + update_gate * h_prev

        self.x_stack.append(x)
        self.reset_gate_stack.append(reset_gate)
        self.update_gate_stack.append(update_gate)
        self.cell_gate_stack.append(cell_gate)
        self.h_prev_stack.append(h_prev)
        self.h_next_stack.append(h_next)

        self.dh_prev = np.zeros_like(h_next)

        return h_next

    def backward(self, dh_next):
        x = self.x_stack.pop()
        h_prev = self.h_prev_stack.pop()
        reset_gate = self.reset_gate_stack.pop()
        update_gate = self.update_gate_stack.pop()
        cell_gate = self.cell_gate_stack.pop()

        h_size = np.shape(dh_next)[1]

        wr = self.weight_ih[h_size * 0:h_size * 1, :]
        wu = self.weight_ih[h_size * 1:h_size * 2, :]
        wc = self.weight_ih[h_size * 2:, :]

        vr = self.weight_hh[h_size * 0:h_size * 1, :]
        vu = self.weight_hh[h_size * 1:h_size * 2, :]
        vc = self.weight_hh[h_size * 2:, :]
        bc = self.bias_hh[h_size * 2:]

        dh = dh_next + self.dh_prev

        d_update_gate = dh * (h_prev - cell_gate)
        d_cell_gate = dh * (1 - update_gate)

        d_au = d_update_gate * update_gate * (1 - update_gate)
        d_ac = d_cell_gate * (1 - np.square(cell_gate))

        d_reset_gate = d_ac * (np.dot(h_prev, vc.T) + bc)
        d_ar = d_reset_gate * reset_gate * (1 - reset_gate)

        dh_prev = dh * update_gate + np.dot(d_ar, vr)
        dh_prev += np.dot(d_au, vu) + np.dot(d_ac * reset_gate, vc)
        self.dh_prev_list.insert(0, dh_prev)
        self.dh_prev = dh_prev

        dx = np.dot(d_ar, wr) + np.dot(d_au, wu) + np.dot(d_ac, wc)
        self.dx_list.insert(0, dx)

        dw = np.vstack([np.dot(d_ar.T, x),
                        np.dot(d_au.T, x),
                        np.dot(d_ac.T, x)])
        self.weight_ih_grad_stack.append(dw)

        dv = np.vstack([np.dot(d_ar.T, h_prev),
                        np.dot(d_au.T, h_prev),
                        np.dot((d_ac * reset_gate).T, h_prev)])
        self.weight_hh_grad_stack.append(dv)

        self.bias_ih_grad_stack.append(
            np.hstack([np.sum(d_ar, axis=0),
                       np.sum(d_au, axis=0),
                       np.sum(d_ac, axis=0)]))

        self.bias_hh_grad_stack.append(
            np.hstack([np.sum(d_ar, axis=0),
                       np.sum(d_au, axis=0),
                       np.sum(d_ac * reset_gate, axis=0)]))

        return dh_prev

2. GRUCell 测试

import torch
import numpy as np
from vanilla_nn.grucell import GRUCell

np.random.seed(123)
torch.random.manual_seed(123)
np.set_printoptions(precision=6, suppress=True, linewidth=80)

grucell_torch = torch.nn.GRUCell(3, 4).double()

grucell_numpy = GRUCell(grucell_torch.weight_ih.data.numpy(),
                        grucell_torch.weight_hh.data.numpy(),
                        grucell_torch.bias_ih.data.numpy(),
                        grucell_torch.bias_hh.data.numpy())

x_numpy = np.random.random((2, 3))
x_torch = torch.tensor(x_numpy, requires_grad=True)

h_numpy = np.random.random((2, 4))
h_torch = torch.tensor(h_numpy, requires_grad=True)

next_h_numpy = grucell_numpy(x_numpy, h_numpy)
next_h_torch = grucell_torch(x_torch, h_torch)

dh_numpy = np.random.random((2, 4))
dh_torch = torch.tensor(dh_numpy, requires_grad=True)

dh_numpy = grucell_numpy.backward(dh_numpy)
next_h_torch.backward(dh_torch)

print("--- 代码输出 ---")
print("out_numpy :\n", next_h_numpy)
print("out_torch :\n", next_h_torch.data.numpy())

print("---------")
print("dh_numpy :\n", dh_numpy)
print("dh_torch :\n", h_torch.grad.data.numpy())

print("---------")
print("dx_numpy :\n", np.array(grucell_numpy.dx_list))
print("dx_torch :\n", x_torch.grad.data.numpy())

print("---------")
print("w_ih_numpy :\n", np.sum(grucell_numpy.weight_ih_grad_stack, axis=0))
print("w_ih_torch :\n", grucell_torch.weight_ih.grad.data.numpy())

print("---------")
print("w_hh_numpy :\n", np.sum(grucell_numpy.weight_hh_grad_stack, axis=0))
print("w_hh_torch :\n", grucell_torch.weight_hh.grad.data.numpy())

print("---------")
print("b_ih_numpy :\n", np.sum(grucell_numpy.bias_ih_grad_stack, axis=0))
print("b_ih_torch :\n", grucell_torch.bias_ih.grad.data.numpy())

print("---------")
print("b_hh_numpy :\n", np.sum(grucell_numpy.bias_hh_grad_stack, axis=0))
print("b_hh_torch :\n", grucell_torch.bias_hh.grad.data.numpy())

"""
--- 代码输出 ---
out_numpy :
 [[ 0.537654  0.419409  0.334602  0.552652]
 [ 0.23298   0.546675  0.322881  0.331436]]
out_torch :
 [[ 0.537654  0.419409  0.334602  0.552652]
 [ 0.23298   0.546675  0.322881  0.331436]]
---------
dh_numpy :
 [[ 0.134685  0.262583  0.150232  0.011796]
 [ 0.29401   0.209619  0.38664   0.512479]]
dh_torch :
 [[ 0.134685  0.262583  0.150232  0.011796]
 [ 0.29401   0.209619  0.38664   0.512479]]
---------
dx_numpy :
 [[[ 0.100331  0.206714 -0.235714]
  [ 0.172891  0.255504 -0.155857]]]
dx_torch :
 [[ 0.100331  0.206714 -0.235714]
 [ 0.172891  0.255504 -0.155857]]
---------
w_ih_numpy :
 [[ 0.000184  0.002742  0.001377]
 [-0.063094 -0.039634 -0.027325]
 [-0.009026 -0.012194 -0.007132]
 [ 0.015227  0.016667  0.010103]
 [ 0.087729  0.052286  0.036599]
 [ 0.076196  0.052676  0.035376]
 [ 0.027772  0.029146  0.017808]
 [-0.084754 -0.101578 -0.060585]
 [ 0.247172  0.215229  0.136668]
 [ 0.432748  0.299664  0.20116 ]
 [ 0.239466  0.250673  0.153232]
 [ 0.122349  0.134346  0.081388]]
w_ih_torch :
 [[ 0.000184  0.002742  0.001377]
 [-0.063094 -0.039634 -0.027325]
 [-0.009026 -0.012194 -0.007132]
 [ 0.015227  0.016667  0.010103]
 [ 0.087729  0.052286  0.036599]
 [ 0.076196  0.052676  0.035376]
 [ 0.027772  0.029146  0.017808]
 [-0.084754 -0.101578 -0.060585]
 [ 0.247172  0.215229  0.136668]
 [ 0.432748  0.299664  0.20116 ]
 [ 0.239466  0.250673  0.153232]
 [ 0.122349  0.134346  0.081388]]
---------
w_hh_numpy :
 [[-0.002084  0.001193  0.00044  -0.001252]
 [-0.076799 -0.06724  -0.045178 -0.028548]
 [-0.005254 -0.012093 -0.007229 -0.000766]
 [ 0.012294  0.018921  0.011737  0.003278]
 [ 0.109266  0.092423  0.062486  0.041131]
 [ 0.088518  0.083027  0.055124  0.032029]
 [ 0.023524  0.034034  0.02126   0.006616]
 [-0.060689 -0.108654 -0.066362 -0.013765]
 [ 0.089854  0.108185  0.069158  0.028726]
 [ 0.262026  0.239856  0.159908  0.095748]
 [ 0.078294  0.109812  0.068845  0.022568]
 [ 0.071772  0.108447  0.067409  0.019455]]
w_hh_torch :
 [[-0.002084  0.001193  0.00044  -0.001252]
 [-0.076799 -0.06724  -0.045178 -0.028548]
 [-0.005254 -0.012093 -0.007229 -0.000766]
 [ 0.012294  0.018921  0.011737  0.003278]
 [ 0.109266  0.092423  0.062486  0.041131]
 [ 0.088518  0.083027  0.055124  0.032029]
 [ 0.023524  0.034034  0.02126   0.006616]
 [-0.060689 -0.108654 -0.066362 -0.013765]
 [ 0.089854  0.108185  0.069158  0.028726]
 [ 0.262026  0.239856  0.159908  0.095748]
 [ 0.078294  0.109812  0.068845  0.022568]
 [ 0.071772  0.108447  0.067409  0.019455]]
---------
b_ih_numpy :
 [ 0.001392 -0.096389 -0.016547  0.026264  0.13283   0.118438  0.047374 -0.149915
  0.402955  0.672871  0.408214  0.211218]
b_ih_torch :
 [ 0.001392 -0.096389 -0.016547  0.026264  0.13283   0.118438  0.047374 -0.149915
  0.402955  0.672871  0.408214  0.211218]
---------
b_hh_numpy :
 [ 0.001392 -0.096389 -0.016547  0.026264  0.13283   0.118438  0.047374 -0.149915
  0.151978  0.342735  0.153074  0.15066 ]
b_hh_torch :
 [ 0.001392 -0.096389 -0.016547  0.026264  0.13283   0.118438  0.047374 -0.149915
  0.151978  0.342735  0.153074  0.15066 ]
"""

3. GRU 测试

import torch
import numpy as np
from vanilla_nn.grucell import GRUCell

np.random.seed(123)
torch.random.manual_seed(123)
np.set_printoptions(precision=6, suppress=True, linewidth=80)

gru_torch = torch.nn.GRU(4, 5, 1).double()

gru_numpy = GRUCell(gru_torch.all_weights[0][0].data.numpy(),
                    gru_torch.all_weights[0][1].data.numpy(),
                    gru_torch.all_weights[0][2].data.numpy(),
                    gru_torch.all_weights[0][3].data.numpy())

x_numpy = np.random.random((3, 3, 4))
x_torch = torch.tensor(x_numpy, requires_grad=True)

h_numpy = np.random.random((1, 3, 5))
h_torch = torch.tensor(h_numpy, requires_grad=True)

dh_numpy = np.random.random((3, 3, 5))
dh_torch = torch.tensor(dh_numpy, requires_grad=True)

out_torch, hn_torch = gru_torch(x_torch, h_torch)

out_torch.backward(dh_torch)

h0_numpy = h_numpy[0]
for i in range(3):
    h0_numpy = gru_numpy(x_numpy[i], h0_numpy)

for i in reversed(range(3)):
    gru_numpy.backward(dh_numpy[i])

print("--- 代码输出 ---")
print("out_numpy :\n", np.array(gru_numpy.h_next_stack))
print("out_torch :\n", out_torch.data.numpy())

print("--- 代码输出 ---")
print("dx_numpy :\n", np.array(gru_numpy.dx_list))
print("dx_torch :\n", x_torch.grad.data.numpy())

print("--- 代码输出 ---")
print("dw_ih_numpy :\n", np.sum(gru_numpy.weight_ih_grad_stack, 0))
print("dw_ih_torch :\n", gru_torch.all_weights[0][0].grad.data.numpy())

print("--- 代码输出 ---")
print("dw_hh_numpy :\n", np.sum(gru_numpy.weight_hh_grad_stack, 0))
print("dw_hh_torch :\n", gru_torch.all_weights[0][1].grad.data.numpy())

print("--- 代码输出 ---")
print("db_ih_numpy :\n", np.sum(gru_numpy.bias_ih_grad_stack, 0))
print("db_ih_torch :\n", gru_torch.all_weights[0][2].grad.data.numpy())

print("--- 代码输出 ---")
print("db_hh_numpy :\n", np.sum(gru_numpy.bias_hh_grad_stack, 0))
print("db_hh_torch :\n", gru_torch.all_weights[0][3].grad.data.numpy())

"""
--- 代码输出 ---
out_numpy :
 [[[ 0.307578  0.38917   0.868305  0.226222  0.190614]
  [ 0.073207  0.063558  0.439481  0.389793 -0.115967]
  [ 0.342953  0.445099  0.494275  0.18942  -0.11399 ]]

 [[ 0.262178  0.124979  0.753652 -0.024015 -0.082316]
  [ 0.053777 -0.031063  0.358107  0.072536 -0.212627]
  [ 0.208464  0.104906  0.509116  0.026988 -0.162194]]

 [[ 0.141425 -0.034831  0.656582 -0.071536 -0.178199]
  [-0.001007 -0.050403  0.306474 -0.05571  -0.174536]
  [ 0.096458 -0.031054  0.448428 -0.061591 -0.166288]]]
out_torch :
 [[[ 0.307578  0.38917   0.868305  0.226222  0.190614]
  [ 0.073207  0.063558  0.439481  0.389793 -0.115967]
  [ 0.342953  0.445099  0.494275  0.18942  -0.11399 ]]

 [[ 0.262178  0.124979  0.753652 -0.024015 -0.082316]
  [ 0.053777 -0.031063  0.358107  0.072536 -0.212627]
  [ 0.208464  0.104906  0.509116  0.026988 -0.162194]]

 [[ 0.141425 -0.034831  0.656582 -0.071536 -0.178199]
  [-0.001007 -0.050403  0.306474 -0.05571  -0.174536]
  [ 0.096458 -0.031054  0.448428 -0.061591 -0.166288]]]
--- 代码输出 ---
dx_numpy :
 [[[-0.099959  0.125734 -0.100467  0.057584]
  [-0.175371  0.278181 -0.08639  -0.081519]
  [ 0.05688   0.215838  0.006216 -0.02745 ]]

 [[-0.030292  0.117966 -0.023817 -0.078948]
  [-0.041677  0.158772  0.007034  0.036202]
  [-0.028633  0.213837  0.008546 -0.06969 ]]

 [[-0.077594  0.189323 -0.042506 -0.126031]
  [-0.021397  0.159047  0.027051 -0.110323]
  [ 0.014817  0.163531  0.020699 -0.00104 ]]]
dx_torch :
 [[[-0.099959  0.125734 -0.100467  0.057584]
  [-0.175371  0.278181 -0.08639  -0.081519]
  [ 0.05688   0.215838  0.006216 -0.02745 ]]

 [[-0.030292  0.117966 -0.023817 -0.078948]
  [-0.041677  0.158772  0.007034  0.036202]
  [-0.028633  0.213837  0.008546 -0.06969 ]]

 [[-0.077594  0.189323 -0.042506 -0.126031]
  [-0.021397  0.159047  0.027051 -0.110323]
  [ 0.014817  0.163531  0.020699 -0.00104 ]]]
--- 代码输出 ---
dw_ih_numpy :
 [[ 0.054313  0.040754  0.046713  0.056132]
 [ 0.143938  0.086123  0.133868  0.142727]
 [-0.012153 -0.020432 -0.025273 -0.01912 ]
 [ 0.250502  0.158463  0.181569  0.266292]
 [ 0.089863  0.081379  0.079555  0.086468]
 [ 0.380143  0.288339  0.288571  0.369766]
 [ 0.421876  0.260856  0.32739   0.447516]
 [ 0.095548  0.049706  0.056802  0.111859]
 [ 0.518252  0.359941  0.455362  0.608289]
 [ 0.466701  0.236542  0.426777  0.473724]
 [ 1.355748  1.005534  1.19756   1.463865]
 [ 1.438667  0.910484  1.333382  1.454368]
 [ 0.813703  0.66155   0.821699  0.913758]
 [ 1.679467  1.182209  1.29286   1.748798]
 [ 1.473526  1.200475  1.428137  1.480017]]
dw_ih_torch :
 [[ 0.054313  0.040754  0.046713  0.056132]
 [ 0.143938  0.086123  0.133868  0.142727]
 [-0.012153 -0.020432 -0.025273 -0.01912 ]
 [ 0.250502  0.158463  0.181569  0.266292]
 [ 0.089863  0.081379  0.079555  0.086468]
 [ 0.380143  0.288339  0.288571  0.369766]
 [ 0.421876  0.260856  0.32739   0.447516]
 [ 0.095548  0.049706  0.056802  0.111859]
 [ 0.518252  0.359941  0.455362  0.608289]
 [ 0.466701  0.236542  0.426777  0.473724]
 [ 1.355748  1.005534  1.19756   1.463865]
 [ 1.438667  0.910484  1.333382  1.454368]
 [ 0.813703  0.66155   0.821699  0.913758]
 [ 1.679467  1.182209  1.29286   1.748798]
 [ 1.473526  1.200475  1.428137  1.480017]]
--- 代码输出 ---
dw_hh_numpy :
 [[ 0.029407  0.040854  0.067315  0.028967  0.006582]
 [ 0.065199  0.106626  0.161274  0.110149  0.040565]
 [-0.00217   0.002182 -0.009461 -0.011639  0.012655]
 [ 0.154114  0.269694  0.300844  0.181655  0.08886 ]
 [ 0.041277  0.04673   0.102476  0.038294 -0.006607]
 [ 0.22554   0.374378  0.425336  0.237448  0.09482 ]
 [ 0.251627  0.479232  0.472401  0.366764  0.17784 ]
 [ 0.066873  0.099892  0.162182  0.052397  0.031526]
 [ 0.313399  0.564707  0.579177  0.443881  0.153558]
 [ 0.212389  0.407104  0.504583  0.422809  0.217823]
 [ 0.224363  0.357882  0.464804  0.271478  0.07211 ]
 [ 0.242434  0.376752  0.565195  0.340365  0.105577]
 [ 0.20171   0.312777  0.443363  0.292979  0.040601]
 [ 0.442316  0.728961  0.869799  0.489859  0.181804]
 [ 0.333121  0.456453  0.815045  0.469363  0.037041]]
dw_hh_torch :
 [[ 0.029407  0.040854  0.067315  0.028967  0.006582]
 [ 0.065199  0.106626  0.161274  0.110149  0.040565]
 [-0.00217   0.002182 -0.009461 -0.011639  0.012655]
 [ 0.154114  0.269694  0.300844  0.181655  0.08886 ]
 [ 0.041277  0.04673   0.102476  0.038294 -0.006607]
 [ 0.22554   0.374378  0.425336  0.237448  0.09482 ]
 [ 0.251627  0.479232  0.472401  0.366764  0.17784 ]
 [ 0.066873  0.099892  0.162182  0.052397  0.031526]
 [ 0.313399  0.564707  0.579177  0.443881  0.153558]
 [ 0.212389  0.407104  0.504583  0.422809  0.217823]
 [ 0.224363  0.357882  0.464804  0.271478  0.07211 ]
 [ 0.242434  0.376752  0.565195  0.340365  0.105577]
 [ 0.20171   0.312777  0.443363  0.292979  0.040601]
 [ 0.442316  0.728961  0.869799  0.489859  0.181804]
 [ 0.333121  0.456453  0.815045  0.469363  0.037041]]
--- 代码输出 ---
db_ih_numpy :
 [ 0.106404  0.257179 -0.039206  0.442932  0.181347  0.660625  0.72062   0.218483
  0.946051  0.759723  2.604006  2.604498  1.66155   3.041845  2.817076]
db_ih_torch :
 [ 0.106404  0.257179 -0.039206  0.442932  0.181347  0.660625  0.72062   0.218483
  0.946051  0.759723  2.604006  2.604498  1.66155   3.041845  2.817076]
--- 代码输出 ---
db_hh_numpy :
 [ 0.106404  0.257179 -0.039206  0.442932  0.181347  0.660625  0.72062   0.218483
  0.946051  0.759723  0.763548  0.904376  0.79913   1.342985  1.467562]
db_hh_torch :
 [ 0.106404  0.257179 -0.039206  0.442932  0.181347  0.660625  0.72062   0.218483
  0.946051  0.759723  0.763548  0.904376  0.79913   1.342985  1.467562]
"""

使用Jupyter Notebook进行深度学习编程 - 深度学习教程 shandianfk_com ChatGPT AI jupyter 深度学习 ide
大家好，今天我们要聊聊如何使用JupyterNotebook进行深度学习编程。深度学习是人工智能领域中的一项重要技术，通过模仿人脑神经网络的方式进行学习和分析。JupyterNotebook作为一个强大的工具，可以帮助我们轻松地进行深度学习编程，尤其适合初学者和研究人员。本文将带领大家一步步了解如何在JupyterNotebook中开展深度学习项目。一、什么是JupyterNotebook？Jup
torch.unsqueeze：灵活调整张量维度的利器冰蓝蓝 transformer transformer 深度学习
在深度学习框架PyTorch中，张量（Tensor）是最基本的数据结构，它类似于NumPy中的数组，但可以在GPU上运行。在日常的深度学习编程中，我们经常需要调整张量的维度以适应不同的操作和层。torch.unsqueeze函数就是PyTorch提供的一个非常有用的工具，用于在指定位置增加张量的维度。本文将详细介绍torch.unsqueeze的用法和一些实际应用场景。什么是torch.unsqu
Course1神经网络和深度学习编程作业毛十三_
第三周-带有一个隐藏层的平面数据分类建立一个神经网络，带有一个隐藏层。用到的知识：构建具有单隐藏层的2类分类神经网络。使用具有非线性激活功能激活函数，例如tanh。计算交叉熵损失（损失函数）。实现向前和向后传播。numpy：是用Python进行科学计算的基本软件包。sklearn：为数据挖掘和数据分析提供的简单高效的工具。matplotlib：是一个用于在Python中绘制图表的库。testCas
MOJO语言的诞生是乔乔啊 #MOJO mojo
文章目录背景目标现状背景传统的编译器技术如LLVM和GCC并不适合现有深度学习编程语言的发展迭代，无法完全支持现代芯片架构。如今，专用机器学习加速器的标准技术是MLIR。MLIR是一个相对较新的开源编译器基础架构，最初由Google（其主要负责人转到Modular）启动，已在机器学习加速器社区广泛应用。MLIR的优势在于它能够构建领域特定编译器，特别是用于不是传统CPU和GPU的奇怪领域，例如AI
Hello World！广煜永不挂科大模型微调 python pytorch mnist
一、minist数据集深度学习编程特有的helloworld程序：采用minist数据集完成意向特定深度学习项目1、minist数据集介绍MNIST数据集是一个广泛使用的手写数字识别数据集，它包含了许多不同人手写的数字图片。这个数据集被广泛用于研究手写数字识别，是深度学习领域的一个典型应用。一共包含四个文件夹：train-images-idx3-ubyte.gz：训练集图像（9912422字节）5
U-Net代码复现--utils dice_score.py 北方骑马的萝卜深度学习（代码复现）python 深度学习医学图像分割
本文记录自己的学习过程，内容包括：代码解读：Pytorch-UNet深度学习编程基础：Pytorch-深度学习（新手友好）UNet论文解读：医学图像分割：U_Net论文阅读数据：https://hackernoon.com/hacking-gta-v-for-carvana-kaggle-challenge-6d0b7fb4c781完整代码解读详见：U-Net代码复现–更新中utilsdice_s
U-Net代码复现--train.py 北方骑马的萝卜深度学习医学图像分割深度学习人工智能 python pytorch
本文记录自己的学习过程，内容包括：代码解读：Pytorch-UNet深度学习编程基础：Pytorch-深度学习（新手友好）UNet论文解读：医学图像分割：U_Net论文阅读数据：https://hackernoon.com/hacking-gta-v-for-carvana-kaggle-challenge-6d0b7fb4c781完整代码解读详见：U-Net代码复现–更新中(还在更新中。。。。。
U-Net代码复现--更新中北方骑马的萝卜深度学习深度学习 U-Net 代码解读 python pytorch
本文记录自己的学习过程，内容包括：代码解读：Pytorch-UNet深度学习编程基础：Pytorch-深度学习（新手友好）UNet论文解读：医学图像分割：U_Net论文阅读数据：https://hackernoon.com/hacking-gta-v-for-carvana-kaggle-challenge-6d0b7fb4c781参考：https://blog.csdn.net/qq_44886
吴恩达深度学习编程作业报错解决方法汇总就喜欢你看不惯我又干不掉我的样子Hhhh 人工智能深度学习
概述及资源分享大二结束后的暑假，学习吴恩达深度学习（[双语字幕]吴恩达深度学习deeplearning.ai_哔哩哔哩_bilibili）的课程，在做编程作业的时候总是遇到一些报错，尤其是导入所需要的库的时候会报一些Nomodel。。。的问题，作为深度学习的小白一枚，上网搜索方法来解决错误，有时候方法不一定都顶用，所以想把管用的方法记录一下。有时候，这些报错还和你电脑里中piplist（在命令提示
现代C++中的从头开始深度学习：【4/8】梯度下降无水先生深度学习 c++深度学习开发语言
一、说明在本系列中，我们将学习如何仅使用普通和现代C++编写必须知道的深度学习算法，例如卷积、反向传播、激活函数、优化器、深度神经网络等。在这个故事中，我们将通过引入梯度下降算法来介绍数据中2D卷积核的拟合。我们将使用卷积和上一个故事中引入的成本函数概念，将所有内容编码为现代C++和特征。这个故事是：C++的梯度下降，查看其他故事：0—现代C++深度学习编程基础1—在C++中编码2D卷积2—使用L
AI编程常用工具 Jupyter Notebook 交个朋友之猿田地 AI编程 jupyter ide python
点击上方蓝色字体，选择“设为星标”回复”云原生“获取基础架构实践深度学习编程常用工具我们先来看4个常用的编程工具：SublimeText、Vim、Jupyter。虽然我介绍的是Jupyter，但并不是要求你必须使用它，你也可以根据自己的喜好自由选择。SublimeText第一个是SublimeText，它是一个非常轻量且强大的文本编辑工具，内置了很多快捷的功能，同时还支持很丰富的插件功能，对我们来
机器学习 & 深度学习编程笔记晨同学0327 机器学习深度学习笔记
sigmoid函数defsigmoid(x):return1.0/(1+np.exp((-x)))定义最小平方和损失函数loss=torch.nn.MSELoss()线性回归编程如果不加噪音就成了正常的线性函数了，所以要加噪音。torch.normal(0,0.01,y.shape)torch.normal(0,0.01,y.shape)是一个用于生成服从正态分布的张量的函数。其中，0代表均值，0
吴恩达深度学习编程作业_吴恩达深度学习笔记(57)-深度学习框架Deep Learning frameworks... weixin_39824033 吴恩达深度学习编程作业
深度学习框架(DeepLearningframeworks)如果你已经差不多从零开始学习了使用Python和NumPy实现深度学习算法，很高兴你这样做了。但你会发现，除非应用更复杂的模型，例如卷积神经网络，或者循环神经网络，或者当你开始应用很大的模型，否则它就越来越不实用了，至少对大多数人而言，从零开始全部靠自己实现并不现实。幸运的是，现在有很多好的深度学习软件框架，可以帮助你实现这些模型。类比一
基于MATLAB编程的长短期神经网络LSTM的大豆期货价格预测神经网络机器学习智能算法画图绘图神经网络深度学习神经网络机器学习
目录背影摘要LSTM的基本定义LSTM实现的步骤基于长短期神经网络LSTM的大豆期货价格预测MATALB代码效果图结果分析展望参考论文背影期货预测是一种比较难预测的数学问题，有很多模型进行研究，但是都有局限性，准确率不高，本文用LSTM进行大豆期货价格预测，实现深度学习编程，不需要拟合公式，逼近效果好。摘要LSTM原理，MATALB编程长短期神经网络LSTM的大豆期货价格预测，LSTM的基本定义L
基于matlab编程的多输入多输出长短期神经网络回归分析神经网络机器学习智能算法画图绘图神经网络神经网络 matlab 回归
目录背影摘要LSTM的基本定义LSTM实现的步骤基于长短期神经网络LSTM的多输入多输出回归分析MATALB代码效果图结果分析展望参考论文背影期货预测是一种比较难预测的数学问题，有很多模型进行研究，但是都有局限性，准确率不高，本文用LSTM进行大豆期货价格预测，实现深度学习编程，不需要拟合公式，逼近效果好。摘要LSTM原理，MATALB编程长短期神经网络LSTM的大豆期货价格预测，LSTM的基本定
程序员入门编程3大秘诀，有匠心的程序员才能成为一名手艺人！编程狮W3Cschool
有不少人理想是做一名程序员，不过苦于没有方法，对编程望而却步。编程如何入门呢?下面w3cschool给小伙伴们说说编程入门的3大秘诀：程序员入门编程3大秘诀，有匠心的程序员才能成为一名手艺人！0、建立目标明确自己的目标，到底是想做网站，还是游戏、ios应用、安卓应用。当你找到自己的编程目标时，学习编程自然有个无形的动力在推动着你前进。1、深度学习编程初学者程序员对编程概念要有一定的了解，积累一定的
深度学习笔记（一）记录训练过程汤姆和佩琦 pytorch深度学习深度学习 pytorch python
深度学习笔记（一）记录训练过程前言一、tensorboardX中SummaryWriter记录训练过程二、总结前言本帖子主要记录深度学习编程过程中的一些笔记，欢迎指导批评。博主使用的是win11+CUDA11.4.0+CUDNN11.4+pytorch1.10+python3.6的配置环境，在pycharm中编程。提示：以下是本篇文章正文内容，部分内容参考自pytorch官网文档。一、tensor
机器学习、深度学习过程中用到的工具。梦飞想静静 python 深度学习机器学习
小伙伴们，还在为机器学习、深度学习编程苦恼吗，Python学习库来帮你!!!下面是几个网站链接，方便大家学习!http://www.csdn.net/article/2015-12-10/2826435http://blog.csdn.net/u013886628/article/details/51819142http://www.4hou.com/info/observation/4012.h
TensorFlow构建二维数据拟合模型（1） Rain:) TensorFlow tensorflow python 机器学习深度学习
知识图谱TensorFlow运行机制TensorFlow是基于计算图的深度学习编程模型Tensor表示张量，其实质上是某种类型的多维数组Flow表示基于数据流图的计算，实质上是张量在不同节点间的转化过程。在TensorFlow中，计算图中的节点称为OP（即operation的缩写），节点之间的边描述了计算之间的依赖关系。在计算过程中，一个节点可获得0或多个张量，产生0或多个张量。TensorFlo
深度学习编程笔记2：搭建网络八股之自制数据集还好江南 python 深度学习 tensorflow 机器学习神经网络
代码中难点readline()方法：从字面意思可以看出，该方法每次读出一行内容，所以，读取时占用内存小，比较适合大文件，该方法返回一个字符串对象。相对于把text文件中刑如2028_7.jpg7的数据一行行读入存到contents中其余的写在程序中代码importtensorflowastffromPILimportImageimportnumpyasnpimportostrain_path='.
深度学习编程小tips weixin_44743047 深度学习人工智能
ViT网络paddle代码加入位置信息在ViT中引入一个额外的token用来学习全局信息从而进行分类MutilHeadAttention#基于paddle#2021/12/13#注：该代码是paddlepaddle官方开的ViT课程中老师编写的，我只是把它搬运过来以防丢失，方便随#时查找importpaddleimportpaddle.nnasnnimportnumpyasnpfromPILimp
Win10 anaconda 下cuda+cuDNN+pytorch-gpu安装+导入pycharm中+小白学习需要预先知道的各种问题（小白一条龙服务）噜噜噜Luminary 深度学习 cuda anaconda pytorch cudnn python
文章目录一、下载安装anaconda3二、NVIDIA显卡驱动更新并测试三、安装并测试cuda和cudnn四、安装/卸载/测试win10系统下的GPU版本pytorch五、将pytorch导入pycharm，并测试是否导入成功六、常见安装问题和版本问题如果是编程小白，建议先看这两个博文大致了解一下之后用到的安装命令：1.深度学习编程环境概念（GPU,Tensorflow,Docker,CUDA,C
Tensorflow/Pytorch及python数据处理中问题及解决汇总（持续更新中）酸辣螺丝粉
博主在使用tensorflow进行深度学习编程的时候经常会遇到一些常见的问题，特此在这里将自己遇到的问题与解决方法进行汇总。1、tensor张量维度扩展（试图把shape为[64,10]的张量扩展为[64,128,10]的张量）n=tf.expand_dims(m,axis=1)#m为shape为[64,10]的tensor#经过tf.expand_dims扩展后的shape为[64,1,10],
【邱希鹏】神经网络与深度学习编程习题-chap1-warmup Douzi1024
1.numpy的array操作#1.导入numpy库importnumpyasnp#2.建立一个一维数组a初始化为[4,5,6],#(1)输出a的类型（type）#(2)输出a的各维度的大小（shape）#(3)输出a的第一个元素（值为4）a=np.array([4,5,6])print(type(a))print(a.shape)print(a[0])#3.建立一个二维数组b,初始化为[[4,5
使用Keras搭建神经网络【Tensorflow笔记-ch3】 wykup AI Tensorflow笔记
使用Keras搭建神经网络课程链接1tf.keras搭建神经网络八股1.1keras介绍tf.keras是tensorflow2引入的高封装度的框架，可以用于快速搭建神经网络模型，keras为支持快速实验而生，能够把想法迅速转换为结果，是深度学习框架之中最终易上手的一个，它提供了一致而简洁的API，能够极大地减少一般应用下的工作量，提高代码地封装程度和复用性。Keras官方文档深度学习编程框架中的
深度学习编程入门deep-learning-for-image-processing-master 关于图片分类test1_official_demo的学习 King Bob!! 深度学习分类学习
这个小文件夹有三个部分组成，分别有model,predict和train首先从train开始学习importtorchimporttorchvisionimporttorch.nnasnnfrommodelimportLeNetimporttorch.optimasoptimimporttorchvision.transformsastransformsdefmain():transform=tr
【吴恩达深度学习编程作业】4.4特殊应用——人脸识别InvalidArgumentError: Default MaxPoolingOp only supports NHWC on device ty weixin_44177999 深度学习 tensorflow python
针对人脸识别中，运行到database就出错了。主要原因还是CPU支持的是NHWC，而吴恩达老师格式是NCHW。再则是因为K.set_image_data_format('channels_last')，这段代码改变了输入数据的形式。各段代码更新如下：主函数：fromkeras.modelsimportSequentialfromkeras.layersimportConv2D,ZeroPaddi
【2022·深度强化学习课程】深度强化学习极简入门与Pytorch实战二向箔不会思考 pytorch python 人工智能
课程名称：深度强化学习极简入门与Pytorch实战课程内容：强化学习基础理论，Python和深度学习编程基础、深度强化学习理论与编程实战课程地址：https://edu.csdn.net/course/detail/37122文章目录【0】课程导言【1】一图看懂课程内容【2】课程章节设置【3】课程部分项目截图【4】课程代码与课件【0】课程导言强化学习作为行为主义人工智能学派的典型代表，近几年与深度
【吴恩达深度学习编程作业】4.2深度卷积网络——Keras入门与残差网络的搭建贪钱算法还我头发 AI #Deep Learning 卷积神经网络深度学习
参考文章：Keras入门与残差网络的搭建结果就是笑脸检测并不准确，手势识别也不准确。1.Keras入门——笑脸识别main.pyimportnumpyasnpimportmatplotlib.pyplotaspltfrommatplotlib.pyplotimportimshowfromkeras.layersimportInput,Dense,Activation,ZeroPadding2D,B
【吴恩达深度学习编程作业】4.1卷积神经网络——搭建卷积神经网络模型以及应用贪钱算法还我头发 AI #Deep Learning 深度学习 tensorflow 卷积神经网络 python
参考文章：搭建卷积神经网络以及应用神经网络的底层搭建实现一个拥有卷积层CONV和池化层POOL的网络，包含前向和反向传播CONV模块包括：使用0扩充边界：没有缩小高度和宽度；保留边界的更多信息卷积窗口前向卷积反向卷积POOL模块包括：前向池化创建掩码值分配反向池化main.pyimportnumpyasnpimportmatplotlib.pyplotaspltplt.rcParams['figu
分享100个最新免费的高匿HTTP代理IP mcj8089 代理IP 代理服务器匿名代理免费代理IP 最新代理IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ 120.198.243.130:80,中国/广东省 58.251.78.71:8088,中国/广东省 183.207.228.22:83,中国/
mysql高级特性之数据分区 annan211 java 数据结构 mongodb 分区 mysql
mysql高级特性 1 以存储引擎的角度分析，分区表和物理表没有区别。是按照一定的规则将数据分别存储的逻辑设计。器底层是由多个物理字表组成。 2 分区的原理分区表由多个相关的底层表实现，这些底层表也是由句柄对象表示，所以我们可以直接访问各个分区。存储引擎管理分区的各个底层表和管理普通表一样(所有底层表都必须使用相同的存储引擎)，分区表的索引只是
JS采用正则表达式简单获取URL地址栏参数 chiangfai js 地址栏参数获取
GetUrlParam:function GetUrlParam(param){ var reg = new RegExp("(^|&)"+ param +"=([^&]*)(&|$)"); var r = window.location.search.substr(1).match(reg); if(r!=null
怎样将数据表拷贝到powerdesigner (本地数据库表) Array_06 powerDesigner
================================================== 1、打开PowerDesigner12，在菜单中按照如下方式进行操作 file->Reverse Engineer->DataBase 点击后，弹出 New Physical Data Model 的对话框 2、在General选项卡中 Model name:模板名字，自
logbackのhelloworld 飞翔的马甲日志 logback
一、概述 1.日志是啥？当我是个逗比的时候我是这么理解的：log.debug()代替了system.out.print(); 当我项目工作时，以为是一堆得.log文件。这两天项目发布新版本，比较轻松，决定好好地研究下日志以及logback。传送门1：日志的作用与方法： http://www.infoq.com/cn/articles/why-and-how-log 上面的作
新浪微博爬虫模拟登陆随意而生新浪微博
转载自：http://hi.baidu.com/erliang20088/item/251db4b040b8ce58ba0e1235 近来由于毕设需要，重新修改了新浪微博爬虫废了不少劲，希望下边的总结能够帮助后来的同学们。现行版的模拟登陆与以前相比，最大的改动在于cookie获取时候的模拟url的请求
synchronized 香水浓 java thread
Java语言的关键字，可用来给对象和方法或者代码块加锁，当它锁定一个方法或者一个代码块的时候，同一时刻最多只有一个线程执行这段代码。当两个并发线程访问同一个对象object中的这个加锁同步代码块时，一个时间内只能有一个线程得到执行。另一个线程必须等待当前线程执行完这个代码块以后才能执行该代码块。然而，当一个线程访问object的一个加锁代码块时，另一个线程仍然
maven 简单实用教程 AdyZhang maven
1. Maven介绍 1.1. 简介 java编写的用于构建系统的自动化工具。目前版本是2.0.9，注意maven2和maven1有很大区别，阅读第三方文档时需要区分版本。 1.2. Maven资源见官方网站；The 5 minute test，官方简易入门文档；Getting Started Tutorial，官方入门文档；Build Coo
Android 通过 intent传值获得null aijuans android
我在通过intent 获得传递兑现过的时候报错，空指针,我是getMap方法进行传值，代码如下 1 2 3 4 5 6 7 8 9 public void getMap(View view){ Intent i =
apache 做代理报如下错误：The proxy server received an invalid response from an upstream baalwolf response
网站配置是apache＋tomcat,tomcat没有报错，apache报错是： The proxy server received an invalid response from an upstream server. The proxy server could not handle the request GET /. Reason: Error reading fr
Tomcat6 内存和线程配置 BigBird2012 tomcat6
1、修改启动时内存参数、并指定JVM时区（在windows server 2008 下时间少了8个小时）在Tomcat上运行j2ee项目代码时，经常会出现内存溢出的情况，解决办法是在系统参数中增加系统参数： window下，在catalina.bat最前面 set JAVA_OPTS=-XX:PermSize=64M -XX:MaxPermSize=128m -Xms5
Karam与TDD bijian1013 Karam TDD
一.TDD 测试驱动开发（Test-Driven Development,TDD）是一种敏捷（AGILE）开发方法论，它把开发流程倒转了过来，在进行代码实现之前，首先保证编写测试用例，从而用测试来驱动开发（而不是把测试作为一项验证工具来使用）。 TDD的原则很简单： a.只有当某个
[Zookeeper学习笔记之七]Zookeeper源代码分析之Zookeeper.States bit1129 zookeeper
public enum States { CONNECTING, //Zookeeper服务器不可用，客户端处于尝试链接状态 ASSOCIATING, //？？？ CONNECTED, //链接建立，可以与Zookeeper服务器正常通信 CONNECTEDREADONLY, //处于只读状态的链接状态，只读模式可以在
【Scala十四】Scala核心八：闭包 bit1129 scala
Free variable A free variable of an expression is a variable that’s used inside the expression but not defined inside the expression. For instance, in the function literal expression (x: Int) => (x
android发送json并解析返回json ronin47 android
package com.http.test; import org.apache.http.HttpResponse; import org.apache.http.HttpStatus; import org.apache.http.client.HttpClient; import org.apache.http.client.methods.HttpGet; import
一份IT实习生的总结 brotherlamp PHP php资料 php教程 php培训 php视频
今天突然发现在不知不觉中自己已经实习了 3 个月了，现在可能不算是真正意义上的实习吧，因为现在自己才大三，在这边撸代码的同时还要考虑到学校的功课跟期末考试。让我震惊的是，我完全想不到在这 3 个月里我到底学到了什么，这是一件多么悲催的事情啊。同时我对我应该 get 到什么新技能也很迷茫。所以今晚还是总结下把，让自己在接下来的实习生活有更加明确的方向。最后感谢工作室给我们几个人这个机会让我们提前出来
据说是2012年10月人人网校招的一道笔试题-给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。将重物放到天平左侧，问在两边如何添加砝码 bylijinnan java
public class ScalesBalance { /** * 题目： * 给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。（假设N无限大，但一种重量的砝码只有一个） * 将重物放到天平左侧，问在两边如何添加砝码使两边平衡 * * 分析： * 三进制 * 我们约定括号表示里面的数是三进制，例如 47=(1202
dom4j最常用最简单的方法 chiangfai dom4j
要使用dom4j读写XML文档,需要先下载dom4j包,dom4j官方网站在 http://www.dom4j.org/目前最新dom4j包下载地址:http://nchc.dl.sourceforge.net/sourceforge/dom4j/dom4j-1.6.1.zip 解开后有两个包,仅操作XML文档的话把dom4j-1.6.1.jar加入工程就可以了,如果需要使用XPath的话还需要
简单HBase笔记 chenchao051 hbase
一、Client-side write buffer 客户端缓存请求描述：可以缓存客户端的请求，以此来减少RPC的次数，但是缓存只是被存在一个ArrayList中，所以多线程访问时不安全的。可以使用getWriteBuffer()方法来取得客户端缓存中的数据。默认关闭。二、Scan的Caching 描述： next( )方法请求一行就要使用一次RPC,即使
mysqldump导出时出现when doing LOCK TABLES daizj mysql mysqdump 导数据
　　执行　mysqldump -uxxx -pxxx -hxxx -Pxxxx database tablename > tablename.sql　导出表时，会报 mysqldump: Got error: 1044: Access denied for user 'xxx'@'xxx' to database 'xxx' when doing LOCK TABLES 解决
CSS渲染原理 dcj3sjt126com Web
从事Web前端开发的人都与CSS打交道很多，有的人也许不知道css是怎么去工作的，写出来的css浏览器是怎么样去解析的呢？当这个成为我们提高css水平的一个瓶颈时，是否应该多了解一下呢？一、浏览器的发展与CSS
《阿甘正传》台词 dcj3sjt126com
Part Ⅰ: 《阿甘正传》Forrest Gump经典中英文对白 Forrest: Hello! My names Forrest. Forrest Gump. You wanna Chocolate? I could eat about a million and a half othese. My momma always said life was like a box ochocol
Java处理JSON dyy_gusi json
Json在数据传输中很好用，原因是JSON 比 XML 更小、更快，更易解析。在Java程序中，如何使用处理JSON，现在有很多工具可以处理，比较流行常用的是google的gson和alibaba的fastjson，具体使用如下： 1、读取json然后处理 class ReadJSON { public static void main(String[] args)
win7下nginx和php的配置 geeksun nginx
1. 安装包准备 nginx : 从nginx.org下载nginx-1.8.0.zip php：从php.net下载php-5.6.10-Win32-VC11-x64.zip， php是免安装文件。 RunHiddenConsole: 用于隐藏命令行窗口 2. 配置 # java用8080端口做应用服务器，nginx反向代理到这个端口即可 p
基于2.8版本redis配置文件中文解释 hongtoushizi redis
转载自： http://wangwei007.blog.51cto.com/68019/1548167 在Redis中直接启动redis-server服务时, 采用的是默认的配置文件。采用redis-server xxx.conf 这样的方式可以按照指定的配置文件来运行Redis服务。下面是Redis2.8.9的配置文
第五章常用Lua开发库3-模板渲染 jinnianshilongnian nginx lua
动态web网页开发是Web开发中一个常见的场景，比如像京东商品详情页，其页面逻辑是非常复杂的，需要使用模板技术来实现。而Lua中也有许多模板引擎，如目前我在使用的lua-resty-template，可以渲染很复杂的页面，借助LuaJIT其性能也是可以接受的。如果学习过JavaEE中的servlet和JSP的话，应该知道JSP模板最终会被翻译成Servlet来执行；而lua-r
JZSearch大数据搜索引擎颠覆者 JavaScript
系统简介：大数据的特点有四个层面：第一，数据体量巨大。从TB级别，跃升到PB级别；第二，数据类型繁多。网络日志、视频、图片、地理位置信息等等。第三，价值密度低。以视频为例，连续不间断监控过程中，可能有用的数据仅仅有一两秒。第四，处理速度快。最后这一点也是和传统的数据挖掘技术有着本质的不同。业界将其归纳为4个“V”——Volume，Variety，Value，Velocity。大数据搜索引
10招让你成为杰出的Java程序员 pda158 java 编程框架
如果你是一个热衷于技术的 Java 程序员，那么下面的 10 个要点可以让你在众多 Java 开发人员中脱颖而出。　　 1. 拥有扎实的基础和深刻理解 OO 原则　　对于 Java 程序员，深刻理解 Object Oriented Programming（面向对象编程）这一概念是必须的。没有 OOPS 的坚实基础，就领会不了像 Java 这些面向对象编程语言
tomcat之oracle连接池配置小网客 oracle
tomcat版本7.0 配置oracle连接池方式：修改tomcat的server.xml配置文件： <GlobalNamingResources> <Resource name="utermdatasource" auth="Container" type="javax.sql.DataSou
Oracle 分页算法汇总 vipbooks oracle sql 算法 .net
这是我找到的一些关于Oracle分页的算法，大家那里还有没有其他好的算法没？我们大家一起分享一下！ -- Oracle 分页算法一 select * from ( select page.*,rownum rn from (select * from help) page -- 20 = (currentPag

纯Python和PyTorch对比实现门控循环单元GRU及反向传播

摘要

相关

正文

1. GRUCell 类

2. GRUCell 测试

3. GRU 测试

你可能感兴趣的:(深度学习编程)