AncilunKiang

《动手学深度学习 Pytorch版》 9.1 门控循环单元（GRU）

我们可能会遇到这样的情况：

早期观测值对预测所有未来观测值具有非常重要的意义。

考虑一个极端情况，其中第一个观测值包含一个校验和，目标是在序列的末尾辨别校验和是否正确。在这种情况下，第一个词元的影响至关重要。我们希望有某些机制能够在一个记忆元里存储重要的早期信息。如果没有这样的机制，我们将不得不给这个观测值指定一个非常大的梯度，因为它会影响所有后续的观测值。
一些词元没有相关的观测值。

例如，在对网页内容进行情感分析时，可能有一些辅助HTML代码与网页传达的情绪无关。我们希望有一些机制来跳过隐状态表示中的此类词元。
序列的各个部分之间存在逻辑中断。

例如，书的章节之间可能会有过渡存在，或者证券的熊市和牛市之间可能会有过渡存在。在这种情况下，最好有一种方法来重置我们的内部状态表示。

在学术界已经提出了许多方法来解决这类问题。其中最早的方法是“长短期记忆”（long-short-term memory，LSTM）,将在 9.2节中讨论。门控循环单元（gated recurrent unit，GRU）是一个稍微简化的变体，通常能够提供同等的效果，并且计算的速度明显更快。由于门控循环单元更简单，我们从它开始解读。

9.1.1 门控隐状态

9.1.1.1 重置门和更新门

重置门（reset gate）：控制“可能还想记住”的过去状态的数量，也就是控制旧状态的影响。
更新门（update gate）：控制新状态中有多少个是旧状态的副本，也就是控制新状态的影响。

要点：

两个门是 $(0, 1)$ 区间中的向量，这样就可以进行凸组合。
输入由当前时间步的输入和前一时间步的隐状态给出
输出由使用sigmoid激活函数的两个全连接层给出

门控循环单元的数学表达如下：

$\begin{align} \boldsymbol{R}_t&=\sigma(\boldsymbol{X}_t\boldsymbol{W}_{xr}+\boldsymbol{H}_{t-1}\boldsymbol{W}_{hr}+b_r)\\ \boldsymbol{Z}_t&=\sigma(\boldsymbol{X}_t\boldsymbol{W}_{xz}+\boldsymbol{H}_{t-1}\boldsymbol{W}_{hz}+b_z)\\ \end{align}$

参数字典：

$\boldsymbol{X}_t\in\R^{n\times d}$ 表示小批量输入
- $n$ 表示样本个数
- $n$ 表示输入个数
$\boldsymbol{H}_{t-1}\in\R^{n\times h}$ 表示上一个时间步的隐状态
- $h$ 表示隐藏单元个数
$\boldsymbol{R}_t\in\R^{n\times h}$ 表示重置门
$\boldsymbol{Z}_t\in\R^{n\times h}$ 表示更新门
$\boldsymbol{W}_{xr},\boldsymbol{W}_{xz}\in\R^{d\times h}$ $\boldsymbol{W}_{hr},\boldsymbol{W}_{hz}\in\R^{h\times h}$ 表示权重参数
$b_r,b_z\in\R^{1\times h}$ 表示偏重参数

在求和过程中会触发广播机制。使用 sigmoid 函数将输入值转换到区间 $(0, 1)$ 。

9.1.1.2 候选隐状态

将重置门 $R_t$ 与常规隐状态更新机制集成，得到在时间步 $t$ 的候选隐状态（candidate hidden state） $\tilde{\boldsymbol{H}_t}\in\R^{n\times h}$ ：

$\tilde{\boldsymbol{H}_t}=tanh(\boldsymbol{X}_t\boldsymbol{W}_{xh}+(\boldsymbol{R}_t\odot\boldsymbol{H}_{t-1})\boldsymbol{W}_{hh}+\boldsymbol{b}_h)$

与常规隐状态更新机制公式相比， $\boldsymbol{R}_t$ 和 $\boldsymbol{H}_{t-1}$ 的元素相乘可以减少以往状态的影响。

当重置门 $R_t$ 中的项接近 1 时，就恢复一个如常规隐状态更新机制公式中的普通的循环神经网络。
对于重置门 $R_t$ 中所有接近 0 的项，候选隐状态是以 $X_t$ 作为输入的多层感知机的结果。因此，任何预先存在的隐状态都会被重置为默认值。

9.1.1.3 隐状态

上述的计算结果只是候选隐状态，接下来仍然需要结合更新门的效果。这一步确定新的隐状态 $\boldsymbol{H}_t\in\R^{n\times h}$ 在多大程度上来自旧的状态 $\boldsymbol{H}_{t-1}$ 和新的候选状态 $\tilde{\boldsymbol{H}_t}$ 。更新门 $\boldsymbol{Z}_t$ 仅需要在 $\boldsymbol{H}_{t-1}$ 和 $\tilde{\boldsymbol{H}_t}$ 之间进行按元素的凸组合就可以实现这个目标。这就得出了门控循环单元的最终更新公式：

$\boldsymbol{H}_t=\boldsymbol{Z}_t\odot\boldsymbol{H}_{t-1}+(1-\boldsymbol{Z}_t)\odot\tilde{\boldsymbol{H}_t}$

每当更新门 $Z_t$ 接近 1 时，模型就倾向只保留旧状态。此时，来自 $X_t$ 的信息基本上被忽略，从而有效地跳过了依赖链条中的时间步。
当 $Z_t$ 接近 0 时，新的隐状态 $H_t$ 就会接近候选隐状态 $\tilde{\boldsymbol{H}_t}$ 。

这些设计可以帮助我们处理循环神经网络中的梯度消失问题，并更好地捕获时间步距离很长的序列的依赖关系。例如，如果整个子序列的所有时间步的更新门都接近于 1，则无论序列的长度如何，在序列起始时间步的旧隐状态都将很容易保留并传递到序列结束。

总之，门控循环单元具有以下两个显著特征：

重置门有助于捕获序列中的短期依赖关系；
更新门有助于捕获序列中的长期依赖关系。

9.1.2 从零开始实现

import torch
from torch import nn
from d2l import torch as d2l

batch_size, num_steps = 32, 35
train_iter, vocab = d2l.load_data_time_machine(batch_size, num_steps)  # 读取时间机器数据集

9.1.2.1 初始化模型参数

def get_params(vocab_size, num_hiddens, device):  # 初始化模型参数
    num_inputs = num_outputs = vocab_size

    def normal(shape):
        return torch.randn(size=shape, device=device)*0.01

    def three():
        return (normal((num_inputs, num_hiddens)),
                normal((num_hiddens, num_hiddens)),
                torch.zeros(num_hiddens, device=device))

    W_xz, W_hz, b_z = three()  # 更新门参数
    W_xr, W_hr, b_r = three()  # 重置门参数
    W_xh, W_hh, b_h = three()  # 候选隐状态参数
    # 输出层参数
    W_hq = normal((num_hiddens, num_outputs))
    b_q = torch.zeros(num_outputs, device=device)
    # 附加梯度
    params = [W_xz, W_hz, b_z, W_xr, W_hr, b_r, W_xh, W_hh, b_h, W_hq, b_q]
    for param in params:
        param.requires_grad_(True)
    return params

9.1.2.2 定义模型

def init_gru_state(batch_size, num_hiddens, device):  # 隐状态初始化
    return (torch.zeros((batch_size, num_hiddens), device=device), )

def gru(inputs, state, params):
    W_xz, W_hz, b_z, W_xr, W_hr, b_r, W_xh, W_hh, b_h, W_hq, b_q = params
    H, = state  # 优雅，逗号解包
    outputs = []
    for X in inputs:
        Z = torch.sigmoid((X @ W_xz) + (H @ W_hz) + b_z)  # 更新门运算 @符号做哈达玛积
        R = torch.sigmoid((X @ W_xr) + (H @ W_hr) + b_r)  # 重置门运算
        H_tilda = torch.tanh((X @ W_xh) + ((R * H) @ W_hh) + b_h)  # 候选隐状态
        H = Z * H + (1 - Z) * H_tilda  # 隐状态计算
        Y = H @ W_hq + b_q  # 预测值计算
        outputs.append(Y)
    return torch.cat(outputs, dim=0), (H,)

9.1.2.3 训练预测

vocab_size, num_hiddens, device = len(vocab), 256, d2l.try_gpu()
num_epochs, lr = 500, 1
model = d2l.RNNModelScratch(len(vocab), num_hiddens, device, get_params,
                            init_gru_state, gru)
d2l.train_ch8(model, train_iter, vocab, lr, num_epochs, device)

perplexity 1.0, 32229.1 tokens/sec on cuda:0
time travelleryou can show black is white by argument said filby
traveller with a slight accession ofcheerfulness really thi

9.1.3 简洁实现

num_inputs = vocab_size
gru_layer = nn.GRU(num_inputs, num_hiddens)
model = d2l.RNNModel(gru_layer, len(vocab))
model = model.to(device)
d2l.train_ch8(model, train_iter, vocab, lr, num_epochs, device)

perplexity 1.0, 182698.8 tokens/sec on cuda:0
time traveller with a slight accession ofcheerfulness really thi
travelleryou can show black is white by argument said filby

练习

（1）假设我们只想使用时间步 $t^{'}$ 的输入来预测时间步 $t > t^{'}$ 的输出。对于每个时间步，重置门和更新门的最佳值是什么？

不会。

（2）调整和分析超参数对运行时间、困惑度和输出顺序的影响。

分别修改各个参数试试、

def test(Hyperparameters):  # [batch_size, num_steps, num_hiddens, lr, num_epochs]
    train_iter_now, vocab_now = d2l.load_data_time_machine(Hyperparameters[0], Hyperparameters[1])

    gru_layer_now = nn.GRU(len(vocab_now), Hyperparameters[2])
    net_now = d2l.RNNModel(gru_layer_now, len(vocab_now))
    net_now = model.to(device)
    d2l.train_ch8(net_now, train_iter_now, vocab_now, Hyperparameters[3], Hyperparameters[4], d2l.try_gpu())

Hyperparameters_lists = [
    [64, 35, 256, 1, 500],  # 加批量大小
    [32, 64, 256, 1, 500],  # 加时间步
    [32, 35, 512, 1, 500],  # 加隐藏单元数
    [32, 35, 256, 0.5, 500],  # 减半学习率
    [32, 35, 256, 1, 200]  # 减轮数
]

for Hyperparameters in Hyperparameters_lists:
    test(Hyperparameters)

perplexity 1.0, 194760.4 tokens/sec on cuda:0
time traveller for so it will be convenient to speak of himwas e
travelleryou can show black is white by argument said filby

（3）比较 rnn.RNN 和 rnn.GRU 的不同实现对运行时间、困惑度和输出字符串的影响。

batch_size2, num_steps2 = 32, 35
train_iter2, vocab2 = d2l.load_data_time_machine(batch_size2, num_steps2)

vocab_size2, num_hiddens2, device = len(vocab2), 256, d2l.try_gpu()
num_epochs2, lr2 = 500, 1
num_inputs2 = vocab_size2

gru_layer2 = nn.GRU(num_inputs2, num_hiddens2)
net_GRU = d2l.RNNModel(gru_layer2, len(vocab2))
net_GRU = model.to(device)
d2l.train_ch8(net_GRU, train_iter2, vocab2, lr2, num_epochs2, device)

perplexity 1.0, 196633.4 tokens/sec on cuda:0
time traveller for so it will be convenient to speak of himwas e
traveller with a slight accession ofcheerfulness really thi

rnn_layer = nn.RNN(len(vocab2), num_hiddens2)
net_RNN = d2l.RNNModel(rnn_layer, vocab_size=len(vocab2))
net_RNN = net_RNN.to(device)
d2l.train_ch8(net_RNN, train_iter2, vocab2, lr2, num_epochs2, device)

perplexity 1.3, 190636.6 tokens/sec on cuda:0
time traveller held in his hand was a glitteringmetallic framewo
travellerisctallerasced fo the onther fite dok you know hom

（4）如果仅仅实现门控循环单元的一部分，例如，只有一个重置门或一个更新门会怎样？

去掉更新门根本不带收敛的；去掉重置门还行，甚至更平滑了。

# 删除更新门

batch_size, num_steps = 32, 35
train_iter, vocab = d2l.load_data_time_machine(batch_size, num_steps)

def get_params_change1(vocab_size, num_hiddens, device):
    num_inputs = num_outputs = vocab_size

    def normal(shape):
        return torch.randn(size=shape, device=device)*0.01

    def three():
        return (normal((num_inputs, num_hiddens)),
                normal((num_hiddens, num_hiddens)),
                torch.zeros(num_hiddens, device=device))

    # W_xz, W_hz, b_z = three()
    W_xr, W_hr, b_r = three()
    W_xh, W_hh, b_h = three()
    W_hq = normal((num_hiddens, num_outputs))
    b_q = torch.zeros(num_outputs, device=device)
    # params = [W_xz, W_hz, b_z, W_xr, W_hr, b_r, W_xh, W_hh, b_h, W_hq, b_q]
    params = [W_xr, W_hr, b_r, W_xh, W_hh, b_h, W_hq, b_q]
    for param in params:
        param.requires_grad_(True)
    return params

def init_gru_state_change1(batch_size, num_hiddens, device):
    return (torch.zeros((batch_size, num_hiddens), device=device), )

def gru_change1(inputs, state, params):
    # W_xz, W_hz, b_z, W_xr, W_hr, b_r, W_xh, W_hh, b_h, W_hq, b_q = params
    W_xr, W_hr, b_r, W_xh, W_hh, b_h, W_hq, b_q = params
    H, = state
    outputs = []
    for X in inputs:
        # Z = torch.sigmoid((X @ W_xz) + (H @ W_hz) + b_z)
        R = torch.sigmoid((X @ W_xr) + (H @ W_hr) + b_r)
        H_tilda = torch.tanh((X @ W_xh) + ((R * H) @ W_hh) + b_h)
        # H = Z * H + (1 - Z) * H_tilda
        Y = H_tilda @ W_hq + b_q
        outputs.append(Y)
    return torch.cat(outputs, dim=0), (H,)

vocab_size, num_hiddens, device = len(vocab), 256, d2l.try_gpu()
num_epochs, lr = 500, 1
model_change1 = d2l.RNNModelScratch(len(vocab), num_hiddens, device, get_params_change1,
                            init_gru_state_change1, gru_change1)
d2l.train_ch8(model_change1, train_iter, vocab, lr, num_epochs, device)

perplexity 10.0, 45023.4 tokens/sec on cuda:0
time travellere the the the the the the the the the the the the 
travellere the the the the the the the the the the the the

# 删除重置门

batch_size, num_steps = 32, 35
train_iter, vocab = d2l.load_data_time_machine(batch_size, num_steps)

def get_params_change2(vocab_size, num_hiddens, device):
    num_inputs = num_outputs = vocab_size

    def normal(shape):
        return torch.randn(size=shape, device=device)*0.01

    def three():
        return (normal((num_inputs, num_hiddens)),
                normal((num_hiddens, num_hiddens)),
                torch.zeros(num_hiddens, device=device))

    W_xz, W_hz, b_z = three()
    # W_xr, W_hr, b_r = three()
    W_xh, W_hh, b_h = three()
    W_hq = normal((num_hiddens, num_outputs))
    b_q = torch.zeros(num_outputs, device=device)
    # params = [W_xz, W_hz, b_z, W_xr, W_hr, b_r, W_xh, W_hh, b_h, W_hq, b_q]
    params = [W_xz, W_hz, b_z, W_xh, W_hh, b_h, W_hq, b_q]
    for param in params:
        param.requires_grad_(True)
    return params

def init_gru_state_change2(batch_size, num_hiddens, device):
    return (torch.zeros((batch_size, num_hiddens), device=device), )

def gru_change2(inputs, state, params):
    # W_xz, W_hz, b_z, W_xr, W_hr, b_r, W_xh, W_hh, b_h, W_hq, b_q = params
    W_xz, W_hz, b_z, W_xh, W_hh, b_h, W_hq, b_q = params
    H, = state
    outputs = []
    for X in inputs:
        Z = torch.sigmoid((X @ W_xz) + (H @ W_hz) + b_z)
        # R = torch.sigmoid((X @ W_xr) + (H @ W_hr) + b_r)
        # H_tilda = torch.tanh((X @ W_xh) + ((R * H) @ W_hh) + b_h)
        H_tilda = torch.tanh((X @ W_xh) + (H @ W_hh) + b_h)
        H = Z * H + (1 - Z) * H_tilda
        Y = H_tilda @ W_hq + b_q
        outputs.append(Y)
    return torch.cat(outputs, dim=0), (H,)

vocab_size, num_hiddens, device = len(vocab), 256, d2l.try_gpu()
num_epochs, lr = 500, 1
model_change2 = d2l.RNNModelScratch(len(vocab), num_hiddens, device, get_params_change2,
                            init_gru_state_change2, gru_change2)
d2l.train_ch8(model_change2, train_iter, vocab, lr, num_epochs, device)

perplexity 1.0, 38633.7 tokens/sec on cuda:0
time travelleryou can show black is white by argument said filby
traveller with a slight accession ofcheerfulness really thi

生死四分钟4 minute泰剧免费在线观看《死生时刻》4分钟中文字幕高清HD全集4 Minutes完整无删减版观看-4分钟在哪看多少集百度云/夸克迅雷网盘资源优惠攻略官
《生死四分钟》（4Minutes）是一部泰国电视剧，讲述了一个关于时间、命运和选择的故事。主角Great是一名工商管理学院的大学生，同时也是一位富有企业主的儿子。他意外获得了一种超自然的力量，可以预见四分钟后的未来，这种能力使他能够改变许多事件的结果。Great在某天遇见了外科住院医生Tyme，两人逐渐增进关系并开始发展。死生时刻链接：https://pan.quark.cn/s/d4c20b70
GPT-3 面试题
简介1、GPT-3是什么？它是基于什么模型的？GPT-3是一种基于深度学习原理的语言预测模型。它是由OpenAI开发的，可以从互联网数据中生成任何类型的文本。它只需要一小段文本作为输入，就可以生成大量的准确和复杂的机器生成文本²⁴。GPT-3是基于Transformer模型的，使用了仅有解码器的自回归架构。它使用下一个单词预测目标进行训练¹²。GPT-3有8个不同的模型，参数从1.25亿到1750
大白转战小荧幕——《超能陆战队第1季》妙介子
大白转战小荧幕——《超能陆战队第1季》今天聊聊美剧《超能陆战队第1季》。片名BigHero6:TheSeriesSeason1(2017)，别名超能陆战队动画剧。迪斯尼的《超能陆战队》大获成功后，电视剧版、漫画统统安排上了。2017年电视剧版《超能陆战队》终于上映，深受观众们喜爱的大白也重新和大家相遇。当初《超能陆战队》能够获得奥斯卡最佳动画长片，除了故事完成度很高外，还有一项的视觉重要技术也是功
林妍林经(哥哥假死回来后，全家都疯了)全章节在线阅读_(哥哥假死回来后，全家都疯了)完结版免费阅读_林妍林经《哥哥假死回来后，全家都疯了》完结版免费阅读_林妍林经热门小说_哥哥假死回来后，全家都... 笔趣阁官方账号
林妍林经(哥哥假死回来后，全家都疯了)全章节在线阅读_(哥哥假死回来后，全家都疯了)完结版免费阅读_林妍林经《哥哥假死回来后，全家都疯了》完结版免费阅读_林妍林经热门小说_哥哥假死回来后，全家都疯了(林妍林经)全集阅读_哥哥假死回来后，全家都疯了最新章节阅读主角配角：林妍林经简介：大厅里，我唯一的好朋友兼同桌张平平正跟警员沟通她说我的手机打不通，明明约好见面的日子也爽约看着她着急得双眼通红，我的心
边缘计算与量子模型优化驱动医疗诊断新突破
内容概要在医疗人工智能领域，边缘计算与量子模型优化的协同演进正重构诊断系统的技术范式。通过将计算节点前置至医疗设备端，边缘架构有效解决了传统云端模型面临的实时性瓶颈，配合量子优化算法对复杂特征空间的快速寻优能力，使得CT、MRI等高维影像数据的解析效率提升显著。值得关注的是，框架选型直接影响着模型部署的可行性——TensorFlow在移动端推理优化方面的工具链完备性，与PyTorch动态图机制对迭
【PTA数据结构 | C语言版】我爱背单词秋说 PTA 数据结构题目集数据结构 c语言算法
本专栏持续输出数据结构题目集，欢迎订阅。文章目录题目代码题目作为一个勤奋的学生，你在阅读一段英文文章时，是否希望有个程序能自动帮你把没有背过的生词列出来？本题就请你实现这个程序。输入格式：输入第1行给出1个正整数n（2≤n≤10^3），为已经背下来的单词的数量。接下来输入的每行是不超过20个字符的、仅由小写英文字母组成的单词。题目保证没有重复的单词。最后是一段整理好的英文文章，文章仅包含不超过20
放弃暗恋后，疯批哥哥宠她入骨(宋亦凝、贺今尧)最新章节在线阅读_(放弃暗恋后，疯批哥哥宠她入骨)最新章节在线阅读_放弃暗恋后，疯批哥哥宠她入骨(宋亦凝、贺今尧)完结版免费阅读_放弃暗恋后，疯批哥... 霸道推书2
书名：《放弃暗恋后，疯批哥哥宠她入骨》主角配角：宋亦凝、贺今尧小说简介：那年，她被留在遗弃的空房子中，叫天天不应，叫地地不灵。还是他把她带回了家。从那天起，她便成了他名义上的妹妹，可惜，只是妹妹……他告诉她，只要她乖乖听话，他不会不管她，可每一次看到他和别的女人在一起，她的心都会隐隐作痛。后来，一次醉酒，她意外和哥哥的兄弟混在了一起。她：“我不缺哥哥。”哥哥的兄弟：“乖，你还小……”还小？她最讨厌
《于氏王后》韩剧全集8集大结局完整未删减版【1080p超清韩语中字】2024年于氏王后高清完整版免费在线观看播放-百度云/夸克迅雷UC网盘资源全网优惠分享
《于氏王后》韩剧全集8集大结局完整未删减版【1080p超清韩语中字】2024年于氏王后高清完整版免费在线观看播放-百度云/夸克迅雷UC网盘资源《于氏王后》是一部以高句丽时代为背景的韩剧，讲述了因国王高男武（池昌旭饰）突然去世，引发的王位争夺战。于正熙（全钟瑞饰）作为王后，面临着来自各方的威胁和挑战，她必须在24小时内为成为新国王而孤军奋战。剧中，乙巴素（金武烈饰）为了阻止王权争夺而向于正熙求婚，而
精通 triton 使用 MLIR 的源码逻辑 - 第001节：triton 的应用简介
项目使用到MLIR，通过了解triton对MLIR的使用，体会到MLIR在较大项目中的使用方式，汇总一下。1.Triton概述OpenAITriton是一个开源的编程语言和编译器，旨在简化GPU高性能计算（HPC）的开发，特别是针对深度学习、科学计算等需要高效并行计算的领域。既允许开发者编写高度优化的代码，又不必过度关注底层硬件细节。这样，通过简化高性能计算，可以加速新算法的实现和实验。传统GPU
OpenHarmony外设驱动移植指南你我皆是牛马星人鸿蒙开发 HarmonyOS OpenHarmony harmonyos OpenHarmony 鸿蒙开发源码分析迁移学习嵌入式硬件驱动开发
往期推文全新看点（文中附带最新·鸿蒙全栈学习笔记）鸿蒙（HarmonyOS）北向开发知识点记录~鸿蒙（OpenHarmony）南向开发保姆级知识点汇总~鸿蒙应用开发与鸿蒙系统开发哪个更有前景？嵌入式开发适不适合做鸿蒙南向开发？看完这篇你就了解了~对于大前端开发来说，转鸿蒙开发究竟是福还是祸？鸿蒙岗位需求突增！移动端、PC端、IoT到底该怎么选？记录一场鸿蒙开发岗位面试经历~持续更新中……外设驱动子
【OpenHarmony】鸿蒙开发：轻量系统服务管理|存储机制详解(一) 你我皆是牛马星人 HarmonyOS 鸿蒙开发 OpenHarmony harmonyos 鸿蒙开发 OpenHarmony 嵌入式硬件 SAStore模块物联网
往期推文全新看点（文中附带最新·鸿蒙全栈学习笔记）鸿蒙（HarmonyOS）北向开发知识点记录~鸿蒙（OpenHarmony）南向开发保姆级知识点汇总~鸿蒙应用开发与鸿蒙系统开发哪个更有前景？嵌入式开发适不适合做鸿蒙南向开发？看完这篇你就了解了~对于大前端开发来说，转鸿蒙开发究竟是福还是祸？鸿蒙岗位需求突增！移动端、PC端、IoT到底该怎么选？记录一场鸿蒙开发岗位面试经历~持续更新中……一、前言本
顾璟寒珞珞(被病娇太子爷强制求爱后)完整版免费在线阅读_《被病娇太子爷强制求爱后》全集在线阅读_被病娇太子爷强制求爱后(顾璟寒珞珞)完结版免费阅读_被病娇太子爷强制求爱后全文免费阅读_顾璟寒珞珞... 笔趣阁官方推荐小说
顾璟寒珞珞(被病娇太子爷强制求爱后)完整版免费在线阅读_《被病娇太子爷强制求爱后》全集在线阅读_被病娇太子爷强制求爱后(顾璟寒珞珞)完结版免费阅读_被病娇太子爷强制求爱后全文免费阅读_顾璟寒珞珞《被病娇太子爷强制求爱后》最新章节阅读_(顾璟寒珞珞)热门小说主角配角：顾璟寒珞珞简介：7顾璟寒穿着黑色风衣，神色晦暗不明的站在不远处，脸上挂着一抹阴冷的笑他看人时，总是这样一副表情常雨薇吓了一跳，反应过来
pytorch图像分类全流程（二）前人栽树,后人乘凉 datawhale pytorch pytorch 分类 python
本次使用的是ImageNet1000类别信息，resnet18预训练模型。记录一些一坑和知识点。在传入图片或视频之前我们都会对其进行预处理，归纳下来为四个字母RCTN：缩放、裁剪、转Tensor、归一化，可以使用transforms.Compose()函数打包对应四个函数进行预处理，当然这里有个小坑，transforms.Compose()只接受pillow格式的图像，不能拿opencv传入图片。
头条搜索极速版邀请码是多少(2024新版邀请码大全)珍惜答碍凌风导师
1、点击下载安装头条搜索极速版app软件，使用手机号注册头条搜索极速版邀请码是头条搜索极速版邀请码邀请码【1493484064】【1461718474】、【1247737368】和【1045168054】。【1045168054】【1632714604】【1110408474】【1168892484】和【1484027154】请注意，只有在下载头条搜索极速版APP后的10天内填写邀请码才有奖励，超
我被装行李箱送人，我爸知道后杀疯了杨维婆婆最热门小说_完结版免费小说我被装行李箱送人，我爸知道后杀疯了杨维婆婆多多文馆
《我被装行李箱送人，我爸知道后杀疯了》主角：杨维婆婆简介：我爸在美股赚了亿万。恰逢婆婆公司遭遇经济危机。我迫不及待准备把这个好消息告诉她。她却误以为我爸在美股亏空，把一份离婚协议书摆在我面前。老公更是找了一个金主，把我拱手相送。我想跑。婆婆扒光我的衣服。用凳子砸断我的腿。我告诉他，爸没有亏空，而是大赚了一笔。他却觉得我只是想用这个借口脱身，不相信我的话。“能帮你的，其实并不是我，而是另有其人。”老
平凡的日子2 不经意的闯入
今天打开了安装好久没动过的ps软件，在b站上听了几个小时的视频，突然发现并没有自己想象中的那么难，今天我学会了如何创建文件，懂得了抓手和缩放工具的使用，还明白了蒙版如何创建以及使用的技巧，第一天的收获满满呀！希望接下来的每一天都能收获不同的知识，来丰富自己贫乏的知识库。加油，我可以的！ps的常用分辨率
python教程修订版 Ethan learn English python
9/23Inthiscourse,I'mgoingtoteachyoueverythingyouneedtoknowtogetstartedprogramminginPython.Now,Pythonisoneofthemostpopularprogramminglanguagesoutthere在众多的……中.Andit'sbyfar目前为止oneofthemostsõughtafter受欢迎的
PyTorch图像分类系列——流程概览 VAMOT PyTorch图像分类系列 pytorch 深度学习分类计算机视觉
一、加载数据1.使用torchvision.datasets的方法加载经典数据集在此网址查看支持哪些经典数据集：Datasets—Torchvision0.18documentation(pytorch.org)data_train=torchvision.datasets.CIFAR10(root="CIFAR10",train=True,transform=ToTensor(),target_
tensorflow sigmoid_cross_entropy_with_logits 函数解释及公式推导 CrazyWolf_081c
tensorflowsigmoid_cross_entropy_with_logits函数解释及公式推导tensorflow官方文档解释参考pytorch--BCELosspytorch--BCELoss解释参考定义在tensorflow/python/ops/nn_impl.py.功能：计算在给定logits和label之间的sigmoidcrossentropy。测量离散分类任务中的概率误差，
ReactNative 0.69发布 wayne214 前端
ReactNative0.69正式版发布了，主要带来如下几点：1.React18的支持2.默认绑定引擎HermesReact18ReactNative0.69是第一个支持React18的正式版本。React18提供了更多提升，比如新的hookapi，userId等。此外，React18包括新的并发特性，例如useTransition或完整的Suspense支持。React18的更新后全面支持Sus
沈映雪姜若灵(上山探险，我打脸苗疆圣女)全本免费在线阅读_沈映雪姜若灵全集在线阅读_上山探险，我打脸苗疆圣女(沈映雪姜若灵)全集阅读_上山探险，我打脸苗疆圣女最新章节阅读_沈映雪姜若灵《上山探险... 笔趣阁官方账号
沈映雪姜若灵(上山探险，我打脸苗疆圣女)全本免费在线阅读_沈映雪姜若灵全集在线阅读_上山探险，我打脸苗疆圣女(沈映雪姜若灵)全集阅读_上山探险，我打脸苗疆圣女最新章节阅读_沈映雪姜若灵《上山探险，我打脸苗疆圣女》完结版免费阅读_上山探险，我打脸苗疆圣女全文免费阅读主角配角：沈映雪姜若灵简介：开学前，有新生在群里发了自己的照片一身苗疆服饰，娇俏可爱“啊，不小心点错了，撤不回了怎么办，嘤嘤嘤”“既然已
【TypeScript学习笔记】TypeScript 核心知识点 Zaly. Vue学习笔记 typescript 学习笔记
目录前言TypeScript核心概念基本类型与高级类型常用内置工具类型类型断言与类型守卫TypeScript在Vue3中的应用Vue3中TypeScript的作用范围Props和Emits的类型定义CompositionAPI中的类型支持前言TypeScript是微软开发的一个开源的编程语言，通过在JavaScript的基础上添加静态类型定义构建而成。TypeScript通过TypeScript编
ai绘画生成软件哪个好？几款好用的AI绘画软件分享! 呼酱小宝箱
随着人工智能技术的不断发展，越来越多的AI绘画生成软件被开发出来。这些软件利用深度学习技术，可以将普通照片或图像转化成具备艺术效果的画作。那么，ai绘画生成软件哪个好？首先，让我们来看一下几个常见的AI绘画生成软件，它们分别是：1、DeepDreamDeepDream是由Google开发的一款AI绘画生成软件。它通过卷积神经网络对输入的图片进行处理，从而生成出具有艺术风格的画作。DeepDream
她家暴德普，巨富马斯克含泪被甩！这个美国版“马蓉”有剧毒！不靠谱的球
今天要给大家介绍一位剧毒美人，拥有核弹级的杀伤力。男人一旦被她迷住，必定被杀个片甲不留。有人说她是美国版“马蓉”，本尊不用发话，各大时尚媒体就会叉起腰来打架，马蓉和她比，门都找不着。但之所以要捎带上马蓉，因为她也有一场遮天蔽日的离婚大战，不仅让天神级的老公跌下神坛，还让自己的阶层做天梯跃升，从18线女配摇身变成大女主。老公是金炮灰，自己裹着这层金粉，转身位列神班。这女人叫AmberHeard，19
Pytorch图像二分类代码 AlexNet 望舒向晚 Pytorch pytorch 深度学习机器学习
importtorchimporttorch.nnasnnimporttorch.optimasoptimimporttorch.utils.dataimporttorch.nn.functionalasFimporttorchvisionfromtorchvisionimporttransformsfromPILimportImagedefcheck_image(path):try:im=Ima
After Effects 教程，如何在 After Effects 中应用平铺效果？ Mac123123
欢迎观看AfterEffects中文版教程，小编带大家学习AfterEffects的基本工具和使用技巧，了解如何在AE中平铺效果。随着背景图层开始变得模糊，图标大约在1秒后开始显现。可以使用一种叫做「平铺」的效果，对图标进行动画处理。选择「图层1」，转到界面右侧的「效果和预设」面板，单击一次搜索字段，然后键入「tiler」，随即弹出扭曲滤镜「CCTiler」。单击该滤镜，把它拖入「合成」面板，放到
基于逻辑回归的图像二分类算法实现（Pytorch版）哎呦哥哥、图像分类 pytorch 逻辑回归分类
基于逻辑回归的图像二分类算法实现（Pytorch版）数据集模型代码数据集链接：FastFoodClassificationDataset我们只使用Burger和Pizza这两类。模型代码importtorchimporttorch.nnasnnfromtorchvision.models.utilsimportload_state_dict_from_urlmodel_urls={'resnet5
软考信息安全工程师经验分享以及报考建议大学生编程地备考分享经验分享安全 web安全
我是参加的是21年11月份的信息安全工程师考试，给大家分享一些经验因为信息安全工程师16年才开始考，而且一年只考一次，再加上又改了新教材，两版的差别又很大，所以除了教材，能找到的其他知识和练习题是非常的少，而且截至目前为止，20年那一次的考试，官方一直不给公布真题，全网上能找到关于那次考试的，只有一两篇由参加过的考生所写的帖子，我一开始还纳闷为什么，在我考完21年的后，我想我知道答案了我猜，21年
十年老Python程序员：给我一个链接，没有我不能爬的视频，只有我顶不住的视频 IT孔乙己
一、写在前面真的，为什么别人发游戏这么多人看，我发了两次了加起来才一百个。算了算了，不整游戏了，反正你们也不爱看~python今天来试试把头条上扭腰上热门的那些妹子爬一爬，不知道我顶不顶得住~python二、准备工作1、使用的环境python3.8pycharm2021.2专业版2、要用的第三方模块seleniumrequestsparsel三、大致流程鉴于你们不喜欢我啰嗦，但是流程呢，我还是要给
林欢周晴《狐臭校花污染源》完结版免费阅读_狐臭校花污染源全文免费阅读_林欢周晴(狐臭校花污染源)完整版免费在线阅读_《狐臭校花污染源》全集在线阅读_林欢周晴(狐臭校花污染源)最新章节免费在线阅读... 小说全文全本
林欢周晴《狐臭校花污染源》完结版免费阅读_狐臭校花污染源全文免费阅读_林欢周晴(狐臭校花污染源)完整版免费在线阅读_《狐臭校花污染源》全集在线阅读_林欢周晴(狐臭校花污染源)最新章节免费在线阅读_(林欢周晴)完结版在线阅读主角配角：林欢周晴简介：校花室友有狐臭我提出切除汗腺就可痊愈，但她不领情，反而给我下药，趁我昏迷，用腋下将我活生生闷死临死前，我还听到她怨毒的声音：要不是你把我有狐臭的事情说出去
java责任链模式 3213213333332132 java 责任链模式村民告县长
责任链模式，通常就是一个请求从最低级开始往上层层的请求，当在某一层满足条件时，请求将被处理，当请求到最高层仍未满足时，则请求不会被处理。就是一个请求在这个链条的责任范围内，会被相应的处理，如果超出链条的责任范围外，请求不会被相应的处理。下面代码模拟这样的效果：创建一个政府抽象类,方便所有的具体政府部门继承它。 package 责任链模式; /** *
linux、mysql、nginx、tomcat 性能参数优化 ronin47
一、linux 系统内核参数 /etc/sysctl.conf文件常用参数 net.core.netdev_max_backlog = 32768 #允许送到队列的数据包的最大数目 net.core.rmem_max = 8388608 #SOCKET读缓存区大小 net.core.wmem_max = 8388608 #SOCKET写缓存区大
php命令行界面 dcj3sjt126com PHP cli
常用选项 php -v php -i PHP安装的有关信息 php -h 访问帮助文件 php -m 列出编译到当前PHP安装的所有模块执行一段代码 php -r 'echo "hello, world!";' php -r 'echo "Hello, World!\n";' php -r '$ts = filemtime("
Filter&Session 171815164 session
Filter HttpServletRequest requ = (HttpServletRequest) req; HttpSession session = requ.getSession(); if (session.getAttribute("admin") == null) { PrintWriter out = res.ge
连接池与Spring,Hibernate结合 g21121 Hibernate
前几篇关于Java连接池的介绍都是基于Java应用的，而我们常用的场景是与Spring和ORM框架结合，下面就利用实例学习一下这方面的配置。 1.下载相关内容： &nb
[简单]mybatis判断数字类型 53873039oycg mybatis
昨天同事反馈mybatis保存不了int类型的属性,一直报错，错误信息如下: Caused by: java.lang.NumberFormatException: For input string: "null" at sun.mis
项目启动时或者启动后ava.lang.OutOfMemoryError: PermGen space 程序员是怎么炼成的 eclipse jvm tomcat catalina.sh eclipse.ini
在启动比较大的项目时，因为存在大量的jsp页面，所以在编译的时候会生成很多的.class文件，.class文件是都会被加载到jvm的方法区中，如果要加载的class文件很多，就会出现方法区溢出异常 java.lang.OutOfMemoryError: PermGen space. 解决办法是点击eclipse里的tomcat，在
我的crm小结 aijuans crm
各种原因吧，crm今天才完了。主要是接触了几个新技术： Struts2、poi、ibatis这几个都是以前的项目中用过的。 Jsf、tapestry是这次新接触的，都是界面层的框架，用起来也不难。思路和struts不太一样，传说比较简单方便。不过个人感觉还是struts用着顺手啊，当然springmvc也很顺手，不知道是因为习惯还是什么。jsf和tapestry应用的时候需要知道他们的标签、主
spring里配置使用hibernate的二级缓存几步 antonyup_2006 java spring Hibernate xml cache
．在spring的配置文件中 applicationContent.xml，hibernate部分加入 xml 代码 <prop key="hibernate.cache.provider_class">org.hibernate.cache.EhCacheProvider</prop> <prop key="hi
JAVA基础面试题百合不是茶抽象实现接口 String类接口继承抽象类继承实体类自定义异常
/* * 栈（stack）：主要保存基本类型（或者叫内置类型）（char、byte、short、 *int、long、 float、double、boolean）和对象的引用，数据可以共享，速度仅次于 * 寄存器（register），快于堆。堆（heap）：用于存储对象。 */ &
让sqlmap文件 "继承" 起来 bijian1013 java ibatis sqlmap
多个项目中使用ibatis , 和数据库表对应的 sqlmap文件（增删改查等基本语句)，dao, pojo 都是由工具自动生成的, 现在将这些自动生成的文件放在一个单独的工程中，其它项目工程中通过jar包来引用，并通过"继承"为基础的sqlmap文件，dao,pojo 添加新的方法来满足项
精通Oracle10编程SQL(13)开发触发器 bijian1013 oracle 数据库 plsql
/* *开发触发器 */ --得到日期是周几 select to_char(sysdate+4,'DY','nls_date_language=AMERICAN') from dual; select to_char(sysdate,'DY','nls_date_language=AMERICAN') from dual; --建立BEFORE语句触发器 CREATE O
【EhCache三】EhCache查询 bit1129 ehcache
本文介绍EhCache查询缓存中数据，EhCache提供了类似Hibernate的查询API，可以按照给定的条件进行查询。要对EhCache进行查询，需要在ehcache.xml中设定要查询的属性数据准备 @Before public void setUp() { //加载EhCache配置文件 Inpu
CXF框架入门实例白糖_ spring Web 框架 webservice servlet
CXF是apache旗下的开源框架，由Celtix + XFire这两门经典的框架合成，是一套非常流行的web service框架。它提供了JAX-WS的全面支持，并且可以根据实际项目的需要，采用代码优先（Code First）或者 WSDL 优先（WSDL First）来轻松地实现 Web Services 的发布和使用，同时它能与spring进行完美结合。在apache cxf官网提供
angular.equals boyitech AngularJS AngularJS API AnguarJS 中文API angular.equals
angular.equals 描述: 比较两个值或者两个对象是不是相等。还支持值的类型，正则表达式和数组的比较。两个值或对象被认为是相等的前提条件是以下的情况至少能满足一项：两个值或者对象能通过=== （恒等）的比较两个值或者对象是同样类型，并且他们的属性都能通过angular
java-腾讯暑期实习生-输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A[0]*A[1]*...*A[i-1]*A[i+1] bylijinnan java
这道题的具体思路请参看何海涛的微博：http://weibo.com/zhedahht import java.math.BigInteger; import java.util.Arrays; public class CreateBFromATencent { /** * 题目：输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A
FastDFS 的安装和配置修订版 Chen.H linux fastDFS 分布式文件系统
FastDFS Home:http://code.google.com/p/fastdfs/ 1. 安装 http://code.google.com/p/fastdfs/wiki/Setup http://hi.baidu.com/leolance/blog/item/3c273327978ae55f93580703.html 安装libevent (对libevent的版本要求为1.4.
[强人工智能]拓扑扫描与自适应构造器 comsci 人工智能
当我们面对一个有限拓扑网络的时候,在对已知的拓扑结构进行分析之后,发现在连通点之后,还存在若干个子网络,且这些网络的结构是未知的,数据库中并未存在这些网络的拓扑结构数据....这个时候,我们该怎么办呢? 那么,现在我们必须设计新的模块和代码包来处理上面的问题
oracle merge into的用法 daizj oracle sql merget into
Oracle中merge into的使用 http://blog.csdn.net/yuzhic/article/details/1896878 http://blog.csdn.net/macle2010/article/details/5980965 该命令使用一条语句从一个或者多个数据源中完成对表的更新和插入数据. ORACLE 9i 中，使用此命令必须同时指定UPDATE 和INSE
不适合使用Hadoop的场景 datamachine hadoop
转自：http://dev.yesky.com/296/35381296.shtml。　　Hadoop通常被认定是能够帮助你解决所有问题的唯一方案。当人们提到“大数据”或是“数据分析”等相关问题的时候，会听到脱口而出的回答：Hadoop! 实际上Hadoop被设计和建造出来，是用来解决一系列特定问题的。对某些问题来说，Hadoop至多算是一个不好的选择，对另一些问题来说，选择Ha
YII findAll的用法 dcj3sjt126com yii
看文档比较糊涂，其实挺简单的： $predictions=Prediction::model()->findAll("uid=:uid",array(":uid"=>10)); 第一个参数是选择条件：”uid=10″。其中:uid是一个占位符，在后面的array(“:uid”=>10)对齐进行了赋值；更完善的查询需要
vim 常用 NERDTree 快捷键 dcj3sjt126com vim
下面给大家整理了一些vim NERDTree的常用快捷键了，这里几乎包括了所有的快捷键了，希望文章对各位会带来帮助。切换工作台和目录 ctrl + w + h 光标 focus 左侧树形目录ctrl + w + l 光标 focus 右侧文件显示窗口ctrl + w + w 光标自动在左右侧窗口切换ctrl + w + r 移动当前窗口的布局位置 o 在已有窗口中打开文件、目录或书签，并跳
Java把目录下的文件打印出来蕃薯耀列出目录下的文件文件夹下面的文件目录下的文件
Java把目录下的文件打印出来 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 11:02:
linux远程桌面----VNCServer与rdesktop hanqunfeng Desktop
windows远程桌面到linux，需要在linux上安装vncserver，并开启vnc服务，同时需要在windows下使用vnc-viewer访问Linux。vncserver同时支持linux远程桌面到linux。 linux远程桌面到windows，需要在linux上安装rdesktop，同时开启windows的远程桌面访问。下面分别介绍，以windo
guava中的join和split功能 jackyrong java
guava库中，包含了很好的join和split的功能，例子如下： 1）将LIST转换为使用字符串连接的字符串 List<String> names = Lists.newArrayList("John", "Jane", "Adam", "Tom");
Web开发技术十年发展历程 lampcy android Web 浏览器 html5
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
架构师之mima-----------------mina的非NIO控制IOBuffer(说得比较好) nannan408 buffer
1.前言。如题。 2.代码。 IoService IoService是一个接口，有两种实现：IoAcceptor和IoConnector；其中IoAcceptor是针对Server端的实现，IoConnector是针对Client端的实现；IoService的职责包括： 1、监听器管理 2、IoHandler 3、IoSession
ORA-00054:resource busy and acquire with NOWAIT specified Everyday都不同 oracle session Lock
[Oracle] 今天对一个数据量很大的表进行操作时，出现如题所示的异常。此时表明数据库的事务处于“忙”的状态，而且被lock了，所以必须先关闭占用的session。 step1，查看被lock的session： select t2.username, t2.sid, t2.serial#, t2.logon_time from v$locked_obj
javascript学习笔记 tntxia JavaScript
javascript里面有6种基本类型的值:number、string、boolean、object、function和undefined。number：就是数字值，包括整数、小数、NaN、正负无穷。string:字符串类型、单双引号引起来的内容。boolean:true、false object:表示所有的javascript对象，不用多说function:我们熟悉的方法，也就是
Java enum的用法详解 xieke90 enum 枚举
Java中枚举实现的分析：示例： public static enum SEVERITY{ INFO,WARN,ERROR } enum很像特殊的class，实际上enum声明定义的类型就是一个类。而这些类都是类库中Enum类的子类 (java.l