宝友你好

Datawhale组队学习NLP_情感分析baseline updated学习笔记

本文为学习Datawhale 2021.9组队学习情感分析笔记
原学习文档地址：https://github.com/datawhalechina/team-learning-nlp/tree/master/EmotionalAnalysis

baseline笔记见https://blog.csdn.net/weixin_43634785/article/details/120289701?spm=1001.2014.3001.5502

baseline存在很多可以优化的地方，比如

使用预训练词向量
把RNN网络换成双向LSTM网络
由于参数量的提升加入正则项
尝试不同的优化器

接下来就从上述几个方面对baseline进行修改

1 RNN网络换成LSTM网络

实例化模型

"""5.Model"""
INPUT_DIM = len(TEXT.vocab)
EMBEDDING_DIM = 100
HIDDEN_DIM = 256
OUTPUT_DIM = 1
N_LAYERS = 2
BIDIRECTIONAL = True
DROPOUT = 0.5
PAD_IDX = TEXT.vocab.stoi[TEXT.pad_token]
# UNK_IDX 不用传进去，因为PAD不需要计算而UNK需要计算

model = RNN(INPUT_DIM,
            EMBEDDING_DIM,
            HIDDEN_DIM,
            OUTPUT_DIM,
            N_LAYERS,
            BIDIRECTIONAL,
            DROPOUT,
            PAD_IDX)

模型定义

class RNN(nn.Module):
    def __init__(self, vocab_size, embedding_dim, hidden_dim, output_dim, n_layers,
                 bidirectional, dropout, pad_idx):
        super().__init__()
        # embedding嵌入层(词向量)
        self.embedding = nn.Embedding(vocab_size, embedding_dim, padding_idx=pad_idx)

        # RNN变体————双向LSTM
        self.rnn = nn.LSTM(embedding_dim,  # input_size
                           hidden_dim,  #output_size
                           num_layers=n_layers,  # 层数
                           bidirectional=bidirectional,  #是否双向
                           dropout=dropout)  #随机去除神经元
        # 线性连接层
        self.fc = nn.Linear(hidden_dim * 2, output_dim)
        # 前向传播+后向传播两个hidden_state，且合并在一起，所以×2

        # 随机去除神经元
        self.dropout = nn.Dropout(dropout)

    def forward(self, text, text_lengths):
        # text的形状 [sent len, batch size]

        embedded = self.dropout(self.embedding(text))
        # embedded的形状 [sent len, batch size, emb dim]

        # pack sequence
        # lengths need to be on CPU!
        # 把embedded包进来，避免了后面还计算pad部分
        packed_embedded = nn.utils.rnn.pack_padded_sequence(embedded, text_lengths.to('cpu'))

        packed_output, (hidden, cell) = self.rnn(packed_embedded)

        # unpacked sequence
        output, output_lengths = nn.utils.rnn.pad_packed_sequence(packed_output)

        # output的形状[sent len, batch size, hid dim * num directions]
        # output 中的 padding tokens 是数值为0的张量

        # hidden 的形状 [num layers * num directions, batch size, hid dim]
        # cell  的形状 [num layers * num directions, batch size, hid dim]

        # concat the final forward (hidden[-2,:,:]) and backward (hidden[-1,:,:]) hidden layers
        # and apply dropout

        hidden = self.dropout(torch.cat((hidden[-2,:,:], hidden[-1,:,:]), dim = 1))

        return self.fc(hidden)

注意此处forward过程与baseline中RNN的区别，这里除了传入text外，还传入了text_length，在forward过程中需要使用到，效果就是模型算到这个位置的时候就停止计算。否则输出的大部分都是在pad位置的输出。那么问题是感觉baseline中的RNN效果不好的一部分原因是不是没有进行这个操作呢？
对forward过程举个例子进行说明

前向的输入：

text, text_lengths = batch.text  # batch.text返回的是一个元组(数字化的张量,每个句子的长度)
model(text, text_lengths)

text的形状：[sent len, batch size]
实例： text=[745, 64] 一个batch64个句子，句子长度最长是745

text 输入到 embedding [vocab_size, embedding dim] 得到embedded [sent len, batch size, emb dim]
实例：embedding=[25002, 100] embedded=[745, 64, 100]

embedded 输入到 pack_padded_sequence 里得到 packed_embedded
这一步主要是为了让pad token不参与参数的更新，注意 lengths need to be on CPU!

packed_embedded 输入到 RNN 中会判断是否为PackedSequence 最后输出得到 packed_output, (hidden, cell)

如果要使用输出需要对packed_output解压
output和hidden， cell
output的维度是[745, 64, 512]，这里745是句子长度，64个句子，512是因为hidden size=256, 两层lstm拼接起来就是512

ouput_length：

tensor([745, 745, 744, 744, 743, 743, 742, 738, 738, 738, 738, 736, 734, 734,
        734, 734, 733, 732, 731, 731, 730, 730, 729, 728, 727, 727, 726, 726,
        725, 723, 723, 723, 722, 722, 721, 721, 720, 720, 719, 716, 716, 715,
        715, 715, 713, 712, 712, 711, 707, 707, 707, 706, 705, 704, 703, 702,
        702, 701, 701, 700, 699, 699, 699, 698])

记录了每个句子的长度，可以看到这个迭代器是会自动排序的，把长度相似的句子都放在一起，减少padding 的数量

output[0]

tensor([[-0.0019,  0.0004, -0.0030,  ..., -0.0097,  0.0420,  0.0041],
        [ 0.0034,  0.0361, -0.0009,  ..., -0.0292,  0.0479,  0.0052],
        [ 0.0123,  0.0347,  0.0076,  ..., -0.0316, -0.0182, -0.0500],
        ...,
        [-0.0454,  0.0027, -0.0149,  ..., -0.1120,  0.0238, -0.0076],
        [-0.0103,  0.0637,  0.0412,  ..., -0.0712,  0.0208, -0.0349],
        [-0.0093,  0.0435,  0.0166,  ..., -0.0712,  0.0133, -0.0321]],
       grad_fn=<SelectBackward>)

ouput[744]：

tensor([[ 0.0110,  0.0757, -0.0370,  ...,  0.0177, -0.0130, -0.0178],
        [-0.0145,  0.0666, -0.0171,  ..., -0.0171,  0.0181,  0.0005],
        [ 0.0000,  0.0000,  0.0000,  ...,  0.0000,  0.0000,  0.0000],
        ...,
        [ 0.0000,  0.0000,  0.0000,  ...,  0.0000,  0.0000,  0.0000],
        [ 0.0000,  0.0000,  0.0000,  ...,  0.0000,  0.0000,  0.0000],
        [ 0.0000,  0.0000,  0.0000,  ...,  0.0000,  0.0000,  0.0000]],
       grad_fn=<SelectBackward>)

从这两个的输出可以明显看到，句子长度不够的输出就是0

接下来看看hidden是什么样子的

hidden和cell的维度 [4, 64, 255]

hidden是各层向右输出，output是模型向上的输出

hidden 的形状 [num layers * num directions, batch size, hid dim]

cell 的形状 [num layers * num directions, batch size, hid dim]

因为超参N_LAYERS = 2 又bidirectional=True双向两层lstm，num directions=2，所以拼接起来就是4层的hidden output

参考：https://zhuanlan.zhihu.com/p/79064602

bi-lstm的模型其实就是两个分开lstm模型，只是使用的时候把他们各自的输出和hidden拼接起来。

这篇文章里提到了为什么很多数据里都有T转置这个矩阵的量，应该是与batch_first有关

还提到了为什么lstm要进行pack操作，与RNN不同，对lstm一直输入pad(0)也会对输出有影响，所以要记录pad前的那个位置，计算到此处后面就都不管了，具体细节可以看上面那篇文章。之前的baseline使用的普通RNN没有进行pack操作，如果使用了pack，会提点见6

为什么最后concat取的是 hidden[-2,:,:], hidden[-1,:,:]
下图是一个双向lstm的结构

而这个图是一个w+1层的也就是num_layers=2的lstm的结构

参考 https://zhuanlan.zhihu.com/p/39191116

举个例子，我们定义一个num_layers=3的双向LSTM，h_n第一个维度的大小就等于 6 （2*3），h_n[0]表示第一层前向传播最后一个time step的输出，h_n[1]表示第一层后向传播最后一个time step的输出，h_n[2]表示第二层前向传播最后一个time step的输出，h_n[3]表示第二层后向传播最后一个time step的输出，h_n[4]和h_n[5]分别表示第三层前向和后向传播时最后一个time step的输出。

所以模型的每一层都是一个双向lstm，而不是向左三层加向右三层的堆叠。取-2,-1就是最后一层的前向和后向的输出。

注意：
在将embeddings(词向量)输入RNN前，我们需要借助nn.utils.rnn.packed_padded_sequence将它们‘打包’，以此来保证RNN只会处理不是pad的token。我们得到的输出包括packed_output (a packed sequence)以及hidden sate 和 cell state。如果没有进行‘打包’操作，那么输出的hidden state和cell state大概率是来自句子的pad token。如果使用packed padded sentences，输出的就会是最后一个非padded元素的hidden state 和 cell state。

之后我们借助nn.utils.rnn.pad_packed_sequence 将输出的句子‘解压’转换成一个tensor张量。需要注意的是来自padding tokens的输出是零张量，通常情况下，我们只有在后续的模型中使用输出时才需要‘解压’。虽然在本案例中下不需要，这里只是为展示其步骤。

2 使用预训练词向量

选取GloVe词向量，GloVe的全称是：Global Vectors for Word Representation。此处有关于其有详细的介绍和大量资源。本教程将不介绍该词向量是如何具体得到的，仅简单描述下如何使用此词向量,这里我们使用的是 “glove.6B.100d” ，其中，6B表示词向量是在60亿规模的tokens上训练得到的，100d表示词向量是100维的(注意,这个词向量有800多兆)

TEXT.build_vocab表示从预训练的词向量中，将当前训练数据中的词汇的词向量抽取出来，构成当前训练集的 Vocab(词汇表)。对于当前词向量语料库中没有出现的单词（记为UNK，unknown），通过高斯分布随机初始化（unk_init = torch.Tensor.normal_）。

MAX_VOCAB_SIZE = 25_000

TEXT.build_vocab(train_data, 
                 max_size = MAX_VOCAB_SIZE, 
                 vectors = "glove.6B.100d", 
                 unk_init = torch.Tensor.normal_)

LABEL.build_vocab(train_data)

pretrained_embeddings = TEXT.vocab.vectors
# 检查词向量形状 [vocab size, embedding dim]
print(pretrained_embeddings.shape)

# 用预训练的embedding词向量替换原始模型初始化的权重参数
model.embedding.weight.data.copy_(pretrained_embeddings)

#将unknown 和padding token设置为0 它们与情感无关。
UNK_IDX = TEXT.vocab.stoi[TEXT.unk_token]

model.embedding.weight.data[UNK_IDX] = torch.zeros(EMBEDDING_DIM)
model.embedding.weight.data[PAD_IDX] = torch.zeros(EMBEDDING_DIM)

输入是一个单位矩阵 embedding是一个[25002, 100]的矩阵，每一行就代表一个单词的向量

这样输入乘embedding就得到了[25002, 100] 相当于输入就是一个用于索引的矩阵

需要注意的是，pad token的词向量在模型训练过程中始终不会被学习。而unknown token的词向量是会被学习的。

可以看到在模型初始化的时候，unknown token就没有传入，只有pad token传入了。也有把unk词向量设置为所有词的均值

class RNN(nn.Module):
    def __init__(self, vocab_size, embedding_dim, hidden_dim, output_dim, n_layers, 
                 bidirectional, dropout, pad_idx):

3 使用Adam优化器

import torch.optim as optim

optimizer = optim.Adam(model.parameters())

4 模型验证

"""9.Test"""
# 由于上面只保存了模型的state_dict，没有保存模型的定义，所以如果要分开运行的话这里要重新定义模型
model.load_state_dict(torch.load('tut2-model.pt'))

test_loss, test_acc = evaluate(model, test_iterator, criterion)

print(f'Test Loss: {test_loss:.3f} | Test Acc: {test_acc*100:.2f}%')

保存state_dict和model的区别
对于仅保存state_dict()的方式，那保存和加载模型的方式为：

保存：torch.save(model.state_dict(), PATH)
加载：model.laod_state_dict(torch.load(PATH))

一般加载模型是在训练完成后用模型做测试，这时候加载模型记得要加上model.eval()，把模型切换到evaluation模式，这时候会调整dropout和bactch的模式。

对于保存和加载整个模型的情况：

torch.save(model, PATH)
model = torch.load(PATH)

可以看到，前面的model.load_state_dict()和这里的不同,前面的情况需要你先定义一个模型，然后再load_state_dict()
但是这里load整个模型，会把模型的定义一起load进来。完成了模型的定义和加载参数的两个过程。

import spacy
nlp = spacy.load('en_core_web_sm')

def predict_sentiment(model, sentence):
    model.eval()  # 模型切换为evaluate模式 
    tokenized = [tok.text for tok in nlp.tokenizer(sentence)]  # 对句子进行分词操作
    indexed = [TEXT.vocab.stoi[t] for t in tokenized]  # 将分词后的每个词，对应着词汇表，转换成对应的index索引
    length = [len(indexed)]  # 获取句子的长度
    tensor = torch.LongTensor(indexed).to(device)  # 将indexes，从list转化成tensor
    tensor = tensor.unsqueeze(1)  # 将length转化成张量tensor
    length_tensor = torch.LongTensor(length)  # 用sigmoid将预测值压缩到0~1之间
    prediction = torch.sigmoid(model(tensor, length_tensor))  
    return prediction.item()  # 用item()方法，将只有一个值的张量tensor转化成整数0

所以如果想要单独运行模型验证部分，最好在保存模型的时候使用torch.save(model, PATH)，这样就不需要再定义模型了。

5 一些重要的点

1.针对模型训练过程中的一点补充：在模型训练过程中，对于每个样本中补齐后加上的pad token，模型是不应该对其进行训练的，也就是并不会学习“”标记的嵌入。因为padding token跟句子的情感是无关的。这就意味着pad token的嵌入层(词向量)会一直保持初始化的状态（初始化为全零）。具体而言，我们是通过往nn.Embedding 层传入pad token 的index索引，作为padding_idx参数。

2.因为实验中使用的双向LSTM的包含了前向传播和后向传播过程，所以最后的隐藏状态向量包含了前向和后向的隐藏状态，所以在下一层nn.Linear层中的输入的形状就是隐藏层维度形状的两倍。

3.在将embeddings(词向量)输入RNN前，我们需要借助nn.utils.rnn.packed_padded_sequence将它们‘打包’，以此来保证RNN只会处理不是pad的token。我们得到的输出包括packed_output (a packed sequence)以及hidden sate 和 cell state。如果没有进行‘打包’操作，那么输出的hidden state和cell state大概率是来自句子的pad token。如果使用packed padded sentences，输出的就会是最后一个非padded元素的hidden state 和 cell state。

4.之后我们借助nn.utils.rnn.pad_packed_sequence 将输出的句子‘解压’转换成一个tensor张量。需要注意的是来自padding tokens的输出是零张量，通常情况下，我们只有在后续的模型中使用输出时才需要‘解压’。虽然在本案例中下不需要，这里只是为展示其步骤。

5.final hidden sate：也就是hidden，其形状是[num layers * num directions, batch size, hid dim]。因为我们只要最后的前向和后向传播的hidden states,我们只要最后2个hidden layers就行hidden[-2,:,:] 和hidden[-1,:,:]，然后将他们合并在一起,再传入线性层linear layer。
#####这里不知道怎么解释会比较好，还需调整。

对于第5点，hidden的索引是怎么排的？

参考 https://pytorch.org/docs/1.7.1/generated/torch.nn.LSTM.html?highlight=lstm#torch.nn.LSTM

If the LSTM is bidirectional, num_directions should be 2, else it should be 1.

所以num directions的1,2索引应该是指的方向，num layers都是-1就指的是取最后一层。

6 对baseline中的普通RNN进行了pack操作

使用pack操作要注意几点

创建BucketIterator迭代器时设置sort_within_batch=True,
RNN的输出只有两项即output和hidden，packed_output, hidden = self.rnn(packed_embedded)
baseline:

Epoch: 01 | Epoch Time: 0m 13s
	Train Loss: 0.694 | Train Acc: 49.89%
	 Val. Loss: 0.694 | Val. Acc:49.49%
Epoch: 02 | Epoch Time: 0m 13s
	Train Loss: 0.693 | Train Acc: 50.31%
	 Val. Loss: 0.695 | Val. Acc:50.63%
Epoch: 03 | Epoch Time: 0m 13s
	Train Loss: 0.693 | Train Acc: 50.26%
	 Val. Loss: 0.694 | Val. Acc:49.66%
Epoch: 04 | Epoch Time: 0m 13s
	Train Loss: 0.693 | Train Acc: 49.77%
	 Val. Loss: 0.694 | Val. Acc:49.41%
Epoch: 05 | Epoch Time: 0m 13s
	Train Loss: 0.693 | Train Acc: 50.05%
	 Val. Loss: 0.694 | Val. Acc:49.39%
	 Test Loss: 0.708 | Test Acc:47.74%

baseline+pad:

Epoch: 01 | Epoch Time: 0m 5s
	Train Loss: 0.693 | Train Acc: 50.88%
	 Val. Loss: 0.692 | Val. Acc:52.20%
Epoch: 02 | Epoch Time: 0m 5s
	Train Loss: 0.692 | Train Acc: 51.98%
	 Val. Loss: 0.691 | Val. Acc:53.03%
Epoch: 03 | Epoch Time: 0m 5s
	Train Loss: 0.691 | Train Acc: 52.65%
	 Val. Loss: 0.690 | Val. Acc:53.72%
Epoch: 04 | Epoch Time: 0m 5s
	Train Loss: 0.690 | Train Acc: 53.42%
	 Val. Loss: 0.689 | Val. Acc:53.50%
Epoch: 05 | Epoch Time: 0m 5s
	Train Loss: 0.689 | Train Acc: 53.91%
	 Val. Loss: 0.688 | Val. Acc:53.64%
	 Test Loss: 0.689 | Test Acc:53.78%

明显有提升

7 遇到的环境问题

7.1 torchtext版本问题

安装torchtext时，当前的torch版本为1.8.1，无法兼容最新版本的torchtext，百度后安装了版本要求为1.8.0的torchtext==0.9，

安装torchtext的过程中还是给安装了1.8.0版本的torch，输入condal ist显示有两个版本的torch，

这时环境不再支持gpu训练，所以卸载了新安装的1.8.0版本torch，

import torch后显示ModuleNotFoundError: No module named 'torch'，之后安装了原来1.8.1版本的torch，gpu还是无法使用。

没办法只能重新装了环境。torchtext只支持大版本的torch吗？

7.2 gpu

原来的cuda设置

# 根据当前环境选择是否调用GPU进行训练
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

只占用了显存，但gpu的利用率是0%，没有设置用哪块显卡？改成以下可以正常运行

device = torch.device('cuda:0' if torch.cuda.is_available() else 'cpu')

参考：

https://zhuanlan.zhihu.com/p/79064602
https://zhuanlan.zhihu.com/p/100360301
https://zhuanlan.zhihu.com/p/39191116

使用CrewAI创建一个研究团队 AI量化投资 php 开发语言多智能体智能体人工智能
本指导文档将带你一步步完成使用CrewAI框架创建你的第一个AI代理团队的过程。通过这个简单的示例，你将学习如何构建一个研究团队，用于研究和分析指定主题，并生成一份综合报告。本教程基于CrewAI官方文档，适合初学者快速上手。前提条件在开始之前，请确保你已完成以下准备工作：安装Python：确保你的系统安装了Python版本在3.10到3.13之间。你可以通过以下命令检查Python版本：pyth
感恩3.26 于励萱
1感恩今天早早起床，收拾好自己，出门去学习2感恩巧玲，思恩准时到地铁站，出门一切顺顺利利，地铁没那么挤3感恩春春今天出门带了眼镜，视力特别好，搞得我们几个人在地铁车门跳来跳去4感恩因为出门早，提前到达学习会场5感恩双龙老师给我们安排住处，房间很舒服6感恩下午的课程，跟原来的销售流程不一样，所以有认真的去听7感恩裕丝的负责任，在家出业绩，还不忘提醒邀约目标顾客8感恩托泰安排的中餐，很美味，几个眼大胃
基于小样本学习的图像分类综述 cdyyyyyyy 学习分类机器学习
目录引言基本概念小样本学习方法分类1、数据增强2、迁移学习3、元学习小样本学习主流方法1、基于度量的小样本学习2、基于Pretraining+FineTuning的方法3、基于元学习的小样本学习总结引言因为课程设计要求，所以进行了关于小样本学习的调研。目前小样本学习还是一个比较热门的研究，很多关于小样本学习的论文也陆续发表。本文只是一个概述，具体方法研究还有待深入。基本概念小样本学习（FSL：Fe
我们开学啦栾文红
春意料峭，乍暖还寒，假期的小尾巴一摆，小朋友们带着离家的不舍与对开学的期待，开启了新学期的新征程。因为这是第二个学期，小朋友们经过一个学期的学习，对幼儿园的生活学习环境并不陌生，孩子们们都是开开心心的入园。看到自己的好朋友也会上去打招呼，手牵手一起到班级去。为了小朋友们能有一个开学的仪式感，我们准备了新学期开学典礼，在开学典礼上，园长妈妈向小朋友们送出了新学期的祝福，还给小朋友们准备了开学红包，里
【AI Agent教程】【MetaGPT】案例拆解：使用MetaGPT实现“狼人杀“游戏（2）- 整体流程解析中再看多智能体消息交互通路同学小张大模型游戏笔记人工智能 AIGC MetaGPT AI Agent 多智能体
大家好，我是同学小张，持续学习C++进阶知识和AI大模型应用实战案例，持续分享，欢迎大家点赞+关注，共同学习和进步。本文来学习一下MetaGPT的一个实战案例-狼人杀游戏，该案例源码已经在MetaGPTGitHub开源代码中可以看到。上次我们拆解了该游戏的整体实现框架（【AIAgent教程】【MetaGPT】案例拆解：使用MetaGPT实现“狼人杀“游戏（1）-整体框架解析），本文我们从运行流程的
每日早晚都读书1000/73-阅读“历史典籍”｜《罗马人的故事2-汉尼拔战记》盐野七生箸学习历史视角智慧使自己拥有“多元思维” 李廿
罗马人，智力不如希腊人，体力不如高卢人，技术不如埃特鲁利亚人，经济不如迦太基人，但为何却能一一打败对手，建立并维持庞大的罗马帝国？在这平庸年代，人人渴望英雄。日本女作家盐野七生，决然出走日本，远赴罗马，寻找英雄。定居罗马50多年，15年写就15册巨著《罗马人的故事》，还原一个意大利半岛的小国成为世界帝国，持续1300年的辉煌历程，再现一个英雄辈出的时代……《罗马人的故事2-汉尼拔战记》以女作家自己
李航老师-统计学习小三爷_df1b
三个准则1.作为入门选手，不要每章都看2.不要从零造轮子去实现算法，太浪费时间3.必须能手推公式章节目录##统计学习概论-统计学习的目的是对数据进行==预测与分析==-统计学习的前提是同类数据具有一定的统计规律性-统计学习的方法-监督学习(supervisedlearning)-非监督学习(unsupervisedlearning)-半监督学习(semi-supervisedlearning)-强
IAP固件升级进阶（Qt上位机） TianYaKe-天涯客 STM32 外设学习+项目实践 Qt qt 开发语言
前言时隔近一年，再次接触IAP固件升级，这次修改了以前的一些bug，同时新增一些实用性的功能。有纰漏请指出，转载请说明。学习交流请发邮件[email protected]。上位机界面视频演示当Up对iap固件升级的机制有了更深的理解后_哔哩哔哩_bilibili固件升级指令重要代码1.通过拖拽实现文件读取//MainWindow类的dragEnterEvent方法//当鼠标拖动文件进入MainWi
车辆云端威胁情报共享系统的多维解析与发展路径百态老人大数据人工智能
第一部分：内容本质提取原始内容描述了一个闭环网络安全体系：“车辆实时上传异常行为日志至安全运营中心（VSOC），云端通过机器学习分析攻击模式并下发全局防御策略”。其核心架构包含：数据采集层：车辆端持续收集异常行为日志数据，包含CAN总线通信模式、网络流量特征及驾驶行为数据传输层：通过V2X通信协议和OTA更新通道实现车云双向通信分析层：安全运营中心(VSOC)采用CNN-BiSRU等深度学习模型进
2019-05-15 华英雄_712d
2019-05-15姓名：郭祥华组别：315期六项精进努力一组【日精进打卡第515】【知～学习】背诵《六项精进》2遍共2104遍。背诵《大学》2遍共2104遍。原则：“痛苦加反思等于进步”“接受严厉的爱”“迎接而并非躲避痛苦”经典语句：你面临的挑战将考验你强化了，如果你没有经历过失败，就说明你没有努力突破极限，而如果你不努力突破极限，你就不能最大限度的挖掘自己的潜能，努力突破极限，有时失败有时成功
2019.1.24星期四亲子日记95 李妈妈
图片发自App图片发自App图片发自App大宝被评为三好学生了！一年级的第一学期马上结束了，虽然期末考试的成绩不理想，但是这一学期大宝还是很努力的，大宝的缺点就是学东西还不够扎实，做题的时候读题不认真，不会检查！希望假期里我们一起努力改掉这些坏习惯！让大宝在新的学期里更加的主动认真的去学习，也希望大宝能够再活跃一点，能够积极参与学校的各项活动！做一个全面发展的好学生！！！厦小一年六班李新妈妈
基于深度学习的语音识别：从音频信号到文本转录 Blossom.118 机器学习与人工智能深度学习语音识别音视频人工智能机器学习线性代数计算机视觉
前言语音识别（AutomaticSpeechRecognition,ASR）是人工智能领域中一个极具挑战性和应用前景的研究方向。它通过将语音信号转换为文本，为人们提供了更加自然和便捷的人机交互方式。近年来，深度学习技术在语音识别领域取得了显著进展，极大地提高了语音识别的准确率和鲁棒性。本文将详细介绍如何使用深度学习技术构建一个语音识别系统，从音频信号的预处理到模型的训练与部署。一、语音识别的基本概
“重复”定义函数的睿智(Python/与ai助手“智普清言”深度交流) 梦幻精灵_cq 笔记学习
镜像双胞谬重复，定制便捷巧活工。笔记模板由python脚本于2025-07-1612:16:30创建，本篇笔记适合至少通晓一门语言，熟悉基本编程范式的coder翻阅。学习的细节是欢悦的历程博客的核心价值：在于输出思考与经验，而不仅仅是知识的简单复述。Python官网：这里，才python前沿。英文原版，原汁原味，才是寻根溯源的正统。地址：https://www.python.org/F
偶拾《退让》，一阙仿七律带出的文化思考(中文诗创作) 梦幻精灵_cq 笔记学习
礼貌温言沐春风，谦让理解通彼此。笔记模板由python脚本于2025-07-0111:29:03创建，本篇笔记适合喜欢中文仿古七言诗的coder翻阅。学习的细节是欢悦的历程博客的核心价值：在于输出思考与经验，而不仅仅是知识的简单复述。Python官网：这里，才python前沿。英文原版，原汁原味，才是寻根溯源的正统。地址：https://www.python.org/Free：大咖
2018-09-06 晰姐吉祥
姓名：王彬公司：杭州爵卓服饰有限公司（NE潮牌男装）【日精进打卡第68天】【知～学习】《六项精进》1遍共183遍《六项精进》通篇1遍共33遍《大学》1遍共135遍《经营十二条》0遍共11遍••••••【经典名句】人生的道路都是由心来描绘的，所以，无论自己处于多么严酷的境遇之中，心头都不应为悲观的思想所萦绕。——稻盛和夫【行～实践】一、修身：（对自己个人）1、学习英语两小时，打卡第七天；二、齐家：（
过拟合、欠拟合及其解决方案；梯度消失、梯度爆炸；循环神经网络进阶 Ryan_sz1
1、过拟合、欠拟合及其解决方案过拟合、欠拟合机器学习或者训练深度神经网络的时候经常会出现欠拟合和过拟合这两个问题，但是，一开始我们的模型往往是欠拟合的，也正是因为如此才有了优化的空间，我们需要不断的调整算法来使得模型的表达能拿更强。但是优化到了一定程度就需要解决过拟合的问题了。也就是说欠拟合是模型表达能力不够，达不到很好的表达效果。而过拟合是在训练集的范围内表达能力过强，导致完全拟合了训练集。解决
我读《史记·刺客列传》奋笔疾书的待业妈妈
这个月的陪伴营文学史作业是汉的文学史讲义。汉的文学相对于先秦来说，少了不少。而且这个月看到友友们写的先秦文学讲义，每一份都太棒啦！有对整个先秦文学史进行梳理的，也有对某一部作品进行整理概括的，也有对个别文章进行赏析的。在学习友友们的先秦文学讲义时，也大概定下自己的这个月目标——《史记》。《史记》的内容非常多，从三皇五帝到汉，上千年的历史被融入一本书中，司马迁着实是个怪才。司马迁为了完成心中的《史记
学习 | 看疫情地图，学 PPT 制作小斌PPT
今天是大年初七，由于突发疫情，大家都没能好好过个春节，新型肺炎来至已有多天，人心惶惶，至今已确诊有九千多人感染，但相信，大家一定能挺过来的，疫情会得到控制的。越是危难的时候，越要淡定，不听信谣言，不传谣，自己做好隔离工作，不聚众，清洁通风，从自身做起。长期在家，就当是好好放个长假吧。现在在手机上，我们也可以轻松了解当前疫情动态，跟踪疫情进展，自己也可以作相应的规划。例如可以从如下5个地方查看疫情概
@选调生在传承红色基因中汲取奋进力量神奇咩咩咩
《习近平谈治国理政》生动记录了习近平总书记领导党和人民应变局、开新局的伟大实践，集中展现了马克思主义中国化的最新成果，是系统反映习近平新时代中国特色社会主义思想的权威著作。作为选调生，学习跟进、认识跟进、行动跟进，全面系统地读原著学原文、悟原理、知原义，重点关注第四卷提出的一系列原创性的治国理政新理念新思想新战略，对于我们进一步加深对中国之路、中国之治、中国之理的理解，深刻体悟这一思想强大的真理力
适合学生赚钱的软件学生在校赚零花钱氧惠_飞智666999
生时代是人生中最美好的阶段之一，但也是经济压力较大的阶段之一。很多学生想要通过自己的努力赚取一些零花钱，既能减轻家庭负担，又能锻炼自己的能力和经验。但是，在校学习任务繁重，时间和空间都有限制，如何找到适合自己的赚钱方式呢？氧惠APP，2022全新模式，0投资，最快63天做到月入十万。我的直推也会放到你下面，我曾经1年做到百万团队，现在加入我也会帮你做到百万团队。【氧惠】百度有几百万篇报道，也期待你
python爬大学生就业信息报告_Python语言爬虫——Python 岗位分析报告 weixin_39578457
本文主要向大家介绍了Python语言爬虫——Python岗位分析报告，通过具体的内容向大家展示，希望对大家学习Python语言有所帮助。前两篇我们分别爬取了糗事百科和妹子图网站，学习了Requests,BeautifulSoup的基本使用。不过前两篇都是从静态HTML页面中来筛选出我们需要的信息。这一篇我们来学习下如何来获取Ajax请求返回的结果。本篇以拉勾网为例来说明一下如何获取Ajax请求内容
接纳自己晴岚85
郑海燕焦点初级十期坚持分享第59天2018.8.9今天早上做完中药热敷回来的路上，我一直在心里默默的念叨着一句话：郑海燕你真是太棒了，你做事真有自己的想法，你真善于表达自己。这是我最想给自己说的话，也是我最渴望达到的目标，所以我在心里默默的念叨了快一百遍。念叨完我觉得自己内心生出了许多的力量。学习焦点有两个月了，虽然看书，分享，听课，都在坚持，但是最近半个月，我的情绪很低落，也许是生活的压力，也许
【学习有多重要】早妈活出生命的意义
图片发自App翻开日记本，从12年开始写日记，前几年都是负能量，抱怨老公、抱怨工作，唯独不抱怨自己。多愁善感、郁郁寡欢，活着很累!而从2017年底开始，我像变了一个人。我现在很正能量，积极向上、宠辱不惊、热爱工作、热爱生活，能处理好夫妻、亲子、婆媳关系，享受生活。我之所以能发生改变，是因为那一年我生了小宝，我可以休产假，我有时间看书了，有时间学习了。我从书中和子木读书会的分享中获得了力量，也获得了
富爸爸穷爸爸之富人思维穷人思维微笑de记忆2019
①不论什么情况，即便是富裕有余，也要先“支付自己”：也就是强制储蓄把收入的一部分强制性的先行存入自己的投资账户、退休账户等具有长期规划意义的账户，再把剩下的部分考虑用做其他支出和学习。通过强制性的控制，可以一方面控制自己的支出，另一方面也锻炼了自己的财商——即不要花超过自己能力范围的钱并努力开源②“过安稳的一生”并不是那么不可取的想法，而是不要被安稳的生活所营造的“安全”的环境所迷惑。③避免迈入“
今日放弃一一休
没有学习，下了点资料，找时间看。突然想到，人做决定的时候，到底是什么在作祟。就那我来说，明明已经想清楚如果不发生改变，现在这样子下去很可怕，可就是迈不出那一步，不知道是心理有所顾虑，还是习惯了在这片区域难以离开。只怕这样子时间越久，越难离开，沉默成本只会无限的增加。选择陈本也就变得最小化了，不知道这样子说对不对。
10.20工作总结 240b9999ea48
p前往正科门店进行参观学习d上午在直营店参观学习，参观别人的门店才会知道自己门店的不足。别人各种地方的卫生什么的都能整理得干干净净，反观咱们加盟店，学习的东西还有很多。下午前往上风杠门店扶持。因为门店明天要培训，所以监督并指导门店打扫卫生晚上回家整理区域内目前发现的问题，并开了一个简短的会议c由于是第一次开展会议，需要会议学习的地方还有很多a前往上风港培训消杀
2023-04-03 向日葵积极向上
每日一省导师班复训结束了，这一次断断续续的听课，听的不是很好，不过，还是有收获的，今天的实操流程有很大的启发。今天老公又说，你学了这么久有用的不嘛？问题解决了没？怎么还是这个样子呢？他爱怎么怎么的，我好解脱……听到他这样说，我心里就在想，这货就那样，固执又不学习，他自己也没招，把希望寄托在我身上，希望我去解决目前的问题（一直以来都这样，只要有事就是我的事）。我说：我们养了十几年的娃，十几年的教育结
选择比努力更重要 chocolatemamama
少即多，少给孩子贴不好标签比如孩子在物权意识比较强的阶段不愿意分享的时候，不给孩子贴"小气、吝啬"的标签，多给他说"不"的权力我们要给予孩子尊重。这时的少即收获孩子更愿意多的分享。少即多，无效的社交。减少了灯红酒绿的社交后，小喝几杯的习惯也还是有的，但会选择在家自己喝一些，看几页书。减少无效社交，多了独处学习空间。少即多，少责怪多引导一次孩子在湿的地板赤脚玩滑冰，一不留意神，女儿摔个四脚朝天。见此
学配音能赚到钱吗配音新手圈
当然可以，学习配音不仅能够开启一扇通往创意与表达的新大门，更是一条潜力无限、能够实实在在赚取可观收入的职业道路。配音兼职接单推荐公众号，配音新手圈，声优配音圈，新配音兼职圈，配音就业圈，鼎音副业，有声新手圈，每天更新各种的配音任务，新手小白也可以接单。1、配音新手圈这是一个公众号配音新手圈里面每天更新配音任务(只要有手机就可以接单，对经验无要求)，都是适合没有基础的人去做的，每天都会发布新任务。适
思维导图学习之二阶:实践力第四节纯优妈咪
时间:2021.5.29课程:简快导图之《杨柳》,核心心法:关键词和逻辑。课程收获:首先老师讲了拆解的意义，比如我们在给孩子讲解绘本的时候，我们会把它拆解成大类，中类，小类，小小类。那么拆解有什么意义呢？它可以使我们思路更清晰，把复杂的事情经过层层的分层分级，最终明白和理解的一个过程。这节课还是进行收敛型思维的训练，以《杨柳》为例展开。第一步：通读全文；第二步：通文理解（略）；第三步:逐句找关键词
knob UI插件使用换个号韩国红果果 JavaScript jsonp knob
图形是用canvas绘制的 js代码 var paras = { max:800, min:100, skin:'tron',//button type thickness:.3,//button width width:'200',//define canvas width.,canvas height displayInput:'tr
Android+Jquery Mobile学习系列(5)-SQLite数据库白糖_ JQuery Mobile
目录导航 SQLite是轻量级的、嵌入式的、关系型数据库，目前已经在iPhone、Android等手机系统中使用,SQLite可移植性好，很容易使用，很小，高效而且可靠。因为Android已经集成了SQLite，所以开发人员无需引入任何JAR包，而且Android也针对SQLite封装了专属的API，调用起来非常快捷方便。我也是第一次接触S
impala-2.1.2-CDH5.3.2 dayutianfei impala
最近在整理impala编译的东西，简单记录几个要点：根据官网的信息（https://github.com/cloudera/Impala/wiki/How-to-build-Impala）： 1. 首次编译impala，推荐使用命令： ${IMPALA_HOME}/buildall.sh -skiptests -build_shared_libs -format 2.仅编译BE ${I
求二进制数中1的个数周凡杨 java 算法二进制
解法一：对于一个正整数如果是偶数，该数的二进制数的最后一位是 0 ，反之若是奇数，则该数的二进制数的最后一位是 1 。因此，可以考虑利用位移、判断奇偶来实现。 public int bitCount(int x){ int count = 0; while(x!=0){ if(x%2!=0){ /
spring中hibernate及事务配置 g21121 Hibernate
hibernate的sessionFactory配置：  <bean id="sessionFactory" class="org.springframework.orm.hibernate3.LocalSessionFactoryBean"> <
log4j.properties 使用 510888780 log4j
log4j.properties 使用一.参数意义说明输出级别的种类 ERROR、WARN、INFO、DEBUG ERROR 为严重错误主要是程序的错误 WARN 为一般警告，比如session丢失 INFO 为一般要显示的信息，比如登录登出 DEBUG 为程序的调试信息配置日志信息输出目的地 log4j.appender.appenderName = fully.qua
Spring mvc-jfreeChart柱图（2）布衣凌宇 jfreechart
上一篇中生成的图是静态的，这篇将按条件进行搜索，并统计成图表，左面为统计图，右面显示搜索出的结果。第一步：导包第二步；配置web.xml(上一篇有代码) 建BarRenderer类用于柱子颜色 import java.awt.Color; import java.awt.Paint; import org.jfree.chart.renderer.category.BarR
我的spring学习笔记14-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。 PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java
maven 之 cobertura 简单使用 antlove maven test unit cobertura report
1. 创建一个maven项目 2. 创建com.CoberturaStart.java package com; public class CoberturaStart { public void helloEveryone(){ System.out.println("=================================================
程序的执行顺序百合不是茶 JAVA执行顺序
刚在看java核心技术时发现对java的执行顺序不是很明白了,百度一下也没有找到适合自己的资料,所以就简单的回顾一下吧代码如下; 经典的程序执行面试题 //关于程序执行的顺序 //例如： //定义一个基类 public class A(){ public A(
设置session失效的几种方法 bijian1013 web.xml session失效监听器
在系统登录后，都会设置一个当前session失效的时间，以确保在用户长时间不与服务器交互，自动退出登录，销毁session。具体设置很简单，方法有三种：（1）在主页面或者公共页面中加入：session.setMaxInactiveInterval(900);参数900单位是秒，即在没有活动15分钟后，session将失效。这里要注意这个session设置的时间是根据服务器来计算的，而不是客户端。所
java jvm常用命令工具 bijian1013 java jvm
一.概述程序运行中经常会遇到各种问题，定位问题时通常需要综合各种信息，如系统日志、堆dump文件、线程dump文件、GC日志等。通过虚拟机监控和诊断工具可以帮忙我们快速获取、分析需要的数据，进而提高问题解决速度。本文将介绍虚拟机常用监控和问题诊断命令工具的使用方法，主要包含以下工具: &nbs
【Spring框架一】Spring常用注解之Autowired和Resource注解 bit1129 Spring常用注解
Spring自从2.0引入注解的方式取代XML配置的方式来做IOC之后，对Spring一些常用注解的含义行为一直处于比较模糊的状态，写几篇总结下Spring常用的注解。本篇包含的注解有如下几个： Autowired Resource Component Service Controller Transactional 根据它们的功能、目的，可以分为三组，Autow
mysql 操作遇到safe update mode问题 bitray update
我并不知道出现这个问题的实际原理,只是通过其他朋友的博客,文章得知的一个解决方案,目前先记录一个解决方法,未来要是真了解以后,还会继续补全. 在mysql5中有一个safe update mode,这个模式让sql操作更加安全,据说要求有where条件,防止全表更新操作.如果必须要进行全表操作,我们可以执行 SET
nginx_perl试用 ronin47 nginx_perl试用
因为空闲时间比较多，所以在CPAN上乱翻，看到了nginx_perl这个项目(原名Nginx::Engine)，现在托管在github.com上。地址见：https://github.com/zzzcpan/nginx-perl 这个模块的目的，是在nginx内置官方perl模块的基础上，实现一系列异步非阻塞的api。用connector/writer/reader完成类似proxy的功能（这里
java-63-在字符串中删除特定的字符 bylijinnan java
public class DeleteSpecificChars { /** * Q 63 在字符串中删除特定的字符 * 输入两个字符串，从第一字符串中删除第二个字符串中所有的字符。 * 例如，输入”They are students.”和”aeiou”，则删除之后的第一个字符串变成”Thy r stdnts.” */ public static voi
EffectiveJava--创建和销毁对象 ccii 创建和销毁对象
本章内容： 1. 考虑用静态工厂方法代替构造器 2. 遇到多个构造器参数时要考虑用构建器（Builder模式） 3. 用私有构造器或者枚举类型强化Singleton属性 4. 通过私有构造器强化不可实例化的能力 5. 避免创建不必要的对象 6. 消除过期的对象引用 7. 避免使用终结方法 1. 考虑用静态工厂方法代替构造器类可以通过
[宇宙时代]四边形理论与光速飞行 comsci
从四边形理论来推论为什么光子飞船必须获得星光信号才能够进行光速飞行？一组星体组成星座向空间辐射一组由复杂星光信号组成的辐射频带，按照四边形-频率假说一组频率就代表一个时空的入口那么这种由星光信号组成的辐射频带就代表由这些星体所控制的时空通道，该时空通道在三维空间的投影是一
ubuntu server下python脚本迁移数据 cywhoyi python Kettle pymysql cx_Oracle ubuntu server
因为是在Ubuntu下，所以安装python、pip、pymysql等都极其方便，sudo apt-get install pymysql，但是在安装cx_Oracle（连接oracle的模块）出现许多问题，查阅相关资料，发现这边文章能够帮我解决，希望大家少走点弯路。http://www.tbdazhe.com/archives/602 1.安装python 2.安装pip、pymysql
Ajax正确但是请求不到值解决方案 dashuaifu Ajax async
Ajax正确但是请求不到值解决方案解决方案：1 . async: false , 2. 设置延时执行js里的ajax或者延时后台java方法！！！！！！！例如： $.ajax({ &
windows安装配置php+memcached dcj3sjt126com PHP Install memcache
Windows下Memcached的安装配置方法 1、将第一个包解压放某个盘下面，比如在c:\memcached。 2、在终端（也即cmd命令界面）下输入 'c:\memcached\memcached.exe -d install' 安装。 3、再输入： 'c:\memcached\memcached.exe -d start' 启动。（需要注意的: 以后memcached将作为windo
iOS开发学习路径的一些建议 dcj3sjt126com ios
iOS论坛里有朋友要求回答帖子，帖子的标题是：想学IOS开发高阶一点的东西，从何开始，然后我吧啦吧啦回答写了很多。既然敲了那么多字，我就把我写的回复也贴到博客里来分享，希望能对大家有帮助。欢迎大家也到帖子里讨论和分享，地址：http://bbs.csdn.net/topics/390920759 下面是我回复的内容：结合自己情况聊下iOS学习建议，
Javascript闭包概念 fanfanlovey JavaScript 闭包
1.参考资料 http://www.jb51.net/article/24101.htm http://blog.csdn.net/yn49782026/article/details/8549462 2.内容概述要理解闭包，首先需要理解变量作用域问题内部函数可以饮用外面全局变量 var n=999; 　　functio
yum安装mysql5.6 haisheng mysql
1、安装http://dev.mysql.com/get/mysql-community-release-el7-5.noarch.rpm 2、yum install mysql 3、yum install mysql-server 4、vi /etc/my.cnf 添加character_set_server=utf8
po/bo/vo/dao/pojo的详介 IT_zhlp80 java BO VO DAO POJO po
JAVA几种对象的解释 PO:persistant object持久对象,可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作. VO:value object值对象。通常用于业务层之间的数据传递，和PO一样也是仅仅包含数据而已。但应是抽象出的业务对象,可
java设计模式 kerryg java 设计模式
设计模式的分类：一、设计模式总体分为三大类： 1、创建型模式（5种）：工厂方法模式，抽象工厂模式，单例模式，建造者模式，原型模式。 2、结构型模式（7种）：适配器模式，装饰器模式，代理模式，外观模式，桥接模式，组合模式，享元模式。 3、行为型模式（11种）：策略模式，模版方法模式，观察者模式，迭代子模式，责任链模式，命令模式，备忘录模式，状态模式，访问者
[1]CXF3.1整合Spring开发webservice——helloworld篇木头.java spring webservice CXF
Spring 版本3.2.10 CXF 版本3.1.1 项目采用MAVEN组织依赖jar 我这里是有parent的pom，为了简洁明了，我直接把所有的依赖都列一起了，所以都没version，反正上面已经写了版本 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="ht
Google 工程师亲授：菜鸟开发者一定要投资的十大目标 qindongliang1922 工作感悟人生
身为软件开发者，有什么是一定得投资的？ Google 软件工程师 Emanuel Saringan 整理了十项他认为必要的投资，第一项就是身体健康，英文与数学也都是必备能力吗？来看看他怎么说。（以下文字以作者第一人称撰写））你的健康无疑地，软件开发者是世界上最久坐不动的职业之一。每天连坐八到十六小时，休息时间只有一点点，绝对会让你的鲔鱼肚肆无忌惮的生长。肥胖容易扩大罹患其他疾病的风险，
linux打开最大文件数量1,048,576 tianzhihehe c linux
File descriptors are represented by the C int type. Not using a special type is often considered odd, but is, historically, the Unix way. Each Linux process has a maximum number of files th
java语言中PO、VO、DAO、BO、POJO几种对象的解释衞酆夼 java VO BO POJO po
PO:persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作。 BO:business object业务对象封装业务逻辑的java对象