Yang SiCheng

【NLP】12 RNN神经网络应用在情绪分类NLP任务——LSTM(hidden, output)、Attention、Transform Encoder

LSTM

1. LSTM-hidden
- 1.1 调试过程
- 1.2 结果
- 1.3 全部代码
2. LSTM-output
3. Attention
4. Transformer
5. 全部代码
6. 小结

1. LSTM-hidden

训练集、测试集、训练集格式如下：

什么破烂反派，毫无戏剧冲突能消耗两个多小时生命，还强加爱情戏。脑残片好圈钱倒是真的。 NEG
机甲之战超超好看，比变形金刚强；人，神，变异人，人工智能互殴，强强强强；每一小段末句都是槽或者笑点，应该死了不少编剧；Jane不来客串，雷神没露，扣分；女神配怪兽，fair enough；美国队长我最喜欢他的盾，大概因为紫龙；难得人物多次发表演讲还不死；最后，找到了下半年新发型，开心！ POS
啦啦啦 NORM
...

1.1 调试过程

训练集上每5000个句子打印一次结果，在验证集和测试集的Loss和Accuracy分别为以下：

训练集句子总数：579947
验证集句子总数：835633
测试集句子总数：6582
cuda
(0.6757109771410998, 0.5973040848751986) (0.6478104839284357, 0.6675281240498632)
(4.683135150947266, 0.758642873125979) (5.7317852833308, 0.693523867436911)

结果出来的太慢了，这里猜测可能是验证集句子的数量太多导致的，而且我们也不需要算Loss，同时加上时间信息，每2000个句子打印一次结果

注意到准确度波动较大，这里每20个句子误差反向传播一次：

训练集句子总数：579947
验证集句子总数：5636
测试集句子总数：6582
cuda
Epoch: 01 | 0 | Time: 0m 0s | Loss:0.7626190185546875
	Validation Accuracy:0.45136612021857925 Test Accuracy:0.4414715719063545
Epoch: 01 | 5000 | Time: 0m 0s | Loss:2.622600959512056e-06
	Validation Accuracy:0.8590163934426229 Test Accuracy:0.6953481301307388
Epoch: 01 | 10000 | Time: 0m 0s | Loss:4.880456447601318
	Validation Accuracy:0.6145719489981785 Test Accuracy:0.7705989662511402
Epoch: 01 | 15000 | Time: 0m 0s | Loss:1.9933998584747314
	Validation Accuracy:0.7180327868852459 Test Accuracy:0.7873213742778961
Epoch: 01 | 20000 | Time: 0m 0s | Loss:0.5889929533004761
	Validation Accuracy:0.6122040072859745 Test Accuracy:0.7906658558832472
Epoch: 01 | 25000 | Time: 0m 0s | Loss:0.0062605151906609535
	Validation Accuracy:0.8446265938069216 Test Accuracy:0.7172392824566738
Epoch: 01 | 30000 | Time: 0m 0s | Loss:0.008551644161343575
	Validation Accuracy:0.8619307832422587 Test Accuracy:0.6955001520218912
Epoch: 01 | 35000 | Time: 0m 0s | Loss:0.003599713556468487
	Validation Accuracy:0.1714025500910747 Test Accuracy:0.37017330495591366
Epoch: 01 | 40000 | Time: 0m 0s | Loss:0
	Validation Accuracy:0.5411657559198543 Test Accuracy:0.8332319854058985
Epoch: 01 | 45000 | Time: 0m 0s | Loss:0
	Validation Accuracy:0.6375227686703097 Test Accuracy:0.8259349346305868
Epoch: 01 | 50000 | Time: 0m 0s | Loss:0
	Validation Accuracy:0.4387978142076503 Test Accuracy:0.8279112192155671
Epoch: 01 | 55000 | Time: 0m 0s | Loss:0
	Validation Accuracy:0.6608378870673952 Test Accuracy:0.823198540589845

数据感觉有些过拟合，验证集上表现不好，波动较大，这里增加早停，当验证集的准确度有两次减少则停止，结果：

Epoch: 01 | 0 | Time: 0m 0s | Loss:0.7791017293930054
	Validation Accuracy:0.32932604735883425 Test Accuracy:0.30054727880814835
Finish training at 0 epoch 319 
	Validation Accuracy:0.8571948998178507 Test Accuracy:0.6948920644572818

每64个句子误差反向传播一次：

Finish training at 0 epoch 383 
	Validation Accuracy:0.8562841530054645 Test Accuracy:0.6948920644572818

把LSTM层数改为2层：

Finish training at 0 epoch 447 
	Validation Accuracy:0.857559198542805 Test Accuracy:0.6951961082395866

还是多给点数据给验证集：

训练集句子总数：579947
验证集句子总数：14678
测试集句子总数：6582
Finish training at 0 epoch 703 
	Validation Accuracy:0.7404820118756549 Test Accuracy:0.6948920644572818

两层时不应该是简单的相加，这里增加一个二层到一层的线性变化，同时在结束时增加每64个句子的Loss和的绘图：

Epoch: 01 | 63 | Time: 0m 3s | Loss:36.484230041503906
	max_tmp:0
Epoch: 01 | 127 | Time: 0m 33s | Loss:23.735937118530273
	max_tmp:0.7449528466643381
Epoch: 01 | 191 | Time: 0m 47s | Loss:14.672348022460938
	max_tmp:0.7449528466643381
Finish training at 0 epoch 191 
	Validation Accuracy:0.7449528466643381 Test Accuracy:0.6951961082395866

把层数改为10层：

Epoch: 01 | 63 | Time: 0m 8s | Loss:54.9057502746582
	max_tmp:0
Epoch: 01 | 127 | Time: 1m 27s | Loss:43.604095458984375
	max_tmp:0.5093258819420189
Epoch: 01 | 191 | Time: 2m 46s | Loss:33.390384674072266
	max_tmp:0.7439049947607405
Epoch: 01 | 255 | Time: 4m 5s | Loss:21.977874755859375
	max_tmp:0.7449528466643381
Epoch: 01 | 319 | Time: 4m 46s | Loss:7.002665042877197
	max_tmp:0.7449528466643381
Finish training at 0 epoch 319 
	Validation Accuracy:0.7449528466643381 Test Accuracy:0.6951961082395866

注意到这个准确率和之前一样，我们把停止条件的大于换成大于等于，结果Loss越来越低，但是验证集精确度没有变，就很奇怪，今天早上起来看了看原训练数据集，一直到5323行才有NEG的情绪，这样神经网络只要把情绪都判为POS不就好了吗？

训练集句子总数：579947
POS:308422 NEG:271525		# 0.5318
验证集句子总数：14678
POS:10909 NEG:3719		# 0.7432
测试集句子总数：6582
POS:4574 NEG:2008		# 0.6949

应该就是这样，不平衡数据集！与程序计算出来的精确度不一样的原因是，不一定所有的句子都有句向量，没有的直接就continue了

采用：

i = random.randint(0, len(train_dataset)-1)

还是很极端：

	Validation Accuracy:0.2550471533356619 Test Accuracy:0.3048038917604135
	Validation Accuracy:0.2550471533356619 Test Accuracy:0.3048038917604135
	Validation Accuracy:0.2550471533356619 Test Accuracy:0.3048038917604135

就是不是全都是POS，就是全都是NEG，解决方法：参数更新需要同时更新两个网络，每64个句子误差反向传播一次，每2000个句子进行判断，连续3次验证集精确度下降则停止：

...
Epoch: 9984 | Time: 4m 10s | Loss:35.62297821044922
Finish training at 10023 epoch
	Validation Accuracy:0.554658110201372 Test Accuracy:0.7929461842505321 Train Accuracy:0.5529679376083189

每一次完整迭代计算验证集精确度：

...
Epoch: 0 | 578496 | Time: 92m 9s | Loss:22.1627140045166
	max_tmp:0.5487299988810563
...
Epoch: 1 | 1157056 | Time: 185m 17s | Loss:18.839628219604492
	max_tmp:0.5491775763679086
...
Epoch: 2 | 1735616 | Time: 278m 15s | Loss:30.74102783203125
Epoch: 3 | 1735680 | Time: 278m 42s | Loss:17.16641616821289
...

采用GRU代替LSTM，层数为20，bidirectional=True, dropout=0.1：

Epoch: 0 | 1000 | Time: 1m 0s | Average Loss:51.44233322143555
Epoch: 0 | 2000 | Time: 2m 3s | Average Loss:45.25587844848633
Epoch: 0 | 3000 | Time: 3m 4s | Average Loss:43.14613723754883
Epoch: 0 | 4000 | Time: 4m 9s | Average Loss:42.77010726928711
...

训练太慢了…

用SGD方法代替Adam试试：

Epoch: 0 | 1000 | Time: 1m 2s | Average Loss:44.23997497558594
Epoch: 0 | 2000 | Time: 2m 9s | Average Loss:43.98634338378906
...

1.2 结果

依然很慢，把层数从20层改到2层，为了加快训练速度，训练集仅使用原数据集的15%，梯度下降方法依然用Adam：

...
Epoch: 0 | 85000 | Time: 7m 17s | Average Loss:27.285926818847656
loss_valuate:0.837062966359744
	Validation Accuracy:0.5368584414144774 Test Accuracy:0.854058984493767
...
Epoch: 1 | 85000 | Time: 14m 54s | Average Loss:25.68672752380371
loss_valuate:0.8672566204030873
	Validation Accuracy:0.5397406052544064 Test Accuracy:0.848434174521131
...
Epoch: 2 | 85000 | Time: 22m 30s | Average Loss:24.318418502807617
loss_valuate:0.9009444542595056
	Validation Accuracy:0.5494956213280124 Test Accuracy:0.8440255396777135
...
Epoch: 3 | 85000 | Time: 31m 34s | Average Loss:21.747648239135742
loss_valuate:1.0091007267764105
	Validation Accuracy:0.544950670657355 Test Accuracy:0.8282152629978717
...
Epoch: 4 | 85000 | Time: 39m 12s | Average Loss:19.935115814208984
loss_valuate:1.074355800008314
	Validation Accuracy:0.5378561135129143 Test Accuracy:0.8084524171480694
...
Epoch: 5 | 85000 | Time: 47m 39s | Average Loss:17.499746322631836
loss_valuate:1.207078773660071
	Validation Accuracy:0.5343088349406939 Test Accuracy:0.8165095773791426
...
Epoch: 6 | 85000 | Time: 56m 49s | Average Loss:16.686220169067383
loss_valuate:1.1837956443645383
	Validation Accuracy:0.5364150315929498 Test Accuracy:0.8029796290665856
...
Epoch: 7 | 85000 | Time: 67m 25s | Average Loss:16.701534271240234
loss_valuate:1.22396472034004
	Validation Accuracy:0.5384103757898238 Test Accuracy:0.8155974460322286
...
Epoch: 8 | 85000 | Time: 75m 3s | Average Loss:15.525861740112305
loss_valuate:1.2596575871577431
	Validation Accuracy:0.5338654251191663 Test Accuracy:0.8189419276375798
...
Epoch: 9 | 85000 | Time: 82m 41s | Average Loss:15.818358421325684
loss_valuate:1.313194776424454
	Validation Accuracy:0.5368584414144774 Test Accuracy:0.8241106719367589
	 Train Accuracy:0.4994024986420424

可以发现，从第2代开始，验证集的Loss就在不断上升，但精确度变化不大，大致在0.53-0.54左右，如果早停的话，第1代就会停止，此时Test Accuracy为0.85，表现还是很好的

但是为什么验证集的精确度和训练集的精确度这么低？

每64代的Loss变化曲线如下：

为避免偶然性，再次训练：

...
Epoch: 0 | 85000 | Time: 6m 57s | Average Loss:27.515430450439453
loss_valuate:0.8839113093913431
	Validation Accuracy:0.5336597307221542 Test Accuracy:0.8000912131346914
...
Epoch: 1 | 85000 | Time: 14m 20s | Average Loss:25.438941955566406
loss_valuate:0.9057566658784911
	Validation Accuracy:0.5499054189384667 Test Accuracy:0.8399209486166008
...
Epoch: 2 | 85000 | Time: 21m 43s | Average Loss:23.79216194152832
loss_valuate:0.9505235861522199
	Validation Accuracy:0.5367753421608991 Test Accuracy:0.8511705685618729
...

可能验证集的选择不是很好

1.3 全部代码

import jieba
import torch
import torch.nn as nn
from gensim.models import KeyedVectors
import matplotlib.pyplot as plt
import time
import random
# import torch.nn.functional as F

word_vec = KeyedVectors.load('/mnt/Data1/ysc/TF-IDF/vectors.kv')

path_train = '/mnt/Data1/ysc/Data_Small.txt'
path_valuate = '/mnt/Data1/ysc/dmsc_v2_small.txt'
path_test = '/mnt/Data1/ysc/Chinese review datasets/test.txt'

train_dataset = []
train_label = []
valuate_dataset = []
valuate_label = []
test_dataset = []
test_label = []

# pos_cnt = 0
# neg_cnt = 0
with open(path_train, 'r', encoding='utf-8') as file:
    for line in file.readlines():
        if random.randint(1,100)>15:continue
        if line[-4:-1] == 'POS':
            train_label.append(torch.tensor([1]))
            # pos_cnt += 1
        elif line[-4:-1] == 'NEG':
            train_label.append(torch.tensor([0]))
            # neg_cnt += 1
        elif line[-4:-1] == 'ORM':
            continue
        train_dataset.append((' '.join(jieba.cut(line[:-5].strip('\n').strip(' '))).split(' ')))
print('训练集句子总数：{}'.format(len(train_dataset)))
# print('POS:{} NEG:{}'.format(pos_cnt, neg_cnt))

# pos_cnt = 0
# neg_cnt = 0
with open(path_valuate, 'r', encoding='utf-8') as file:
    for line in file.readlines():
        if line[-4:-1] == 'POS':
            if random.randint(0,1)==0:continue
            valuate_label.append(torch.tensor([1]))
            # pos_cnt += 1
        elif line[-4:-1] == 'NEG':
            valuate_label.append(torch.tensor([0]))
            # neg_cnt += 1
        elif line[-4:-1] == 'ORM':
            continue
        valuate_dataset.append((' '.join(jieba.cut(line[:-5].strip('\n').strip(' '))).split(' ')))
print('验证集句子总数：{}'.format(len(valuate_dataset)))
# print('POS:{} NEG:{}'.format(pos_cnt, neg_cnt))

# pos_cnt = 0
# neg_cnt = 0
with open(path_test, 'r', encoding='utf-8') as file:
    for line in file.readlines():
        if line[-4:-1] == 'POS':
            test_label.append(torch.tensor([1]))
            # pos_cnt += 1
        elif line[-4:-1] == 'NEG':
            test_label.append(torch.tensor([0]))
            # neg_cnt += 1
        elif line[-4:-1] == 'ORM':
            continue
        test_dataset.append((' '.join(jieba.cut(line[:-5].strip('\n').strip(' '))).split(' ')))
print('测试集句子总数：{}'.format(len(test_dataset)))
# print('POS:{} NEG:{}'.format(pos_cnt, neg_cnt))

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
print(device)
# device = torch.device("cpu")


def embedding(sentence):
    sentence_embedding = []
    for word in sentence:
        try:
            sentence_embedding.append([word_vec[word]])
        except:
            continue
    return sentence_embedding


class Net(nn.Module):
    def __init__(self, hidden_size):
        super(Net, self).__init__()
        self.hidden_size = hidden_size
        # self.lstm = nn.LSTM(word_vec.vector_size, hidden_size, num_layers=20, bidirectional=True)
        self.rgu = nn.GRU(word_vec.vector_size, hidden_size, num_layers=2, bidirectional=True, dropout=0.1)

    def forward(self, input, hidden=None):
        embeds = torch.tensor(embedding(input), device=device)
        output = embeds
        output, hidden = self.rgu(output, hidden)
        return output, hidden  # seq_len, batch, num_directions * hidden_size

    # def initHidden(self):
    #     h_0 = torch.zeros(40, 1, self.hidden_size, device=device)  # num_layers * num_directions, batch, hidden_size
    #     c_0 = torch.zeros(40, 1, self.hidden_size, device=device)
    #     return (h_0, c_0)


class ClassificationModel(nn.Module):
    def __init__(self, rnn, device: torch.device, hidden_size):
        super().__init__()
        self.rnn = rnn
        self.device = device
        self.hidden_size = hidden_size
        self.fc = nn.Linear(4,1)
        self.emo = nn.Linear(hidden_size, 2)

    def forward(self, input, hidden=None):
        output, hidden = self.rnn(input, hidden)        # hidden.size() = 40 * 1 * 256
        # emo = self.emo(hidden[0].squeeze(1))
        # emo = hidden[0].permute(1,2,0)       # batch*hidden_size*(num_layer*bi)
        emo = hidden.permute(1, 2, 0)
        emo = emo.squeeze(0)
        emo = self.fc(emo)
        emo = self.emo(emo.permute(1,0))
        return  emo


rnn = Net(256)
model = ClassificationModel(rnn, device, 256)


def test():
    with torch.no_grad():
        # model.eval()
        # losses = 0
        cnt = 0
        right = 0
        for i in range(len(test_dataset)):
            try:
                # hidden = rnn.initHidden()
                classification = model(test_dataset[i])
                # loss = criterion(classification, test_label[i].cuda())     # .cuda()
                if classification.data.topk(1)[1].item() == test_label[i].cuda().item(): right += 1        # .cuda()
                # losses += loss
                cnt += 1
            except:
                continue
        # model.train()
        # return losses.item() / cnt, right / cnt
        return right / cnt

def train2():
    with torch.no_grad():
        # model.eval()
        # losses = 0
        cnt = 0
        right = 0
        for i in range(len(train_dataset)):
            try:
                # hidden = rnn.initHidden()
                classification = model(train_dataset[i])
                # loss = criterion(classification, valuate_label[i].cuda())      # .cuda()
                if classification.data.topk(1)[1].item() == valuate_label[i].cuda().item(): right += 1     # .cuda()
                # losses += loss
                cnt += 1
            except:
                continue
        # model.train()
        # return losses.item() / cnt, right / cnt
        return right / cnt

def valuate():
    with torch.no_grad():
        # model.eval()
        losses = 0
        cnt = 0
        right = 0
        for i in range(len(valuate_dataset)):
            try:
                # hidden = rnn.initHidden()
                classification = model(valuate_dataset[i])
                loss = criterion(classification, valuate_label[i].cuda())      # .cuda()
                if classification.data.topk(1)[1].item() == valuate_label[i].cuda().item(): right += 1     # .cuda()
                losses += loss
                cnt += 1
            except:
                continue
        # model.train()
        return losses.item() / cnt, right / cnt
        # return right / cnt


def epoch_time(start_time, end_time):
    elapsed_time = end_time - start_time
    elapsed_mins = int(elapsed_time / 60)
    elapsed_secs = int(elapsed_time - (elapsed_mins * 60))
    return elapsed_mins, elapsed_secs


loss_plot = []
def train():
    optimizer_model = torch.optim.Adam(model.parameters(), lr=1e-3)  # 学习率1e-3
    optimizer_rnn = torch.optim.Adam(rnn.parameters(), lr=1e-3)  # 学习率1e-3
    losses = 0
    cnt = 0
    max_iter = 2
    max_tmp = 99999999
    if torch.cuda.is_available() == True:
        model.cuda()
    # if True:
        model.train()
        start_time = time.time()
        loss_print = []
        optimizer_model.zero_grad()
        optimizer_rnn.zero_grad()
        for epoch in range(10):
            # for i in range(len(train_dataset)):
            # i = random.randint(0, len(train_dataset)-1)
            L = random.sample(range(0, len(train_dataset)), len(train_dataset))
            for i in L:
                try:
                # if True:
                #     hidden = rnn.initHidden()
                    classification = model(train_dataset[i])
                    loss = criterion(classification, train_label[i].cuda())    # .cuda()
                    losses += loss
                    cnt += 1
                except:
                    # print(dataset[i])
                    # print('?')
                    continue

                if cnt%64==0:
                    loss_plot.append(losses)
                    loss_print.append(losses)
                    losses.backward()
                    optimizer_model.step()
                    optimizer_rnn.step()
                    losses = 0
                    optimizer_model.zero_grad()
                    optimizer_rnn.zero_grad()

                if cnt%5000==0:
                    end_time = time.time()
                    epoch_mins, epoch_secs = epoch_time(start_time, end_time)
                    # print(f'Epoch: {epoch} | {cnt} | Time: {epoch_mins}m {epoch_secs}s | Average Loss:{sum(loss_plot)/len(loss_plot)}')
                    print(f'Epoch: {epoch} | {cnt} | Time: {epoch_mins}m {epoch_secs}s | Average Loss:{sum(loss_print)/len(loss_print)}')
                    loss_print.clear()

            # if cnt%2000==0:
            cnt = 0
            loss_valuate, acc_valuate = valuate()
            print('loss_valuate:{}'.format(loss_valuate))
            print('\tValidation Accuracy:{} Test Accuracy:{}'.format(acc_valuate, test()))
            # if True:
            #     cnt = 0
            #     # end_time = time.time()
            #     # epoch_mins, epoch_secs = epoch_time(start_time, end_time)
            #     # print(f'Epoch: {epoch + 1:02} | {i} | Time: {epoch_mins}m {epoch_secs}s | Loss:{losses}')
            #     # print('\tValidation Accuracy:{} Test Accuracy:{}'.format(valuate(), test()))
            #     loss_valuate, acc_valuate = valuate()
            #     if loss_valuate <= max_tmp:
            #         max_tmp = loss_valuate
            #         print('\tacc_valuate:{}'.format(acc_valuate))
            #         max_iter = 2
            #     else:
            #         max_iter -= 1
            #         if max_iter == 0:
            #             print('Finish training at {} epoch'.format(epoch))
            #             # print('\tTest Accuracy:{}'.format(test()))
            #             return




if __name__ == '__main__':
    criterion = nn.CrossEntropyLoss()
    criterion = criterion.cuda()       # .cuda()
    train()
    loss_valuate, acc_valuate = valuate()
    print('\t Train Accuracy:{}'.format(train2()))
    plt.plot(loss_plot)
    plt.show()

2. LSTM-output

又出现原因Linux服务器不能复制粘贴问题，解决办法：断开连接，在任务管理器中打开rdpclip.exe进程，重新连接即可

填充到MAX_LENGTH

之前是提取LSTM的hidden进行情绪分类，现在我们提取output进行分类，首先需要求得MAX_LENGTH，首先计算出测试集最大的长度：

tmp = []
for i in test_dataset:
    tmp.append(len(i))
print(max(tmp))
print(tmp.index(max(tmp)))

35
3201	# 前冲的前风挡与发动机舱盖设计扁平的一线式进气格栅硕大的镀铬标识以及独特的猫眼式前大灯组设计共同构成了动感十足的前脸造型 POS

现在将长度大于35的都舍弃掉，长度不足35的补零，问题：GRU得到的结果的seq_len=MAX_LENGTH，需不需要把原来补0的地方反填充？

之前训练的是579947中15%的句子，即86992条句子，由于这次剔除长度大于35的句子，所以选择大约30%的句子，其中90%作为训练集，10%作为验证集，结果：

训练集句子总数：80326
验证集句子总数：6632
测试集句子总数：6582
...
Epoch: 0 | 75000 | Time: 6m 26s | Average Loss:28.276050567626953
loss_valuate:0.42667644462573884
	Validation Accuracy:0.7881176113973931 Test Accuracy:0.8481301307388264
...
Epoch: 1 | 75000 | Time: 13m 43s | Average Loss:25.611026763916016
loss_valuate:0.4267350191345862
	Validation Accuracy:0.787056683843589 Test Accuracy:0.8619641228336881
...
Epoch: 2 | 75000 | Time: 21m 0s | Average Loss:22.443496704101562
loss_valuate:0.433334253455119
	Validation Accuracy:0.7916035162170355 Test Accuracy:0.8400729705077531
...
Epoch: 3 | 75000 | Time: 28m 17s | Average Loss:18.7727108001709
loss_valuate:0.4872552155364315
	Validation Accuracy:0.7990300090936647 Test Accuracy:0.8057160231073275
...
Epoch: 4 | 75000 | Time: 35m 34s | Average Loss:14.302709579467773
loss_valuate:0.5966615194116588
	Validation Accuracy:0.7932706880872992 Test Accuracy:0.7782000608087565
...
Epoch: 5 | 75000 | Time: 43m 27s | Average Loss:11.667118072509766
loss_valuate:0.6506671055622916
	Validation Accuracy:0.7867535616853591 Test Accuracy:0.7625418060200669
...
Epoch: 6 | 75000 | Time: 53m 5s | Average Loss:8.828022956848145
loss_valuate:0.7403560382881176
	Validation Accuracy:0.7885722946347378 Test Accuracy:0.8092125266038309
...
Epoch: 7 | 75000 | Time: 60m 23s | Average Loss:6.954474925994873
loss_valuate:0.8605225867450363
	Validation Accuracy:0.793422249166414 Test Accuracy:0.7911219215567041
...
Epoch: 8 | 75000 | Time: 67m 41s | Average Loss:6.85260009765625
loss_valuate:0.9329092089932556
	Validation Accuracy:0.7791755077296151 Test Accuracy:0.7490118577075099
...
Epoch: 9 | 75000 | Time: 74m 59s | Average Loss:6.265404224395752
loss_valuate:1.0107637227900501
	Validation Accuracy:0.7835707790239467 Test Accuracy:0.7987230161143205
	 Train Accuracy:0.5595580444982594

每5000个句子Average Loss变化曲线：

结果分析：loss_valuate在不断加大，Train Accuracy:0.5595580444982594很低，感觉又像过拟合，又像欠拟合，假如第一代就停止，则测试集正确率为0.848

增加梯度衰减和梯度修剪，每10000个句子判断验证集上的Loss是否最小，如果是则保存模型，不是则按gamma=0.5衰减梯度，运行5代停止

Epoch: 0 | 10000 | Time: 0m 53s | Average Loss:34.887184143066406
	Validation Accuracy:0.7559055118110236
	Best Test Accuracy:0.7780480389176041
Epoch: 0 | 20000 | Time: 2m 11s | Average Loss:33.639976501464844
	Validation Accuracy:0.7542071946888992
	Best Test Accuracy:0.7581331711766495
Epoch: 0 | 30000 | Time: 3m 28s | Average Loss:31.14021873474121
	Validation Accuracy:0.7642427049559981
	Best Test Accuracy:0.7908178777743995
Epoch: 0 | 50000 | Time: 5m 53s | Average Loss:28.4647274017334
	Validation Accuracy:0.7911069939786939
	Best Test Accuracy:0.8203101246579507
Epoch: 0 | 70000 | Time: 8m 16s | Average Loss:26.075702667236328
	Validation Accuracy:0.7957387679481241
	Best Test Accuracy:0.8409851018546671
Epoch: 0 | 80000 | Time: 9m 34s | Average Loss:27.208580017089844
	Validation Accuracy:0.7958931604137718
	Validation Accuracy:0.8040759610930986
	Test Accuracy:0.8250228032836728
Epoch: 1 | 80000 | Time: 18m 50s | Average Loss:23.543182373046875
	Validation Accuracy:0.797745870001544
	Validation Accuracy:0.7997529720549638
	Test Accuracy:0.8402249923989055
Epoch: 2 | 80000 | Time: 28m 5s | Average Loss:22.02412986755371
	Validation Accuracy:0.7969739076733056
	Validation Accuracy:0.7958931604137718
	Test Accuracy:0.8391608391608392
Epoch: 3 | 80000 | Time: 37m 20s | Average Loss:23.04869842529297
	Validation Accuracy:0.7975914775358962
	Validation Accuracy:0.798209047398487
	Test Accuracy:0.8382487078139252
Epoch: 4 | 80000 | Time: 46m 36s | Average Loss:22.402061462402344
	Validation Accuracy:0.7980546549328392
	Validation Accuracy:0.7999073645206114
	Test Accuracy:0.8371845545758589
	Test Accuracy:0.8380966859227729
	Train Accuracy:0.5482827660557523

下面把output[embeds .size()[0]:, :, :] = 0，并不能运行，应该是有梯度方向传播的地方不能直接这样吧，暂时先不管了

3. Attention

思路如下：

Epoch: 0 | 10000 | Time: 0m 20s | Average Loss:32.250694274902344
	Validation Accuracy:0.7360296387774005
	Best Test Accuracy:0.8006993006993007
Epoch: 0 | 20000 | Time: 0m 53s | Average Loss:29.19270896911621
	Validation Accuracy:0.7790984871874035
	Best Test Accuracy:0.828823350562481
Epoch: 0 | 30000 | Time: 1m 26s | Average Loss:28.382543563842773
	Validation Accuracy:0.7775548008644644
	Best Test Accuracy:0.8508665247795683
Epoch: 0 | 50000 | Time: 2m 26s | Average Loss:27.309593200683594
	Validation Accuracy:0.7757023772769374
	Best Test Accuracy:0.8376406202493158
Epoch: 0 | 60000 | Time: 3m 0s | Average Loss:26.23936653137207
	Validation Accuracy:0.7966965112689102
	Best Test Accuracy:0.830191547582852
Epoch: 0 | 70000 | Time: 3m 32s | Average Loss:26.756301879882812
	Validation Accuracy:0.7934547699907378
	Best Test Accuracy:0.8469139556096078
Epoch: 1 | 20000 | Time: 5m 14s | Average Loss:23.47141456604004
	Validation Accuracy:0.7957702994751467
	Best Test Accuracy:0.8435694740042566
...
	Validation Accuracy:0.7933004013584439
	Test Accuracy:0.8543630282760718
	Train Accuracy:0.5571870170015456

再运行一次程序，并保存模型：

Epoch: 0 | 10000 | Time: 0m 20s | Average Loss:31.835342407226562
	Validation Accuracy:0.7151947850380258
	Best Test Accuracy:0.8257829127394345
Epoch: 0 | 20000 | Time: 0m 54s | Average Loss:29.066537857055664
	Validation Accuracy:0.773552692844948
	Best Test Accuracy:0.823198540589845
Epoch: 0 | 30000 | Time: 1m 27s | Average Loss:28.290781021118164
	Validation Accuracy:0.7839515753530963
	Best Test Accuracy:0.8370325326847066
Epoch: 0 | 50000 | Time: 2m 28s | Average Loss:26.492918014526367
	Validation Accuracy:0.7963681514822287
	Best Test Accuracy:0.8155974460322286
Epoch: 0 | 60000 | Time: 3m 2s | Average Loss:27.036176681518555
	Validation Accuracy:0.7971441874902996
	Best Test Accuracy:0.8356643356643356
Epoch: 0 | 70000 | Time: 3m 35s | Average Loss:26.933622360229492
	Validation Accuracy:0.798541052304827
	Best Test Accuracy:0.842809364548495
	Validation Accuracy:0.8019556107403384
	Best Test Accuracy:0.8504104591061112
Test Accuracy:0.8242626938279112
Train Accuracy:0.5502637294446168

load模型运行报错：

RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED

应该是cuDNN版本不一致，解决办法：

torch.backends.cudnn.enabled = False

中文字体显示报错：

findfont: Font family ['sans-serif'] not found. Falling back to DejaVu Sans.
RuntimeWarning: Glyph 36895 missing from current font.   font.set_text(s, 0, flags=flags)

终端python的环境下，查看字体路径，判断是否有SimHei(黑体)存在：

import matplotlib
print(matplotlib.matplotlib_fname())

/home/ysc/anaconda3/lib/python3.8/site-packages/matplotlib/mpl-data/matplotlibrc

在以上文件夹中并没有找到，在Windows的C:\Windows\Fonts的文件夹下，解决办法参考此和此

一个例子：

from matplotlib import font_manager as fm, rcParams
import matplotlib.pyplot as plt


plt.rcParams['font.sans-serif'] = ['SimHei']  # 显示中文标签
plt.rcParams['axes.unicode_minus'] = False

plt.plot([1,2,3])
plt.xlabel('服务器')
plt.show()

中文显示成功

图中添加annotate标注文字可见此，测试示例：‘但是通话质量真的很好因为我只用一张的卡所以暂时没发现那个用大卡爆音的问题’：

‘电话簿容量大’，这一句话判错了，应该focus在’大’上面：

‘功能比较全’：

‘虽然沃尔沃拥有如此惊人的强大动力’：

‘可以说拥有出色的影音效果’：

‘充电确实很慢’：

‘但是散热做的相当不错’：

‘照片很清晰’：

‘这部奇瑞风云最大的特点是造型漂亮’

‘的对焦准确性相当好’，这一句话也判错了，应该focus在’相当好’上面，而不是’对焦’：

看一下分类错误的句子：

亮度高	# 不好判断
它的听筒设计较小
速度及慢		# 错别字
为什么积于一个这么好功能的电话不支持功能和呢		# 不知所云
但由于的体积较小	# POS
总体来讲的声音效果算是中规中矩		# NEG
高感太夸张了		# NEG
不过也同意其他网友说的画质不是很油润鄙人在室内用的多灯光杂且色温很乱用光高手若觉得它很油润请你板砖啊		# NEG
哎系统虽好	# POS
...

4. Transformer

再看看测试集最大的长度：

len()=689的句子：

最大长度1795：

所以设计PositionalEncoding可以把最大长度设成2000？虽然前面也会筛一次长度超过35的

Epoch: 0 | 10000 | Time: 0m 26s | Average Loss:42.63115692138672
	Validation Accuracy:0.59113750571037
	Best Test Accuracy:0.7145028884159319
Epoch: 0 | 30000 | Time: 1m 43s | Average Loss:42.416709899902344
	Validation Accuracy:0.6100197959494442
	Best Test Accuracy:0.7178473700212831
Epoch: 0 | 40000 | Time: 2m 25s | Average Loss:42.32552719116211
	Validation Accuracy:0.650373077508756
	Best Test Accuracy:0.7137427789601702
Epoch: 0 | 70000 | Time: 4m 17s | Average Loss:40.882720947265625
	Validation Accuracy:0.6401705497182885
	Best Test Accuracy:0.7339616904834296
Epoch: 1 | 10000 | Time: 5m 44s | Average Loss:40.04580307006836
	Validation Accuracy:0.6602710522308513
	Best Test Accuracy:0.7386743691091517
Epoch: 1 | 40000 | Time: 7m 36s | Average Loss:39.11258316040039
	Validation Accuracy:0.6681894320085275
	Best Test Accuracy:0.7490118577075099
Epoch: 1 | 70000 | Time: 9m 27s | Average Loss:39.2961311340332
	Validation Accuracy:0.6738236637734125
	Best Test Accuracy:0.7436910915171785
Epoch: 2 | 80000 | Time: 14m 51s | Average Loss:39.47162628173828
	Validation Accuracy:0.6750418760469011
	Best Test Accuracy:0.7430830039525692
	Validation Accuracy:0.6761078117862037
	Best Test Accuracy:0.7383703253268471
	Test Accuracy:0.7415627850410459
	Train Accuracy:0.5259473443920256

发现测试集精确度不高，所以transformer_encoder得到的seq_len * 1 * 300的tensor，不能通过简单第一维求和、第二维softmax、再过一个tanh激活函数来实现，还是用之前填充和Attention方法分别一试

填充

Epoch: 0 | 10000 | Time: 0m 25s | Average Loss:249.44175720214844
	Validation Accuracy:0.6426361386138614
	Best Test Accuracy:0.5901489814533293
Epoch: 0 | 20000 | Time: 1m 7s | Average Loss:143.79180908203125
	Validation Accuracy:0.6208230198019802
	Best Test Accuracy:0.6351474612344178
Epoch: 0 | 30000 | Time: 1m 50s | Average Loss:98.39894104003906
	Validation Accuracy:0.6717202970297029
	Best Test Accuracy:0.5982061416844026
Epoch: 0 | 40000 | Time: 2m 43s | Average Loss:82.15373992919922
	Validation Accuracy:0.6709467821782178
	Best Test Accuracy:0.6644876862268166
Epoch: 0 | 60000 | Time: 3m 59s | Average Loss:49.74187088012695
	Validation Accuracy:0.6477413366336634
	Best Test Accuracy:0.7298570994223168
Epoch: 0 | 70000 | Time: 4m 40s | Average Loss:46.70456314086914
	Validation Accuracy:0.6842512376237624
	Best Test Accuracy:0.7444512009729402
Epoch: 0 | 80000 | Time: 5m 22s | Average Loss:43.52018737792969
	Validation Accuracy:0.6780631188118812
	Best Test Accuracy:0.7766798418972332
	Validation Accuracy:0.6913675742574258
	Best Test Accuracy:0.7684706597750076
Epoch: 1 | 10000 | Time: 6m 22s | Average Loss:39.705623626708984
	Validation Accuracy:0.7094678217821783
	Best Test Accuracy:0.7292490118577075
Epoch: 1 | 20000 | Time: 7m 5s | Average Loss:39.43376159667969
	Validation Accuracy:0.7148824257425742
	Best Test Accuracy:0.7713590757069018
Epoch: 1 | 40000 | Time: 8m 21s | Average Loss:34.8393440246582
	Validation Accuracy:0.7332920792079208
	Best Test Accuracy:0.7858011553663727
Epoch: 1 | 50000 | Time: 9m 3s | Average Loss:34.54415512084961
	Validation Accuracy:0.7504641089108911
	Best Test Accuracy:0.7342657342657343
	Validation Accuracy:0.7558787128712872
	Best Test Accuracy:0.8055640012161751
Test Accuracy:0.8142292490118577
Train Accuracy:0.5190969537652699

Attention

不能用Attention把，它就返回了一个output，没有隐层…

5. 全部代码

# 


import torch
import torch.nn as nn
import torch.nn.functional as F

import jieba
from gensim.models import KeyedVectors
import matplotlib.pyplot as plt
import time
import random

word_vec = KeyedVectors.load('vectors.kv')

path_data = '/mnt/Data1/ysc/Data_Small.txt'
path_test = '/mnt/Data1/ysc/Chinese review datasets/test.txt'

MAX_LENGTH = 35

train_dataset = []
train_label = []
valuate_dataset = []
valuate_label = []
test_dataset = []
test_label = []


with open(path_data, 'r', encoding='utf-8') as file:
    for line in file.readlines():
        if random.randint(1,1000)>1:continue        # 100/30
        tmp = ' '.join(jieba.cut(line[:-5].strip('\n').strip(' '))).split(' ')
        if len(tmp) > 35: continue
        if random.randint(1,100)>10:     # 10
            if line[-4:-1] == 'POS':
                train_label.append(torch.tensor([1]))
            elif line[-4:-1] == 'NEG':
                train_label.append(torch.tensor([0]))
            elif line[-4:-1] == 'ORM':
                continue
            train_dataset.append(tmp)
        else:
            if line[-4:-1] == 'POS':
                if random.randint(0, 1) == 0: continue
                valuate_label.append(torch.tensor([1]))
            elif line[-4:-1] == 'NEG':
                valuate_label.append(torch.tensor([0]))
            elif line[-4:-1] == 'ORM':
                continue
            valuate_dataset.append(tmp)

print('训练集句子总数：{}'.format(len(train_dataset)))
print('验证集句子总数：{}'.format(len(valuate_dataset)))


with open(path_test, 'r', encoding='utf-8') as file:
    for line in file.readlines():
        # if random.randint(1, 100) > 1: continue
        if line[-4:-1] == 'POS':
            test_label.append(torch.tensor([1]))
        elif line[-4:-1] == 'NEG':
            test_label.append(torch.tensor([0]))
        elif line[-4:-1] == 'ORM':
            continue
        test_dataset.append((' '.join(jieba.cut(line[:-5].strip('\n').strip(' '))).split(' ')))

print('测试集句子总数：{}'.format(len(test_dataset)))

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
print(device)


def embedding(sentence):
    sentence_embedding = []
    for word in sentence:
        try:
            sentence_embedding.append([word_vec[word]])
        except:
            continue
    return sentence_embedding


class Net(nn.Module):
    def __init__(self, hidden_size):
        super(Net, self).__init__()
        self.hidden_size = hidden_size
        self.gru = nn.GRU(word_vec.vector_size, hidden_size, num_layers=2, bidirectional=True, dropout=0.1)
        self.fc = nn.Linear(2 * hidden_size * MAX_LENGTH, 2)

    def forward(self, input, hidden=None):
        embeds = torch.tensor(embedding(input), device=device)
        if len(embeds) == 0: return
        packed = torch.cat([embeds, torch.zeros(MAX_LENGTH - embeds.size()[0], 1, 300).cuda()], dim=0)
        output, hidden = self.gru(packed, hidden)       # output.size() = seq_len * 1 * (2*256), hidden.size() = 4 * 1 * 256

        # output[embeds .size()[0]:, :, :] = 0

        output = output.view(1,-1)
        emo = self.fc(output)
        return hidden, emo  # seq_len, batch, num_directions * hidden_size


class Attention(nn.Module):
    def __init__(self, hidden_size):
        super(Attention, self).__init__()
        self.hidden_size = hidden_size
        self.gru = nn.GRU(word_vec.vector_size, hidden_size, num_layers=2, bidirectional=True, dropout=0.1)
        self.fc1 = nn.Linear((2 *2 * hidden_size + 2 * hidden_size), 8)     # Attention dim = 8
        self.fc2 = nn.Linear(2 * hidden_size, 2)

    def forward(self, input, hidden=None):
        embeds = torch.tensor(embedding(input), device=device)
        if len(embeds) == 0: return
        # packed = torch.cat([embeds, torch.zeros(MAX_LENGTH - embeds.size()[0], 1, 300).cuda()], dim=0)
        output, hidden = self.gru(embeds, hidden)       # output.size() = seq_len * 1 * (2*256), hidden.size() = 4 * 1 * 256
        hidden = hidden.view(1, -1)
        hidden = hidden.repeat(1, output.size()[0], 1)      # 1 * seq_len * 1024
        output = output.permute(1, 0, 2)
        combine = torch.cat((output, hidden), dim=2)        # 1 * seq_len * 1536
        combine = self.fc1(combine)     # 1 * seq_len * 8
        combine = torch.tanh(combine)
        combine = torch.sum(combine, dim=2)     # 1 * seq_len
        attention = F.softmax(combine, dim=1)

        a = attention.unsqueeze(1)
        a_apply = a.bmm(output)
        emo = self.fc2(a_apply.squeeze(1))

        return attention, emo  # seq_len, batch, num_directions * hidden_size

import math
class PositionalEncoding(nn.Module):
    def __init__(self, d_model, dropout=0.1, max_len=5000):  # ninp, dropout
        super(PositionalEncoding, self).__init__()
        self.dropout = nn.Dropout(p=dropout)
        pe = torch.zeros(max_len, d_model)  # 5000 * 200
        position = torch.arange(0, max_len, dtype=torch.float).unsqueeze(1)  # [[0],[1],...[4999]] 5000 * 1
        div_term = torch.exp(torch.arange(0, d_model, 2).float() * (-math.log(
            10000.0) / d_model))  # e ^([0, 2,...,198] * -ln(10000)(-9.210340371976184) / 200) [1,0.912,...,(1.0965e-04)]
        pe[:, 0::2] = torch.sin(position * div_term)
        pe[:, 1::2] = torch.cos(position * div_term)
        pe = pe.unsqueeze(0).transpose(0, 1)  # 5000 * 1 * 200, 最长5000的序列，每个词由1 * 200的矩阵代表着不同的时间
        self.register_buffer('pe', pe)

    def forward(self, x):
        x = x + self.pe[:x.size()[0], :]  # torch.Size([35, 1, 200])
        return self.dropout(x)

from torch.nn import TransformerEncoder, TransformerEncoderLayer
class TransformerModel(nn.Module):
    def __init__(self, hidden_size, dropout=0.1):
        super(TransformerModel, self).__init__()
        self.hidden_size = hidden_size
        self.pos_encoder = PositionalEncoding(word_vec.vector_size, dropout)
        encoder_layers = TransformerEncoderLayer(word_vec.vector_size, 2, self.hidden_size, dropout)     # head = 2, dim = 256
        self.transformer_encoder = TransformerEncoder(encoder_layers, 2)        # layer = 2
        # self.decoder = nn.Linear(word_vec.vector_size, 2)
        self.decoder = nn.Linear(MAX_LENGTH * word_vec.vector_size, 2)
        self.init_weights()


    def init_weights(self):
        initrange = 0.5
        self.decoder.bias.data.zero_()
        self.decoder.weight.data.uniform_(-initrange, initrange)

    def forward(self, input):
        embeds = torch.tensor(embedding(input), device=device)
        if len(embeds) == 0: return
        src = embeds * math.sqrt(word_vec.vector_size)
        src = self.pos_encoder(src)     # seq_len * 1 * 300
        output = self.transformer_encoder(src)      # seq_len * 1 * 300
        # The effect is not good
        # output = torch.sum(output, dim=0)       # 1 * 300
        # output = F.softmax(output, dim=1)
        # output = torch.tanh(output)
        # emo = self.decoder(output)

        # padding zero
        output = torch.cat([output, torch.zeros(MAX_LENGTH - output.size()[0], 1, 300).cuda()], dim=0)
        output = output.view(1, -1)
        emo = self.decoder(output)

        # Attention

        return output, emo



# model = Net(256)
model = Attention(256)
# model = TransformerModel(256)


def test(best_model):
    with torch.no_grad():
        cnt = 0
        right = 0
        for i in range(len(test_dataset)):
            # if True:
            try:
                _, classification = best_model(test_dataset[i])
                if classification.data.topk(1)[1].item() == test_label[i].cuda().item(): right += 1        # .cuda()
                else:
                    print(''.join(test_dataset[i]))
                cnt += 1
            except:
                continue
        return right / cnt

def train2(best_model):
    with torch.no_grad():
        best_model.eval()
        cnt = 0
        right = 0
        for i in range(len(train_dataset)):
            try:
                _, classification = best_model(train_dataset[i])
                if classification.data.topk(1)[1].item() == valuate_label[i].cuda().item(): right += 1     # .cuda()
                cnt += 1
            except:
                continue
        return right / cnt

def valuate():
    with torch.no_grad():
        losses = 0
        cnt = 0
        right = 0
        for i in range(len(valuate_dataset)):
            try:
                _, classification = model(valuate_dataset[i])
                loss = criterion(classification, valuate_label[i].cuda())      # .cuda()
                if classification.data.topk(1)[1].item() == valuate_label[i].cuda().item(): right += 1     # .cuda()
                losses += loss
                cnt += 1
            except:
                continue
        return losses.item() / cnt, right / cnt
        # return right / cnt


def epoch_time(start_time, end_time):
    elapsed_time = end_time - start_time
    elapsed_mins = int(elapsed_time / 60)
    elapsed_secs = int(elapsed_time - (elapsed_mins * 60))
    return elapsed_mins, elapsed_secs


import matplotlib.pyplot as plt
import matplotlib.ticker as ticker
def showAttention(input_sentence, output_words, attentions, title):
    plt.rcParams['font.sans-serif'] = ['SimHei']  # 显示中文标签
    plt.rcParams['axes.unicode_minus'] = False

    # 用色条设置图形
    fig = plt.figure()
    ax = fig.add_subplot(111)
    cax = ax.matshow(attentions.numpy())       # colormap, cmap='bone'
    fig.colorbar(cax)
    # plt.title(title,verticalalignment='bottom')
    # 设置轴
    ax.set_xticklabels([''] + input_sentence, rotation=90)
    ax.set_yticklabels([''] + output_words)

    # Show label at every tick
    ax.xaxis.set_major_locator(ticker.MultipleLocator(1))
    ax.yaxis.set_major_locator(ticker.MultipleLocator(1))

    plt.show()




loss_plot = []
def train():
    optimizer_model = torch.optim.Adam(model.parameters(), lr=1e-3)  # 学习率1e-3
    scheduler = torch.optim.lr_scheduler.StepLR(optimizer_model, 1, gamma=0.9)
    losses = 0
    cnt = 0
    max_iter = 2
    max_tmp = 99999999
    if torch.cuda.is_available() == True:
        model.cuda()
        model.train()
        start_time = time.time()
        loss_print = []
        optimizer_model.zero_grad()
        for epoch in range(5):
            L = random.sample(range(0, len(train_dataset)), len(train_dataset))
            for i in L:
                try:
                # if True:
                    _, classification = model(train_dataset[i])
                    loss = criterion(classification, train_label[i].cuda())    # .cuda()
                    losses += loss
                    cnt += 1
                except:
                #     print('?')
                    continue

                if cnt % 64 == 0:
                    loss_print.append(losses)
                    losses.backward()
                    torch.nn.utils.clip_grad_norm_(model.parameters(), 0.25)  # 规定了最大不能超过的max_norm
                    optimizer_model.step()
                    losses = 0
                    optimizer_model.zero_grad()

                if cnt % 5000 == 0:
                    end_time = time.time()
                    epoch_mins, epoch_secs = epoch_time(start_time, end_time)
                    average_loss = sum(loss_print)/len(loss_print)
                    loss_plot.append(average_loss)
                    print(f'Epoch: {epoch} | {cnt} | Time: {epoch_mins}m {epoch_secs}s | Average Loss:{average_loss}')
                    loss_print.clear()

                if cnt % 10000 == 0:
                    loss_valuate, acc_valuate = valuate()
                    # print('loss_valuate:{}'.format(loss_valuate))
                    print('\tValidation Accuracy:{}'.format(acc_valuate))
                    if loss_valuate <= max_tmp:
                        max_tmp = loss_valuate
                        best_model = model
                        print('\tBest Test Accuracy:{}'.format(test(best_model)))
                    else:
                        scheduler.step()


            loss_valuate, acc_valuate = valuate()
            # print('loss_valuate:{}'.format(loss_valuate))
            print('\tValidation Accuracy:{}'.format(acc_valuate))
            if loss_valuate <= max_tmp:
                max_tmp = loss_valuate
                best_model = model
                print('\tBest Test Accuracy:{}'.format(test(best_model)))
            else:
                scheduler.step()
            cnt = 0

        print('Test Accuracy:{}'.format(test(best_model)))
        print('Train Accuracy:{}'.format(train2(best_model)))
        torch.save(model.state_dict(),'transformer_and_attention.pth')


def filter(sentence_list):
    new_list = []
    for word in sentence_list:
        if word in word_vec.vocab:
            new_list.append(word)
    return new_list

if __name__ == '__main__':
    # criterion = nn.CrossEntropyLoss()
    # criterion = criterion.cuda()       # .cuda()
    # train()
    # plt.plot(loss_plot)
    # plt.show()
    torch.backends.cudnn.enabled = False
    model.load_state_dict(torch.load('transformer_and_attention.pth'))

    print('Test Accuracy:{}'.format(test(model.cuda())))

    # str = '但是通话质量真的很好因为我只用一张的卡所以暂时没发现那个用大卡爆音的问题'
    # test_dataset = [' '.join(jieba.cut(str)).split(' ')]
    # test_label = [torch.tensor([1])]
    model = model.cuda()
    with torch.no_grad():
        for i in range(5):
            index = random.randint(0, len(test_dataset))
            # index = 0
            attention, classification = model(test_dataset[index])
            if test_label[index]==0:true_classification='NEG'
            elif test_label[index]==1:true_classification='POS'
            if classification.data.topk(1)[1].item() == test_label[index].cuda().item():
                true_classification = true_classification + '√'
            else:
                true_classification = true_classification + '×'

            print(''.join(test_dataset[index]))
            showAttention(filter(test_dataset[index]), [true_classification], attention.cpu(), ''.join(test_dataset[index]))
#

6. 小结

基本把RNN在文本上的应用跑了一遍，包括LSTM取hidden、output，Attention，Transformer Encoder，其中Attention模型表现应该是最好的，能达到85%的准确率，可视化也做得很好，下一步看一下BERT

你可能感兴趣的:(【自然语言处理】,深度学习,lstm,自然语言处理,pytorch,人工智能)

【图像处理入门】12. 综合项目与进阶：超分辨率、医学分割与工业检测小米玄戒Andrew 图像处理：从入门到专家图像处理人工智能深度学习算法 python 计算机视觉 CV
摘要本周将聚焦三个高价值的综合项目，打通传统算法与深度学习的技术壁垒。通过图像超分辨率重建对比传统方法与深度学习方案，掌握医学图像分割的U-Net实现，设计工业缺陷检测的完整流水线。每个项目均包含原理解析、代码实现与性能优化，帮助读者从“技术应用”迈向“系统设计”。一、项目1：图像超分辨率重建（从模糊到清晰的跨越）1.技术背景与核心指标超分辨率（SR）是通过算法将低分辨率（LR）图像恢复为高分辨率
Python机器学习元学习库higher 音程机器学习人工智能 python 机器学习
higher是一个用于元学习（Meta-Learning）和高阶导数（Higher-ordergradients）的Python库，专为PyTorch设计。它扩展了PyTorch的自动微分机制，使得在训练过程中可以动态地计算参数的梯度更新，并把这些更新过程纳入到更高阶的梯度计算中。一、主要用途higher主要用于以下场景：元学习（Meta-Learning）比如MAML（Model-Agnosti
Densenet模型花卉图像分类深度学习乐园分类数据挖掘人工智能
项目源码获取方式见文章末尾！600多个深度学习项目资料，快来加入社群一起学习吧。《------往期经典推荐------》项目名称1.【基于CNN-RNN的影像报告生成】2.【卫星图像道路检测DeepLabV3Plus模型】3.【GAN模型实现二次元头像生成】4.【CNN模型实现mnist手写数字识别】5.【fasterRCNN模型实现飞机类目标检测】6.【CNN-LSTM住宅用电量预测】7.【VG
基于AFM注意因子分解机的推荐算法深度学习乐园深度学习实战项目深度学习科研项目推荐算法算法机器学习
关于深度实战社区我们是一个深度学习领域的独立工作室。团队成员有：中科大硕士、纽约大学硕士、浙江大学硕士、华东理工博士等，曾在腾讯、百度、德勤等担任算法工程师/产品经理。全网20多万+粉丝，拥有2篇国家级人工智能发明专利。社区特色：深度实战算法创新获取全部完整项目数据集、代码、视频教程，请进入官网：zzgcz.com。竞赛/论文/毕设项目辅导答疑，v：zzgcz_com1.项目简介项目A033基于A
Tair向量数据库：阿里云原生内存数据库服务的高性能向量检索解决方案 mmlihaio 数据库云原生 python
Tair向量数据库：阿里云原生内存数据库服务的高性能向量检索解决方案1.引言在当今的人工智能和大数据时代，高效的向量检索已成为许多应用场景的关键需求。Tair作为阿里云开发的云原生内存数据库服务，不仅提供了丰富的数据模型和企业级能力，还引入了基于非易失性内存(NVM)存储介质的持久内存优化实例。本文将深入探讨如何利用Tair向量数据库功能，实现高性能的向量存储和检索。2.Tair向量数据库概述Ta
阿里云魔搭社区AIGC专区：中国AI创作的革命性平台 Liudef06小白阿里云 AIGC 人工智能
在生成式人工智能重塑全球数字创作版图的浪潮中，中国首个一站式AIGC开发平台——阿里云魔搭社区AIGC专区于2024年9月杭州云栖大会正式亮相。这一突破性进展不仅填补了国内全流程AI创作工具的空白，更以157款多模态开源模型和全免费GPU算力的开放姿态，为超过690万开发者提供了从模型调用到应用落地的完整生态支持。一、魔搭社区：中国AI模型生态的奠基者魔搭社区（ModelScope）作为阿里云在2
探秘阿里云Tair KVCache：大模型推理的加速引擎云资源服务商阿里云云计算人工智能
一、引言近年来，人工智能领域发展迅猛，大语言模型（LLM）不断取得突破，其应用场景也日益广泛。从智能客服到内容生成，从智能写作到智能翻译，大语言模型正在深刻地改变着我们的生活和工作方式。随着模型规模的不断扩大和推理需求的日益增长，大模型推理过程中的显存瓶颈问题逐渐凸显，成为制约其发展和应用的关键因素。在大模型推理中，KVCache技术作为一种优化手段，通过缓存历史Token的Key/Value向量
AI正在偷偷取代这10种职业，你的工作安全吗？
近年来，人工智能（AI）的飞速发展正在悄然改变我们的工作方式。从自动化客服到AI生成内容，许多传统职业正面临被取代的风险。虽然AI带来了更高的效率和便利，但也让不少人开始担忧：我的工作会被AI抢走吗？今天，我们就来盘点10种最容易被AI取代的职业，并探讨如何在这个AI时代保持竞争力。1.客服代表取代指数：★★★★★AI驱动的聊天机器人（如ChatGPT、GoogleBard）已经能够处理大部分基础
直播预告！探讨生成模型中的极简概念擦除青稞社区. 青稞Talk 人工智能图像处理
主页：http://qingkeai.online/原文：https://mp.weixin.qq.com/s/yc4whKbnVY8ho1w7rgFVGg6月16日20:00，青稞Talk第55期，新加坡国立大学博士生张扬，将直播分享《生成模型中的极简概念擦除》。分享嘉宾张扬，慕尼黑工业大学计算机专业硕士，新加坡国立大学人工智能专业博士。曾于牛津大学进行学术访问，并在微软亚洲研究院及美国运通新加
embedding模型有哪些？如何选择合适的embedding模型？行云流水AI笔记 embedding
embedding模型是一种将数据映射到低维空间的模型，常用于自然语言处理、推荐系统、图像识别等领域。以下是一些常见的embedding模型：Word2Vec：CBOW（ContinuousBag-of-Words）：通过上下文预测中心词。Skip-Gram：通过中心词预测上下文。GloVe（GlobalVectorsforWordRepresentation）：结合了词频统计和Word2Vec的
强化学习 16G实践以下是基于CQL（Conservative Q-Learning）与QLoRA（Quantized Low-Rank Adaptation）结合的方案相关开源项目及资源，【ai技】行云流水AI笔记开源人工智能
根据你提供的CUDA版本（11.5）和NVIDIA驱动错误信息，以下是PyTorch、TensorFlow的兼容版本建议及环境修复方案：1.版本兼容性表框架兼容CUDA版本推荐安装命令（CUDA11.5）PyTorch11.3/11.6pipinstalltorchtorchvisiontorchaudio--extra-index-urlhttps://download.pytorch.org/
【DeepSeek实战】3、Ollama实战指南：LobeChat+多网关架构打造高可用大模型集群无心水 Ollama实战指南 LobeChat实战 DeepSeek实战 DeepSeek全栈应用开发 AI入门大模型 CSDN技术干货
一、企业级大模型集群架构全景解析在人工智能落地应用的过程中，大模型服务的高可用性、成本控制和灵活扩展能力成为企业关注的核心痛点。本方案通过LobeChat前端、AI网关层和Ollama模型集群的三层架构设计，实现了无需复杂运维即可部署的生产级大模型服务体系。该架构不仅支持负载均衡、故障转移和模型热切换等企业级特性。还通过量化技术将硬件成本降低60%以上，为中小企业提供了与商业云服务相当的性能体验。
生成式人工智能实战 | 深度卷积生成对抗网络（Deep Convolutional Generative Adversarial Network, DCGAN）盼小辉丶生成式人工智能实战150讲人工智能生成对抗网络神经网络
生成式人工智能实战|深度卷积生成对抗网络0.前言1.模型与数据集分析1.1模型分析1.2数据集介绍2.构建DCGAN生成人脸图像2.1数据处理2.2模型构建2.3模型训练0.前言深度卷积生成对抗网络(DeepConvolutionalGenerativeAdversarialNetworks,DCGAN)是基于生成对抗网络(ConvolutionalGenerativeAdversarialNet
深度学习实战：基于嵌入模型的AI应用开发 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络人工智能深度学习 ai
深度学习实战：基于嵌入模型的AI应用开发关键词：嵌入模型（EmbeddingModel）、深度学习、向量空间、语义表示、AI应用开发、相似性搜索、迁移学习摘要：本文将带你从0到1掌握基于嵌入模型的AI应用开发全流程。我们会用“翻译机”“数字身份证”等生活比喻拆解嵌入模型的核心原理，结合Python代码实战（BERT/CLIP模型）演示如何将文本、图像转化为可计算的语义向量，并通过“智能客服问答”“
2024年AI 智能助手（大模型）产品市场分析｜商派徐礼昭｜商派软件市场负责人人工智能
一、引言人工智能的浪潮不断向前推进，智能助手作为其中的重要应用，已经逐渐渗透到我们生活的各个方面。它们以其便捷性和个性化的特点，改变了我们与世界的互动方式。本报告将对AI智能助手进行全面的行业分析，包括行业概况、主要玩家、用户数据、发展要素以及未来趋势等方面，并通过具体案例分享，帮助读者深入了解这一领域的现状和未来发展潜力。二、行业概览（一）智能助手的定义和发展阶段智能助手是利用人工智能技术为用户
高通 QCS8550 大模型性能深度解析：从算力基准到场景实测的全维度 Benchmark 伊利丹~怒风 Qualcomm 人工智能 AI编程 python arm 自然语言处理
前言在人工智能技术狂飙突进的时代，大模型正以前所未有的速度重塑各行业生态，从智能客服到多模态交互，从边缘推理到端侧部署，其应用场景不断拓展。而这一切革新的背后，离不开底层硬件的强力支撑。高通QCS8550作为面向下一代智能设备的旗舰级计算平台，凭借高达48TOPS的AI算力与先进的第七代高通AI引擎，在大模型性能表现上极具竞争力。其异构多核架构不仅能高效处理复杂的神经网络计算，还通过软硬件协同优化
从零开始理解零样本学习：AI人工智能必学技术 AI天才研究院 Agentic AI 实战 AI人工智能与大数据 AI大模型企业级应用开发实战 ai
从零开始理解零样本学习：AI人工智能必学技术关键词：零样本学习、人工智能、机器学习、知识迁移、语义嵌入摘要：本文旨在全面深入地介绍零样本学习这一在人工智能领域具有重要意义的技术。首先阐述零样本学习的背景和基本概念，通过详细的解释和直观的示意图让读者建立起对零样本学习的初步认识。接着深入剖析其核心算法原理，结合Python代码进行详细说明，同时引入相关数学模型和公式并举例阐释。通过项目实战部分，带领
卷积神经网络（Convolutional Neural Network, CNN）不想秃头的程序神经网络语音识别人工智能深度学习网络卷积神经网络
卷积神经网络（ConvolutionalNeuralNetwork,CNN）是一种专门用于处理图像、视频等网格数据的深度学习模型。它通过卷积层自动提取数据的特征，并利用空间共享权重和池化层减少参数量和计算复杂度，成为计算机视觉领域的核心技术。以下是CNN的详细介绍：一、核心思想CNN的核心目标是从图像中自动学习层次化特征，并通过空间共享权重和平移不变性减少参数量和计算成本。其关键组件包括：卷积层（
ResNet（Residual Network）不想秃头的程序神经网络语音识别人工智能深度学习网络残差网络神经网络
ResNet（ResidualNetwork）是深度学习中一种经典的卷积神经网络（CNN）架构，由微软研究院的KaimingHe等人在2015年提出。它通过引入残差连接（SkipConnection）解决了深度神经网络中的梯度消失问题，使得网络可以训练极深的模型（如上百层），并在图像分类、目标检测、语义分割等任务中取得了突破性成果。以下是ResNet的详细介绍：一、核心思想ResNet的核心创新是
P25：LSTM实现糖尿病探索与预测 ?Agony lstm 人工智能 rnn
本文为365天深度学习训练营中的学习记录博客原作者：K同学啊一、相关技术1.LSTM基本概念LSTM（长短期记忆网络）是RNN（循环神经网络）的一种变体，它通过引入特殊的结构来解决传统RNN中的梯度消失和梯度爆炸问题，特别适合处理序列数据。结构组成：遗忘门：决定丢弃哪些信息，通过sigmoid函数输出0-1之间的值，表示保留或遗忘的程度。输入门：决定更新哪些信息，同样通过sigmoid函数控制更新
Python训练营打卡——DAY16（2025.5.5） cosine2025 Python训练营打卡 python 开发语言机器学习
目录一、NumPy数组基础笔记1.理解数组的维度(Dimensions)2.NumPy数组与深度学习Tensor的关系3.一维数组(1DArray)4.二维数组(2DArray)5.数组的创建5.1数组的简单创建5.2数组的随机化创建5.3数组的遍历5.4数组的运算6.数组的索引6.1一维数组索引6.2二维数组索引6.3三维数组索引二、SHAP值的深入理解三、总结1.NumPy数组基础总结2.SH
[Python]-基础篇1- 从零开始的Python入门指南踏雪无痕老爷子 Python python 开发语言
无论你是尚未接触编程的新手，还是想从其他语言转向Python的开发者，这篇文章都是你的入门课。一、Python是什么？Python是一种解释型、高级、通用型编程语言，以简洁明了、简单易用着称。它可以应用于网站开发、自动化脚本、数据分析、人工智能、系统操作等多种场景。二、如何安装Python步骤：访问Python官方网站选择目前最新的Python3.x版本下载Windows用户请务必勾选“AddPy
【机器学习&深度学习】反向传播机制
目录一、一句话定义二、类比理解三、为什重要？四、用生活例子解释：神经网络=烹饪机器人4.1第一步：尝一口（前向传播）4.2第二步：倒着推原因（反向传播）五、换成人工智能流程说一遍六、图示类比：找山顶（最优参数）七、总结一句人话八、PyTorch代码示例：亲眼看到每一层的梯度九、梯度=损失函数对参数的偏导数十、类比总结反向传播（Backpropagation）是神经网络中训练过程的核心机制，它就像“
人脸识别算法赋能园区无人超市安防升级智驱力人工智能算法人工智能边缘计算人脸识别智慧园区智慧工地智慧煤矿
人脸识别算法赋能园区无人超市安防升级正文在园区无人超市的运营管理中，传统安防手段依赖人工巡检或基础监控设备，存在响应滞后、误报率高、环境适应性差等问题。本文从技术背景、实现路径、功能优势及应用场景四个维度，阐述如何通过人脸识别检测、人员入侵算法及疲劳检测算法的协同应用，构建高效、精准的智能安防体系。一、技术背景：视觉分析算法的核心支撑人脸识别算法基于深度学习的卷积神经网络（CNN）模型，通过提取面
潜入思维的海洋：SoftCoT++如何让语言模型更聪明步子哥智能涌现语言模型人工智能自然语言处理
在人工智能的浩瀚星空下，大型语言模型（LLMs）如同一颗颗璀璨的恒星，照亮了从文本生成到复杂推理的广阔领域。然而，这些模型在推理任务中往往像是在迷雾中航行——尽管它们能抵达目的地，却常常因为固定的思维路径而错过更优的航线。2025年5月，一篇题为《SoftCoT++:Test-TimeScalingwithSoftChain-of-ThoughtReasoning》的论文如同一盏明灯，照亮了如何让
BI+AI实战：我们如何用3秒完成车企供应链推演 qq_43696218 人工智能
一、BI+AI引领财务分析新纪元在财务数据分析领域，奥威BI+AI正以革命性的姿态颠覆传统。当金蝶、用友等工具仍深陷报表泥潭时，奥威BI+AI通过深度融合商业智能（BI）与人工智能（AI），实现了从滞后报表到实时洞察的飞跃。这不仅极大地提升了财务分析的效率，更为企业的战略决策提供了前所未有的精准支持。二、BI+AI的核心技术优势‌实时动态分析‌o奥威BI+AI摒弃了静态数据集，依托原始科目余额表实
DeepSeek-V3 通俗详解：从诞生到优势，以及与 GPT-4o 的对比码事漫谈 AI ai
前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站1.DeepSeek的前世今生1.1什么是DeepSeek？DeepSeek是一家专注于人工智能技术研发的公司，致力于打造高性能、低成本的AI模型。它的目标是让AI技术更加普惠，让更多人能够用上强大的AI工具。1.2DeepSeek-V3的诞生DeepSeek-V3是DeepSeek公司推出的最新一代A
企业级AI开发利器：Spring AI框架深度解析与实战_spring ai实战 AI大模型-海文人工智能 spring python 算法开发语言 java 机器学习
企业级AI开发利器：SpringAI框架深度解析与实战一、前言：Java生态的AI新纪元在人工智能技术爆发式发展的今天，Java开发者面临着一个新的挑战：如何将大语言模型（LLMs）和生成式AI（GenAI）无缝融入企业级应用。传统的Java生态缺乏统一的AI集成方案，开发者往往需要为不同AI供应商（如OpenAI、阿里云、HuggingFace）编写大量重复的接口适配代码，这不仅增加了开发成本，
图扑软件智慧云展厅，开启数字化展馆新模式智慧园区可视化 5g 人工智能大数据安全云计算
随着疫情的影响以及新兴技术的不断发展，展会的发展形式也逐渐从线下转向线上。通过“云”上启动、云端互动、双线共频的形式开展。通过应用大数据、人工智能、沉浸式交互等多重技术手段，构建数据共享、信息互通、精准匹配的高精度“云展厅”，突破时空壁垒限制。图扑软件运用HT强大的渲染功能，数字孪生“云展位”，1:1复现实际展厅内部独特的结构造型和建筑特色。也可以第一人称视角漫游，模拟用户在展厅内的参观场景，在保
转行要趁早！网络安全行业人才缺口大，企业招聘需求正旺！
网络安全行业具有人才缺口大、岗位选择多、薪资待遇好、学历要求不高等优势，对于想要转行的人员来说，是一个非常不错的选择。人才缺口大网络安全攻防技术手段日新月异，特别是现在人工智能技术飞速发展，网络安全形势复杂严峻，人才重要性凸显。教育部《网络安全人才实战能力白皮书》数据显示，到2027年，我国网络安全人员缺口将达327万。近期发布的《2024年网络安全产业人才发展报告》中提到，沿用ISC2的人才缺口
java工厂模式 3213213333332132 java 抽象工厂
工厂模式有 1、工厂方法 2、抽象工厂方法。下面我的实现是抽象工厂方法, 给所有具体的产品类定一个通用的接口。 package 工厂模式; /** * 航天飞行接口 * * @Description * @author FuJianyong * 2015-7-14下午02:42:05 */ public interface SpaceF
nginx频率限制+python测试 ronin47 nginx 频率 python
部分内容参考：http://www.abc3210.com/2013/web_04/82.shtml 首先说一下遇到这个问题是因为网站被攻击，阿里云报警，想到要限制一下访问频率，而不是限制ip（限制ip的方案稍后给出）。nginx连接资源被吃空返回状态码是502，添加本方案限制后返回599，与正常状态码区别开。步骤如下：
java线程和线程池的使用 dyy_gusi ThreadPool thread Runnable timer
java线程和线程池一、创建多线程的方式 java多线程很常见，如何使用多线程，如何创建线程，java中有两种方式，第一种是让自己的类实现Runnable接口，第二种是让自己的类继承Thread类。其实Thread类自己也是实现了Runnable接口。具体使用实例如下： 1、通过实现Runnable接口方式 1 2
Linux 171815164 linux
ubuntu kernel http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.1.2-unstable/ 安卓sdk代理 mirrors.neusoft.edu.cn 80 输入法和jdk sudo apt-get install fcitx su
Tomcat JDBC Connection Pool g21121 Connection
Tomcat7 抛弃了以往的DBCP 采用了新的Tomcat Jdbc Pool 作为数据库连接组件，事实上DBCP已经被Hibernate 所抛弃，因为他存在很多问题，诸如：更新缓慢，bug较多，编译问题，代码复杂等等。 Tomcat Jdbc P
敲代码的一点想法永夜-极光 java 随笔感想
入门学习java编程已经半年了,一路敲代码下来,现在也才1w+行代码量,也就菜鸟水准吧,但是在整个学习过程中,我一直在想,为什么很多培训老师,网上的文章都是要我们背一些代码?比如学习Arraylist的时候,教师就让我们先参考源代码写一遍,然
jvm指令集程序员是怎么炼成的 jvm 指令集
转自：http://blog.csdn.net/hudashi/article/details/7062675#comments 将值推送至栈顶时 const ldc push load指令 const系列该系列命令主要负责把简单的数值类型送到栈顶。(从常量池或者局部变量push到栈顶时均使用) 0x02 &nbs
Oracle字符集的查看查询和Oracle字符集的设置修改 aijuans oracle
本文主要讨论以下几个部分：如何查看查询oracle字符集、修改设置字符集以及常见的oracle utf8字符集和oracle exp 字符集问题。一、什么是Oracle字符集 Oracle字符集是一个字节数据的解释的符号集合,有大小之分,有相互的包容关系。ORACLE 支持国家语言的体系结构允许你使用本地化语言来存储，处理，检索数据。它使数据库工具，错误消息，排序次序，日期，时间，货
png在Ie6下透明度处理方法 antonyup_2006 css 浏览器 Firebug IE
由于之前到深圳现场支撑上线，当时为了解决个控件下载，我机器上的IE8老报个错，不得以把ie8卸载掉，换个Ie6,问题解决了，今天出差回来，用ie6登入另一个正在开发的系统，遇到了Png图片的问题，当然升级到ie8(ie8自带的开发人员工具调试前端页面JS之类的还是比较方便的，和FireBug一样，呵呵)，这个问题就解决了，但稍微做了下这个问题的处理。我们知道PNG是图像文件存储格式，查询资
表查询常用命令高级查询方法(二) 百合不是茶 oracle 分页查询分组查询联合查询
----------------------------------------------------分组查询 group by having --平均工资和最高工资 select avg(sal)平均工资,max(sal) from emp ; --每个部门的平均工资和最高工资
uploadify3.1版本参数使用详解 bijian1013 JavaScript uploadify3.1
使用：绑定的界面元素<input id='gallery'type='file'/>$("#gallery").uploadify({设置参数，参数如下}); 设置的属性： id: jQuery(this).attr('id'),//绑定的input的ID langFile: 'http://ww
精通Oracle10编程SQL(17)使用ORACLE系统包 bijian1013 oracle 数据库 plsql
/* *使用ORACLE系统包 */ --1.DBMS_OUTPUT --ENABLE:用于激活过程PUT,PUT_LINE,NEW_LINE,GET_LINE和GET_LINES的调用 --语法：DBMS_OUTPUT.enable(buffer_size in integer default 20000); --DISABLE:用于禁止对过程PUT,PUT_LINE,NEW
【JVM一】JVM垃圾回收日志 bit1129 垃圾回收
将JVM垃圾回收的日志记录下来，对于分析垃圾回收的运行状态，进而调整内存分配(年轻代，老年代，永久代的内存分配)等是很有意义的。JVM与垃圾回收日志相关的参数包括： -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -Xloggc -XX:+PrintGC 通
Toast使用白糖_ toast
Android中的Toast是一种简易的消息提示框，toast提示框不能被用户点击，toast会根据用户设置的显示时间后自动消失。创建Toast 两个方法创建Toast makeText(Context context, int resId, int duration) 参数：context是toast显示在
angular.identity boyitech AngularJS AngularJS API
angular.identiy 描述: 返回它第一参数的函数. 此函数多用于函数是编程. 使用方法: angular.identity(value); 参数详解: Param Type Details value * to be returned. 返回值: 传入的value 实例代码: <!DOCTYPE HTML>
java-两整数相除，求循环节 bylijinnan java
import java.util.ArrayList; import java.util.List; public class CircleDigitsInDivision { /** * 题目：求循环节，若整除则返回NULL，否则返回char*指向循环节。先写思路。函数原型：char*get_circle_digits(unsigned k,unsigned j)
Java 日期周年 Chen.H java C++c C#
/** * java日期操作(月末、周末等的日期操作) * * @author * */ public class DateUtil { /** */ /** * 取得某天相加(减)後的那一天 * * @param date * @param num *
[高考与专业]欢迎广大高中毕业生加入自动控制与计算机应用专业 comsci 计算机
不知道现在的高校还设置这个宽口径专业没有,自动控制与计算机应用专业,我就是这个专业毕业的,这个专业的课程非常多,既要学习自动控制方面的课程,也要学习计算机专业的课程,对数学也要求比较高.....如果有这个专业,欢迎大家报考...毕业出来之后,就业的途径非常广..... 以后
分层查询（Hierarchical Queries） daizj oracle 递归查询层次查询
Hierarchical Queries If a table contains hierarchical data, then you can select rows in a hierarchical order using the hierarchical query clause: hierarchical_query_clause::= start with condi
数据迁移 daysinsun 数据迁移
最近公司在重构一个医疗系统，原来的系统是两个.Net系统，现需要重构到java中。数据库分别为SQL Server和Mysql，现需要将数据库统一为Hana数据库，发现了几个问题，但最后通过努力都解决了。 1、原本通过Hana的数据迁移工具把数据是可以迁移过去的，在MySQl里面的字段为TEXT类型的到Hana里面就存储不了了，最后不得不更改为clob。 2、在数据插入的时候有些字段特别长
C语言学习二进制的表示示例 dcj3sjt126com c basic
进制的表示示例 # include <stdio.h> int main(void) { int i = 0x32C; printf("i = %d\n", i); /* printf的用法 %d表示以十进制输出 %x或%X表示以十六进制的输出 %o表示以八进制输出 */ return 0; }
NsTimer 和 UITableViewCell 之间的控制 dcj3sjt126com ios
情况是这样的: 一个UITableView, 每个Cell的内容是我自定义的 viewA viewA上面有很多的动画, 我需要添加NSTimer来做动画, 由于TableView的复用机制, 我添加的动画会不断开启, 没有停止, 动画会执行越来越多. 解决办法: 在配置cell的时候开始动画, 然后在cell结束显示的时候停止动画查找cell结束显示的代理
MySql中case when then 的使用 fanxiaolong casewhenthenend
select "主键", "项目编号", "项目名称","项目创建时间", "项目状态","部门名称","创建人" union (select pp.id as "主键", pp.project_number as &
Ehcache（01）——简介、基本操作 234390216 cache ehcache 简介 CacheManager crud
Ehcache简介目录 1 CacheManager 1.1 构造方法构建 1.2 静态方法构建 2 Cache 2.1&
最容易懂的javascript闭包学习入门 jackyrong JavaScript
http://www.ruanyifeng.com/blog/2009/08/learning_javascript_closures.html 闭包（closure）是Javascript语言的一个难点，也是它的特色，很多高级应用都要依靠闭包实现。下面就是我的学习笔记，对于Javascript初学者应该是很有用的。一、变量的作用域要理解闭包，首先必须理解Javascript特殊
提升网站转化率的四步优化方案 php教程分享数据结构 PHP 数据挖掘 Google 活动
网站开发完成后,我们在进行网站优化最关键的问题就是如何提高整体的转化率，这也是营销策略里最最重要的方面之一，并且也是网站综合运营实例的结果。文中分享了四大优化策略：调查、研究、优化、评估，这四大策略可以很好地帮助用户设计出高效的优化方案。 PHP开发的网站优化一个网站最关键和棘手的是，如何提高整体的转化率，这是任何营销策略里最重要的方面之一，而提升网站转化率是网站综合运营实力的结果。今天，我就分
web开发里什么是HTML5的WebSocket？ naruto1990 Web html5 浏览器 socket
当前火起来的HTML5语言里面，很多学者们都还没有完全了解这语言的效果情况，我最喜欢的Web开发技术就是正迅速变得流行的 WebSocket API。WebSocket 提供了一个受欢迎的技术，以替代我们过去几年一直在用的Ajax技术。这个新的API提供了一个方法，从客户端使用简单的语法有效地推动消息到服务器。让我们看一看6个HTML5教程介绍里的 WebSocket API：它可用于客户端、服
Socket初步编程——简单实现群聊 Everyday都不同 socket 网络编程初步认识
初次接触到socket网络编程，也参考了网络上众前辈的文章。尝试自己也写了一下，记录下过程吧：服务端：（接收客户端消息并把它们打印出来） public class SocketServer { private List<Socket> socketList = new ArrayList<Socket>(); public s
面试：Hashtable与HashMap的区别（结合线程） toknowme
昨天去了某钱公司面试，面试过程中被问道 Hashtable与HashMap的区别？当时就是回答了一点，Hashtable是线程安全的，HashMap是线程不安全的，说白了，就是Hashtable是的同步的，HashMap不是同步的，需要额外的处理一下。今天就动手写了一个例子，直接看代码吧 package com.learn.lesson001; import java
MVC设计模式的总结 xp9802 设计模式 mvc 框架 IOC
随着Web应用的商业逻辑包含逐渐复杂的公式分析计算、决策支持等，使客户机越来越不堪重负，因此将系统的商业分离出来。单独形成一部分，这样三层结构产生了。其中‘层’是逻辑上的划分。三层体系结构是将整个系统划分为如图2.1所示的结构[3] （1）表现层（Presentation layer）：包含表示代码、用户交互GUI、数据验证。该层用于向客户端用户提供GUI交互，它允许用户