weixin_39599454

lstm训练情感分析的优点_评论上的情感分析：主题与情感词抽取

问题描述

针对评论网站上的用户评论进行细粒度的情感分析，区别于传统的粗粒度的情感分类（判断一句话的表达情感的正/负性），评论者在一句话中往往会提到多个角度，并在每个角度都抱有不同的观点内容与正/负极性

举例：金拱门快餐的食品质量一般，但是服务很周到
抽取结果：食品质量 → 一般；服务 → 周到，这里 “食品质量” 与 “服务” 是两个不同的角度（aspect，也叫opinion target），前一个角度对应的情感词（opinion word）是 “一般”，极性为负（negative），后一个角度对应的情感词为 “周到”，极性为正（positive）

问题抽象：其实可以看作一个类似于分词问题的 “序列标注” 问题，如下图所示，给出分词后的输入序列，输出两个同等长度的 BIO 序列，一个作为角度词抽取的输出序列结果，一个作为情感词抽取的输出序列结果，这里 BIO 标记为序列标注问题的惯用标记法，“B” 即为欲标记的目标内容的开始词，“I” 为欲标记内容的中间词（或结尾词），“O” 为不标记的内容

另外，将这个问题抽象成序列标注问题还有一个很大的缺点，就是角度词和情感词的抽取是单独的，不是成对匹配的，即就算抽取出两个角度词和两个情感词，也不能将每个情感词对应到每个角度词上，万一两个情感词说的都是同一个角度呢，比如 “美国记者我不知道，但是香港记者啊最快且最吼”，这个问题暂时不知道其他的解决办法

目标

刚从 Keras 转到 Tensorflow（极其智障的做法，一定要先学 tf 再学 keras），实践一下
实践一下序列标注这类 seq2seq 类问题的操作方式
探索一下文本上的细粒度情感分析

源代码与数据下载

wavewangyue/opinion_extractiongithub.com

word2vec 模型下载（基于 Yelp 数据预训练）： https:// pan.baidu.com/s/1CJjmTr MoTzL7m6VBYrz_OQ
提取码 hdzi

数据集

SemEval 2014 ( Restaurant ) ：数据来源是用户在网上对餐厅的评价，处理好的数据都放在 git 里了，而原始数据长下面这个样子

从数据示例看，数据集只提供了角度词（aspectTerm）的抽取结果，没有情感词的抽取结果，训练加测试数据总共 3841 条，需要人工标注情感词结果（WTF...）

不过还好我拿到了别人标注过的一个结果，提供者是南洋理工大学的 Wang Wenya （感激不尽），目前 state-of-art 的论文 Coupled Multi-Layer Attentions for Co-Extraction of Aspect and Opinion Terms（AAAI 2017）的作者

还是先上结论

像主题词与情感词提取这种细粒度情感分析问题并不是一个简单的问题，目前是当成一个序列标注问题来处理，可是无法满足成对提取的要求，目前我还不知道什么更好的办法
虽然都是深度学习工具，但是使用 Tensorflow 比使用 Keras 更难，更底层，但是不能只学傻瓜式的高层接口，还是要学习下底层的具体的东西，能实现的东西要更灵活，对模型的理解也更深刻

1. 数据预处理

标注数据集下载下来的数据示例上面贴出来过，是 xml 格式的，提供了抽取出来的单词，需要自己把原句子序列处理成 BIO 序列的形式，数据量比较小，不到 4000 条，并且是英文的，涉及不到什么万恶的编码问题，所以没啥可说的，放一下处理好的数据结果

test_docs.txt

test_labels_a.txt（角度词标注结果）

这里把 BIO 序列换成了 012 序列，B 对应 0，I 对应 1，因为数字标签方便之后操作

test_labels_p.txt（情感词标注结果）

词向量模型

训练一个 word2vec 词向量模型，这个是独立在模型外面提前做的，因为数据集提供的数据只有 4000 条很少，不使用预训练的 word embedding 模型效果就会不好。训练数据用的是“Yelp”（外国版“大众点评”）的数据，数据内容就是很多用户在它们网站上留下的对酒店的评论文本，下载地址上面有

2 模型搭建

tensorflow 可太挑战传统编程思维了，但是很有趣。分两步

先搭模型，模型相当于数据流动的管道，在管道里有各种操作（比如加减乘除等等），但是此时只是一个管道，你可以看每个管道口的数据形状（shape），但是没有任何具体数据
放数据进去，让数据在管道里流，流到底就出结果了，每次放一条数据（也可以一次放多条，也就是一个batch，因为数据量很少就没弄batch），每条数据流完出结果计算一下 loss，优化一下参数，然后继续放

分两个代码文件说，一个是 lstm.py，负责搭建模型，包括输入，输出，loss，参数更新方式等等一切细节，另一个是 train_lstm.py，负责读入数据，数据预处理，以及调用前一个 py 进行训练等操作

lstm.py

先放一个模型框架，包括两个并列的 LSTM 层，两个全连接层（dense_out），最后是损失函数（loss）与优化器（optimizer），evaluate 是用来在训练过程中定期计算准确度的，方便自己看结果

首先定义输入输出，在 tf 的模型搭建过程中，输入输出用 tf.placeholder（占位符）表示，而参数用 tf.Variable 表示

 def build_input(self):
        config = self.config
        x  = tf.placeholder(tf.float32, shape=(None, config.embedding_dim), name='x')
        y1 = tf.placeholder(tf.int32, shape=(None,), name='y1')
        y2 = tf.placeholder(tf.int32, shape=(None,), name='y2')
        return x, y1, y2

这里输入格式是（None，config.embedding_dim），None 是指序列的长度，因为每个句子长度不一样，无法提前确定有多长，我又不想做 padding 把它们切割到同样的长度，所以就用 None 占位，而 config.embedding_dim 是每个单词的词向量的维度，也就是词向量训练的维度，即 200

然后 y1，y2 就分别是角度词与情感词的结果序列，格式是（None，），这个 None 跟 x 的 None 相等，然后第二维为空就相当于第二维为 1，因为输出的只是一个数字（0，1 或 2，对应B，I 与 O），只有 1 维

接下来是模型，首先输入的 x 分别进入两个 LSTM 中，得到结果分别为 r_a 与 r_p，然后再分别进入两个全连接层，得到结果 logits_a 与 logits_p，最后 softmax 一下，得到最终的结果 out_a 与 out_p ，放代码：

def __init__(self, config):
        self.config = config
        self.init_state = []
        self.final_state = []
        self.x, self.y1, self.y2 = self.build_input()
        for i in ['a','p']:
            with tf.variable_scope("rnn_"+i):
                with tf.variable_scope("gru_cell"):
                    cell = tf.nn.rnn_cell.BasicLSTMCell(config.gru_hidden_size)
                    cell = tf.nn.rnn_cell.DropoutWrapper(cell, output_keep_prob=config.drop_rate)
                    init_state = cell.zero_state(1, tf.float32)
                self.init_state.append(init_state)
                r, final_state = tf.nn.dynamic_rnn(cell, tf.reshape(self.x, [1, -1, config.embedding_dim]), initial_state=init_state)
                self.final_state.append(final_state)
                r = tf.reshape(r, [-1, config.gru_hidden_size])
            if i == 'a':
                r_a = r
            else:
                r_p = r
        
        with tf.variable_scope("dense_out_a"):
            C_a = tf.Variable(tf.random_normal([config.gru_hidden_size, 3]), name='C')
            logits_a = tf.matmul(r_a, C_a)
            out_a = tf.nn.softmax(logits_a)
            
        with tf.variable_scope("dense_out_p"):
            C_p = tf.Variable(tf.random_normal([config.gru_hidden_size, 3]), name='C')
            logits_p = tf.matmul(r_p, C_p)
            out_p = tf.nn.softmax(logits_p)

这里 tensorflow 和 keras 的区别就出来了，keras 做到以上几点只需要无脑一层一层往上堆就可以了，但是 tensorflow 就要很具体的写了，比如 keras 里全连接是这么写

model.add(Dense(labels.shape[1], activation='softmax'))

反正就是堆一层，我具体怎么个全连接法你也不用管，但是 tensorflow 里就得明白写出来，是先新建一个参数张量 C_a ，然后再去和输入 r_a 去做矩阵乘法，让你有一种 “哦，原来如此” 的感觉

这里 LSTM 是个比较难写的地方，因为需要提前处理好 init_state，也就是 LSTM 单元的初始状态，也就针对每条数据，当第一个单词还没有输入进去的时候，LSTM单元里的状态参数是什么样的

修正：其实没必要，这里有点多余了，dynamic_rnn 不需要输入 init_state，让它帮你初始化就可以了

dynamic_rnn 这个函数非常强大，直接把整个单词序列输入进去，他帮你把单词一个一个按顺序输入 LSTM 单元，最后返回所有结果，不用你自己写循环一个一个单词输入了

另外 with tf.variable_scope 这句话属于没有作用但是很有意义的语句，保持良好的为变量建立命名空间的习惯，既能避免重名参数产生冲突的尴尬，又能让人在使用 tensorboard 对模型进行检查的时候看上去很整齐，而不是乱七八糟一大团

接下来是 loss 的定义和参数更新函数的定义，loss 直接在上面得到的输出结果 logits_a 与 logits_p （注意不是 softmax 之后的 out_a 与 out_p）上加一个交叉熵损失函数 sparse_softmax_cross_entropy_with_logits ，然后将得到的 loss 输入 optimizer 中，用 Adam 优化器对参数进行反向传播更新，就打完收工了。上代码：

def build_loss(self, logits_a, logits_p):
        logits = tf.concat([logits_a, logits_p], 0)
        y = tf.concat([self.y1, self.y2], 0)
        loss = tf.nn.sparse_softmax_cross_entropy_with_logits(logits=logits, labels=y)
        loss = tf.reduce_sum(loss)
        return loss

def build_optimizer(self, loss):
        config = self.config
        tvars = tf.trainable_variables()
        grads, _ = tf.clip_by_global_norm(tf.gradients(loss, tvars), config.max_grad_norm)
        optimizer = tf.train.AdamOptimizer(config.learning_rate)
        train_op = optimizer.apply_gradients(zip(grads, tvars), global_step=tf.contrib.framework.get_or_create_global_step())
        return train_op

3 训练与测试

train_lstm.py

首先随便设置一些参数

class Config(object):
    embedding_dim = 200 # 词向量维度
    gru_hidden_size = 80 # lstm 隐层个数
    batch_size = 1 # 数据量小，没有用 batch
    learning_rate = 0.007 # 学习率
    drop_rate = 0.5 # LSTM 层drop率

然后就是把数据读入，然后处理成模型输入所需的向量形式，代码就不放了。直接放训练代码

epochs = 100
with tf.Session() as sess:
        tf.summary.FileWriter('graph', sess.graph)
        sess.run(tf.global_variables_initializer())
        
        start = time.time()
        new_state = sess.run(model.init_state)
        statistic_step = 200
        total_loss = 0
        for e in range(epochs):    
            for i in range(len(x_train)):
                feed_dict = {model.x: x_train[i],
                             model.y1: y_train_a[i],
                             model.y2: y_train_p[i]}
                for ii, dd in zip(model.init_state, new_state):
                    feed_dict[ii] = dd
                loss, new_state, _ = sess.run([model.loss, model.final_state, model.optimizer], feed_dict=feed_dict)
                total_loss += loss
                end = time.time()
                if i % statistic_step == 0:
                    print '********************************************' 
                    print 'epoch: '+str(e)+' / '+str(epochs)
                    print 'steps: '+str(i)
                    print 'cost_time: '+str(end-start)
                    if i == 0:
                        print 'loss: '+str(total_loss)
                    else:
                        print 'loss: '+str(total_loss/statistic_step)
                    total_loss = 0
                if i % statistic_step == 0:
                    correct_a_num = 0
                    correct_p_num = 0
                    test_batch_size = 128
                    for j in range(test_batch_size):
                        index = random.randint(0, len(x_train)-1)
                        feed_dict[model.x] = x_train[index]
                        feed_dict[model.y1] = y_train_a[index]
                        feed_dict[model.y2] = y_train_p[index]
                        correct_a, correct_p, out_a = sess.run([model.correct_a, model.correct_p, model.out_a], feed_dict=feed_dict)
                        if correct_a:
                            correct_a_num += 1
                        if correct_p:
                            correct_p_num += 1
                    score1 = float(correct_a_num)*100/test_batch_size
                    score2 = float(correct_p_num)*100/test_batch_size
                    print 'precision: '+str(score1)+' '+str(score2)

这里 epochs=100 是指跑 100 轮，每轮把所有数据跑一遍。statistic_step=200 是指每输入200条句子就测试一下目前的准确度

tensorflow 的训练很有意思，这个 sess.run 这个函数，你放模型里哪个位置的变量进去，他就运行到哪个位置。比如这里如果只放 model.loss，他就跑一遍模型到 loss 函数那个位置，然后输出，但是如果只放 model.r_a 进去（就是 LSTM 层的输出结果），他就只运行到 LSTM 层然后输出，后面的就不管了，自然也运行不到优化器那块，也不能进行参数的更新，很清奇的脑回路

总结

具体运行结果就不放了，因为忘截图了。。。反正准确度大概就在 60%-70%之间这样吧

总结放开头了

就酱，收工

C++——内存管理 kiiila C++c++
目录1.c++内存分布2.c语言中动态内存管理3.c++动态内存管理4.operatornew和operatordelete函数5.new和delete的实现原理6.定位new表达式（了解）7.malloc/free和new/delete的区别8.什么是内存泄漏，内存泄漏的危害1.c++内存分布内核空间用户代码不能读写栈向下增长内存映射段文件映射、动态库、匿名映射堆向上增长数据段或静态区全局数据、
读论文 Situated Instruction Following MhZhou0412 人工智能深度学习 python
研究背景：在传统的指令跟随范式中，代理独自在一个空房子里行动，导致语言使用既简单又人为“完整”。与此相反，我们提出了情境指令跟随（SIF），该方法拥抱真实世界通信中固有的不完全和模糊性，具有人的物理存在。情境指令的意义通过人类的过去行动和预期未来行为自然展开。在我们的设置中，指令具有以下特征：(1)模糊不清，(2)具有时间演变的意图，(3)可以通过代理的动态行动更精确地解释。SIF中的任务包括两个
Java力扣题解：169 多数元素——投票法早起之王 leetcode leetcode
题目给定一个大小为n的数组，找到其中的多数元素。多数元素是指在数组中出现次数大于⌊n/2⌋的元素。你可以假设数组是非空的，并且给定的数组总是存在多数元素。来源：力扣（LeetCode）链接：https://leetcode-cn.com/problems/majority-element著作权归领扣网络所有。商业转载请联系官方授权，非商业转载请注明出处。分析这里的投票法，是以第一个元素为基准数，票
LeetCode 3090.每个字符最多出现两次的最长子字符串爱笑的coder 算法刷题-滑动窗口 leetcode 算法职场和发展
题目：给你一个字符串s，请找出满足每个字符最多出现两次的最长子字符串，并返回该子字符串的最大长度。思路：用一个数组代替hashset记录字符出现次数代码：classSolution{publicintmaximumLengthSubstring(Strings){char[]ch=s.toCharArray();intans=0;int[]record=newint[26];intleft=0;f
基于MySQL8.0安装部署MHA集群（一主两从）收买神的欢心 mysql 数据库大数据
写在前面之前搭建过MySQL5.7版本的MHA集群，因为一些需要，现进行MySQL8.0版本的MHA集群搭建，搭建步骤基本与5.7版本相似，所以某些测试部分、问题解决、安装包、mha的IP漂移配置文件可以参照我之前写的博文，但是有部分配置文件做了改动，且8.0版本的某些命令与5.7版本的也不尽相同，需要注意。基于MySQL5.7安装部署MHA集群（一主一从）可查看MySQL高可用集群搭建（一主一从
一步教你轻松实现--Word方括号打勾☑ 韦_恩 windows日常使用总结 word
开门见山，不说废话，本文介绍两种方法任君选择！1.方法1：在需要输入“方框打勾”符号的地方按着【Alt】键的同时，输入数字“9745”，输入完之后再松开【Alt】键，你会发现这个数字瞬间变成了“方框打勾”符号【如果没有就再按下回车键】。2.方法2：需要输入“方框打勾”符号的地方输入“2611”，然后按下【Alt+X】的组合键，即可看到“2611”瞬间变成了“方框打勾”符号。alt+x键后：以上两种
论文阅读：DeepFake-Adapter: Dual-Level Adapter for DeepFake Detection（Deepfake模型快速调参）海拉鲁的小厨娘读论文论文阅读
一、论文信息论文名称：DeepFake-Adapter:Dual-LevelAdapterforDeepFakeDetection作者团队：项目主页：https://github.com/rshaojimmy/DeepFake-Adapter（代码暂未开源）二、动机与创新动机：目前的deepfake检测模型泛化能力差，将其归因于过拟合于低级的伪造模式，现有的deepfake检测方法仅关注低级别的伪
[Qt]常用控件介绍-显示类控件-QLabel、QLCDNumber、QProgressBar、QCalendarWidget控件北顾南栀倾寒 Qt C++c++qt 开发语言
目录1.Label控件属性介绍三种文本格式的设置应用编辑图片与自动拉伸应用QLable伙伴设置2.LCDNumber控件属性Demo：倒计时程序多线程实现倒计时程序3.ProgressBar控件属性Demo：定时器--进度条随机增长Qt头文件的前置声明4.CalendarWidget控件属性重要的信号1.Label控件可以用来显示文本和图片内容，内部含有许多功能，但是在运行后只能用于显示文本和实现
MHA架构部署凰玥 MySQL mysql
一、**简介MHA（MasterHA）是一款开源的MySQL的高可用程序，它为MySQL主从复制架构提供了automatingmasterfailover功能。MHA在监控到master节点故障时，会提升其中拥有最新数据的slave节点成为新的master节点，在此期间，MHA会通过于其它从节点获取额外信息来避免一致性方面的问题。MHA还提供了master节点的在线切换功能，即按需切换master
震惊！996加班写教程？OUT了！我用Python+AI，一键自动生成，效率提升100倍！ lizhijianwill 人工智能 python 开发语言改行学it java javascript
导语：你是否还在为了撰写技术教程而苦苦挣扎？是否还在996的工位上，熬夜爆肝，只为输出一篇高质量的技术文档？醒醒吧！这个时代变了！今天，我就要告诉你一个颠覆传统的秘密武器，让你彻底告别低效的手工教程编写模式，拥抱AI，解放生产力，让效率飞起来！时代焦虑：AI浪潮来袭，你还在用“石器时代”的方法写教程？2024年，AI技术已经渗透到我们生活的方方面面。“AI智能体”、“思维链”、“生产力革命”这些词
基于Python的自然语言处理系列（2）：Word2Vec（负采样）会飞的Anthony 自然语言处理人工智能信息系统自然语言处理 word2vec 人工智能
在本系列的第二篇文章中，我们将继续探讨Word2Vec模型，这次重点介绍负采样（NegativeSampling）技术。负采样是一种优化Skip-gram模型训练效率的技术，它能在大规模语料库中显著减少计算复杂度。接下来，我们将通过详细的代码实现和理论讲解，帮助你理解负采样的工作原理及其在Word2Vec中的应用。1.Word2Vec（负采样）原理1.1负采样的背景在Word2Vec的Skip-g
如何运用python爬虫获取大型资讯类网站文章，并同时导出pdf或word格式文本？大懒猫软件深度学习 python 网络爬虫自然语言处理
这里，我们以比较知名的商业新知网站https://www.shangyexinzhi.com/为例进行代码编写，下面进行代码应用思路。第一部分，分析网站结构首先，我们来分析，要使用Python技术分析一个网站的结构，通常可以通过以下步骤实现：获取网站的HTML内容：使用requests库来获取网站的HTML源代码。解析HTML内容：使用BeautifulSoup库来解析HTML，提取网站的结构信息
大模型GUI系列论文阅读 DAY4：《PREDICT: Multi-Agent-based Debate Simulation for Generalized Hate Speech Detecti》 feifeikon 论文阅读
摘要虽然已经提出了一些公共基准用于训练仇恨言论检测模型，但这些基准之间的标注标准差异为模型的泛化学习带来了挑战，限制了其适用性。先前的研究提出了通过数据整合或扩充来泛化模型的方法，但在克服数据集之间的标注标准差异方面仍然存在局限性。为了解决这些挑战，我们提出了PREDICT，一种基于多代理（multi-agent）概念的仇恨言论检测新框架。PREDICT包括两个阶段：（1）PRE（基于视角的推理）
Solon Cloud Gateway 开发：Helloword 组合缺一 Solon Java Framework gateway java solon
SolonCloudGateway，是一个可Java编程的分布式接口网关（或，代理网关）。有没有注册与发布服务。都可以用。不管是php或者node.js或得java，只要是http服务。也都可互通。下面，演示给一个服务（比如：https://www.baidu.com）配置代理网关呢？1、新建个空的solon-lib项目，添加maven依赖：生成空的solon-lib项目https://solon
牛客网面试必刷TOP101-03二叉树BM40 重建二叉树 bingw0114 面试数据结构职场和发展
描述给定节点数为n的二叉树的前序遍历和中序遍历结果，请重建出该二叉树并返回它的头结点。例如输入前序遍历序列{1,2,4,7,3,5,6,8}和中序遍历序列{4,7,2,1,5,3,8,6}，则重建出如下图所示。提示:1.vin.length==pre.length2.pre和vin均无重复元素3.vin出现的元素均出现在pre里4.只需要返回根结点，系统会自动输出整颗树做答案对比数据范围：n≤20
Python知识点：基于Python工具和技术，如何使用Truffle进行智能合约开发与部署杰哥在此 Python系列 python 智能合约开发语言编程面试
开篇，先说一个好消息，截止到2025年1月1日前，翻到文末找到我，赠送定制版的开题报告和任务书，先到先得！过期不候！如何使用Truffle与Python进行智能合约开发与部署Truffle是一个强大的开发框架，它为以太坊智能合约的开发、测试和部署提供了一整套工具。虽然Truffle主要使用JavaScript和Solidity，但是它也可以与Python工具和技术配合使用，以实现更灵活的开发流程。
leetcode_字符串 14.最长公共前缀函数 MiyamiKK57 leetcode 算法 python
14.编写一个函数来查找字符串数组中的最长公共前缀如果不存在公共前缀，返回空字符串“”1.startswith()方法调用Python内置的startwith()方法，用于检查字符串是否以指定的子字符串开头语法：str.startswith(prefix[,start[,end]])prefix：指定要检查的开头子字符串，可以是一个字符串或包含多个字符串的元组。start（可选）：起始检查的位置（
25.1.6 python基础程序练习 MiyamiKK57 python
23.暂停后输出暂停一段时间后输出importtimetime.sleep(2)#停顿2秒后输出print('helloworld')24.成绩if语句利用条件运算符的嵌套来完成此题；学习成绩>=90分的同学用A表示，60-89分的用B表示，60以下用C表示a=int(input('请输入成绩：'))ifa>=90:print('A')elif60<=a<90:print('B')else:pri
LeetCode 21. 合并两个有序链表链表合并 Java实现 Lentr0py LeetCode 算法题 leetcode 链表 java 算法数据结构
21.合并两个有序链表21.合并两个有序链表题目来源题目分析题目难度题目标签题目限制解题思路思路：核心算法步骤迭代法代码实现代码解读性能分析复杂度结果测试用例扩展讨论优化写法其他实现总结21.合并两个有序链表题目来源21.合并两个有序链表题目分析将两个升序链表合并为一个新的升序链表并返回。新链表是通过拼接给定的两个链表的所有节点组成的。题目难度难度：简单题目标签标签：链表题目限制两个链表的节点数目
力扣：69. x 的平方根题解（Java） HOOHV 力扣题解
题目地址：x的平方根题目描述：实现intsqrt(intx)函数。计算并返回x的平方根，其中x是非负整数。由于返回类型是整数，结果只保留整数的部分，小数部分将被舍去。示例1:输入:4输出:2示例2:输入:8输出:2说明:8的平方根是2.82842..., 由于返回类型是整数，小数部分将被舍去。解题思路：没什么好说的，调用函数，然后强制转换成int返回就行了。……其实是要手动开平方，用到公式(x+a
C语言：函数详解 wai歪why c语言开发语言
1.函数的概念其实在C语⾔也引⼊函数（function）的概念，有些翻译为：⼦程序，⼦程序这种翻译更加准确⼀些。C语⾔中的函数就是⼀个完成某项特定的任务的⼀⼩段代码。这段代码是有特殊的写法和调⽤⽅法的。C语⾔的程序其实是由⽆数个⼩的函数组合⽽成的。C语言中我们会见到两类函数：库函数和自定义函数。2.库函数C语⾔标准中规定了C语⾔的各种语法规则，C语言本身是不提供库函数的，但我们写代码时经常会用到重
C++异常机制：构建健壮代码的艺术 Main. 24 c++开发语言
1.异常的概念及应用1.1.异常的概念异常处理机制允许程序中独⽴开发的部分能够在运⾏时就出现的问题进⾏通信并做出相应的处理，异常使得我们能够将问题的检测与解决问题的过程分开，程序的⼀部分负责检测问题的出现，然后解决问题的任务传递给程序的另⼀部分，检测环节⽆须知道问题的处理模块的所有细节。C语⾔主要通过错误码的形式处理错误，错误码本质就是对错误信息进⾏分类编号，拿到错误码以还要去查询错误信息，⽐较⿇
C++11：开启高效编程之旅（万字详解） Main. 24 c++开发语言
1.列表初始化1.1.C++98传统的{}C++98中⼀般数组和结构体可以⽤{}进行初始化。structPoint{int_x;int_y;};intmain(){//初始化数组intarray1[]={1,2,3,4,5};intarray2[5]={0};//初始化结构体Pointp={1,2};return0;}1.2.C++11中的{}C++11以后想统⼀初始化⽅式，试图实现⼀切对象皆可⽤
使用Python进行3D游戏开发 2301_79366332 python 3d pygame Python
Python是一种功能强大且易于学习的编程语言，它也可以用于开发3D游戏。虽然Python在游戏开发方面可能不如其他专门的游戏引擎和语言，但它仍然提供了许多库和工具，可以帮助您构建简单的3D游戏。在本文中，我们将探讨如何使用Python进行基本的3D游戏开发。安装所需的库要开始使用Python进行3D游戏开发，您需要安装一些必要的库。其中，最重要的是Pygame库和PyOpenGL库。Pygame
2025-1-21-sklearn学习(43) 使用 scikit-learn 介绍机器学习楼上阑干横斗柄，寒露人远鸡相应。汤姆和佩琦 sklearn 机器学习 sklearn 学习 python 人工智能 scikit-learn
文章目录sklearn学习(43)使用scikit-learn介绍机器学习43.1机器学习：问题设置43.2加载示例数据集43.3学习和预测43.4模型持久化43.4规定43.4.1类型转换43.4.2再次训练和更新参数43.4.3多分类与多标签拟合sklearn学习(43)使用scikit-learn介绍机器学习文章参考网站：https://sklearn.apachecn.org/和https
leetcode 3090. 每个字符最多出现两次的最长子字符串萌の鱼 leetcode 算法 c++数据结构
题目如下数据范围观察数据范围发现s最长也就100也就是说O(n^2)的暴力法的时间复杂度也是可以接受的。不过本题使用不定长滑动窗口可以优化至O(n)是本人比较推荐的。那么滑动窗口是如何把时间复杂度优化成O(n)的呢？暴力法如下for(inti=0;imap;intn=s.size();if(n==0)return0;intmax1=1;intj=0;for(inti=0;i
通过Python编程语言实现“机器学习”小项目教程案例胡萝卜不甜机器学习 python 机器学习开发语言
1.Python与机器学习概述1.1Python语言特点Python是一种广泛使用的高级编程语言，具有简洁、易读、易学的特点，这使得它成为初学者和专业人士的首选语言之一。简洁性：Python的语法简洁明了，减少了代码量，提高了开发效率。例如，与其他语言相比，Python可以用更少的代码实现相同的功能，这使得代码更容易编写和维护。易读性：Python的代码风格类似于英语，易于理解和阅读。这种易读性使
图神经网络系列论文阅读DAY1：《Predicting Tweet Engagement with Graph Neural Networks》 feifeikon 神经网络论文阅读人工智能
摘要翻译：社交网络是全球范围内分享内容的重要在线渠道之一。在这种背景下，预测一篇帖子在互动方面是否会产生影响，对于推动这些媒体的盈利利用至关重要。在现有研究中，许多方法通过利用帖子的直接特征来解决这一问题，这些特征通常与文本内容以及发布该帖子的用户相关。在本文中，我们认为互动的增加还与另一个关键因素相关，即社交媒体用户发布的帖子之间的语义关联。因此，我们提出了一种基于图神经网络（GraphNeur
Python知识点：如何使用Panda3D进行3D游戏开发杰哥在此 Python系列 python 3d 开发语言编程面试
使用Panda3D进行3D游戏开发是一个相对复杂但功能强大的过程。Panda3D是一个基于Python和C++的开源引擎，专为3D游戏开发而设计。它支持物理、动画、着色器、碰撞检测等，能够制作高质量的3D游戏。以下是如何使用Panda3D进行3D游戏开发的基本步骤。1.安装Panda3D首先，你需要安装Panda3D。你可以使用以下命令安装：pipinstallpanda3d2.创建一个基本的Pa
leetcode_链表 21.合并两个有序链表 MiyamiKK57 leetcode 链表算法
21.合并两个有序链表将两个升序链表合并为一个新的升序链表并返回。新链表是通过拼接给定的两个链表的所有节点组成的。思路：定义一个哑节点（dummynode），哑节点是一个初始的虚拟节点，它不存储有效值，只是方便操作，定义一个指针current指向哑节点，用于构建新链表。遍历两个链表，使用两个指针p1和p2分别指向list1和list2的头部，并比较p1.val和p2.val，将较小值的节点连接到c
mondb入手木zi_鸣 mongodb
windows 启动mongodb 编写bat文件， mongod --dbpath D:\software\MongoDBDATA mongod --help 查询各种配置配置在mongob 打开批处理，即可启动，27017原生端口，shell操作监控端口扩展28017，web端操作端口启动配置文件配置，数据更灵活
大型高并发高负载网站的系统架构 bijian1013 高并发负载均衡
扩展Web应用程序一.概念简单的来说，如果一个系统可扩展，那么你可以通过扩展来提供系统的性能。这代表着系统能够容纳更高的负载、更大的数据集，并且系统是可维护的。扩展和语言、某项具体的技术都是无关的。扩展可以分为两种： 1.
DISPLAY变量和xhost(原创) czmmiao display
DISPLAY 在Linux/Unix类操作系统上, DISPLAY用来设置将图形显示到何处. 直接登陆图形界面或者登陆命令行界面后使用startx启动图形, DISPLAY环境变量将自动设置为:0:0, 此时可以打开终端, 输出图形程序的名称(比如xclock)来启动程序, 图形将显示在本地窗口上, 在终端上输入printenv查看当前环境变量, 输出结果中有如下内容:DISPLAY=:0.0
获取B/S客户端IP 周凡杨 java 编程 jsp Web 浏览器
最近想写个B/S架构的聊天系统，因为以前做过C/S架构的QQ聊天系统，所以对于Socket通信编程只是一个巩固。对于C/S架构的聊天系统，由于存在客户端Java应用，所以直接在代码中获取客户端的IP，应用的方法为： String ip = InetAddress.getLocalHost().getHostAddress(); 然而对于WEB
浅谈类和对象朱辉辉33 编程
类是对一类事物的总称，对象是描述一个物体的特征，类是对象的抽象。简单来说，类是抽象的，不占用内存，对象是具体的，占用存储空间。类是由属性和方法构成的，基本格式是public class 类名{ //定义属性 private/public 数据类型属性名； //定义方法 publ
android activity与viewpager+fragment的生命周期问题肆无忌惮_ viewpager
有一个Activity里面是ViewPager，ViewPager里面放了两个Fragment。第一次进入这个Activity。开启了服务，并在onResume方法中绑定服务后，对Service进行了一定的初始化，其中调用了Fragment中的一个属性。 super.onResume(); bindService(intent, conn, BIND_AUTO_CREATE);
base64Encode对图片进行编码 843977358 base64 图片 encoder
/** * 对图片进行base64encoder编码 * * @author mrZhang * @param path * @return */ public static String encodeImage(String path) { BASE64Encoder encoder = null; byte[] b = null; I
Request Header简介 aigo servlet
当一个客户端(通常是浏览器)向Web服务器发送一个请求是，它要发送一个请求的命令行，一般是GET或POST命令，当发送POST命令时，它还必须向服务器发送一个叫“Content-Length”的请求头(Request Header) 用以指明请求数据的长度，除了Content-Length之外，它还可以向服务器发送其它一些Headers，如：
HttpClient4.3 创建SSL协议的HttpClient对象 alleni123 httpclient 爬虫 ssl
public class HttpClientUtils { public static CloseableHttpClient createSSLClientDefault(CookieStore cookies){ SSLContext sslContext=null; try { sslContext=new SSLContextBuilder().l
java取反 -右移-左移-无符号右移的探讨百合不是茶位运算符位移
取反：在二进制中第一位，1表示符数，0表示正数 byte a = -1; 原码：10000001 反码：11111110 补码：11111111 //异或: 00000000 byte b = -2; 原码：10000010 反码：11111101 补码：11111110 //异或: 00000001
java多线程join的作用与用法 bijian1013 java 多线程
对于JAVA的join，JDK 是这样说的：join public final void join （long millis ）throws InterruptedException Waits at most millis milliseconds for this thread to die. A timeout of 0 means t
Java发送http请求(get 与post方法请求) bijian1013 java spring
PostRequest.java package com.bijian.study; import java.io.BufferedReader; import java.io.DataOutputStream; import java.io.IOException; import java.io.InputStreamReader; import java.net.HttpURL
【Struts2二】struts.xml中package下的action配置项默认值 bit1129 struts.xml
在第一部份，定义了struts.xml文件，如下所示： <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache.org/dtds/struts
【Kafka十三】Kafka Simple Consumer bit1129 simple
代码中关于Host和Port是割裂开的，这会导致单机环境下的伪分布式Kafka集群环境下，这个例子没法运行。实际情况是需要将host和port绑定到一起， package kafka.examples.lowlevel; import kafka.api.FetchRequest; import kafka.api.FetchRequestBuilder; impo
nodejs学习api ronin47 nodejs api
NodeJS基础什么是NodeJS JS是脚本语言，脚本语言都需要一个解析器才能运行。对于写在HTML页面里的JS，浏览器充当了解析器的角色。而对于需要独立运行的JS，NodeJS就是一个解析器。每一种解析器都是一个运行环境，不但允许JS定义各种数据结构，进行各种计算，还允许JS使用运行环境提供的内置对象和方法做一些事情。例如运行在浏览器中的JS的用途是操作DOM，浏览器就提供了docum
java-64.寻找第N个丑数 bylijinnan java
public class UglyNumber { /** * 64.查找第N个丑数具体思路可参考 [url] http://zhedahht.blog.163.com/blog/static/2541117420094245366965/[/url] * 题目：我们把只包含因子 2、3和5的数称作丑数（Ugly Number）。例如6、8都是丑数，但14
二维数组（矩阵）对角线输出 bylijinnan 二维数组
/** 二维数组对角线输出两个方向例如对于数组： { 1, 2, 3, 4 }, { 5, 6, 7, 8 }, { 9, 10, 11, 12 }, { 13, 14, 15, 16 }, slash方向输出： 1 5 2 9 6 3 13 10 7 4 14 11 8 15 12 16 backslash输出： 4 3
[JWFD开源工作流设计]工作流跳跃模式开发关键点(今日更新) comsci 工作流
既然是做开源软件的,我们的宗旨就是给大家分享设计和代码,那么现在我就用很简单扼要的语言来透露这个跳跃模式的设计原理大家如果用过JWFD的ARC-自动运行控制器,或者看过代码,应该知道在ARC算法模块中有一个函数叫做SAN(),这个函数就是ARC的核心控制器,要实现跳跃模式,在SAN函数中一定要对LN链表数据结构进行操作,首先写一段代码,把
redis常见使用 cuityang redis 常见使用
redis 通常被认为是一个数据结构服务器，主要是因为其有着丰富的数据结构 strings、map、 list、sets、 sorted sets 引入jar包 jedis-2.1.0.jar (本文下方提供下载) package redistest; import redis.clients.jedis.Jedis; public class Listtest
配置多个redis dalan_123 redis
配置多个redis客户端 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&quo
attrib命令 dcj3sjt126com attr
attrib指令用于修改文件的属性.文件的常见属性有:只读.存档.隐藏和系统. 只读属性是指文件只可以做读的操作.不能对文件进行写的操作.就是文件的写保护. 存档属性是用来标记文件改动的.即在上一次备份后文件有所改动.一些备份软件在备份的时候会只去备份带有存档属性的文件.
Yii使用公共函数 dcj3sjt126com yii
在网站项目中，没必要把公用的函数写成一个工具类，有时候面向过程其实更方便。在入口文件index.php里添加 require_once('protected/function.php'); 即可对其引用，成为公用的函数集合。 function.php如下： <?php /** * This is the shortcut to D
linux 系统资源的查看（free、uname、uptime、netstat） eksliang netstat linux uname linux uptime linux free
linux 系统资源的查看转载请出自出处：http://eksliang.iteye.com/blog/2167081 http://eksliang.iteye.com 一、free查看内存的使用情况语法如下： free [-b][-k][-m][-g] [-t] 参数含义 -b:直接输入free时，显示的单位是kb我们可以使用b(bytes),m
JAVA的位操作符 greemranqq 位运算 JAVA位移 <<>>>
最近几种进制，加上各种位操作符，发现都比较模糊，不能完全掌握，这里就再熟悉熟悉。 1.按位操作符：按位操作符是用来操作基本数据类型中的单个bit,即二进制位，会对两个参数执行布尔代数运算，获得结果。与（&）运算： 1&1 = 1, 1&0 = 0, 0&0 &
Web前段学习网站 ihuning Web
Web前段学习网站菜鸟学习：http://www.w3cschool.cc/ JQuery中文网：http://www.jquerycn.cn/ 内存溢出：http://outofmemory.cn/#csdn.blog http://www.icoolxue.com/ http://www.jikexue
强强联合：FluxBB 作者加盟 Flarum justjavac r
原文：FluxBB Joins Forces With Flarum作者：Toby Zerner译文：强强联合：FluxBB 作者加盟 Flarum译者：justjavac FluxBB 是一个快速、轻量级论坛软件，它的开发者是一名德国的 PHP 天才 Franz Liedke。FluxBB 的下一个版本(2.0)将被完全重写，并已经开发了一段时间。FluxBB 看起来非常有前途的，
java统计在线人数（session存储信息的） macroli java Web
这篇日志是我写的第三次了前两次都发布失败！郁闷极了！由于在web开发中常常用到这一部分所以在此记录一下，呵呵，就到备忘录了！我对于登录信息时使用session存储的，所以我这里是通过实现HttpSessionAttributeListener这个接口完成的。 1、实现接口类，在web.xml文件中配置监听类，从而可以使该类完成其工作。 public class Ses
bootstrp carousel初体验快速构建图片播放 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
img{ border: 1px solid white; box-shadow: 2px 2px 12px #333; _width: expression(this.width > 600 ? "600px" : this.width + "px"); _height: expression(this.width &
SparkSQL读取HBase数据，通过自定义外部数据源 superlxw1234 spark sparksql sparksql读取hbase sparksql外部数据源
关键字：SparkSQL读取HBase、SparkSQL自定义外部数据源前面文章介绍了SparSQL通过Hive操作HBase表。 SparkSQL从1.2开始支持自定义外部数据源(External DataSource)，这样就可以通过API接口来实现自己的外部数据源。这里基于Spark1.4.0，简单介绍SparkSQL自定义外部数据源，访
Spring Boot 1.3.0.M1发布 wiselyman spring boot
Spring Boot 1.3.0.M1于6.12日发布，现在可以从Spring milestone repository下载。这个版本是基于Spring Framework 4.2.0.RC1,并在Spring Boot 1.2之上提供了大量的新特性improvements and new features。主要包含以下： 1.提供一个新的sprin

lstm训练情感分析的优点_评论上的情感分析：主题与情感词抽取

问题描述

1. 数据预处理

2 模型搭建

3 训练与测试

总结

你可能感兴趣的:(lstm训练情感分析的优点)