空空如也_stephen

深度学习之文本分类模型-基于attention机制

1、HAN
2、inner-attention for NLI
3、Attentive Pooling
4、LEAM
5、DRCN
6、ABCNN
7、Multiway Attention Networks
8、aNMM

1、HAN

HAN(Hierarchical Attention Networks)是由Zichao Yang[1]等人提出的一种算法，其主要思想是利用attention机制，将单词进行编码，得到句子的向量s，接着用同样的方式对句子进行编码，最终得到文章的向量V，最终，可以在V上加入softmax，进而进行分类模型的构建。最终在多个数据集上达到了SOTA，其模型结构图如下所示：

整体的架构包括四个部分：word encoder, word attention, sentence encoder, sentence attention。

word encoder
给定一个句子中的单词$w_{it} t \in [0,T]$，我们首先得到单词的embedding信息，通过矩阵$W_{e}$，$x_{ij} = W_{e} * w_{it}$，接着，我们将得到的单词信息依次的通过双向的GRU网络，分别得到相应每个单词隐藏层输出信息。公式如下所示

接下来，我们将每个单词双向的GRU输出拼接成一个向量$h_{it} =\left[\overrightarrow{h}_{i t}, \overleftarrow{h}_{i t}\right]$

Word Attention
我们将$h_{it}$输入到一个多层感知机(MLP)中，激活函数是tanh函数，并得到$u_{it}$向量，接下来，我们通过上下文向量$v_{w}$与$u_{it}$进行向量操作，并通过一个softmax层，最终得到单词的重要性矩阵$\alpha _{it}$，表示第$i$个句子中第t的位置的重要性。最后我们将重要性的矩阵加到$h_{it}$上，得到句子的向量$s_{i}$，具体公式如下：

Sentence Encoder
Sentence Encoder和word encoder相似，同样输入到一个双向的GRU中，并将两个双向的向量进行拼接，得到第$i$个句子$h_{i}$
Sentence Attention
接下来我们按照上述方式，得到句子的重要性矩阵$\alpha _{i}$，并将其作用到$h_{i}$中，最终得到文章的向量$v$，公式如下

Document Classification
当我们得到文档的向量后，我们就可以加上全连接层，输出节点的个数是类别数量，构建模型进行训练了。

2、inner-attention for NLI

这里介绍一个自然语言推测(NLI)的任务，NLI讲的是一个句子是否可以推测出另外一个句子，这种可以看做是一个分类任务，类别有三种，分别是Entailment (inferred to be true), Contradiction (inferred to be false) and Neutral (truth unknown)，例如：

Yang Liu[2]等人提出了将mean pooling 和 inner-attention方法加入到了这种任务中。其思想整体架构图如下所示

其网络结构可以看做是孪生网络结构，我们输入"前提"句子和"假设"句子，通过共享的多层网络，最终得到两个句子的表达，最后将两个句子做一个拼接，最后加上一个softmax层，作为最终的分类。

其网络结构由三部分组成：sentence input,sentence encoding, sentence matching

sentence input
sentence input 模块主要是将单词转化为词向量，这里就不做过多的讲解了，可以利用固定词向量，或者是随着网络自己训练。
sentence encoding
sentence encoding首先将词向量通过双向的LSTM，得到对应的表达，接下来包括两个阶段，第一个阶段是将最顶端的LSTM的输出进行average pooling操作，得到对应的向量，第二个阶段是Inner attention，其公式如下

其中Y表示双向LSTM的输出，$R_{ave}$表示的平均池化的输出，$\alpha$表示attention矩阵，这里论文中的参数介绍的并不是很详细，我理解之所以叫Inner attention是因为它用了内部的LSTM的表达。

sentence matching
我们将两个句子分别得到相应的表达，那么拼接的方式有三种：a、直接拼接。b、元素之间相乘。c、元素之间求差异(没明白啥意思)。最终，我们在最后加上softmax层。

3、Attentive Pooling

AP(Attentive Pooling)是用于QA的，其由IBM的Cicero dos Santos(3)等人提出的一种算法，其基本思想是利用一个权重矩阵，将问题Q和答案A进行信息的交互关联，也就是说Q的表达中包含A的一些信息，A的表达中又包含了Q的一些信息，在最后，我们各自提取每个维度的max pooling的值，各自经过softmax，得到相应的表达。总体的结构图如下所示

由图所示，我们首先得到question和answer的表达，即各自的词向量WEs,接下来，我们利用LSTM或者是CNN提取深层次的特征，对于模型利用LSTM来说，我们叫AP-LSTM，对于利用CNN的模型来说，叫做AP-CNN，接着，我们得到对应的输出Q和A，接着建立一个向量矩阵G，我们利用$tanh(Q^{T} G A)$得到Q和A相关的表达G，接下来，利用max pooling，得到row的表达和column的表达，将这两个表达分别进行softmax，进而乘以各自的原始向量Q,A，得到表达$r_{q}$和$r_{a}$，我们利用向量相似性计算方式，得到两者的结果。

4、LEAM

LEAM是Guoyin Wang[4]等人提出的将单词和分类的label同时进行embedding，接着利用两者向量的cosin余弦值获得矩阵向量，利用"划窗"方法（这个名字是我自己取得）得到对应的向量，最后输出层依旧是softmax，进行分类预测。整体逻辑架构如下图所示

这里（a）表示的是传统的分类方法，(b)是作者提出的算法。我们分别来进行讲解。

step1
我们首先得到单词的embedding向量和label的embedding向量。假设单词的embedding向量维度为V=(128,100),label的embedding向量为C=(10,100)其中，128代表输入单词的个数，10代表类别标签的个数。
step2
接下来进行C和V的cosin操作，这里将C和V进行矩阵操作，得到(128,10)的矩阵，$\hat{G}$也是(128,10)的矩阵，将这两个向量进行相除，得$G$。为啥会有个$\hat{G}$这个矩阵呢，我们知道cosin余弦最后要除以两个向量模的乘积，所以在$\hat{G}$的每个单元格中，分别代表各自向量模的乘积。
step3
接着，我们将这个(128,10)的矩阵进行一些操作，对于其中的一条向量，我们选择其上下各r个向量，包括该向量本身，组成一个(2r+1,10)的矩阵，这里$W_{1}$是一个(2r+1)的向量，$b_{1}$为(10)维向量，我们对(2r+1,10)的这个矩阵进行操作，首先与$W_{1}$进行矩阵乘法，得到(10)维向量，再与$b_{1}$进行相加，得到(10)维向量。最后，我们利用max_pooling取这个(10)维向量中最大的，得到$m_{l}$
step4
经过多次这样的操作，我们会得到一个长度为L的向量$m$，对$m$进行softmax操作，最终得到$\beta$。

step5
$\beta$为一个长度为L的向量，其中每一个维度都表示当前单词$l$的一些权重信息，我们将权重信息乘以最后的单词信息$v_{l}$上，本质上是对单词向量加上权重，并将所有词向量的各个维度进行相加，最终得到向量维度为10的固定向量。有了这个表达向量，我们就可以进行最后的softmax操作，进行分类的训练了。

5、DRCN

DRCN（Densely-connected Recurrent and Co-attentive neural Network ）是由韩国人Seonhoon Kim[5]等人提出的一种算法，其整体思想是将embedding层，RNN隐藏层和经过attention之后的向量进行拼接，并进行多次这样的操作，最终通过一个AE,池化，和全连接操作，得到相应的结果。其主要包括Word Representation Layer、Densely connected Recurrent Networks、Densely-connected Co-attentive networks、Bottleneck component、Interaction and Prediction Layer。接下来我们一步一步来进行解释。

首先我们先放上论文中模型的结构图。

Word Representation Layer
词向量的输入，词向量的输入分为四个部分，并将这四个部分进行拼接，第一部分是用固定词向量，这里可以利用word2vec或者glove等其他词向量获取方式得到词向量。第二部分是可训练词向量，这里其实也可以利用word2vec或者glove等训练的词向量，或者使用随机初始化的词向量，这一部分的词向量会在训练时更新参数。这里作者给出了两者的优缺点，固定词向量可以防止过拟合，但是对于特定领域的数据不灵活，可训练的词向量可以得到特征间的关系的表达，但是容易过拟合，所以将两者一起使用。第三个部分是字符级别的embedding，这里的embedding经过一个卷积神经网络，得到对应的表达，第四个部分表示当前单词是否出现在另外一个句子中，这样将这四个部分词向量进行拼接，得到模型的输入词向量。公式如下

其中$e_{p_{i}}^{fix}$表示第二部分，固定词向量。$e_{p_{i}}^{tr}$表示第二部分，可训练词向量。$c_{p_{i}}$表示第三部分，字符级别向量。$f_{p_{i}}$表示第四部分。最后将这些向量进行拼接，得到输入向量。

Densely connected Recurrent Networks
这一部分就是得到RNN的输出向量，这里也有三种方式，第一种，直接利用RNN的输出向量$h_{i}$，第二种，将RNN的输出向量$h_{i}$和输入向量$x_{i}$进行加和，第三种，将$h_{i}$和$x_{i}$进行拼接。
Densely-connected Co-attentive networks
这一部分，我们需要获得attention的表达，公式如下

在每一个步骤中，我们都会得到两个句子的RNN隐藏层表达，分别为$h_{p_{i}}$和$h_{q_{j}}$，我们初始化有一个attention权重矩阵$\alpha_{ij}$表示第一个句子第$i$个单词和第二个句子第$j$个单词的权重，首先，我们根据权重矩阵$\alpha_{ij}$和第二个句子$h_{q_{j}}$得到第一个句子相应的表达$\alpha_{p_{i}}$，接下来，我们更新权重矩阵$\alpha_{ij}$，首先我们获得$h_{p_{i}}$和$h_{q_{j}}$的$\cosin$余弦值以及$h_{p_{i}}$和其他单词的余弦值，但其实这里我有个疑问，就是在第一轮的时候，后面的RNN隐藏层单元还没有得到，这里我们怎么计算余弦值？这里先空着，如果后续有答案了再补上。最终，我们将上面两个部分得到的向量进行拼接，最终得到新的输入向量。

Bottleneck component
这里加入了一个AE,说是由于参数量过大，目的是为了减少参数量。
Interaction and Prediction Layer
最终，我们得到两个句子的输出，我们可以利用$p+q$，$p-q$，$|p-q|$等操作，以及原始$p,q$进行拼接，再加上一个全连接层，最终得到相应的输出。

6、ABCNN

ABCNN（attention based CNN）是由Wenpeng Yin[6]等人提出，其目的是将attention机制加入到CNN中，实验结果取得了SOTA的效果。其模型总共由三个，分别是ABCNN-1，ABCNN-2，ABCNN-3。下面分别来进行介绍。

这两节主要介绍了文本匹配，其实文本匹配在形式上也是一种分类任务，在输出端为二分类，表示相关和不相关，所以将其放在文本分类中进行讲解。

ABCNN-1
红色框框为输入的文本向量表达，我们看到由两个红色的框框，分别表示两段文本，假设其中一段文本维度为[5,8]，另一段文本为[7,8]，首先，我们利用一些求相似性的手段，论文中用$1/(1 + |x - y|)$其中，x,y分别表示[1,8]和[1,8]的文本，其中$|.|$表示欧式距离，这样我们就可以得到attention matrix的矩阵A，其维度为[5,7]，接下来，我们用两个向量$w_{0},w_{1}$来对矩阵$A$进行向量操作，其中$w_{0}$的维度是[7,8],$w_{1}$的维度是[5,8]，这样就可以得到attention feature map，其维度分别为[5,8]和[7,8]，我们将这两个attention feature map 和原始的representation feature map进行组合，输入到卷积神经网络中，得到输出。
ABCNN-2
由图所示，我们假设conv input的两个句子分别为[5,8]和[7,8]的矩阵，首先，经过一个卷积层，得到[7,8]和[9,8]的矩阵，之所以维度会增大是因为在输入的句子中加入了padding向量。接下来，我们依旧通过一些操作得到attention matrix A，A的维度是[7,9]，方法依旧可以用ABCNN-1的方法来进行获得。接着，我们将A的行和列分别进行相加，得到[1,7]和[1,9]的向量，并用卷积层对原始的[7,8]和[9,8]的矩阵进行卷积操作，这里不进行padding，窗口大小为3，filter大小为[3,8]，我们先将[1,7]的对应3维向量和filter，以及原始矩阵进行相乘，并在相应维度进行相加求平均操作，得到[1,8]向量，经过5次卷积，得到[5,8]向量，最后，我们可以根据得到的两个[5,8]矩阵进行操作。
ABCNN-3
ABCNN-3就是将ABCNN-1和ABCNN-2进行合并

7、Multiway Attention Networks

这篇论文是Chuanqi Tan[7]等人发表的，这篇论文的主要思路是使用了四种attention的方式对句子进行表达，分别是Concat Attention、Bilinear Attention、Dot Attention、Minus Attention四种attention方式，模型整体架构如图所示分为编码层，多方式attention匹配层，聚合层、预测输出层。

编码层
这一层对输入的单词进行编码，这里使用预训练的语言模型来获取单词的词向量。对于句子P，Q来说，得到这两个句子中每个单词的词向量。接下来我们分别将其输入到双向GRU得到输出$h_{t}^{q} = [ \xrightarrow [h_{t}^{q}] , \xleftarrow[h_{t}^{q}] ]$以及$h_{t}^{p} = [ \xrightarrow [h_{t}^{p}] , \xleftarrow[h_{t}^{p}] ]$
多方式attention匹配层
这一层为整体逻辑的核心层，其中attention的方式包括四种，分别是Concat Attention、Bilinear Attention、Dot Attention、Minus Attention，接下来，我们罗列出每一种attention相应的公式。

我们以Concat Attention方式进行讲解，$h_{t}^{p}$表示$t$时刻p的输出，我们将这个输出乘以一个$W_{c}^{2}$接着加上q中第$j$个单词输出乘以$W_{c}^{1}$的结果，在外层加上一个tanh激活函数，再乘以$v_{c}^{T}$得到q的第j个单词的输出$s_{j}^{t}$，当我们得到q中所有单词的$s_{j}^{t}$后，进行一个softmax操作，得到$\alpha_{i}^{t}$，将结果加在$h_{t}^{q}$上，得到结果$q_{t}^{c}$。其他几种方式得到类似的结果。
聚合层
聚合层的作用是将上一层多种方式得到的输出进行合并
预测输出层
将上一层得到的结果进行组合输出。

8、aNMM

aNMM(Attention-Based Neural Matching Model)是由Liu Yang[8]等人提出的一种方法，其主要创新点是应用了一个Value-shared Weighting的方式将变长的矩阵转换成固定维度的矩阵，其整体逻辑结构如下图所示

主要部分有word embedding，QA Matching Matrix，Value-shared Weighting，Question Attention Network四个部分,接下来我们一一进行讲解

word embedding
首先，我们获取Q，A的单词的词向量，这里论文中用的方式是word2vec。假设Q中有M个单词，A中有N个单词，向量维度为D，则我们会得到两个矩阵[M,D],[N,D]。
QA Matching Matrix
这一步我们得到上述两个矩阵相乘的结果矩阵，维度为[M,N]，其中第$i$行第$j$列表示Q中第$j$个单词和A中第$j$个单词的词向量进行cosin余弦操作。
Value-shared Weighting
由于A是变长的序列，所以这里的N是变长的，如果我们想把向量输出到固定维度，传统的做法是利用CNN进行卷积操作，得到固定维度向量。论文中提出了一种新的方法，即由于cosin余弦值的范围是在[-1,1]那么我们可以将其以0.1进行分割，分成21份，[-1,-0.9),[-0.9,-0.8).....[0.9,1),[1]。这样，我们建立一个参数个数为21的向量，这样，对于其中一个值为0.85，我们就可以用[0.8,0.9)的这个权值和0.85进行相乘操作，这个输出的维度我们可以固定，这一部分的结构图如下所示。图中的21变为了3。
Question Attention Network
图中得到的固定维度的输出，图中为4，我们将这4个值进行相加并利用sigmoid函数将进行激活，并作用到Q向量上，加上一个softmax，输出层利用一个两个节点表示相关与否，并将上一层与这一层进行一个全连接操作。

参考文献 [1]Zichao Yang(2016)Hierarchical Attention Networks for Document Classification.
[2]Yang Liu（2016）Learning Natural Language Inference using Bidirectional LSTM model and Inner-Attention
[3]Cicero dos Santos（2016）Attentive Pooling Networks.
[4]Guoyin Wang(2018)Joint Embedding of Words and Labels for Text Classification.
[5]Seonhoon Kim（2018）Semantic Sentence Matching with Densely-connected Recurrent and Co-attentive Information
[6]Wenpeng Yin(2018)ABCNN: Attention-Based Convolutional Neural Network for Modeling Sentence Pairs
[7]Chuanqi Tan.Multiway Attention Networks for Modeling Sentence Pairs
[8]Liu Yang(2019)aNMM: Ranking Short Answer Texts with Attention-Based Neural Matching Model.

QQ群采集助手，精准引流必备神器 2401_87347160 其他经验分享
功能概述微信群查找与筛选工具是一款专为微信用户设计的辅助工具，它通过关键词搜索功能，帮助用户快速找到相关的微信群，并提供筛选是否需要验证的群组的功能。主要功能关键词搜索：用户可以输入关键词，工具将自动查找包含该关键词的微信群。筛选功能：工具提供筛选机制，用户可以选择是否只显示需要验证或不需要验证的群组。精准引流：通过上述功能，用户可以更精准地找到目标群组，进行有效的引流操作。3.设备需求该工具可以
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
如何在 Fork 的 GitHub 项目中保留自己的修改并同步上游更新？github_fork_update iBaoxing github
如何在Fork的GitHub项目中保留自己的修改并同步上游更新？在GitHub上Fork了一个项目后，你可能会对项目进行一些修改，同时原作者也在不断更新。如果想要在保留自己修改的基础上，同步原作者的最新更新，很多人会不知所措。本文将详细讲解如何在不丢失自己改动的情况下，将上游仓库的更新合并到自己的仓库中。问题描述假设你在GitHub上Fork了一个项目，并基于该项目做了一些修改，随后你发现原作者对
扫地机类清洁产品之直流无刷电机控制悟空胆好小清洁服务机器人单片机人工智能
扫地机类清洁产品之直流无刷电机控制1.1前言扫地机产品有很多的电机控制，滚刷电机1个，边刷电机1-2个，清水泵电机，风机一个，部分中高端产品支持抹布功能，也就是存在抹布盘电机，还有追觅科沃斯石头等边刷抬升电机，滚刷抬升电机等的，这些电机有直流有刷电机，直接无刷电机，步进电机，电磁阀，挪动泵等不同类型。电机的原理，驱动控制方式也不行。接下来一段时间的几个文章会作个专题分析分享。直流有刷电机会自动持续
消息中间件有哪些常见类型 xmh-sxh-1314 java
消息中间件根据其设计理念和用途，可以大致分为以下几种常见类型：点对点消息队列（Point-to-PointMessagingQueues）：在这种模型中，消息被发送到特定的队列中，消费者从队列中取出并处理消息。队列中的消息只能被一个消费者消费，消费后即被删除。常见的实现包括IBM的MQSeries、RabbitMQ的部分使用场景等。适用于任务分发、负载均衡等场景。发布/订阅消息模型（Pub/Sub
2018-07-23-催眠日作业-#不一样的31天#-66小鹿小鹿_33
预言日：人总是在逃避命运的路上，与之不期而遇。心理学上有个著名的名词，叫做自证预言；经济学上也有一个很著名的定律叫做，墨菲定律；在灵修派上，还有一个很著名的法则，叫做吸引力法则。这3个领域的词，虽然看起来不太一样，但是他们都在告诉人们一个现象：你越担心什么，就越有可能会发生什么。同样的道理，你越想得到什么，就应该要积极地去创造什么。无论是自证预言，墨菲定律还是吸引力法则，对人都有正反2个维度的影响
《大清方方案》| 第二话谁佐清欢
和珅究竟说了些什么？竟能令堂堂九五之尊龙颜失色！此处暂且按下不表；单说这位乾隆皇帝，果真不愧是康熙从小带过的，一旦决定了要做的事，便杀伐决断毫不含糊。他当即亲自拟旨，着令和珅为钦差大臣，全权负责处理方方事件，并钦赐尚方宝剑，遇急则三品以下官员可先斩后奏。和珅身负皇上重托，岂敢有半点怠慢，当夜即率领相关人等，马不停蹄杀奔江汉。这一路上，和珅的几位幕僚一直在商讨方方事件的处置方案。有位年轻幕僚建议快刀
《庄子.达生9》钱江潮369
【原文】孔子观于吕梁，县水三十仞，流沫四十里，鼋鼍鱼鳖之所不能游也。见一丈夫游之，以为有苦而欲死也，使弟子并流而拯之。数百步而出，被发行歌而游于塘下。孔子从而问焉，曰：“吾以子为鬼，察子则人也。请问，‘蹈水有道乎’”曰：“亡，吾无道。吾始乎故，长乎性，成乎命。与齐俱入，与汩偕出，从水之道而不为私焉。此吾所以蹈之也。”孔子曰：“何谓始乎故，长乎性，成乎命？”曰：“吾生于陵而安于陵，故也；长于水而安于
腾讯云技术深度探索：构建高效云原生微服务架构我的运维人生云原生架构腾讯云运维开发技术共享
腾讯云技术深度探索：构建高效云原生微服务架构在当今快速发展的技术环境中，云原生技术已成为企业数字化转型的关键驱动力。腾讯云作为行业领先的云服务提供商，不断推出创新的产品和技术，助力企业构建高效、可扩展的云原生微服务架构。本文将深入探讨腾讯云在微服务领域的最新进展，并通过一个实际案例展示如何在腾讯云平台上构建云原生应用。腾讯云微服务架构概览腾讯云微服务架构基于云原生理念，旨在帮助企业快速实现应用的容
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Google earth studio 简介陟彼高冈yu 旅游
GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
LLM 词汇表落难Coder LLMs NLP 大语言模型大模型 llama 人工智能
Contextwindow“上下文窗口”是指语言模型在生成新文本时能够回溯和参考的文本量。这不同于语言模型训练时所使用的大量数据集，而是代表了模型的“工作记忆”。较大的上下文窗口可以让模型理解和响应更复杂和更长的提示，而较小的上下文窗口可能会限制模型处理较长提示或在长时间对话中保持连贯性的能力。Fine-tuning微调是使用额外的数据进一步训练预训练语言模型的过程。这使得模型开始表示和模仿微调数
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
高端密码学院笔记285 柚子_b4b4
高端幸福密码学院（高级班）幸福使者：李华第（598）期《幸福》之回归内在深层生命原动力基础篇——揭秘“激励”成长的喜悦心理案例分析主讲：刘莉一，知识扩充:成功=艰苦劳动+正确方法+少说空话。贪图省力的船夫，目标永远下游。智者的梦再美，也不如愚人实干的脚印。幸福早课堂2020.10.16星期五一笔记:1，重视和珍惜的前提是知道它的价值非常重要，当你珍惜了，你就真正定下来，真正的学到身上。2，大家需要
2020-04-12每天三百字之连接与替代冷眼看潮
不知道是不是好为人师，有时候还真想和别人分享一下我对某些现象的看法或者解释。人类社会不断发展进步的过程，就是不断连接与替代的过程。人类发现了火并应用火以后，告别了茹毛饮血的野兽般的原始生活（火烧、烹饪替代了生食）人类用石器代替了完全手工，工具的使用使人类进步一大步。类似这样的替代还有很多，随着科技的发展，有更多的原始的事物被替代，代之以更高效、更先进的技术。在近现代，汽车替代了马车，高速公路和铁路
【加密社】Solidity 中的事件机制及其应用加密社闲侃区块链智能合约区块链
加密社引言在Solidity合约开发过程中，事件（Events）是一种非常重要的机制。它们不仅能够让开发者记录智能合约的重要状态变更，还能够让外部系统（如前端应用）监听这些状态的变化。本文将详细介绍Solidity中的事件机制以及如何利用不同的手段来触发、监听和获取这些事件。事件存储的地方当我们在Solidity合约中使用emit关键字触发事件时，该事件会被记录在区块链的交易收据中。具体而言，事件
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
如何部分格式化提示模板:LangChain中的高级技巧 nseejrukjhad langchain java 服务器 python
标题:如何部分格式化提示模板:LangChain中的高级技巧内容:如何部分格式化提示模板:LangChain中的高级技巧引言在使用大型语言模型(LLM)时,提示工程是一个关键环节。LangChain提供了强大的提示模板功能,让我们能更灵活地构建和管理提示。本文将介绍LangChain中一个高级特性-部分格式化提示模板,这个技巧可以让你的提示管理更加高效和灵活。什么是部分格式化提示模板?部分格式化提
东南林氏之九牧林候选父系祖缘树TheYtree
渊源介绍东晋初年晋安林始祖林禄公入闽，传十世隋右丞林茂，由晋安迁居莆田北螺村。又五世而至林万宠，唐开元间任高平太守，生三子：韬、披、昌。韬公之孙攒，唐德宗立双阙以旌表其孝，时号"阙下林家"。昌公字茂吉，乃万宠公第三子，官兵部司马，配宋氏，生一子名萍。萍于唐贞元间明经及第，官沣洲司马(后追赠中宪大夫)。唐太和年间归隐后，迁居仙游游洋，世称“游洋林”；其后裔居游洋后迁移漳州漳浦路下，由路下林第四房平和
在一台Ubuntu计算机上构建Hyperledger Fabric网络落叶无声9 区块链超级账本 Hyperledger fabric 区块链 ubuntu 构建 hyperledger fabric
在一台Ubuntu计算机上构建HyperledgerFabric网络Hyperledgerfabric是一个开源的区块链应用程序平台，为开发基于区块链的应用程序提供了一个起点。当我们提到HyperledgerFabric网络时，我们指的是使用HyperledgerFabric的正在运行的系统。即使只使用最少数量的组件，部署Fabric网络也不是一件容易的事。Fabric社区创建了一个名为Cello
MYSQL面试系列-04 king01299 面试 mysql 面试
MYSQL面试系列-0417.关于redolog和binlog的刷盘机制、redolog、undolog作用、GTID是做什么的？innodb_flush_log_at_trx_commit及sync_binlog参数意义双117.1innodb_flush_log_at_trx_commit该变量定义了InnoDB在每次事务提交时，如何处理未刷入（flush）的重做日志信息（redolog）。它
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
大伟说成语之唉声叹气求索大伟
＊大伟说成语＊【唉声叹气】叹气：因心里不痛快或不如意而吐出长气，发出声音。因为痛苦、憋闷或感伤而发出叹息的声音。【大伟说】情绪外露，非人类所特有，动物亦有情绪，悲哀和欢乐所表示的情绪亦是不一样的，会嗷嗷大叫也会低吟痛哭。不同的是，人类的情绪更复杂，更多样，更丰富。唉声叹气，可以说是最基础的情绪，因为无奈而举足无措，不知该如何如何化解，只有独自一人慢慢承受，长吁短叹不知如何是好，其实是无能无力的表现
libyuv之linux编译 jaronho Linux linux 运维服务器
文章目录一、下载源码二、编译源码三、注意事项1、银河麒麟系统（aarch64）（1）解决armv8-a+dotprod+i8mm指令集支持问题（2）解决armv9-a+sve2指令集支持问题一、下载源码到GitHub网站下载https://github.com/lemenkov/libyuv源码，或者用直接用git克隆到本地，如：gitclonehttps://github.com/lemenko
怎么做淘客赚钱(2022最新免费淘客盈利的方法) 高省_飞智666600
很多人都不知道什么是淘宝客，今天小编为大家解答一下吧。淘宝客，现在简称淘客，是时下比较流行的一个词语，特质为淘宝店推广商品获取提成的人，这些人没有自己的产品，只是在淘宝里面选择适合自己的产品，在自己比较熟悉的领域推广，把产品卖出去之后，会从淘宝店家那里获得百分之五到百分之五十左右的佣金。淘宝客付出的是什么呢？时间。你需要花时间去选适合自己推广的产品，需要花时间去选自己的推广方法，如果你打算自己做个
数据仓库——维度表一致性墨染丶eye 背诵数据仓库
数据仓库基础笔记思维导图已经整理完毕，完整连接为：数据仓库基础知识笔记思维导图维度一致性问题从逻辑层面来看，当一系列星型模型共享一组公共维度时，所涉及的维度称为一致性维度。当维度表存在不一致时，短期的成功难以弥补长期的错误。维度时确保不同过程中信息集成起来实现横向钻取货活动的关键。造成横向钻取失败的原因维度结构的差别，因为维度的差别，分析工作涉及的领域从简单到复杂，但是都是通过复杂的报表来弥补设计
HQL之投影查询归来朝歌 HQL Hibernate 查询语句投影查询
在HQL查询中，常常面临这样一个场景，对于多表查询，是要将一个表的对象查出来还是要只需要每个表中的几个字段，最后放在一起显示？针对上面的场景，如果需要将一个对象查出来： HQL语句写“from 对象”即可 Session session = HibernateUtil.openSession();
Spring整合redis bylijinnan redis
pom.xml <dependencies>  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redi
org.hibernate.NonUniqueResultException: query did not return a unique result: 2 0624chenhong Hibernate
参考：http://blog.csdn.net/qingfeilee/article/details/7052736 org.hibernate.NonUniqueResultException: query did not return a unique result: 2 在项目中出现了org.hiber
android动画效果不懂事的小屁孩 android动画
前几天弄alertdialog和popupwindow的时候，用到了android的动画效果，今天专门研究了一下关于android的动画效果，列出来，方便以后使用。 Android 平台提供了两类动画。一类是Tween动画，就是对场景里的对象不断的进行图像变化来产生动画效果（旋转、平移、放缩和渐变）。第二类就是 Frame动画，即顺序的播放事先做好的图像，与gif图片原理类似。
js delete 删除机理以及它的内存泄露问题的解决方案换个号韩国红果果 JavaScript
delete删除属性时只是解除了属性与对象的绑定，故当属性值为一个对象时，删除时会造成内存泄露（其实还未删除）举例： var person={name:{firstname:'bob'}} var p=person.name delete person.name p.firstname -->'bob' // 依然可以访问p.firstname，存在内存泄露
Oracle将零干预分析加入网络即服务计划蓝儿唯美 oracle
由Oracle通信技术部门主导的演示项目并没有在本月较早前法国南斯举行的行业集团TM论坛大会中获得嘉奖。但是，Oracle通信官员解雇致力于打造一个支持零干预分配和编制功能的网络即服务（NaaS）平台，帮助企业以更灵活和更适合云的方式实现通信服务提供商（CSP）的连接产品。这个Oracle主导的项目属于TM Forum Live!活动上展示的Catalyst计划的19个项目之一。Catalyst计
spring学习——springmvc（二） a-john springMVC
Spring MVC提供了非常方便的文件上传功能。 1，配置Spring支持文件上传： DispatcherServlet本身并不知道如何处理multipart的表单数据，需要一个multipart解析器把POST请求的multipart数据中抽取出来，这样DispatcherServlet就能将其传递给我们的控制器了。为了在Spring中注册multipart解析器，需要声明一个实现了Mul
POJ-2828-Buy Tickets aijuans ACM_POJ
POJ-2828-Buy Tickets http://poj.org/problem?id=2828 线段树，逆序插入 #include<iostream>#include<cstdio>#include<cstring>#include<cstdlib>using namespace std;#define N 200010struct
Java Ant build.xml详解 asia007 build.xml
1,什么是antant是构建工具2,什么是构建概念到处可查到，形象来说，你要把代码从某个地方拿来，编译，再拷贝到某个地方去等等操作，当然不仅与此，但是主要用来干这个3,ant的好处跨平台 --因为ant是使用java实现的，所以它跨平台使用简单--与ant的兄弟make比起来语法清晰--同样是和make相比功能强大--ant能做的事情很多，可能你用了很久，你仍然不知道它能有
android按钮监听器的四种技术百合不是茶 android xml配置监听器实现接口
android开发中经常会用到各种各样的监听器,android监听器的写法与java又有不同的地方; 1,activity中使用内部类实现接口 ,创建内部类实例使用add方法与java类似创建监听器的实例 myLis lis = new myLis(); 使用add方法给按钮添加监听器
软件架构师不等同于资深程序员 bijian1013 程序员架构师架构设计
本文的作者Armel Nene是ETAPIX Global公司的首席架构师，他居住在伦敦，他参与过的开源项目包括 Apache Lucene,，Apache Nutch， Liferay 和 Pentaho等。如今很多的公司
TeamForge Wiki Syntax & CollabNet User Information Center sunjing TeamForge How do Attachement Anchor Wiki Syntax
the CollabNet user information center http://help.collab.net/ How do I create a new Wiki page? A CollabNet TeamForge project can have any number of Wiki pages. All Wiki pages are linked, and
【Redis四】Redis数据类型 bit1129 redis
概述 Redis是一个高性能的数据结构服务器，称之为数据结构服务器的原因是，它提供了丰富的数据类型以满足不同的应用场景，本文对Redis的数据类型以及对这些类型可能的操作进行总结。 Redis常用的数据类型包括string、set、list、hash以及sorted set.Redis本身是K/V系统，这里的数据类型指的是value的类型，而不是key的类型，key的类型只有一种即string
SSH2整合-附源码白糖_ eclipse spring tomcat Hibernate Google
今天用eclipse终于整合出了struts2+hibernate+spring框架。我创建的是tomcat项目，需要有tomcat插件。导入项目以后，鼠标右键选择属性，然后再找到“tomcat”项，勾选一下“Is a tomcat project”即可。具体方法见源码里的jsp图片，sql也在源码里。补充1：项目中部分jar包不是最新版的，可能导
[转]开源项目代码的学习方法 braveCS 学习方法
转自： http://blog.sina.com.cn/s/blog_693458530100lk5m.html http://www.cnblogs.com/west-link/archive/2011/06/07/2074466.html 1）阅读features。以此来搞清楚该项目有哪些特性2）思考。想想如果自己来做有这些features的项目该如何构架3）下载并安装d
编程之美-子数组的最大和（二维） bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; import java.util.Random; public class MaxSubArraySum2 { /** * 编程之美子数组之和的最大值（二维） */ private static final int ROW = 5; private stat
读书笔记-3 chengxuyuancsdn jquery笔记 resultMap配置 ibatis一对多配置
1、resultMap配置 2、ibatis一对多配置 3、jquery笔记 1、resultMap配置当<select resultMap="topic_data"> <resultMap id="topic_data">必须一一对应。 (1)<resultMap class="tblTopic&q
[物理与天文]物理学新进展 comsci
如果我们必须获得某种地球上没有的矿石,才能够进行某些能量输出装置的设计和建造,而要获得这种矿石,又必须首先进行深空探测,而要进行深空探测,又必须获得这种能量输出装置,这个矛盾的循环,会导致地球联盟在与宇宙文明建立关系的时候,陷入困境怎么办呢?
Oracle 11g新特性:Automatic Diagnostic Repository daizj oracle ADR
Oracle Database 11g的FDI（Fault Diagnosability Infrastructure）是自动化诊断方面的又一增强。 FDI的一个关键组件是自动诊断库（Automatic Diagnostic Repository-ADR）。在oracle 11g中，alert文件的信息是以xml的文件格式存在的，另外提供了普通文本格式的alert文件。这两份log文
简单排序:选择排序 dieslrae 选择排序
public void selectSort(int[] array){ int select; for(int i=0;i<array.length;i++){ select = i; for(int k=i+1;k<array.leng
C语言学习六指针的经典程序，互换两个数字 dcj3sjt126com c
示例程序，swap_1和swap_2都是错误的，推理从1开始推到2，2没完成，推到3就完成了 # include <stdio.h> void swap_1(int, int); void swap_2(int *, int *); void swap_3(int *, int *); int main(void) { int a = 3; int b =
php 5.4中php-fpm 的重启、终止操作命令 dcj3sjt126com PHP
php 5.4中php-fpm 的重启、终止操作命令: 查看php运行目录命令：which php/usr/bin/php 查看php-fpm进程数：ps aux | grep -c php-fpm 查看运行内存/usr/bin/php -i|grep mem 重启php-fpm/etc/init.d/php-fpm restart 在phpinfo()输出内容可以看到php
线程同步工具类 shuizhaosi888 同步工具类
同步工具类包括信号量（Semaphore）、栅栏（barrier）、闭锁（CountDownLatch）闭锁（CountDownLatch） public class RunMain { public long timeTasks(int nThreads, final Runnable task) throws InterruptedException { fin
bleeding edge是什么意思 haojinghua DI
不止一次，看到很多讲技术的文章里面出现过这个词语。今天终于弄懂了——通过朋友给的浏览软件，上了wiki。我再一次感到，没有辞典能像WiKi一样，给出这样体贴人心、一清二楚的解释了。为了表达我对WiKi的喜爱，只好在此一一中英对照，给大家上次课。 In computer science, bleeding edge is a term that
c中实现utf8和gbk的互转 jimmee c iconv utf8&gbk编码
#include <iconv.h> #include <stdlib.h> #include <stdio.h> #include <unistd.h> #include <fcntl.h> #include <string.h> #include <sys/stat.h> int code_c
大型分布式网站架构设计与实践 lilin530 应用服务器搜索引擎
1.大型网站软件系统的特点？ a.高并发，大流量。 b.高可用。 c.海量数据。 d.用户分布广泛，网络情况复杂。 e.安全环境恶劣。 f.需求快速变更，发布频繁。 g.渐进式发展。 2.大型网站架构演化发展历程？ a.初始阶段的网站架构。应用程序，数据库，文件等所有的资源都在一台服务器上。 b.应用服务器和数据服务器分离。 c.使用缓存改善网站性能。 d.使用应用
在代码中获取Android theme中的attr属性值 OliveExcel android theme
Android的Theme是由各种attr组合而成, 每个attr对应了这个属性的一个引用, 这个引用又可以是各种东西. 在某些情况下, 我们需要获取非自定义的主题下某个属性的内容 (比如拿到系统默认的配色colorAccent), 操作方式举例一则: int defaultColor = 0xFF000000; int[] attrsArray = { andorid.r.
基于Zookeeper的分布式共享锁 roadrunners zookeeper 分布式共享锁
首先，说说我们的场景，订单服务是做成集群的，当两个以上结点同时收到一个相同订单的创建指令，这时并发就产生了，系统就会重复创建订单。等等......场景。这时，分布式共享锁就闪亮登场了。共享锁在同一个进程中是很容易实现的，但在跨进程或者在不同Server之间就不好实现了。Zookeeper就很容易实现。具体的实现原理官网和其它网站也有翻译，这里就不在赘述了。官
两个容易被忽略的MySQL知识 tomcat_oracle mysql
1、varchar(5)可以存储多少个汉字，多少个字母数字？　　相信有好多人应该跟我一样，对这个已经很熟悉了，根据经验我们能很快的做出决定，比如说用varchar(200)去存储url等等，但是，即使你用了很多次也很熟悉了，也有可能对上面的问题做出错误的回答。　　这个问题我查了好多资料，有的人说是可以存储5个字符，2.5个汉字（每个汉字占用两个字节的话），有的人说这个要区分版本，5.0
zoj 3827 Information Entropy(水题) 阿尔萨斯 format
题目链接：zoj 3827 Information Entropy 题目大意：三种底，计算和。解题思路：调用库函数就可以直接算了，不过要注意Pi = 0的时候，不过它题目里居然也讲了。。。limp→0+plogb(p)=0，因为p是logp的高阶。 #include <cstdio> #include <cstring> #include <cmath&