椒椒。

多模态信息抽取（一）——融合知识图谱和多模态的文本分类研究（论文研读）

融合知识图谱和多模态的文本分类研究

引言：
1 相关工作
- 1.1文本分类
- 1.2知识融合
- 1.3多模态融合
2 融合知识图谱和多模态的文本分类模型
- 2.1文本特征表示
- 2.2实体特征表示
2.3图像特征表示
2.4输入层
- 2.5训练与分类
3实验
- 3.1数据集与评价方法
- 3.2 实验环境与模型参数
- 3.3对比实验结果与分析
4结术语
参考文献:

摘要：传统文本分类方法主要是基于单模态数据所驱动的经验主义统计学习方法，缺乏对数据的理解能力，鲁棒性较差，单个模态的模型输入也难以有效分析互联网中越来越丰富的多模态化数据。针对此问题提出两种提高分类能力的方法：引入多模态信息到模型输入，旨在弥补单模态信息的局限性；引入知识图谱实体信息到模型输入，旨在丰富文本的语义信息，提高模型的泛化能力。模型使用Bert提取文本特征，改进的ResNet提取图像特征，TransE提取文本实体特征，通过前期融合方式输入到Bert模型中进行分类，在研究多标签分类问题的MM-IMDB数据集上F1值达到66.5%，在情感分析数据集Twitter15&17上ACC值达到71.1%，结果均优于其他模型。实验表明，引入多模态信息和实体信息能够提高模型的文本分类能力。

引言：

随着互联网技术的飞速发展和广泛普及，各种模态的数据井喷式涌现，信息的爆炸式增长也为人们带来了新的挑战：面对如此繁杂的多模态化数据，如何从中挖掘出被大众需要的、有价值的信息，是现阶段的一个重要课题。面对模态多样且价值密度低的海量数据，必须要同应用背景深度结合，运用自动化手段对数据进行分类，以便更好的挖掘数据中的价值。在这样的背景下，文本分类方法体现出愈发重要的研究价值。
文本分类是自然语言处理领域的一项经典子任务，指的是将一段文本归类到一个或多个类别之中。目前，文本分类方法主要分为基于机器学习的方法和基于深度学习的方法。常见的机器学习方法包括朴素贝叶斯分类[1]、支持向量机分类[2]、K近邻分类[3]等。
近年来，随着深度学习[4]的迅速发展，各种神经网络模型如雨后春笋般涌现，常见的神经网络模型包括卷积神经网络（ConvolutionalNeuralNetworks,CNN）[5]、循环神经网络（RecurrentNeuralNetwork,RNN）[6]等。深度学习的方法在图像、音频等领域都率先取得了惊人的成果，但在词向量模型出现之前，深度学习在自然语言处理领域发展并不理想，主要原因是神经网络难以处理高纬度、高稀疏的文本表示。Word2Vec[7]的提出为深度学习在NLP领域开辟了道路，它采用分布式表示的词向量代替传统的独热向量，解决了文本表示的问题，常见的词向量模型包括Word2Vec、ELMo[8]、GPT[9]、BERT[10]等。使用神经网络模型来训练词向量语言模型，可以自动提取词向量特征，免去了繁杂的人工特征工程，训练得到的词向量还可以进行灵活的迁移学习。
目前，依赖于大规模的训练数据以及高性能GPU、TPU提供的强大计算能力，以BERT为基线的神经网络模型大放异彩，在许多应用场景都取得了更好的效果。但是，目前的深度学习文本分类方法仍是单模态数据驱动的方法，数据中可挖掘的信息量存在一定局限性，模型的泛化能力和鲁棒性存在不足。针对这些问题，本文提出两种提高分类能力的方法：
（1）引入多模态信息。随着互联网技术的发展，如今的信息呈现多模态化，每一种信息的来源或形式都是一种模态，比如文本模态、音频模态、图像模态等。然而，近来的文本分类方法大多仍处于单模态阶段，其中可挖掘的信息量存在一定的局限性。引入多模态，旨在弥补单模态信息的局限性，多模态之间的互补性与冗余性也削弱了单模态信息受噪声的影响，提高了整个模型的稳定性。
（2）引入知识图谱。知识图谱是结构化的知识表示系统，包含复杂的结构化信息，已经被广泛用于搜索引擎、问答系统等领域。引入知识图谱，旨在为模型提供额外的知识信息，让模型拥有理解能力、联想能力，提高模型的泛化能力。

1 相关工作

本节主要从三个角度阐述：①从单模态角度简述文本分类方法的相关工作；②从知识图谱角度简述知识融合的相关工作；③从多模态角度简述多模态特征融合的相关工作。

1.1文本分类

Word2Vec的提出使深度学习的文本分类方法成为了潮流。学者们开始结合词向量与神经网络模型来进行文本分类。RNN在处理当前时刻的状态时引入了上一时刻隐藏层的值，使模型拥有了一定的记忆能力，适合处理序列信息，在自然语言处理领域中更常用，但序列过长时会出现长期依赖问题。LSTM[11]模型是为了解决RNN的长期依赖问题提出的，在标准的RNN单元上添加门控机制，使得梯度问题得以缓解，但是这个问题仍然存在。CNN在文本分类上也有许多研究成果，Kim提出TextCNN[12]来进行文本分类，通过词向量构建了一个句子矩阵，每行都是一个词向量，随后通过CNN来进行特征提取，取得了不错的效果。Kalchbrenner等人[13]提出了动态CNN模型DCNN，模型在池化层使用了k-max-pooling和动态k-max-pooling，k-max-pooling可以在提取活跃特征的同时保持它们的相对顺序，动态k-max-pooling则在句子长度不同时提取出相应数量的特征，保证后续卷积层的统一。
CNN和RNN在文本分类任务中都取得了很好的效果，但是其几乎不具备可解释性。注意力机制（Attention）是深度学习领域的一个核心技术，也被广泛应用于自然语言处理领域，它模仿人类的视觉注意力，能够计算出各个单词对结果的贡献，同时注意力机制有良好的可视化操作，能够为模型提供一定的可解释性。Bahdanau等人[14]使用Attention机制在机器翻译任务上，取得了显著的成果，第一次将Attention机制应用到自然语言处理领域中，随后Attention机制又被大量应用在基于CNN、RNN的网络模型上。2017年Google团队[15]提出了一种全新的神经网络架构Transformer，Transformer完全摒弃了RNN与CNN，仅使用基于self-attention的注意力机制，佐以多头注意力机制、位置编码、前馈神经网络、残差连接、层归一化等技术，在11项NLP领域任务上刷新了性能记录。目前以BERT为首的预训练语言模型就基于Transformer，BERT的出现在整个自然语言处理领域都是里程碑式的，在各项任务上都显著刷新了记录，后续的大量自然语言处理研究都是基于BERT的改进。

1.2知识融合

人类能够理解语言，一个重要原因是拥有相关的先验背景知识。目前的自然语言处理算法，主要基于海量数据的统计拟合来挖掘文本的语义信息，忽略了先验知识的作用，无法提取语言的深层关联与特征，一定程度上限制了其性能上限。因此，要实现具有理解能力的自然语言处理算法，还需要丰富的领域知识来引导和推理。
知识图谱是将知识结构化表示的知识系统，包含了复杂的领域知识、通用规则和其他的结构化信息，如WikiData[16]、YAGO[17]、DBpedia[18]、WordNet[19]等大规模知识图谱，被广泛应用于搜索引擎、问答系统等基于知识驱动的人工智能领域中。将知识图谱引入到自然语言处理中，能够让模型从知识图谱中提取额外的先验知识，例如文本中隐含的实体概念、实体关系、实体描述等信息，从而丰富文本的上下文语义信息。Wang等人[20]利用Microsoft提供的概念图谱将文本概念化，使用CNN联合训练文本向量与概念向量，得到了结合概念知识的文本特征表示。Chen等人[21]进一步使用双向LSTM和注意力机制来处理概念与文本的关系以及概念之间的关系，取得了更好的文本表示效果。得益于BERT的出现，一些基于BERT的结合知识图谱的预训练语言模型被提出，比如清华和华为提出的ERNIE[22]，结合知识图谱使用TransE算法获得文本中包含的实体向量信息并嵌入到BERT中；北大和腾讯联合提出的K-BERT[23]将关联实体在知识图谱中的三元组信息注入到文本中，得到一个富含语义信息的句子树来进一步进行预训练，都取得了显著的效果。

1.3多模态融合

每一种信息的来源或形式都可以称作一种模态，例如人有触觉、听觉、嗅觉；信息的媒介有文字、语音、图像等，都是一种模态。多模态机器学习（MultiModalMachineLearning,MMML），旨在通过机器学习的方法实现处理和理解多模态信息的能力。目前比较热门的研究方向是图像、文字、音频、视频等模态之间的多模态学习。多模态学习的优势在于弥补了单模态信息的局限性，受单个模态中的噪声影响较小，各模态之间具有冗余性和互补性，合理处理多模态信息，就能得到具有更加丰富特征的信息，从而提升整个模型的性能。
多模态融合是多模态学习的主要研究方向之一，它将从不同模态数据中提取的信息集成到一个稳定的多模态表征中。多模态融合按照融合的层次划分，大致可以分为早期融合和晚期融合。Anastasopoulos等人[24]对不同模态的特征向量直接使用简单的拼接操作。Zadeh等人[25]提出了基于矩阵的TFN（TensorFusionNetwork），使用矩阵运算对不同模态的特征向量作外积来融合多模态信息。Nam等人[26]在多模态融合过程中加入注意力机制来捕捉视觉和语言模态间的联系，在VQA和图像文本匹配任务上达到了很好的效果。BERT在文本领域的成功，也让一些多模态预训练模型架构被提出，比如基于双流模型的ViLBERT[27]、基于单流模型的VisualBERT[28]等，它们将图像和文本数据一同输入到Transformer中，使用Transformer强大的特征提取能力提取融合的多模态特征，其中ViLBERT使用双流模型分别处理图像和文本数据，在后期进行特征融合，而VisualBERT等单流模型直接在前期将视觉特征和文本特征融合输入到模型中。后续研究中，Alberti等人[29]通过实验和详细的分析表明使用早期融合方式的单流模型更具有优势。随后Kiela等人[30]提出使用单模态预训练模型组件来构建多模态架构，不需要进行多模态任务上的预训练，直接在BERT模型上进行Fine-tuning就能取得与多模态预训练模型具有竞争力的性能。
在以上论述方法的启发下，本文针对目前的文本分类模型尚不能有效利用多模态信息，并且缺乏理解能力的问题，结合知识融合和多模态融合两种提升文本表征能力的方法，构建了一个融合知识图谱和多模态的文本分类模型，模型利用不同模态间的信息相互补充，提高了模型的稳定性，知识的引入也使模型能够利用大规模知识图谱中的结构化知识。实验证明，本文提出的方法能够提升模型的分类性能。
本文的主要贡献有：（1）提出了一种同时融合知识图谱、图像以及文本信息的多模态文本分类方法。（2）在图像的引入上，对ResNet模型进行了改进，提升了多模态模型的分类能力。（3）在知识图谱的引入上，提出了将知识图谱实体信息引入到多模态文本分类中的思想，并设计了一套完整的引入流程。（4）通过实验比较了早期融合与晚期融合方式的效果差异。

2 融合知识图谱和多模态的文本分类模型

本文提出的融合知识图谱和多模态的文本分类模型如图1所示。该模型充分结合了文本、实体、图像三种模态信息的特征表示，其中文本特征表示由BERT预训练语言模型生成，实体特征表示通过实体链接提取文本中包含的实体，利用TransE算法生成对应的实体向量，图像特征表示由基于ResNet152预训练模型的改进模型生成。

2.1文本特征表示

BERT(BidirectionalEncoderRepresentationsfromTransformers)是在大规模语料库上进行自监督学习的预训练语言模型，通过在未标注文本上进行MLM随机掩盖和NSP预测下一句两种语言模型任务的预训练来学习语言的内部表征，既可以直接使用其进行下游任务，也可用来提取对下游任务有用的文本特征。本文使用bert-base-uncased模型来生成对应文本的词向量。

2.2实体特征表示

知识图谱本质上是一个基于图结构的语义网络，由节点和边组成，每个节点表示一个实体，每条边表示实体间的一种关系。实体可以是具体的事物，也可以是概念或属性。引入知识图谱中的外部知识到模型中主要有两个重要步骤：实体链接和实体表示学习。
实体链接的主要任务是将一段文本中提及到的关于实体的语言片段（mention）链接到知识图谱中对应的实体（entity）上。本文使用BLINK[31]来检索文本中提及的实体，对应的知识图谱为Wikidata。BLINK将实体链接任务分为两个阶段，首先使用Bi-encoder对mention及其上下文、entity及其描述分别编码得到各自的向量表示，并根据相似度排序获取候选实体candidate，然后将上阶段取得的candidate和mention特征向量连接并使用Cross-encoder编码排序，选出最优实体，模型各阶段使用的编码器都基于独立的预训练的BERT模型。通过BLINK，对于一段给定文本Text{t1,…tn,}可以得到文本对应的实体集Entity{e1,…es,}每个实体信息都记录着其在维基数据网站上的入口信息。利用这些入口信息，再结合一定的转换操作，就可以得到这些实体对应的Wikidata实体“QID”，比如JayChou对应Q238819。
实体表示学习的目的在于将以实体三元组为存储形式的知识图谱转化为深度学习常用的分布式表示向量形式。本文使用TransE模型[32]获取实体的分布式向量表示。TransE是Bordes等人提出的知识表示学习算法，是Trans系列方法的基础，它借鉴词向量的思想，将实体和关系映射到同一个低维向量空间中，关系被解释为实体之间在向量空间中的平移操作，这样对于一个三元组(h,r,t),其中h、r、t分别代表三元组的头实体、关系和尾实体的向量表示，TransE希望它们满足t=h+r。因此TransE定义了如下损失函数：

其中d(.)表示两个向量的距离，这个距离可以为L1或L2范数，S’表示负例三元组，通过将正例三元组的头实体或尾实体替换为其他随机实体来构造，[.]+表示只取结果为正的部分，r是一个超参数，用来控制正负例的距离。损失函数的目的是让正例三元组中(h+r)与t距离最小，同时正例三元组中实体尽可能远离负例三元组中的其他实体。本文使用OpenKE[33]来提取基于TransE的实体向量表示。
通过实体链接和实体表示学习，可以得到实体集的向量表示，再经过一层多头自注意力层处理得到实体特征表示。

2.3图像特征表示

深度残差网络（DeepResidualNetwork，ResNet）[34]的出现是卷积神经网络在图像处理领域史上的里程碑事件，其提出的残差网络让深度学习的“深度”优势得以显现。理论上讲，更深层的神经网络能够进行更加复杂的特征提取，捕获更抽象的特征，深层网络应比浅层网络取得更好的效果，至少不会更差。然而事实上，56层的神经网络在CIFAR-10数据集上的效果远不如20层的神经网络，层数的加深反而使网络退化了。针对这个问题，ResNet提出了残差学习的思想，让层数的加深不会让网络效果变差，从而解决了深度网络的退化问题。
残差学习的思想假设一个神经网络已经在某一层取得最优结果，其后的深层网络是冗余的，如果能够让这些冗余层完成一个恒等映射，使冗余层的输入与输出不变，就能使网络一直保存最优层的输出结果。残差网络通过引入一个残差模块来达到恒等映射效果,残差模块如图2所示。对于一个冗余的网络层，假设输入为x，在引入残差模块前，网络学习到的参数应满足线性变换H(x)=x；引入残差模块后，H(x)=F(x)，这样网络参数只需要满足令残差F(x)=0，相较于直接学习H(x)=x更加容易。
ResNet152模型在进行了大量的卷积操作后，直接对图像做了一次全局平局池化操作，将7×7的特征图压缩为1×1的矩阵，从而捕获特征图的全局特征用于分类。这种方法在一定程度上损失了图像中局部特征蕴含的语义信息和位置信息，本文借鉴了Vit[35]对图像的处理方式，将ResNet152卷积操作后最终提取的特征图分割为均等的子特征图，并将这些子特征图按照线性顺序排列作为图像的特征表示。本文改进后的图像特征提取模型结构如图3所示。
本文把将特征图分割为子特征图并线性排列的操作称为UP（UnfoldPatches），经过UP操作后，可以得到蕴含位置信息的图像特征表示，这些位置信息能够辅助Transformer模型更全面地理解图像，提取到图像中的语义信息，更好的辅助文本模态进行文本分类。

2.4输入层

正如1.3节所述，晚期融合的方式会忽略掉各模态之间的互信息。本文在多模态特征的融合方式上采用早期融合的方式，并利用Transformer模型的强大特征提取能力与多头自注意力机制来学习各模态的融合权重。类似于BERT对文本模态数据的处理方式，各个模态的输入向量由特征表示向量、位置编码向量和段向量叠加而成。由于在图像模态数据的特征表示方法中引入了UP操作，需要考虑子特征图的顺序关系，因此图像模态的输入向量中也需要叠加位置编码向量来学习这些位置信息。同时为了保持模型整体一致性，以及实体信息中可能蕴含的位置信息，模型在处理实体输入向量时也加入了位置编码。段向量的作用则是为了让BERT能够区分出输入向量分别来自不同的模态。
取得到各模态的输入向量后，以级联的方式将其拼接在一起，不同模态之间用特殊标记[SEP]分隔开，输入到预训练的BERT模型进行Fine-tuning训练。输入层的输入向量最终形式可表示为:

2.5训练与分类

各模态特征表示经过模型输入层处理后,输入到BERT模型中进行训练,选取模型输出的[CLS]标签位置的隐藏向量作为分类任务所需的特征向量,模型的最后用全连接层作为分类器,输出一个C维的向量,其中C为分类类别数,第i个维度表示输入被分为第i个类别的概率｡
本文是一个多标签分类问题,使用BCE With LogitsLoss作为损失函数来训练模型,该损失函数是激活函数Sigmoid和二分类交叉熵BCELoss(BinaryCrossEntropy)的组合,并且使用了Log-Sum-Exp的技巧来增强数值稳定性｡使用带有权重衰减修正的BertAdam优化器来更新模型参数｡

3实验

3.1数据集与评价方法

MM-IMDB数据集[36]由Arevalo等人提供,该数据集由IMDB网站提供的电影情节大纲与电影海报构成,并按照电影体裁对电影进行分类,每个电影都可能被分类为多种体裁,体裁共有25个种类,因此这是一个多标签分类问题｡整个数据集包含25891条文本以及对应的海报图片｡本文又在其基础上扩充了每条文本包含的实体信息｡实验中数据集按照60%,10%,30%的比例被分为训练集､验证集与测试集｡
在多标签分类问题中,模型性能的评价方法相较传统分类问题更复杂｡本文选用了两种评价指标:MicroF1和MacroF1｡其中MicroF1同时计算所有预测的F1值,MacroF1计算每个标签的F1值并取平均结果,各评价指标的计算公式如下:
其中precision为精确率,即被预测为正的样本中实际为正的比例,recall为召回率,即原本为正的样本中被预测为正的比例｡F1值则权衡了精确率和召回率,是二者的调和平均数｡N指的是标签的种类数｡MicroPrecision和MicroRecall是同时计算所有类别的总精确率和总召回率。

3.2 实验环境与模型参数

本文实验主要基于Pytorch深度学习框架与pytorch_pretrained_bert库，GPU为RTX3090，Cuda11.0，部分模型参数如表
1：

3.3对比实验结果与分析

本文分别使用单模态信息和多模态融合信息进行了一系列对比实验来验证本文方法的有效性：
1）Bert预训练模型（TextOnly）.使用Bert预训练模型对单模态的文本数据进行训练与分类。
2）ResNet152预训练模型（ImageOnly）.使用ResNet152预训练模型对单模态的图像数据进行训练与分类。
3）MMBT模型（MultimudalBitransformer）.文献[30]所提出的多模态分类模型，也是本实验的基线模型之一。分别使用BERT提取文本特征表示，使用ResNet152提取图像特征表示，并级联拼接输入到BERT进行训练与分类。
4）UP_E_MMBT模型（UnfoldPatches-Entity-MMBT）.本文提出的主要模型，在MMBT模型的基础上，在图像的特征提取中引入UP操作，得到了包含位置信息的图像特征表示。同时，本文还引入了实体向量，使用TransE方法训练Wikidata获得实体向量，进一步提升模型的性能。
5）晚期融合模型（LateConcat）：晚期融合对不同模态的数据分别进行训练，然后再进行融合并输入分类器进行训练与分类。本实验将各模态的特征表示进行了一系列晚期融合实验。实验使用Bert作为文本的特征提取器，使用ResNet或基于ResNet改进的模型作为图像的特征提取器，使用TransE方法训练Wikidata提取实体特征。
实验结果如表2所示，为验证方法的有效性，各模型的实验参数（除模型新增参数）和实验环境保持完全一致。
从实验结果可以看出：
1）单模态的情况下，文本信息的分类效果优于图像信息，一方面这是由于相较于图像，文本更容易挖掘出其蕴含的语义信息，另一方面则是由分类任务的性质决定的，多模态文本分类任务中的图像信息所表达的内容往往是抽象的、不具体的，仅依靠单模态的图像信息难以支撑模型进行有效的分类决策。
2）多模态融合的情况下，各模型的分类效果均优于单模态情况，这说明为模型引入图像信息和实体知识信息能够提升模型的分类性能。引入图像能够补充文本中没有的语义信息，引入实体知识能够使模型获取额外的先验知识，这些信息都可以帮助模型做出更科学的分类决策，提升模型的分类性能。
3）多模态早期融合的方式取得了更好的效果，这说明在多模态融合时利用自注意力机制进行早期融合能够让模型更好地学习到各模态对分类结果的贡献度。UP_E_MMBT的表现优于MMBT，说明本文对图像特征表示的改进，即对图像特征图的UP操作能够提取图像中更深层的语义信息。
4）多模态晚期融合的效果并不理想，甚至不如纯粹的Bert模型，这是因为直接拼接会忽略各模态对分类结果的贡献权重，但是从实验结果仍然可以看出，引入图像和实体知识以及引入图像UP操作后，模型性能会得到提升，这可以佐证本文提出方法的有效性。

4结术语

多模态学习为传统的基于单模态的分类模型带来了新的机遇与挑战，本文基于多模态和知识图谱两个新兴热点，提出了融合知识图谱和多模态的文本分类模型，使用各模态上先进的特征提取器提取特征向量，再通过Bert预训练模型提取各模态融合后的深层语义信息，取得了良好的效果。本文对ResNet模型做出了改进，在模型的尾部引入UP操作，获得了蕴含位置信息的图像特征表示，并取得了相较于原模型更好的效果。本文还提出了将实体知识应用到多模态模型的思想，并设计了一套引ComputerEngineeringandApplications9入实体的流程，取得了良好的效果。
需要注意的是，本文的工作还有进一步的空间，实验方面可以在其他数据集上进一步研究模型的有效性和泛化能力，模型细节上可以在连接各模态特征时进一步考虑各自的权重，文本的实体链接和特征表示方法可以采用更成熟的处理方式，知识图谱的选择上可以针对具体的下游任务选用更专业的领域知识图谱。

参考文献:

[1]贺鸣,孙建军,成颖.基于朴素贝叶斯的文本分类研究综述[J].情报科学,2016,34(7):147-154.HeMing,SunJian-jun,Chengying.TextClassificationBasedonNaiveBayes:AReview[J].InformationScience,2016,34(7):147-154.
[2]崔建明,刘建明,廖周宇.基于SVM算法的文本分类技术研究[J].计算机仿真,2013,30(2):299-302.CuiJian-ming,LiuJian-ming,LiaoZhou-yu.ResearchofTextCategorizationBasedonSupportVectorMachine[J].ComputerSimulation,2013,30(2):299-302.
[3]张宁,贾自艳,史忠植.使用KNN算法的文本分类[J].计算机工程,2005,31(8):171-172.ZhangNing,JiaZi-yan,ShiZhong-zhi.TextCategorizationwithKNNAlgorithm[J].ComputerEngineering,2005,31(8):171-172.
[4]HintonGE,SalakhutdinovRR.ReducingtheDimensionalityofDatawithNeuralNetworks[J].Science,2006,313(5786):504-507.
[5]LecunY,BottouL.Gradient-basedlearningappliedtodocumentrecognition[J].ProceedingsoftheIEEE,1998,86(11):2278-2324.
[6]LiuP,QiuX,HuangX.RecurrentNeuralNetworkforTextClassificationwithMulti-TaskLearning[J].AAAIPress,2016:2873-2879.
[7]MikolovT,ChenK,CorradoG,etal.EfficientEstimationofWordRepresentationsinVectorSpace[J].arXivpreprintarXiv:1301.3781,2013.
[8]PetersM,NeumannM,IyyerM,etal.DeepContextualizedWordRepresentations[C]//Proceedingsofthe2018ConferenceoftheNorthAmericanChapteroftheAssociationforComputationalLinguistics:HumanLanguageTechnologies(HLT-NAACL),Volume1(LongPapers).2018.2227-2237.
[9]RadfordA,NarasimhanK,SalimansT.ImprovingLanguageUnderstandingbyGenerativePre-Training[J/OL].https://s3-us-west-2.amazonaws.com/openai-assets/research-covers/language-unsupervised/language_understanding_paper.pdf，2018
[10]DevlinJ,ChangMW,LeeK,etal.BERT:Pre-trainingofDeepBidirectionalTransformersforLanguageUnderstanding[J].arXivpreprintarXiv:1810.04805,2018.
[11]HochreiterS,SchmidhuberJ.LongShort-TermMemory[J].NeuralComputation,1997,9(8):1735-1780.
[12]KimY.ConvolutionalNeuralNetworksforSentenceClassification[J].arXivpreprintarXiv:1408.5882,2014.
[13]KalchbrennerN,GrefenstetteE,BlunsomP.Aconvolutionalneuralnetworkformodellingsentences[J].arXivpreprintarXiv:1404.2188,2014.
[14]BahdanauD,ChoK,BengioY.Neuralmachinetranslationbyjointlylearningtoalignandtranslate[J].arXivpreprintarXiv:1409.0473,2014.
[15]VaswaniA,ShazeerN,ParmarN,etal.Attentionisallyouneed[C]//AdvancesinNeuralInformationProcessingSystems(NIPS),2017:5998-6008.
[16]VrandecicD,KrtoetzschM.Wikidata:afreecollaborativeknowledgebase[J].CommunicationsoftheAcm,2014,57(10):78-85.
[17]SuchanekFM,KasneciG,WeikumG.YAGO:ACoreofSemanticKnowledgeUnifyingWordNetandWikipedia[C]//InternationalConferenceonWorldWideWeb(ICWWW),2007:697-706.
[18]AuerS,BizerC,KobilarovG,etal.DBpedia:ANucleusforaWebofOpenData[C]//ProceedingsofInternationalSemanticWebConference(ISWC),2007:722-735.[19]Miller,GeorgeA.WordNet:alexicaldatabaseforEnglish[J].CommunicationsoftheAcm,1995,38(11):39-41.
[20]WangJ,WangZ,ZhangD,et.al.Combiningknowledgewithdeepconvolutionalneuralnetworksforshorttextclassification[C]//InTwenty-SixthInternationalJointConferenceonArtificialIntelligence(AAAI),2017:2915-2921.
[21]ChenJ,HuY,LiuJ,etal.DeepShortTextClassificationwithKnowledgePoweredAttention[C]//ProceedingsoftheAAAIConferenceonArtificialIntelligence,2019,33(1):6252-6259.10ComputerEngineeringandApplications
[22]ZhangZ,HanX,LiuZ,etal.ERNIE:Enhancedlanguagerepresentationwithinformativeentities[J].arXivpreprintarXiv:1905.07129,2019.
[23]LiuW,ZhouP,ZhaoZ,etal.K-bert:Enablinglanguagerepresentationwithknowledgegraph[J].arXivpreprintarXiv:1909.07606,2019.
[24]AnastasopoulosA,KumarS,LiaoH.NeuralLanguageModelingwithVisualFeatures[J].arXivpreprintarXiv:1903.02930,2019.
[25]ZadehA,ChenM,PoriaS,etal.TensorFusionNetworkforMultimodalSentimentAnalysis[C]//empiricalmethodsinnaturallanguageprocessing,2017:1103-1114.
[26]NamH,HaJW,KimJ.DualAttentionNetworksforMultimodalReasoningandMatching[C]//ProceedingsoftheIEEEconferenceoncomputervisionandpatternrecognition.2017:299-307.
[27]LuJ,BatraD,ParikhD,etal.ViLBERT:PretrainingTask-AgnosticVisiolinguisticRepresentationsforVision-and-LanguageTasks[J].arXivpreprintarXiv:1908.02265,2019.
[28]LiLH,YatskarM,DYin,etal.VisualBERT:ASimpleandPerformantBaselineforVisionandLanguage[J].arXivpreprintarXiv:1908.03557,2019.
[29]AlbertiC,LingJ,CollinsM,etal.FusionofDetectedObjectsinTextforVisualQuestionAnswering[J].arXivpreprintarXiv:1908.05054,2019.
[30]KielaD,BhooshanS,HFirooz,etal.SupervisedMultimodalBitransformersforClassifyingImagesandText[J].arXivpreprintarXiv:1909.02950,2019.
[31]WuL,PetroniF,JosifoskiM,etal.ScalableZero-shotEntityLinkingwithDenseEntityRetrieval[C]//Proceedingsofthe2020ConferenceonEmpiricalMethodsinNaturalLanguageProcessing(EMNLP).2020:6397-6407.
[32]BordesA,UsunierN,Garcia-DuranA,etal.TranslatingEmbeddingsforModelingMulti-relationalData[C]//InProceedingsofthe26thInternationalConferenceonNeuralInformationProcessingSystems(NIPS)-Volume2,2013:2787-2795.[33]HanX,CaoS,LvX,etal.OpenKE:AnOpenToolkitforKnowledgeEmbedding[C]//Proceedingsofthe2018ConferenceonEmpiricalMethodsinNaturalLanguageProcessing:SystemDemonstrations(EMNLP),2018:139-144.
[34]HeK,ZhangX,RenS,etal.DeepResidualLearningforImageRecognition[J].IEEE,2016:770-778.
[35]DosovitskiyA,BeyerL,KolesnikovA,etal.AnImageisWorth16x16Words:TransformersforImageRecognitionatScale[J].arXivpreprintarXiv:2010.11929,2020.
[36]ArevaloJ,SolorioT,MMontes-Y-Gómez,etal.GatedMultimodalUnitsforInformationFusion[J].arXivpreprintarXiv:1702.01992,2017.
[37]YuJ,JiangJ,XiaR.Entity-sensitiveattentionandfusionnetworkforentity-levelmultimodalsentimentclassification[J].IEEE/ACMTransactionsonAudio,Speech,andLanguageProcessing,2019,28:429-439.

你可能感兴趣的:(图像处理,深度学习,自然语言处理,知识图谱,人工智能,nlp,图像处理)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
自然语言处理_tf-idf _feivirus_ 算法机器学习和数学自然语言处理 tf-idf 逆文档频率词频
importpandasaspdimportmath1.数据预处理docA="Thecatsatonmyface"docB="Thedogsatonmybed"wordsA=docA.split("")wordsB=docB.split("")wordsSet=set(wordsA).union(set(wordsB))print(wordsSet){'on','my','face','sat',
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
Python实现下载当前年份的谷歌影像 sand&wich python 开发语言
在GIS项目和地图应用中，获取最新的地理影像数据是非常重要的。本文将介绍如何使用Python代码从Google地图自动下载当前年份的影像数据，并将其保存为高分辨率的TIFF格式文件。这个过程涉及地理坐标转换、多线程下载和图像处理。关键功能该脚本的核心功能包括：坐标转换：支持WGS-84与WebMercator投影之间转换，以及处理中国GCJ-02偏移。自动化下载：多线程下载地图瓦片，提高效率。图像
Python实现TIFF 文件转换为 PNG 和 JPG 格式 sand&wich python 开发语言
在日常的图像处理工作中，可能会遇到需要将TIFF格式的图像转换为其他格式的情况，例如PNG和JPG。下面，本文将介绍如何使用Python和GDAL库实现这一功能。准备工作在开始之前，请确保已经安装了必要的库：GDAL（GeospatialDataAbstractionLibrary）可以使用以下命令安装GDAL：pipinstallgdal代码实现以下是一个将TIFF文件转换为PNG文件的示例代码
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
免费的GPT可在线直接使用（一键收藏） kkai人工智能 gpt
1、LuminAI（https://kk.zlrxjh.top）LuminAI标志着一款融合了星辰大数据模型与文脉深度模型的先进知识增强型语言处理系统，旨在自然语言处理（NLP）的技术开发领域发光发热。此系统展现了卓越的语义把握与内容生成能力，轻松驾驭多样化的自然语言处理任务。VisionAI在NLP界的应用领域广泛，能够胜任从机器翻译、文本概要撰写、情绪分析到问答等众多任务。通过对大量文本数据的
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI论文题目生成器怎么用？9款论文写作网站简单3步搞定小猪包333 写论文人工智能深度学习计算机视觉
在当今信息爆炸的时代，AI写作工具的出现极大地提高了写作效率和质量。本文将详细介绍9款优秀的论文写作网站，并重点推荐千笔-AIPassPaper。一、千笔-AIPassPaper千笔-AIPassPaper是一款功能强大的AI论文生成器，基于最新的自然语言处理技术，能够一键生成高质量的毕业论文、开题报告等文本内容。它不仅提供智能选题、文献推荐和论文润色等功能，还具有较高的用户评价。其文献综述生成功
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
轻量级模型解读——轻量transformer系列 lishanlu136 #图像分类轻量级模型 transformer 图像分类
先占坑，持续更新。。。文章目录1、DeiT2、ConViT3、Mobile-Former4、MobileViTTransformer是2017谷歌提出的一篇论文，最早应用于NLP领域的机器翻译工作，Transformer解读，但随着2020年DETR和ViT的出现(DETR解读，ViT解读)，其在视觉领域的应用也如雨后春笋般渐渐出现，其特有的全局注意力机制给图像识别领域带来了重要参考。但是tran
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
FlagEmbedding 吉小雨 python库 python
FlagEmbedding教程FlagEmbedding是一个用于生成文本嵌入（textembeddings）的库，适合处理自然语言处理（NLP）中的各种任务。嵌入（embeddings）是将文本表示为连续向量，能够捕捉语义上的相似性，常用于文本分类、聚类、信息检索等场景。官方文档链接：FlagEmbedding官方GitHub一、FlagEmbedding库概述1.1什么是FlagEmbeddi
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 [email protected] 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源