椒椒。

基于改进胶囊网络的文本分类-论文研读

基于改进胶囊网络的文本分类

0引言
1相关工作
- 1.1从标量到向量的转化
- 1.2Squash压缩激活函数
- 1.3动态路由
2改进胶囊网络模型
- 2.1N-gram卷积层
- 2.2主胶囊层
- 2.3卷积层
- 2.4卷积胶囊层
- 2.5全连接胶囊层
3实验与结果分析
- 3.1实验数据
- 3.2多标签分类实验
- - 3.2.1相关实验
  - 3.2.2改进胶囊网络实验
  - 3.2.3加入word2vec扩展实验
  - 3.2.4多标签分类实验结果总结
- 3.3二分类实验
4结语
参考文献（References）

0引言

文字作为传播文化和沟通感情的桥梁，在人类社会发展的道路上一直起着至关重要的作用。随着网络的发展，大量的文字信息走进大众的生活，新闻、微博、短信、网络点评等不同形式的文本大量地涌现。文本信息中蕴含了很多重要信息，对文本的处理主要包括文本检索、翻译、文本分类等。如何快速而准确地获取文本信息，文本分类技术发挥着重要的作用。
文本分类是指，对于给定的一些文本集D=｛d1，d2，⋯，dn｝和一些类别C=｛c1，c2，⋯，cM｝，如何利用分类模型ƒ将D中的文本映射到C中的某一个类别中。例如将淘宝的评论分为好评与差评；微博评论分为开心、愤怒、伤心等情感类型；新闻分为体育新闻、娱乐新闻、教育新闻、军事新闻等。文本分类大致经过了3个阶段：第1阶段代表人物是Maron和Borko，他们20世纪60年代早期就提出了用标引词代替文本，根据标引词在类中出现的概率来确定类别，再将多个标引词用少数因子来代表；第2阶段出现在20世纪60年代中期到70年代中期，这一阶段主要是探索各种可用的分类方法如图论、统计、矩阵法等；第3阶段就是现阶段，将机器学习用于文本分类如：王艺颖［1］和钟磊［2］使用的朴素贝叶斯（NaiveBayesian，NB），殷亚博等［3］和Liu等［4］使用了K-近邻（K-NearestNeighbor，KNN），郭超磊等［5］使用了支持向量机（SupportVectorMachine，SVM），姚立等［6］使用了随机森林（RandomForest）；深度学习方法，如：Wei等［7］使用了卷积神经网络（ConvolutionalNeuralNetwork，CNN），Hu等［8］使用了循环神经网络（RecurrentNeuralNetwork，RNN），冯国明等［9］使用了胶囊网络（CapsuleNetwork，CapsNet）等。
文本分类属于自然语言处理范畴，一般是使用机器学习进行分类操作的，所以提出了很多关于机器学习模型和模型的改进算法。文本分类中一个很重要的发展是由原来仅通过简单的提取关键字转变为通过理解语义和联系上下文而获取文本信息。主题模型能根据一个文本提取出多个主题［5］，不受文本的位置和词语的数量影响。word2vec对于文本分类来说是另一个重要的突破，Church［10］和薛炜明等［11］使用word2vec有效地解决了文本向量维度过大问题，通过CBOw（ContinuousBagofWords）或Skip-Gram模型，可以得到既定的词语和既定词语上下文中可能出现的词语，word2vec使得每个词语的向量表示具有了具体的意义。将word2vec与CNN、长短记忆网络（LongShort-TermMemory，LSTM）、支持向量机（SVM）相结合有效地提高了分类速度，也提高了准确度。近几年又出现了胶囊网络，它在CNN的基础上进行了改进，用动态路由代替CNN中的池化操作。在实践中，胶囊网络更是适用于图片分类和文本分类。Zhao等［12］最先将胶囊网络用于文本分类，先使用一层卷积层对不同位置进行特征的提取，再使用两层胶囊层进行训练，最后使用全连接胶囊层输出每个文本类型的概率进行softmax分类。本文在原有的胶囊网络的基础上进行了改进：先使用一层卷积层对不同位置的特征进行提取；然后使用一层胶囊层对上层的卷积操作的标量输出替换为矢量输出，从而保留了文本的词语顺序和语义；再使用一层卷积层对不同位置的特征再次进行特征的提取，提取完成后，再次使用胶囊层。

1相关工作

2011年，Hinton等［13］首次引入胶囊网络。其核心思想是使用胶囊来代替卷积神经网络中的神经元，使网络可以保留对象之间详细的姿态信息和空间层级关系。2017年，Sabour等［14］在神经信息处理系统大会上发表论文，进一步提出了胶囊间的动态路由算法与胶囊神经网络结构。该论文介绍了一个在MNIST（著名的手写数字图像数据集）上达到最先进性能的胶囊网络架构，并且朱娟等［15］在MultiMNIST（一种不同数字重叠对的变体）上得到了比卷积神经网络更好的结果。张天柱等［16］将胶囊网络进行改进用于图像识别，在MNIST数据集上准确率可达到99.37%。胶囊网络与卷积神经网络不同的地方有：用向量胶囊代替卷积神经网络中的神经元、动态路由代替池化操作、Squash函数代替ReLU激活函数。胶囊网络不同于卷积神经网络的三大部分是标量到向量的转化、Squash压缩激活函数和动态路由。胶囊网络原理图如图1所示，其中，ui表示低层特征，wij表示低层特征与高层特征之间的关系，uj|i表示高层特征。

1.1从标量到向量的转化

卷积神经网络接收到神经元输入的标量后，将标量乘以权重，然后相加得到总和，最后将总和传递给一个非线性激活函数，生成一个输出标量，作为下一层的输入变量。其工作原理可用3个步骤描述：
1）将输入标量xi乘上权重wi；
2）对所有的xi×wi进行求和，得到S；
3）将S传递给非线性激活函数（·），得到输出标量fy。
胶囊网络不同于卷积神经网络的是，在进行加权求和时增加了一步。其工作原理可用4个步骤描述：
1）将输入向量ui乘上权重矩阵wij，得到了新的输入向量uj|i。
2）将输入向量uj|i乘上权重cj|i，其中cj|i由动态路由决定。
3）对所有的uj|i×cj|i进行求和，得到向量Sj。
4）用压缩激活函数Squash，将Sj转化向量vj。

1.2Squash压缩激活函数

激活层就是对卷积层的输出结果做一次非线性映射。本文采用的是ReLU函数，表达式如式（1）所示：

f(x)=max(0，x)（1）

当x大于0时，ReLU函数的导数恒等于1，所以在卷积神经网络中不会导致梯度消失和爆炸问题。若负数值过多，由式（1）看来，这部分的值就都为0，这导致了相应的神经元无法激活，但是可以通过设置学习率来解决。胶囊网络使用的是压缩激活函数Squash，Squash函数的公式如式（2）所示：
式（2）简写为vj=A·B，Squash函数还有功能是使得向量的长度不超过1，而且保持vj和Sj同方向。其中A项可以看出Sj的模长越长，则A项的值越大，则Sj代表的特征就越强，输出值也就越大。B项是将Sj模长压缩为1。由式（7）看来，vj的模长在0_{1，方向同Sj同一个方向。式（2）简写为vj=A·B，Squash函数还有功能是使得向量的长度不超过1，而且保持vj和Sj同方向。其中A项可以看出Sj的模长越长，则A项的值越大，则Sj代表的特征就越强，输出值也就越大。B项是将Sj模长压缩为1。由式（7）看来，vj的模长在0}1，方向同Sj同一个方向。

1.3动态路由

卷积神经网络的池化层又称为下采样或欠采样，用于特征降维，减少参数，还起着加快计算速度和防止过拟合的作用。主要有最大池化和平均池化两种方式。本文采用的是最大池化，原理图如图2所示。
采用最大池化操作，通过调整池化窗口参数，提取出每张特征图中最具有说服力的局部最优特征，从而生成每一行是每一篇文本进行一次最大池化抽样的结果的矩阵。这样也起到约减参数的作用，提高了模型的适应性。
胶囊网络通过采用动态路由可代替卷积神经网络中的池化层，对输入的特征进行聚类，即相似特征越多，这类特征就越强，由此进行了一次特征选择过程，达到池化层特征选择的目的。动态路由伪代码如下所示。

2改进胶囊网络模型

胶囊网络最先开始用在图像上，Zhao等［12］第一次将胶囊网络用在文本分类上，在多分类标签上的效果明显优于卷积神经网络和循环神经网络。
该模型主要分为4个部分：第1部分是一个标准的卷积层，通过多个不同的卷积核在句子的不同位置提取特征；第2部分为主胶囊层，该层是将卷积操作中的标量输出替换为矢量输出，从而保留了文本的单词顺序和语义信息；第3部分为卷积胶囊层，在这一层中，胶囊通过与变换矩阵相乘来计算子胶囊与父胶囊的关系，然后根据路由协议更新上层胶囊层的权重；第4部分是全连接胶囊层，胶囊乘上变换矩阵，然后按照路由协议生成最终的胶囊及其对每个类的概率。4个部分中包括1层卷积层和3次胶囊层。
本文在Zhao等［12］的模型基础上又增加了1层卷积层，用来再次提取不同位置上的特征，使得特征提取更加地细致。基于改进胶囊网络的文本分类模型如图3所示。
模型主要分成了5层，分别是N-gram卷积层、主胶囊层、卷积层、卷积胶囊层和全连接胶囊层。

2.1N-gram卷积层

该层卷积层通过卷积在文本的不同位置提取N-gram特征，若X为文本中的一条文本，其长度为L，词嵌入大小为V，即X的维度大小为L×V，Xi为文本X中的第i个词语，Xi的维度为V。设N-gram滑动大小为K1，Wα为卷积运算操作的滤波器，则Wα的维度为K1×V。滤波器每次移动的单词窗口为Xi至Xi+K1-1，产生的特征为mα，其维度为L-K1+1，则每个单词特征mi的特征如式（3）所示：

2.2主胶囊层

设胶囊的维度为d，pi为N-gram产生的实例化参数，Mi为每个滑动窗口的向量，其维度为B，Wb表示为不同的滑动窗口的共享滤波器，其维度为B×d。生成胶囊P的维度为（L-K1+1）×d，则pi的表示如式（4）所示:
其中：g（）表示非线性压缩函数；b1为胶囊的偏置项。对于所有的滤波器C来说，胶囊特征P可以表示为式（5）所示结构：
其中P的维度为（L-K1+1）×d×C。

2.3卷积层

再次进行卷积操作时，可设置较少的滤波器的个数，一个滤波器提取一个特征，滤波器的个数减少后，特征的个数也随之减少，训练的维度就降低了，节约了时间成本。再次使用卷积操作更加细化了特征的提取过程，使得提取出来的特征更有利于文本的分类。

2.4卷积胶囊层

卷积胶囊层的胶囊维度应与多标签文本分类的分类数量相关，每一层都代表了每一个类型的概率，而主胶囊层的胶囊维度可任意设置。

2.5全连接胶囊层

卷积胶囊层的被压扁成一个胶囊列表，并送入到全连接胶囊层。全连接层可以学习到局部和全局的特征，因为其输入部分为卷积层和动态路由的输出，卷积层提取的是局部特征，动态路由得到的是全局特征。全连接层的输出如式（6）所示：
其中：x为神经元的输入；hW，b(x)为输出；T为W的转置，将输出节点送入softmax分类器进行概率预测，完成文本分类任务。

3实验与结果分析

3.1实验数据

实验采用了两组数据集：一组做多标签分类；另一组做二分类问题。多标签分类实验采用了搜狗实验室的中文新闻数据集，该数据集包括了429819条新闻，能够被标出类别的有320045条新闻，共有13类，剔除掉2类因样本数不足的数据，最后保留了其中的11类作为分类数据文本。每类新闻选择2000条文本，训练集、验证集和测试集的划分比例为16∶4∶5。数据集分布如表1所示。
实验的预处理部分先将下载好的数据进行转码，然后给文本加上标签，分词选用的是中文文本采用的jieba分词工具，由于有些新闻字数太多，为了减少维度的损失，固定文本长度为100个字符。
二分类实验选用了IMDB数据集包含来自互联网电影数据库12500个正面电影评论和12500个负面电影评论，每个句子的长度都固定为150个字符，如果长度大于150个字符，则将超过的部分截掉；如果小于150字符，则在最前面用数字“0”填充。

3.2多标签分类实验

实验采用了python作为算法的实现语言，由于CNN、LSTM和CapsNet是最常见的神经网络模型。所以，先比较CNN、LSTM和CapsNet三种相关方法的分类效果，再进行比较改进后的胶囊网络与Zhao等［12］提出的胶囊网络的分类效果，实验最后加入word2vec进行文本向量建模，分析实验结果。

3.2.1相关实验

在进行神经网络对比实验前，先对比了朴素贝叶斯、支持向量机、K-近邻这三种传统的机器学习方法，在多标签的数据集下，朴素贝叶斯的准确率为84.38%，支持向量机的分类准确率为84.41%，而K-近邻在K值为14时的分类准确率仅为31.47%。实验证明：K-近邻明显地不适合应用于文本分类。其他两种传统机器学习的方法，朴素贝叶斯和支持向量机在分类结果上占取了很大的优势，不仅分类效果好，而且分类的时间较深度学习来说缩短了很多，但是需要人工进行特征构造，可扩展性差；而神经网络能够自动地学习构造特征，具有较强的适应能力。
CNN在搭建模型时，首先将文本处理成矩阵的形式，作为输入层的输入，本文将每个文本处理成100×200的矩阵形式。因为文本长度不一致，所以选取100作为统一的文本长度，超过100的文本截取前100个词语，不足的长度的加零补齐。在进行词语独热编码时，形成了维度为200的词向量，这就形成100×200的矩阵。再通过1层卷积层与池化层来缩小向量长度，再加一层压平层将2维向量压缩到1维，最后通过两层全连接层将向量长度收缩到12上，对应新闻分类的12个类（其中标签0没有用到）。CNN模型结构如表2所示。
由于RNN只考虑到最近状态，无法作用于前期状态，使得分类效果不佳，后来进行了变形，能够不仅能够考虑到之前状态，还能决定哪些状态该保留，哪些状态该遗弃，这就是长短期记忆（LongShort-TermMemory，LSTM）网络。LSTM模型结构如表3所示。CapsNet同CNN一样的是，都需要进行一层卷积层，不同的是经过胶囊层后，输出的结构仍然是二维矩阵，不需要池化层进行池化操作，capsule层里已经使用了动态路由操作，可代替池化操作进行特征选取，最后一层，同CNN一样，将全连接层输出结构变成一维矩阵，不同的是使用的激活函数为Squash函数，该函数在应用中可自行构造。CapsNet模型结构如表4所示。
实验从训练集、验证集和测试集三个方面比较分类效果，实验结果如表5所示。
-
三种方法都是经过了3次迭代过程，在训练集上的分类精度都达到了90%以上，其中胶囊网络分类精度最高，达到了98.62%。在验证集上的分类精度都达到了85%以上，其中还是胶囊网络的精度最高，达到了89.03%。最后比较测试集，在测试集上的分类精度明显低于训练集和验证集，但是，胶囊网络的分类精度还是最高，达到了84.06%。由此可见，在文本分类中，胶囊网络的分类效果要优于卷积神经网络和循环神经网络。胶囊网络是在卷积神经网络的基础上提出来，用来解决池化操作带来的特征信息丢失问题的。考虑到卷积神经网络缺失的相对位置、角度等其他信息的问题，胶囊网络变标量信息为矢量信息，增加了对位置和角度等信息的提取，从而使得识别效果有所提升。卷积神经网络能够注意到各部分的局部特征，但是却忽略了位置和角度等主要信息。以图像人脸为例，卷积神经网络能够识别图像中的各个局部特征，如鼻子、眼睛和嘴巴等，但是对其位置和角度却不做考虑。若嘴巴在额头上，眼睛在下巴上，只要鼻子眼睛嘴巴这些局部特征都在，卷积神经网络会认为该图片就是一张人脸。所以在进行文本分类的过程中卷积神经网络只能联系各个局部特征是否存在，并不会联系其内部结构问题，这就使得了分类效果不如胶囊网络。

3.2.2改进胶囊网络实验

从训练集、验证集、测试集和时间4个方面比较CapNet文献［12］模型和本文提出的CapNet的分类精度，实验结果如表6所示。
从表6的实验结果中可以看出，改进后的胶囊网络比单纯的胶囊网络的分类精度提高了2.14个百分点，相较于Zhao等［12］提出的胶囊网络的分类精度提高了1.17个百分点。卷积操作的增加虽然增加了少量的训练时间，但是特征的提取也更加地细致，使得分类精度有所增加。随着卷积操作的一层一层加入特征提取得越来越细致。以图片为例进行卷积操作，结果如图5所示。
图5下方的3张图分别代表了第1次卷积操作、第2次卷积操作和第3次卷积操作后提取的特征。由图5可以看出：第1次卷积可以提取出低层次的特征；第2次卷积可以提取出中层次的特征；第3次卷积可以提取出高层次的特征。特征是不断进行提取和压缩的，最终能得到比较高层次特征。本文进行了两次卷积操作，并没有进行更加多次的卷积操作，是因为考虑到过多地卷积操作会造成训练的过拟合现象，不仅增加了训练时间还降低了分类精度。在本文提出的网络模型中若再增加一层卷积操作会出现过拟合现象导致分类精度的降低，其在测试集上的分类精度仅达到了80.82%，相较于本文的改进模型分类精度降低了5.38个百分点。

3.2.3加入word2vec扩展实验

最后将word2vec加入到本文的方法中，再次进行实验，实验结果如表7所示。

从表7中可以看出，word2vec的加入使得了文本的分类精度不仅没有增加反而减小了0.64个百分点。word2vec从大量文本语料中以无监督的方式学习语义信息，即通过一个嵌入空间使得语义上相似的单词在该空间内距离很近。其基本思想是把自然语言中的每一个词，表示成一个统一意义统一维度的短向量。但是由于语境的不完善，上下文的联系不够密切，并不能捕捉到全局的信息，这使得分类效果反而降低。

3.2.4多标签分类实验结果总结

多标签分类问题是文本分类的主要部分，本文实验采用的是搜狗实验室的中文新闻数据集，该数据集具有一定的代表性。其实验结果总结如图6所示。
实验对比了长短记忆网络、卷积神经网络、胶囊网络、Zhao等［14］提出的胶囊网络和本文提出的改进胶囊网络（ImprovedCapsNet）［12］的分类效果。实验结果显示，本文的改进胶囊网络模型比多标签实验中的其他4种模型来说效果更好。

3.3二分类实验

由于多分类实验的结果显示，LSTM并不适用于文本的分类问题，所以，二分类实验并没有考虑再次使用其方法进行实验。二分类实验进行了卷积神经网络、胶囊网络、Zhao等［12］提出的胶囊网络和本文改进的胶囊网络分类实验，其结果如图7所示。
从图7可以发现在二分类的电影评论数据集上，改进过后的胶囊网络在测试集上的分类精度达到了87.03%，单纯的卷积神经网络和胶囊网络分别是86%和85.94%，而Zhao等［12］提出的胶囊网络的分类精度为86.50%。从测试集上来看，改进过后的胶囊网络的分类效果还是优于其他三类网络模型的分类效果。虽然测试集上的优势不是很大，但是在验证集上，本文改进过后的胶囊网络明显地优于其他网络模型，比单纯的卷积神经网络和胶囊网络提高了7.28个百分点和5.6个百分点，比Zhao等［12］提出的胶囊网络提高了3.84个百分点。

4结语

胶囊网络有效地克服了卷积神经网络的池化层操作的弊端，动态路由在效果和理论解释性上都优于最大池化操作，但同时也增加了网络的计算量。单独的胶囊网络在文本分类中的分类精度并没有达到最大化，本文将卷积操作与胶囊网络进行结合用于文本分类，实验结果显示，无论是多标签分类还是二分类，本文的方法都比其他方法分类精度要高。胶囊网络中的压缩激活函数Squash，总体上能很好地解释其原理，但是第一项中的“1”，并没有解释，在实验过程中发现，可用其他小于1的非负小数代替“1”，比如0.5，其结果优于Hinton设置的“1”。如何设置Squash中的实数参数，在未来的研究中有待解决。

参考文献（References）

[1]王艺颖.朴素贝叶斯方法在中文文本分类中的应用[J].中国高新科技,2019(7):57-60.(WANGYY.ApplicationofnaiveBayesmethodinChinesetextclassification[J].ChinaHigh-Tech,2019(7):57-60.)
[2]钟磊.基于贝叶斯分类器的中文文本分类[J].电子技术与软件工程,2016(22):156-156.(ZHONGL.ChinesetextclassificationbasedonBayesianclassifier[J].ElectronicTechnologyandSoftwareEngineering,2016(22):156-156.)
[3]殷亚博,杨文忠,杨慧婷,等.基于搜索改进的KNN文本分类算法[J].计算机工程与设计,2018,39(9):2923-2928.(YINYB,YANGWZ,YANGHT,etal.KNNtextclassificationalgorithmbasedonsearchimprovement[J].ComputerEngineeringandDesign,2018,39(9):2923-2928.)
[4]LIUJ,JINT,PANK,etal.AnimprovedKNNtextclassificationalgorithmbasedonSimhash[C]//ProceedingsoftheIEEE16thInternationalConferenceonCognitiveInformaticsandCognitiveComputing.Piscataway:IEEE,2017:92-95.
[5]郭超磊,陈军华.基于SA-SVM的中文文本分类研究[J].计算机应用与软件,2019,36(3):277-281.(GUOCL,CHENJH.ChinesetextclassificationbasedonSA-SVM[J].ComputerApplicationsandSoftware,2019,36(3):277-281.)
[6]姚立,张曦煌.基于主题模型的改进随机森林算法在文本分类中的应用[J].计算机应用与软件,2017,34(8):173-178,212.(YAOL,ZHANGXH.Improvedrandomforestsalgorithmbasedontopicmodelanditsapplicationintextclassification[J].ComputerApplicationandSoftware,2017,34(8):173-178,212.)
[7]WEIF,QINH,YES,etal.Empiricalstudyofdeeplearningfortextclassificationinlegaldocumentreview[C]//Proceedingsofthe2018IEEEInternationalConferenceonBigData.Piscataway:IEEE,2018:3317-3320.
[8]HUF,LIL,ZHANGZ,etal.Emphasizingessentialwordsforsentimentclassificationbasedonrecurrentneuralnetworks[J].JournalofComputerScienceandTechnology,2017,32(4):785-795.
[9]冯国明,张晓冬,刘素辉.基于CapsNet的中文文本分类研究[J].数据分析与知识发现,2019,2(12):68-76.(FENGGM,ZHANGXD,LIUSH.ClassifyingChinesetextswithCapsNet[J].DataAnalysisandKnowledgeDiscovery,2019,2(12):68-76.)
[10]CHURCHKW.Word2Vec[J].NaturalLanguageEngineering,2017,23(1):155-162.
[11]薛炜明,侯霞,李宁.一种基于word2vec的文本分类方法[J].北京信息科技大学学报(自然科学版),2018,33(1):71-75.(XUEWM,HOUX,LIN.Atextcategorizationmethodbasedonword2vec[J].JournalofBeijingInformationScienceandTechnologyUniversity,2018,33(1):71-75.)
[12]ZHAOW,YEJ,YANGM,etal.Investigatingcapsulenetworkswithdynamicroutingfortextclassification[C]//Proceedingsofthe2018ConferenceonEmpiricalMethodsinNaturalLanguageProcessing.Stroudsburg,PA:AssociationforComputationalLinguistics,2018:3110-3119.
[13]HINTONGE,KRIZHEVSKYA,WANGSD.Transformingautoencoders[C]//Proceedingsofthe21stInternationalConferenceonArtificialNeuralNetworks,LNCS6791.Berlin:Springer,2011:44-51.
[14]SABOURS,FROSSTN,HINTONGE.Dynamicroutingbetweencapsules[C]//Proceedingsofthe31stInternationalConferenceonNeuralInformationProcessingSystems.RedHook,NY:CurranAssociatesInc.,2017:3856-3866.
[15]朱娟,陈晓.改进胶囊网络的有序重叠手写数字识别方法[J].激光杂志,2019,40(7):43-46.(ZHUJ,CHENX.Improvedcapsulenetworkforrecognitionoforderlyoverlappedhandwrittennumerals[J].LaserJournal,2019,40(7):43-46.)
[16]张天柱,邹承明.使用模糊聚类的胶囊网络在图像分类上的研究[J].计算机科学,2019,46(12):279-285.(ZHANGTZ,ZOUCM.Studyonimageclassificationofcapsulenetworkusingfuzzyclustering[J].ComputerScience,2019,46(12):279-285.)
[17]NOWAKJ,TASPRINARA,SCHERERR.LSTMrecurrentneuralnetworksforshorttextandsentimentclassification[C]//Proceedingsofthe16thInternationalConferenceonArtificialIntelligenceandSoftComputing,LNCS10246.Cham:Springer,2017:553-562.ThisworkispartiallysupportedbytheNationalNaturalScienceFoundationofChina(61772282).YINChunyong,bornin1977,Ph.D.,professor.Hisresearchinterestsincludecyberspacesecurity,bigdatamining,privacyprotection,artificialintelligence,newcomputing.HEMiao,bornin1995,M.S.candidate.Herresearch

AI大模型的2种模型能力Function call 和ReAct DeepSeek-大模型系统教程人工智能 react.js 前端 git ai 语言模型
近年来，随着AI大模型的快速发展，如何让这些模型更好地与现实世界交互成为了一个重要课题。FunctionCall和ReAct作为两种重要的模型能力，为大模型提供了更强大的工具调用和任务执行能力。我们将深入探讨这两种能力的背景、原理、应用场景以及它们之间的对比。帮助你深入了解他们的价值。01背景介绍AI大模型（如GPT-4、PaLM等）在自然语言处理、文本生成等任务中表现出色，但它们的能力往往局限于
大模型算法工程师面试宝典：精选面试题及参考答案全解析，助你备战AI算法工程师岗位！大模型入门学习人工智能产品经理大数据机器学习程序员大模型大模型学习
大模型应该算是目前当之无愧的最有影响力的AI技术。它正在革新各个行业，包括自然语言处理、机器翻译、内容创作和客户服务等，正成为未来商业环境的重要组成部分。截至目前大模型已超过200个，在大模型纵横的时代，不仅大模型技术越来越卷，就连大模型相关面试也是越来越卷。我今天给大家分享一篇大模型的面试题总结，内容较长，喜欢记得收藏、关注、点赞。ii.为什么会出现LLMs复读机问题？出现LLMs复读机问题可能
百度颠覆了自己，飞算JavaAI造福了中国程序员！飞算JavaAI开发助手百度
在当今这个科技日新月异的时代，企业纷纷寻求技术突破，以期在激烈的市场竞争中脱颖而出。百度，作为中国互联网行业的领军企业之一，凭借其强大的科技实力和创新能力，在人工智能等多个领域取得了显著成就，并正在逐步颠覆自身的传统形象。百度自成立之初，就将技术创新视为企业的生命线。从最初的搜索引擎技术，到如今的深度学习、自然语言处理、计算机视觉等前沿领域，百度始终走在技术革新的前沿。其自主研发的飞桨深度学习平台
零基础起步：基于GpuGeek的文本生成模型实战昊昊该干饭了人工智能 nlp 深度学习 gpu算力 gru
在自然语言处理（NLP）领域，文本生成任务广泛应用于问答系统、智能摘要、内容创作等方向。本文将带领读者使用GpuGeek平台，从注册、上传数据到实例部署与训练，完整构建一个基于GPT2模型的文本生成系统，实战掌握AI模型的云端开发流程。目录一、GpuGeek平台使用流程详解1.注册与登录2.数据上传3.创建训练实例4.启动与使用实例5.关闭实例（手动&自动）二、文本生成实战任务：微调GPT-21.
大模型智能运维详解：技术架构、落地挑战与行业实践 FreeTools FreeAiGuard 运维架构人工智能运维开发科技
大模型智能运维详解：技术架构、落地挑战与行业实践作者：开源大模型智能运维FreeAiOps在数字化转型加速的背景下，企业IT系统复杂度呈指数级增长，传统运维模式面临效率低下、故障定位困难、成本高昂等瓶颈。大模型技术的出现为智能运维提供了突破性解决方案，其通过自然语言处理、多模态数据分析与自动化决策能力，正在重塑运维工作的底层逻辑。本文将从技术原理、落地挑战、行业实践三个维度，系统解析大模型智能运维
Prompt Engineering 指南教程班磊闯Andrea
PromptEngineering指南教程Prompt-Engineering-Guidedair-ai/Prompt-Engineering-Guide:是一个用于指导对话人工智能开发的文档。适合用于学习对话人工智能开发和自然语言处理。特点是提供了详细的指南和参考资料，涵盖了多种对话人工智能技术和算法，并且可以自定义学习路径和行为。项目地址:https://gitcode.com/gh_mirr
电子词典开源项目源代码完全解析
本文还有配套的精品资源，点击获取简介：电子词典作为数字化学习工具，已由传统硬件发展为可定制的开源软件应用。本源代码提供深入理解其工作机制的机会，包括用户界面设计、词典数据库、查询引擎、翻译算法等。源代码通常由主流编程语言编写，涉及到数据结构与算法、UI设计、数据库管理、自然语言处理、本地化与多语言支持、版本控制、软件工程、API接口以及开源社区的协作和交流。1.电子词典工作原理和定制功能电子词典工
Python知识点：如何使用Nvidia Jetson与Python进行边缘计算杰哥在此 Python系列 python 边缘计算开发语言面试编程
开篇，先说一个好消息，截止到2025年1月1日前，翻到文末找到我，赠送定制版的开题报告和任务书，先到先得！过期不候！如何使用NvidiaJetson与Python进行边缘计算NvidiaJetson平台是专为边缘计算设计的一系列AI计算机，它们能够处理和分析来自物联网(IoT)设备和边缘节点的数据。这些设备小巧、节能且功能强大，非常适合用于执行机器学习、计算机视觉和自然语言处理等任务。Python
AI人工智能领域：Bard的崛起之路 AIGC应用创新大全人工智能 bard ai
AI人工智能领域：Bard的崛起之路关键词：Bard、GoogleAI、大语言模型、对话式AI、自然语言处理、生成式AI、AI竞争摘要：本文深入探讨GoogleBard的发展历程、技术架构及其在AI领域的地位。我们将从Bard的诞生背景开始，分析其核心技术原理，比较与其他大语言模型的异同，并通过实际案例展示其应用场景。最后展望Bard的未来发展方向及面临的挑战。背景介绍目的和范围本文旨在全面解析G
从零开始理解Transformer模型：架构与应用淮橘√ transformer 深度学习人工智能
引言近年来，Transformer模型席卷了自然语言处理（NLP）领域，成为了深度学习中的明星架构。从Google提出的《AttentionisAllYouNeed》论文到ChatGPT、BERT等模型的广泛应用，Transformer以其强大的性能和灵活性改变了我们对序列建模的认知。本文将从零开始，深入浅出地解析Transformer的架构原理、核心组件以及实际应用场景，并提供一个简单的代码示例
揭秘自然语言处理在AI人工智能领域的奥秘 AI智能探索者 AI Agent 智能体开发实战人工智能自然语言处理 easyui ai
揭秘自然语言处理在AI人工智能领域的奥秘关键词：自然语言处理、AI人工智能、语言理解、语言生成、语义分析摘要：本文深入探讨了自然语言处理（NLP）在AI人工智能领域的奥秘。首先介绍了自然语言处理的背景，包括目的、预期读者、文档结构和相关术语。接着阐述了自然语言处理的核心概念与联系，通过文本示意图和Mermaid流程图进行展示。详细讲解了核心算法原理和具体操作步骤，并用Python源代码进行阐述。分
【LangChain编程：从入门到实践】AI 大模型检索增强生成 RAG 实践 AI智能应用 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
LangChain编程：从入门到实践-AI大模型检索增强生成RAG实践关键词：LangChain,RAG,大语言模型,检索增强生成,向量数据库,嵌入模型,提示工程1.背景介绍在人工智能和自然语言处理领域,大语言模型(LargeLanguageModels,LLMs)的出现无疑是一个重大突破。像GPT-3、GPT-4这样的模型展现出了惊人的语言理解和生成能力,为各种应用场景带来了无限可能。然而,这些
【机器学习&深度学习】模型微调的基本概念与流程一叶千舟深度学习【理论】机器学习深度学习人工智能
目录前言一、什么是模型微调（Fine-tuning）？二、预训练vs微调：什么关系？三、微调的基本流程（以BERT为例）1️⃣准备数据2️⃣加载预训练模型和分词器3️⃣数据编码与加载4️⃣定义优化器5️⃣开始训练6️⃣评估与保存模型四、是否要冻结BERT层？五、完整训练示例代码5.1环境依赖5.2执行代码总结：微调的优势前言在自然语言处理（NLP）快速发展的今天，预训练模型如BERT成为了众多任务
【自然语言处理-NLP】文本预处理技术云博士的AI课堂哈佛博后带你玩转机器学习深度学习自然语言处理人工智能 NLP 深度学习数据预处理 NLP数据预处理机器学习
以下内容将从基本概念到实用代码分步骤、分场景地详细介绍NLP常见文本预处理方法及其背后的思想。如果无法从外部导入数据，我们会模拟一份简易文本数据（如字符串列表），并在此基础上演示预处理代码及详细解释，确保在常规Python环境下可以运行。一、文本预处理的常见需求和作用在自然语言处理（NLP）任务（如机器学习、深度学习、大模型开发）中，原始文本数据通常会包含各种噪声，例如：多余的空格、换行符、特殊符
从零开始：Python实现语音识别的完整教程_副本 AIGC应用创新大全 AI大模型与大数据技术 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 python 语音识别开发语言 ai
从零开始：Python实现语音识别的完整教程关键词：Python、语音识别、语音转文本、音频处理、机器学习、深度学习、自然语言处理摘要：本文将带你从零开始学习如何使用Python实现语音识别功能。我们将从基础概念讲起，逐步深入到实际代码实现，涵盖音频处理、特征提取、模型训练等关键环节，最终构建一个完整的语音识别系统。无论你是初学者还是有一定经验的开发者，都能从本教程中获得实用的知识和技能。背景介绍
面向大语言模型幻觉的关键数据集：系统性综述与分类法致Great 语言模型人工智能自然语言处理
面向大语言模型幻觉的关键数据集：系统性综述与分类法摘要大语言模型（LargeLanguageModels,LLMs）在自然语言处理的多个领域取得了革命性进展，但其固有的“幻觉”问题——即生成看似合理但与事实不符或与上下文无关的内容——严重制约了其在关键应用中的可靠性与安全性。为了系统性地评估、理解并缓解LLM的幻觉现象，学术界和工业界开发了大量多样化的数据集与基准。本文对大模型幻觉领域的关键数据集
信息抽取数据集全景分析：分类体系、技术演进与挑战_DEEPSEEK 致Great 分类数据挖掘人工智能
信息抽取数据集全景分析：分类体系、技术演进与挑战摘要信息抽取（IE）作为自然语言处理的核心任务，是构建知识图谱、支持智能问答等应用的基础。近年来，随着深度学习技术的发展和大规模预训练模型的兴起，IE数据集呈现爆发式增长，其分析与评估对模型研发和领域迁移至关重要。本文基于对158个主流IE数据集的系统性梳理，首次提出“信息提取与命名实体识别数据集分类体系”。该体系涵盖8大类别（命名实体识别、关系提取
自然语言处理之文本生成：Recurrent Neural Networks (RNN)：序列模型与语言模型 zhubeibei168 自然语言处理自然语言处理 rnn 语言模型人工智能机器翻译生成对抗网络
自然语言处理之文本生成：RecurrentNeuralNetworks(RNN)：序列模型与语言模型自然语言处理简介NLP的基本概念自然语言处理（NaturalLanguageProcessing，简称NLP）是人工智能领域的一个重要分支&#
推荐几本人工智能方面的书（入门级）人邮异步社区人工智能深度学习神经网络
以下推荐几本适合入门人工智能的书籍，帮助你逐步建立基础知识和理解：一、数学基础类《数学之美》推荐理由：深入浅出地讲解了自然语言处理与搜索方向的数学原理，对于理解算法背后的数学逻辑非常有帮助。本书的章节名称，有“统计语言模型”“谈谈中文分词”“贾里尼克和现代语言处理”“布尔代数和搜索引擎”“信息指纹及其应用”等，似乎太过专业，实际上高中和大学低年级的同学们都能看得懂，当然本书因此也可以称得上是“高级
自然语言处理(NLP)中的文本生成控制技术 AI天才研究院 AI大模型企业级应用开发实战 Agentic AI 实战 AI人工智能与大数据自然语言处理 easyui 人工智能 ai
自然语言处理(NLP)中的文本生成控制技术关键词：文本生成、可控生成、语言模型、Prompt工程、解码策略、条件控制、评估指标摘要：本文深入探讨自然语言处理中文本生成控制技术的最新进展。我们将从基础概念出发，系统分析各种控制方法的原理和实现，包括Prompt设计、解码策略优化、条件控制机制等核心内容。文章将结合数学模型、算法实现和实际案例，全面展示如何实现高质量、可控的文本生成，并探讨该领域面临的
Python爬虫实战：研究difflib库相关技术 ylfhpy 爬虫项目实战 python 爬虫 easyui 开发语言前端 difflib
1.引言1.1研究背景与意义在信息爆炸的数字时代，互联网每天产生海量文本内容。据统计，全球新闻网站日均发布文章超过300万篇，社交媒体平台产生的文本信息量更以亿级单位增长。这种信息过载带来了内容同质化、抄袭剽窃等问题，给新闻媒体行业、学术研究领域和搜索引擎优化等带来了挑战。文本相似度分析作为自然语言处理的重要分支，能够有效识别内容间的相似程度，具有重要的应用价值：新闻媒体行业：通过检测新闻抄袭和重
DeepSeek：AI驱动的效率革命与实战案例解 weixin_45788582 人工智能 ai DeepSeek
在人工智能技术的浪潮中，DeepSeek作为一款专注实现AGI（通用人工智能）的先锋工具，正通过其强大的自然语言处理（NLP）与分布式计算能力，重新定义高效办公的边界。以下通过技术解析与实战案例，展现DeepSeek如何赋能个人与企业，开启职场效率革命。一、技术革新：DeepSeek的核心竞争力深度学习赋能DeepSeek的技术架构基于BERT、Transformer等先进深度学习模型，通过构建复
AI 技术&AI开发框架 34号树洞人工智能深度学习人工智能机器学习 NLP GAI
目录一、AI技术及其开发框架1.AI技术分类与代表方向2.主流AI开发框架3.AI应用开发流程简述4.补充：基础依赖与生态二、AI技术方向1.机器学习（MachineLearning,ML）✦核心概念：✦关键方法：✦应用案例：2.深度学习（DeepLearning,DL）✦核心概念：✦网络结构举例：✦技术趋势：3.自然语言处理（NLP）✦核心任务：✦代表模型：4.计算机视觉（ComputerVis
Java AI 新纪元：Spring AI 与 Spring AI Alibaba 的崛起小沛9 Spring AI Alibaba Spring AI java 人工智能 spring spring ai SAA
此章节没什么营养，只是一个描述，同时也能看到AI的能力（文章基本都是AI进行生成的），小沛觉得开始不写点引言好像差了点什么东西，好像鱼离开了自行车。引言：AI时代对Java开发者的机遇与挑战，Java在AI领域的现状在当今技术飞速发展的时代，人工智能（AI）已不再是遥不可及的未来概念，而是深刻地融入到我们生活的方方面面，从智能推荐系统到自动驾驶，从自然语言处理到计算机视觉，AI正以前所未有的速度改
大模型本地部署，拥有属于自己的ChatGpt 小妖同学学AI chatgpt
ChatGpt以其强大的信息整合和对话能力惊艳了全球，在自然语言处理上面表现出了惊人的能力。不管用于文案撰写还是程序辅助开发都大大提高了我们的工作效率，但是其使用有一定的门槛，让我们大多数人都望而却步，今天我们利用ollama实现本地大模型的步骤，让我们轻松拥有自己的人工智能。Ollama作为一个轻量级的工具，可以帮助用户在本地运行这些大型语言模型，无需持续依赖云服务，既保护了数据隐私，又能减少网
Spring AI 结合 MCP MySQL 实现对话式数据库查询没刮胡子软件开发技术实战专栏人工智能AI Spring 数据库 spring 人工智能 spring-ai mcp-server mysql
在现代应用开发中，将人工智能与数据库查询结合可以创造更自然、更智能的用户交互方式。下面我将详细介绍如何使用SpringAI框架结合MCP（可能指MySQL连接池或相关组件）实现对话中的数据库查询功能。什么是SpringAI和MCPMySQLSpringAI框架概述SpringAI是基于Spring生态的人工智能集成框架，它提供了：与大型语言模型(LLM)的集成能力对话管理和自然语言处理功能业务逻辑
信息抽取领域关键Benchmark方法：分类体系
信息抽取领域关键Benchmark方法：分类体系摘要信息抽取（InformationExtraction,IE）作为自然语言处理的核心任务之一，旨在从非结构化文本中识别并结构化关键信息（如实体、关系、事件等），广泛应用于知识图谱构建、智能问答和数据分析等领域。近年来，随着深度学习技术的快速发展，信息抽取方法在性能和应用范围上取得了显著进步，但同时也面临着任务多样性、跨领域泛化性以及低资源场景下的适
TensorFlow：开启智能时代的引擎科技林总 DeepSeek学AI 人工智能
想象一下，计算机能看懂病历、汽车能自动驾驶、机器能创作艺术——这一切的核心，正是深度学习的力量。而推动这场革命的引擎之一，就是今天的主角：**TensorFlow**。---###**一、背景：为什么需要TensorFlow？1.**深度学习的爆发**-传统编程无法解决图像识别、自然语言处理等复杂问题。-神经网络需要高效工具处理海量数据和计算。2.**Google的答案**-2015年开源Tens
浅谈卷积神经网络(CNN) cyc&阿灿 cnn 人工智能神经网络
卷积神经网络(ConvolutionalNeuralNetworks,CNN)作为深度学习领域最具影响力的架构之一，已在计算机视觉、自然语言处理、医学影像分析等领域取得了革命性突破。本文将系统全面地剖析CNN的核心原理、关键组件、经典模型、数学基础、训练技巧以及最新进展，通过理论解析与代码实践相结合的方式，帮助读者深入掌握这一重要技术。一、CNN基础与核心思想1.1传统神经网络的局限性在处理图像等
卷积神经网络亿只小灿灿 Python 算法与数据结构人工智能 cnn 人工智能神经网络
一、引言在当今人工智能的浪潮中，卷积神经网络（ConvolutionalNeuralNetwork，CNN）无疑是一颗璀璨的明星。它在图像识别、语音处理、自然语言处理等众多领域取得了巨大的成功，极大地推动了人工智能技术的发展。那么，什么是卷积神经网络？它的算法原理是什么？本文将深入探讨这些问题，并通过Python代码实现一个简单的卷积神经网络，以帮助读者更好地理解和掌握这一强大的技术。二、卷积神经
Dom 周华华 JavaScript html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
【Spark九十六】RDD API之combineByKey bit1129 spark
1. combineByKey函数的运行机制 RDD提供了很多针对元素类型为(K,V)的API，这些API封装在PairRDDFunctions类中，通过Scala隐式转换使用。这些API实现上是借助于combineByKey实现的。combineByKey函数本身也是RDD开放给Spark开发人员使用的API之一首先看一下combineByKey的方法说明：
msyql设置密码报错：ERROR 1372 (HY000): 解决方法详解 daizj mysql 设置密码
MySql给用户设置权限同时指定访问密码时，会提示如下错误： ERROR 1372 (HY000): Password hash should be a 41-digit hexadecimal number；问题原因：你输入的密码是明文。不允许这么输入。解决办法：用select password('你想输入的密码');查询出你的密码对应的字符串，然后
路漫漫其修远兮吾将上下而求索周凡杨学习思索
王国维在他的《人间词话》中曾经概括了为学的三种境界古今之成大事业、大学问者，罔不经过三种之境界。“昨夜西风凋碧树。独上高楼，望尽天涯路。”此第一境界也。“衣带渐宽终不悔，为伊消得人憔悴。”此第二境界也。“众里寻他千百度，蓦然回首，那人却在灯火阑珊处。”此第三境界也。学习技术，这也是你必须经历的三种境界。第一层境界是说，学习的路是漫漫的，你必须做好充分的思想准备，如果半途而废还不如不要开始。这里，注
Hadoop(二)对话单的操作朱辉辉33 hadoop
Debug： 1、 A = LOAD '/user/hue/task.txt' USING PigStorage(' ') AS (col1,col2,col3); DUMP A; //输出结果前几行示例： (>ggsnPDPRecord(21),,) (-->recordType(0),,) (-->networkInitiation(1),,)
web报表工具FineReport常用函数的用法总结（日期和时间函数）老A不折腾 finereport 报表工具 web开发
web报表工具FineReport常用函数的用法总结（日期和时间函数）说明：凡函数中以日期作为参数因子的，其中日期的形式都必须是yy/mm/dd。而且必须用英文环境下双引号(" ")引用。 DATE DATE(year,month,day):返回一个表示某一特定日期的系列数。 Year:代表年，可为一到四位数。 Month:代表月份。
c++ 宏定义中的##操作符墙头上一根草 C++
#与##在宏定义中的--宏展开 #include <stdio.h> #define f(a,b) a##b #define g(a) #a #define h(a) g(a) int main() { &nbs
分析Spring源代码之，DI的实现 aijuans spring DI 现源代码
(转) 分析Spring源代码之，DI的实现 2012/1/3 by tony 接着上次的讲，以下这个sample [java] view plain copy print
for循环的进化 alxw4616 JavaScript
// for循环的进化 // 菜鸟 for (var i = 0; i < Things.length ; i++) { // Things[i] } // 老鸟 for (var i = 0, len = Things.length; i < len; i++) { // Things[i] } // 大师 for (var i = Things.le
网络编程Socket和ServerSocket简单的使用百合不是茶网络编程基础 IP地址端口
网络编程;TCP/IP协议网络:实现计算机之间的信息共享,数据资源的交换协议:数据交换需要遵守的一种协议,按照约定的数据格式等写出去端口:用于计算机之间的通信每运行一个程序，系统会分配一个编号给该程序，作为和外界交换数据的唯一标识 0~65535 查看被使用的
JDK1.5 生产消费者 bijian1013 java thread 生产消费者 java多线程
ArrayBlockingQueue：一个由数组支持的有界阻塞队列。此队列按 FIFO（先进先出）原则对元素进行排序。队列的头部是在队列中存在时间最长的元素。队列的尾部是在队列中存在时间最短的元素。新元素插入到队列的尾部，队列检索操作则是从队列头部开始获得元素。 ArrayBlockingQueue的常用方法：
JAVA版身份证获取性别、出生日期及年龄 bijian1013 java 性别出生日期年龄
工作中需要根据身份证获取性别、出生日期及年龄，且要还要支持15位长度的身份证号码，网上搜索了一下，经过测试好像多少存在点问题，干脆自已写一个。 CertificateNo.java package com.bijian.study; import java.util.Calendar; import
【Java范型六】范型与枚举 bit1129 java
首先，枚举类型的定义不能带有类型参数，所以，不能把枚举类型定义为范型枚举类，例如下面的枚举类定义是有编译错的 public enum EnumGenerics<T> { //编译错，提示枚举不能带有范型参数 OK, ERROR; public <T> T get(T type) { return null;
【Nginx五】Nginx常用日志格式含义 bit1129 nginx
1. log_format 1.1 log_format指令用于指定日志的格式，格式： log_format name(格式名称) type(格式样式) 1.2 如下是一个常用的Nginx日志格式： log_format main '[$time_local]|$request_time|$status|$body_bytes
Lua 语言 15 分钟快速入门 ronin47 lua 基础
- - 单行注释 - - [[ [多行注释] - - ]] - - - - - - - - - - - 1. 变量 & 控制流 - - - - - - - - - - num = 23 - - 数字都是双精度 str = 'aspythonstring'
java-35.求一个矩阵中最大的二维矩阵 ( 元素和最大 ) bylijinnan java
the idea is from: http://blog.csdn.net/zhanxinhang/article/details/6731134 public class MaxSubMatrix { /**see http://blog.csdn.net/zhanxinhang/article/details/6731134 * Q35 求一个矩阵中最大的二维
mongoDB文档型数据库特点开窍的石头 mongoDB文档型数据库特点
MongoDD: 文档型数据库存储的是Bson文档-->json的二进制特点：内部是执行引擎是js解释器，把文档转成Bson结构，在查询时转换成js对象。 mongoDB传统型数据库对比传统类型数据库：结构化数据，定好了表结构后每一个内容符合表结构的。也就是说每一行每一列的数据都是一样的文档型数据库：不用定好数据结构，
[毕业季节]欢迎广大毕业生加入JAVA程序员的行列 comsci java
一年一度的毕业季来临了。。。。。。。。正在投简历的学弟学妹们。。。如果觉得学校推荐的单位和公司不适合自己的兴趣和专业，可以考虑来我们软件行业，做一名职业程序员。。。软件行业的开发工具中，对初学者最友好的就是JAVA语言了，网络上不仅仅有大量的
PHP操作Excel – PHPExcel 基本用法详解 cuiyadll PHP Excel
导出excel属性设置//Include classrequire_once('Classes/PHPExcel.php');require_once('Classes/PHPExcel/Writer/Excel2007.php');$objPHPExcel = new PHPExcel();//Set properties 设置文件属性$objPHPExcel->getProperties
IBM Webshpere MQ Client User Issue (MCAUSER) darrenzhu IBM jms user MQ MCAUSER
IBM MQ JMS Client去连接远端MQ Server的时候，需要提供User和Password吗？答案是根据情况而定，取决于所定义的Channel里面的属性Message channel agent user identifier (MCAUSER)的设置。 http://stackoverflow.com/questions/20209429/how-mca-user-i
网线的接法 dcj3sjt126com
一、PC连HUB (直连线)A端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。 B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。二、PC连PC （交叉线）A端：(568A)：白绿，绿，白橙，蓝，白蓝，橙，白棕，棕； B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。三、HUB连HUB&nb
Vimium插件让键盘党像操作Vim一样操作Chrome dcj3sjt126com chrome vim
什么是键盘党？键盘党是指尽可能将所有电脑操作用键盘来完成，而不去动鼠标的人。鼠标应该说是新手们的最爱，很直观，指哪点哪，很听话！不过常常使用电脑的人，如果一直使用鼠标的话，手会发酸，因为操作鼠标的时候，手臂不是在一个自然的状态，臂肌会处于绷紧状态。而使用键盘则双手是放松状态，只有手指在动。而且尽量少的从鼠标移动到键盘来回操作，也省不少事。在chrome里安装 vimium 插件
MongoDB查询（2）——数组查询[六] eksliang mongodb MongoDB查询数组
MongoDB查询数组转载请出自出处：http://eksliang.iteye.com/blog/2177292 一、概述 MongoDB查询数组与查询标量值是一样的，例如，有一个水果列表，如下所示： > db.food.find() { "_id" : "001", "fruits" : [ "苹
cordova读写文件（1） gundumw100 JavaScript Cordova
使用cordova可以很方便的在手机sdcard中读写文件。首先需要安装cordova插件：file 命令为： cordova plugin add org.apache.cordova.file 然后就可以读写文件了，这里我先是写入一个文件，具体的JS代码为： var datas=null;//datas need write var directory=&
HTML5 FormData 进行文件jquery ajax 上传到又拍云 ileson jquery Ajax html5 FormData
html5 新东西：FormData 可以提交二进制数据。页面test.html <!DOCTYPE> <html> <head> <title> formdata file jquery ajax upload</title> </head> <body> <
swift appearanceWhenContainedIn:(version1.2 xcode6.4) 啸笑天 version
swift1.2中没有oc中对应的方法： + (instancetype)appearanceWhenContainedIn:(Class <UIAppearanceContainer>)ContainerClass, ... NS_REQUIRES_NIL_TERMINATION; 解决方法：在swift项目中新建oc类如下： #import &
java实现SMTP邮件服务器 macroli java 编程
电子邮件传递可以由多种协议来实现。目前，在Internet 网上最流行的三种电子邮件协议是SMTP、POP3 和 IMAP，下面分别简单介绍。　　◆ SMTP 协议　　简单邮件传输协议(Simple Mail Transfer Protocol,SMTP)是一个运行在TCP/IP之上的协议，用它发送和接收电子邮件。SMTP 服务器在默认端口25上监听。SMTP客户使用一组简单的、基于文本的
mongodb group by having where 查询sql qiaolevip 每天进步一点点学习永无止境 mongo 纵观千象
SELECT cust_id, SUM(price) as total FROM orders WHERE status = 'A' GROUP BY cust_id HAVING total > 250 db.orders.aggregate( [ { $match: { status: 'A' } }, { $group: {
Struts2 Pojo（六） Luob. POJO strust2
注意：附件中有完整案例 1.采用POJO对象的方法进行赋值和传值 2.web配置 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee&q
struts2步骤 wuai struts
1、添加jar包 2、在web.xml中配置过滤器 <filter> <filter-name>struts2</filter-name> <filter-class>org.apache.st

基于改进胶囊网络的文本分类-论文研读