敷衍zgf

【论文阅读】AlBert: A Lite Bert For Self-Supervised Learning Of Language Representations

【论文阅读】AlBert: A Lite Bert For Self-Supervised Learning Of Language Representations（语言表示自监督学习的简化版）

前言

BERT 模型提出之后，在排行榜上产生了许多 NLP 任务的最新成果。但是，模型非常大，所需要的参数达到110M(Bert_base)和340M(Bert_large)，导致了普通的研究人员无法利用自身条件去训练这样庞大的模型。

摘要

在通常情况下，增大模型的规模可以提高模型在自然语言下游任务的性能。但是随着GPU/TPU内存限制和训练时间的限制，在某些时候进一步增加模型变得更加困难。为了解决这个问题，作者提出了两种减少参数的技术来降低内存消耗和提高Bert的训练速度。通过实验证明，相比于Bert，Albert具有更好的可伸缩性，还使用了一种专注于建模句子间连贯性的自监督损失，并表明它始终有助于多句输入的下游任务。模型在GLUE、RACE和SQuAD基准测试上得到了最新的结果，同时与BERT-large相比具有更少的参数。

一、介绍

全网络预训练为语言表征学习带来了一系列的突破，许多重要的NLP任务，包括那些训练数据有限的任务，都从这些预先训练的模型中受益匪浅。这些突破的一个最引人注目的迹象是，在一项为中国初中和高中英语考试设计的阅读理解任务中，机器的表现发生了变化。RACE测验：论文最初描述了任务，并制定了建模挑战报告，然后最先进的机器精度为44.1%；最新公布的结果显示，他们的模型性能为83.2%；作者在这里介绍的工作将其推高到89.4%，这是45.3%的惊人改进，主要归功于当前构建高性能预训练语言表示的能力。
这些改进的证据表明，大型网络对于实现最先进的性能至关重要。预训练大型模型并将其提炼为用于实际应用的小型模型已成为普遍的做法。 考虑到模型大小的重要性，作者提问: 拥有更好的NLP模型和拥有更大的模型一样容易吗?
回答这个问题的一个障碍是可用硬件的内存限制。鉴于目前最先进的模型通常有数亿甚至数十亿个参数，当作者试图缩放模型时，很容易遇到这些限制。在分布式训练中，训练速度也会受到很大的阻碍，因为通信开销与模型中参数的数量成正比。
针对上述问题的现有解决方案包括模型并行化和智能内存管理。这些解决方案解决了内存限制问题，但没有解决通信开销。在本文中，作者通过设计一个简化版的Bert (ALBERT)体系结构来解决上述所有问题，该体系结构的参数比传统BERT体系结构少得多。
ALBERT结合了两种参数缩减技术，解决了预训练模型缩放的主要障碍。第一种是：嵌入因式分解 通过将庞大的词汇嵌入矩阵分解为两个小矩阵，将隐含层的大小与词汇嵌入的大小分离开来，这种分离使得增加隐层大小更容易，而不会显著增加词汇表嵌入的参数大小。第二种是：跨层参数共享 这种技术可以防止参数随网络深度的增长而增长。这两种技术都显著减少了BERT的参数数量，而不会严重损害性能，从而提高了参数效率。类似于BERT-large的ALBERT配置的参数少18倍，训练速度快1.7倍。参数缩减技术还可以作为一种正则化形式，稳定训练并有助于泛化。
为了进一步提高AlBert的性能，作者还引入了一种用于句子顺序预测的自监督损失(SOP)。SOP主要关注句间连贯，旨在解决Bert中提出的下一句预测(NSP)丢失的无效问题。
由于这些设计决策，作者能够扩展到更大的ALBERT配置，这些配置的参数仍然比BERT-large少，但性能明显更好。作者在著名的GLUE、SQuAD和RACE自然语言理解基准上实现了最新的结果。具体来说，将RACE准确率提高到89.4%，GLUE基准提高到89.4，将SQuAD 2.0的F1分数提高到92.2.

二、相关工作

2.1 扩大自然语言的表示学习Scaling up representation learning for natural language

学习自然语言的表示法已被证明对广泛的自然语言处理任务是有用的，并已被广泛采用。过去两年最重要的变化之一是从训练前的单词嵌入(标准的或上下文的)转变为全网络的训练，然后进行特定于任务的微调。在这一项工作中，通常表明更大的模型尺寸可以提高性能。例如，Devlin等人(2019)表明，在三个选定的自然语言理解任务中，使用更大的隐藏大小、更多的隐藏层和更多的注意力头总是会带来更好的表现。然而，由于模型大小和计算成本问题，它们停留在1024的隐藏层大小上。
由于计算能力的限制，特别是GPU/TPU内存的限制，在大型模型上进行实验非常困难。鉴于目前最先进的模型通常有数亿甚至数十亿个参数，很容易达到内存极限。为了解决这个问题，Chen等人(2016)提出了一种称为梯度检查点的方法，以额外的向前通过为代价降低内存需求为次线性。Gomez等人(2017)提出了一种从下一层重构每一层激活的方法，这样他们就不需要存储中间激活。这两种方法都以降低速度为代价来减少内存消耗。Rafel et al.(2019)提出使用模型并行化来训练一个巨型模型。相比之下，作者的参数缩减技术减少了内存消耗并提高了训练速度。

2.2 跨层参数共享Cross-Layer Parameter Sharing

跨层共享参数的想法已经在Transformer体系结构中进行了探索，但先前的工作主要集中在对标准编码器-解码器任务的训练，而不是训练前/调优设置。与作者的观察结果不同，Dehghani等人(2018)表明，具有跨层参数共享的网络(通用转换器，UT)在语言建模和主谓一致性方面比标准转换器具有更好的性能。最近，Bai等人(2019)提出了transformer网络的深度均衡模型(DQE)，并表明DQE可以达到某一层的输入嵌入和输出嵌入保持不变的平衡点。通过观察显示作者的嵌入是振荡的而不是收敛的。 Hao et al. (2019) 将参数共享transformer与标准transformer相结合，进一步增加了标准transformer的参数数量。

2.3 句子排序目标 Sentence Ordering Objectives

AlBert 使用基于预测两个连续文本片段的顺序的预训练损失。一些研究人员对训练前目标进行了实验，这些目标与语篇连贯类似。语篇中的连贯和衔接已经得到了广泛的研究，发现了许多连接相邻语段的现象。大多数在实践中被发现有效的目标是相当简单的。Skipthought和FastSent的句子嵌入是通过使用一个句子的编码来预测相邻句子中的单词来学习的。句子嵌入学习的其他目标包括预测未来的句子，而不仅仅是预测邻近的句子和预测显式话语标记。我们的损失最类似于Jernite等人(2017)的句子排序目标，即学习句子嵌入以确定两个连续句子的顺序。然而，与上述大多数工作不同的是，我们的损失是在文本片段而不是句子中定义的。Bert使用基于预测一对句子中的第二句是否已与另一个文档中的一句交换的损失。作者在实验中对比了这种损失，发现句子排序是一个更具挑战性的预训练任务，对某些下游任务更有用。与作者的工作同时，Wang等人(2019)也试图预测两个连续文本片段的顺序，但他们将其与原始的下一句预测结合在一个三分类任务中，而不是对两者进行经验比较。

三、AlBert的结构(The Elements Of AlBert)

在本节中，作者将介绍AlBert的设计决策，并与原始Bert体系结构的相应配置进行量化比较。

3.1 模型架构选择Model Architecture Choices

AlBert体系结构的主干与Bert类似，因为它使用带有GELU非线性的transformer编码器。作者遵循Bert表示法约定，将词汇表嵌入大小表示为E，将编码器层数表示为L，将隐藏大小表示为H，在Devlin等人(2019)之后，将前馈/过滤器大小设置为4H，注意头数量设置为H/64。AlBert对Bert的设计选择做出了三个主要贡献。

1.因式分解嵌入参数化： 在Bert以及后续的建模改进如XLNet和RoBERTa中，WordPiece嵌入大小E与隐含层大小H绑定，即E≡H。由于建模和实际原因，这个决策似乎不是最优的，如下所示。
从建模的角度来看，WordPiece嵌入是为了学习与上下文无关的表示，而隐藏层嵌入是为了学习与上下文相关的表示。正如关于上下文长度的实验所表明的那样，类bert表示的力量来自于使用上下文为学习这种上下文相关表示提供信号。因此，将WordPiece嵌入大小E从隐藏层大小H中分离出来，允许根据建模需求更有效地使用总模型参数，这就决定了H远大于E。
从实用的角度来看，自然语言处理通常要求词汇量V较大。如果E≡H，则增大H则嵌入矩阵的大小增大，其大小为V×E。这很容易导致一个具有数十亿个参数的模型，其中大多数参数只在训练过程中很少更新。
因此，对于AlBert，我们使用嵌入参数的因式分解，将它们分解为两个更小的矩阵。我们不直接将单热点向量投影到大小为H的隐藏空间中，而是先将它们投影到尺寸为E的低维嵌入空间中，然后再将其投影到隐藏空间中。通过使用这种分解，我们将嵌入参数从O(V × H)减少到O(V × E + E × H)。当H远大于E时，这种参数减少非常显著。选择对所有词块使用相同的E，因为与全词嵌入相比，它们在文档中更均匀地分布，而对不同的词具有不同的嵌入大小是很重要的。

2.跨层参数共享： 对于AlBert，作者提出跨层参数共享作为提高参数效率的一种方法。共享参数的方式有多种，例如跨层只共享前馈网络(FFN)参数，或者只共享注意力参数。AlBert的默认选择是跨层共享所有参数。所有的实验都使用这个默认选择，除非另有说明。作者将这个设计决策与第4.5节实验中的其他策略进行比较。
Dehghani等人(2018)(通用transformer，UT)和Bai等人(2019)(深度均衡模型，DQE)为transformer网络探索了类似的策略。与作者的观察结果不同，Dehghani等人(2018)表明UT的性能优于vanilla Transformer。
Bai等人，(2019)表明，当某一层的输入和输出嵌入保持不变时，它们的 DQEs 达到了一个平衡点。作者对L2距离和余弦相似度的测量表明作者的嵌入是振荡的而不是收敛的。

图1显示了每一层输入和输出嵌入的L2距离和余弦相似度，使用BERT-large和AlBert-large配置(见表1)。观察到AlBert从一层到另一层的过渡要比BERT平滑得多。这些结果表明，权重共享对稳定网络参数有一定的作用。尽管与BERT相比，这两个指标都有所下降，但即使在24层之后，它们也不会收敛到0。这表明AlBert参数的解空间与DQE发现的解空间有很大的不同。

3.句子间连贯损失： 除了掩盖语言模型(MLM)损失，BERT还使用了一种称为下句预测(NSP)的额外损失。NSP是一种用于预测原文中两个片段是否连续出现的二元分类损失，具体表现为:从训练语料库中提取连续的片段生成正例;通过配对来自不同文档的片段来创建反例;正例和负例的抽样概率相等。NSP目标旨在提高下游任务(如自然语言推理)的性能，这些任务需要对句子对之间的关系进行推理。然而，随后的研究(Yang等人，2019;Liu等人，2019)发现NSP的影响不可靠，并决定消除它，这一决定得到了跨多个任务的下游任务性能改善的支持。
我们推测，与MLM相比，NSP作为一项任务缺乏难度是其无效的主要原因。按照规定，NSP将主题预测和连贯预测合并在一个任务中。然而，与连贯预测相比，主题预测更容易学习，而且与使用MLM损失学习到的内容重叠更多。

作者认为句间建模是语言理解的一个重要方面，但作者提出了主要基于连贯的损失。也就是说，对于AlBert，使用了一个句子顺序预测(SOP)损失，它避免了主题预测，而是专注于建模句间连贯。我们认为句间建模是语言理解的一个重要方面，但我们提出了主要基于连贯的损失。也就是说，对于ALBERT，我们使用了一个句子顺序预测(SOP)损失，它避免了主题预测，而是专注于建模句间连贯。SOP丢失使用与BERT(来自同一文档的两个连续段)相同的技术作为正例，使用相同的两个连续段作为负例，但交换了它们的顺序。这迫使模型学习语篇层面连贯特性的细粒度差异。正如我们在第4.6节中所展示的，结果表明NSP根本无法解决SOP任务(即，它最终学习更容易的主题预测信号，并在SOP任务上以随机基线水平执行)，而SOP可以在合理程度上解决NSP任务，这可能是基于分析错位的相干线索。因此，ALBERT模型持续地提高了多句编码任务的下游任务性能。

3.2 模型设置

在表1中展示了具有可比超参数设置的BERT和ALBERT模型之间的差异。由于上面讨论的设计选择，ALBERT模型的参数尺寸比相应的BERT模型小得多。
例如，ALBERT-large比BERT-large少了大约18倍的参数，18M比334M。H = 2048的ALBERT-xlarge配置只有60M参数，H = 4096的ALBERT-xxlarge配置有233M参数，即约占BERTlarge参数的70%。注意，对于ALBERT-xxlarge，我们主要展示12层网络上的结果，因为24层网络(具有相同的配置)获得类似的结果，但计算成本更高。
这种参数效率的提高是ALBERT设计选择的最重要的优势。在量化这种优势之前，需要更详细地介绍我们的实验设置。

四、实验结果

4.1 实验设置

为了使比较尽可能有意义，作者在使用BookCorpus和英文维基百科进行训练前基线模型时遵循BERT 设置。这两个语料库包含约16GB的未压缩文本。将输入格式化为“[CLS] x1 [SEP] x2 [SEP]”，其中x1 = x1,1, x1,2··和x2 = x1,1, x1,2···是两个段。作者总是将最大输入长度限制为512，随机生成小于512的输入序列，概率为10%。与BERT一样，使用的词汇量为30000，使用SentencePiece标记化，如XLNet。
使用n-gram掩码为MLM目标生成掩码输入，每个n-gram掩码的长度随机选择。长度n的概率由

将n-gram(即n)的最大长度设置为3(即MLM目标可以由最多3-gram的完整单词组成，如“White House correspondents”)。
所有模型更新都使用批量大小为4096和学习率为0.00176的LAMB优化器。除非另有说明，否则将对所有模型进行12.5万步的训练。培训在Cloud TPU V3上完成。根据模型的大小，用于训练的tpu的数量从64到512不等。本节中描述的实验设置用于作者的所有版本的BERT和ALBERT模型，除非另有说明。

4.2 评价基准

4.2.1 内在标准
为了监视训练进度，我们使用与第4.1节相同的过程，基于来自SQuAD和RACE的开发集创建一个开发集。我们报告了传销和句子分类任务的准确性。注意，我们只使用这个集合来检查模型是如何收敛的;它还没有被用于影响任何下游评估的性能的方式，例如通过模型选择。
4.2.2 下游的评价
继Y ang等人(2019)和Liu等人(2019)之后，我们在三个流行的基准上评估了我们的模型:通用语言理解评估(GLUE)基准(Wang等人，2018)，斯坦福问答数据集(SQuAD;Rajpurkar等，2016;以及来自考试的阅读理解(RACE)数据集(Lai et al.， 2017)。为了完整起见，我们在附录A.3中提供了这些基准测试的描述。如(Liu et al.， 2019)所示，我们在开发集上执行早期停止，在开发集上我们展示所有比较，但基于任务排行榜的最终比较除外，我们也展示测试集结果。对于在开发集上有很大差异的GLUE数据集，我们展示中位数超过5次运行。

4.3 AlBert和Bert的整体比较

现在，我们准备量化第三节中描述的设计选择的影响，特别是围绕参数效率的选择。参数效率的提高展示了ALBERT设计选择的最重要优势，如表2所示:在只有大约70%的BERT-large参数的情况下，ALBERT-xxlarge比BERT-large取得了显著的改进，这是通过几个代表性下游任务的开发集得分的差异来衡量的:SQuAD v1.1(+1.9%)、SQuAD v2.0(+3.1%)、MNLI(+1.4%)、SST-2(+2.2%)和RACE(+8.4%)。
另一个有趣的观察结果是在相同的训练配置(相同的tpu数量)下，训练时的数据吞吐量速度。由于较少的通信和较少的计算，ALBERT模型与相应的BERT模型相比具有更高的数据吞吐量。如果我们使用BERT-large作为基线，我们可以观察到ALBERT-large在遍历数据时大约快1.7倍，而ALBERT-xxlarge因为更大的结构而慢3倍。
接下来，我们进行相容实验，量化每个ALBERT设计选择的个人贡献。

4.4 带有参数的因式分解

表3展示了使用基于albert的配置设置(参见表1)，使用相同的代表性下游任务集，更改词汇表嵌入大小E的效果。在非共享条件下(bert样式)，更大的嵌入尺寸提供更好的性能，但不是很多。

表2:在BookCorpus和Wikipedia上预训练125k步的模型的开发集结果。
在这里和其他地方，Avg列是通过其左侧下游任务得分的平均值计算出来的(每个小队的F1和EM两个数字首先是平均值)。在全共享条件下(albert-style)，大小为128的嵌入似乎是最好的。基于这些结果，我们在未来的所有设置中使用嵌入大小E = 128，作为进一步缩放的必要步骤。

4.5 跨层参数共享

表4展示了各种跨层参数共享策略的实验，使用基于Albert的配置(表1)和两种嵌入大小(E = 768和E = 128)。我们比较了全共享策略(ALBERT-style)、非共享策略(BERT-style)和中间策略，其中仅共享注意力参数(但不共享FNN参数)或仅共享FFN参数(但不共享注意力参数)。
在这两种情况下，全共享策略都会损害性能，但E = 128(平均1.5)比E = 768(平均-2.5)更轻。此外，大部分性能下降似乎来自于共享ffn层参数，而共享注意参数在E = 128时没有下降(平均为+0.1)，当E = 768时略有下降(平均为-0.7)。还有其他跨层共享参数的策略。例如，我们可以将L层划分为N个大小为M的组，每个大小为M的组共享参数。总的来说，我们的实验结果表明，group size M越小，我们得到的性能越好。然而，群体规模M的减小也显著增加了整体参数的数量。我们选择全共享策略作为默认选择。

4.6 句子顺序预测(sop)

直接比较了三种附加句间损失的实验条件:none (XLNet-和roberta-style)、NSP (bert-style)和SOP (Albert-style)，使用Albert-base配置。表5显示了内在(MLM、NSP和SOP任务的准确性)和下游任务的结果。

内在任务的结果表明，NSP损失对SOP任务没有带来辨别能力(52.0%的准确率，类似于“None”条件下的随机猜测性能)。这允许我们得出结论，NSP最终只建模主题转移。相比之下，SOP损失确实相对较好地解决了NSP任务(准确率为78.9%)，而SOP任务甚至更好(准确率为86.5%)。

更重要的是，SOP损失似乎持续地提高了多句编码任务的下游任务性能（around +1% for SQuAD1.1, +2% for SQuAD2.0, +1.7% for
RACE）平均分数提高约+1%。

4.7 训练相同的时间

表2中的加速结果表明，与Albert-xxlarge相比，BERT-large的数据吞吐量大约高3.17倍。由于较长的训练通常会带来更好的性能，我们执行了一个比较，而不是控制数据吞吐量(训练步骤的数量)，我们控制实际的训练时间(即，让模型训练相同的小时数)。在表6中，我们比较了一个BERT-large模型经过400k训练步数(经过34小时训练)后的性能，大致相当于训练一个Albert-xxlarge模型经过125k训练步数(经过32小时训练)所需要的时间。

经过大致相同时间的训练后，Albert-xxlarge明显优于BERT-large:在Avg上优于+1.5%，在RACE上差异高达+5.2%。

4.8 额外的训练数据和信息丢失效应

到目前为止所做的实验只使用了Wikipedia和BOOKCORPUS数据集，在本节中，我们展示了XLNet 使用的附加数据的影响测量结果。
图2a绘制了dev set MLM 精度在两种情况下的图，一种是没有附加数据，另一种是有附加数据，后一种情况有显著提高。我们还观察到表7中下游任务的性能改进，但SQuAD基准测试除外(它们是基于维基百科的，因此会受到域外训练材料的负面影响)。

我们还注意到，即使在训练了1M步后，我们最大的模型仍然不能与它们的训练数据过拟合。因此，我们决定删除dropout以进一步增加我们的模型容量。

图2b中的图显示，去除dropout显著提高了MLM的精度。在1M训练步长左右对ALBERT-xxlarge的中间评估(表8)也证实了去除dropout有助于下游任务。有经验证据(Szegedy等人，2017)和理论证据(Li等人，2019)表明，卷积神经网络的批处理归一化和dropout的组合可能会产生有害的结果。据我们所知，我们是第一个证明dropout会损害基于transformer的大型模型的性能的人。然而，ALBERT的底层网络结构是transformer的一个特例，需要进一步的实验来确定这种现象是否会出现在其他基于transformer的体系结构中。

4.9 目前最先进的nlu任务

我们在本节中展示的结果使用了Devlin等人(2019)使用的训练数据，以及Liu等人(2019)和Y ang等人(2019)使用的附加数据。我们展示了在两种设置下进行微调的最先进的结果:单模型和整体。在这两种情况下，我们只进行单任务微调。继Liu等人(2019)之后，在开发集上，我们展示了五次运行的中值结果。

单模型ALBERT配置包含了所讨论的最佳性能设置:一个ALBERT-xxlarge配置(表1)使用了MLM和SOP损失的组合，并且没有dropout。
对最终集成模型有贡献的检查点是根据开发集的性能选择的;根据任务的不同，为这个选择考虑的检查点数量从6到17个不等。对于GLUE(表9)和RACE(表10)基准测试，我们对集成模型的模型预测取平均值，其中候选模型使用12层和24层体系结构从不同的训练步骤中进行微调。对于SQuAD(表10)，我们对具有多个概率的跨度的预测得分取平均值;我们还对“无法回答的”决定的得分取平均值。
单模型和集成结果都表明，ALBERT在所有三个基准测试中都显著提高了最先进的水平，达到了89.4的GLUE分数，92.2的SQuAD 2.0测试F1分数和89.4的RACE测试精度。后者似乎是一个特别强劲的进步，比BERT上升了17.4%的绝对分数(Devlin等人，2019;Clark等人，2019)，比XLNet +7.6% (Yang等人，2019)，比RoBERTa +6.2% (Liu等人，2019)，比DCMI+ 5.3% (DCMI+是专门为阅读理解任务设计的多个模型的集合。我们的单一模型达到了86.5%的精度，这仍然比最先进的集成模型好2.4%。

五、讨论

虽然ALBERT-xxlarge的参数比BERT-large少，而且得到的结果明显更好，但由于它的结构更大，计算成本更高。因此，一个重要的下一步是通过稀疏注意力(Child et al.， 2019)和块注意力(Shen et al.， 2018)等方法加快ALBERT的训练和推理速度。正交研究线可以提供额外的表示能力，包括硬示例挖掘(Mikolov等人，2013年)和更有效的语言建模训练(Yang等人，2019年)。此外，尽管我们有令人信服的证据表明，句子顺序预测是一项更持久有效的学习任务，可以带来更好的语言表示，但我们假设，可能还有更多的维度尚未被当前的自监督训练损失所捕获，可以为结果表示创造额外的表示能力。

Deno入门教程：Node.js 的替代品 xiaoweids 编程语言 JavaScript node.js javascript 开发语言
转自：微点阅读https://www.weidianyuedu.com这几天假期，我学习了一下Deno[1]。它是Node.js的替代品。有了它，将来可能就不需要Node.js了。这篇文章就是Deno的一个初步介绍，尝试回答为什么Node.js不能满足需要，以及Deno能够带给我们什么？以下内容主要基于BertBelder[2]和RyanDahl[3]的最新演讲。0、进入主题之前，先说一下Deno
设计模式-单一职责原则 qq_26920109 java java 设计模式深圳
单一职责原则（SRP：Singleresponsibilityprinciple）又称单一功能原则，原话解释是：thereshouldneverbemorethanareasonofaclasstochange,也就是引起类的变化原因不能超过一个，面向对象五个基本原则（SOLID）之一。该原则由罗伯特·C·马丁（RobertC.Martin）于《敏捷软件开发：原则、模式和实践》一书中给出的。马丁表
图像处理篇---图像预处理 Ronin-Lotus 图像处理篇深度学习篇程序代码篇图像处理人工智能 opencv python 深度学习计算机视觉
文章目录前言一、通用目的1.1数据标准化目的实现1.2噪声抑制目的实现高斯滤波中值滤波双边滤波1.3尺寸统一化目的实现1.4数据增强目的实现1.5特征增强目的实现：边缘检测直方图均衡化锐化二、分领域预处理2.1传统机器学习（如SVM、随机森林）2.1.1特点2.1.2预处理重点灰度化二值化形态学操作特征工程2.2深度学习（如CNN、Transformer）2.2.1特点2.2.2预处理重点通道顺序
目前市场上主流的机器视觉的框架有哪些？他们的特点及优劣 yuanpan 机器学习计算机视觉
目前市场上主流的机器视觉框架和工具可以分为商业软件、开源工具和深度学习框架三大类。以下是它们的总结及特点对比：1.商业软件(1)Halcon(MVTec)特点：专注于工业机器视觉，提供高精度、高效率的算法。支持复杂的工业应用，如缺陷检测、3D视觉、深度学习等。提供图形化开发工具HDevelop和多种编程接口。优势：算法优化好，适合实时工业应用。硬件兼容性强，支持多种工业相机和设备。劣势：商业软件，
1.1PaddleTS_环境配置：一个易用的深度时序建模的Python库 pythonQA python paddlepaddle
PaddleTS是一个易用的深度时序建模的Python库，它基于飞桨深度学习框架PaddlePaddle，专注业界领先的深度模型，旨在为领域专家和行业用户提供可扩展的时序建模能力和便捷易用的用户体验。PaddleTS的主要特性包括：设计统一数据结构，实现对多样化时序数据的表达，支持单目标与多目标变量，支持多类型协变量封装基础模型功能，如数据加载、回调设置、损失函数、训练过程控制等公共方法，帮助开发
【大模型科普】AIGC技术发展与应用实践（一文读懂AIGC）人工智能
【专栏介绍】⌈⌈⌈人工智能与大模型应用⌋⌋⌋人工智能（AI）通过算法模拟人类智能，利用机器学习、深度学习等技术驱动医疗、金融等领域的智能化。大模型是千亿参数的深度神经网络（如ChatGPT），经海量数据训练后能完成文本生成、图像创作等复杂任务，显著提升效率，但面临算力消耗、数据偏见等挑战。当前正加速与教育、科研融合，未来需平衡技术创新与伦理风险，推动可持续发展。文章目录一、AIGC概述（一）什么是
代码逐行解析 | 教你在C++中使用深度学习提取特征点 3Ｄ视觉工坊 3D视觉从入门到精通 c++深度学习开发语言人工智能
点击下方卡片，关注「3D视觉工坊」公众号选择星标，干货第一时间送达扫描下方二维码，加入3D视觉技术星球，星球内汇集了众多3D视觉实战问题，以及各个模块的学习资料：最新顶会论文、书籍、源码、视频（近20门系统课程[星球成员可免费学习]）等。想要入门3D视觉、做项目、搞科研，就加入我们吧。作者：泡椒味的口香糖|来源：3DCV添加微信：dddvision
深度学习-130-RAG技术之基于Anything LLM搭建本地私人知识库的应用策略问题总结(一) 皮皮冰燃深度学习深度学习人工智能 RAG
文章目录1AnythingLLM的本地知识库1.1本地知识库应用场景1.2效果对比及思考1.3本地体现在哪些方面1.3.1知识在本地1.3.2分割后的文档在本地1.3.3大模型部署运行在本地2问错问题带来的问题2.1常见的问题2.2原因分析3为什么LLM不使用我的文件？3.1LLM不是万能的【omnipotent】3.2LLM不会自省【introspect】3.3AnythingLLM是如何工作的
3DMAX点云算法：实现毫米级BIM模型偏差检测（附完整代码）夏末之花人工智能
摘要本文基于激光雷达点云数据与BIM模型的高精度对齐技术，提出一种融合动态体素化与多模态特征匹配的偏差检测方法。通过点云预处理、语义分割、模型配准及差异分析，最终实现建筑构件毫米级偏差的可视化检测。文中提供关键代码实现，涵盖点云处理、特征提取与深度学习模型搭建。一、核心算法流程点云预处理与特征增强去噪与下采样：采用统计滤波与体素网格下采样，去除离群点并降低数据量。语义分割：基于PointNet++
数据增强：扩充数据集，提升模型的鲁棒性 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 LLM大模型落地实战指南计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
数据增强：扩充数据集，提升模型的鲁棒性1.背景介绍1.1数据集的重要性在机器学习和深度学习领域中,数据集是训练模型的基础。高质量的数据集对于构建准确、鲁棒的模型至关重要。然而,在现实世界中,获取大量高质量的数据通常是一个巨大的挑战。数据采集过程耗时耗力,而且成本高昂。此外,某些领域的数据存在隐私和安全问题,难以获取。1.2数据集不足的挑战当数据集规模有限时,模型很容易过拟合,无法很好地推广到新的、
Docker打包深度学习项目 FLY_LTL docker 深度学习容器
文章目录Docker打包深度学习项目1.Docker和NVIDIAContainerToolkit的安装1.Docker2.NVIDIAContainerToolkit3.添加国内镜像源2.使用Dockerfile打包并保存镜像1.Dockerfile2.通过Dockerfile生成镜像3.保存镜像和加载4.运行Docker并测试参考Docker打包深度学习项目本文来源于个人实践总结，供各位同学参
深度革命：ResNet 如何用 “残差连接“ 颠覆深度学习安意诚Matrix 机器学习笔记深度学习人工智能
一文快速了解ResNet创新点在深度学习的历史长河中，2015年或许是最具突破性的一年。这一年，微软亚洲研究院的何恺明团队带着名为ResNet（残差网络）的模型横空出世，在ImageNet图像分类竞赛中以3.57%的错误率夺冠，将人类视觉的识别误差（约5.1%）远远甩在身后。更令人震撼的是，ResNet将神经网络的深度推至152层，彻底打破了"深层网络无法训练"的魔咒。这场革命的核心，正是一个简单
智能形状匹配技术全解析：从经典算法到深度学习与神经形态计算【超级详细版】 AI筑梦师计算机视觉算法深度学习人工智能机器学习计算机视觉 python
智能形状匹配技术全解析：从经典算法到深度学习与神经形态计算1.引言1.1研究背景在计算机视觉、模式识别、医学影像分析和自动驾驶等领域，形状匹配是核心任务之一。然而，现实世界的形状往往存在可变性（Variability），主要体现在以下几个方面：形变（Deformation）：物体可能由于柔性材料、外力作用或生物运动发生非刚性形变。尺度变化（ScaleVariation）：目标形状在不同场景下可能大
Python 模拟鼠标轨迹算法 a485240 鼠标轨迹计算机外设
一.鼠标轨迹模拟简介传统的鼠标轨迹模拟依赖于简单的数学模型，如直线或曲线路径。然而，这种方法难以捕捉到人类操作的复杂性和多样性。AI大模型的出现，使得能够通过深度学习技术，学习并模拟更自然的鼠标移动行为。二.鼠标轨迹算法实现AI大模型通过学习大量的人类鼠标操作数据，能够识别和模拟出自然且具有个体差异的鼠标轨迹。以下是实现这一技术的关键步骤：数据收集：收集不同玩家在各种游戏环境中的鼠标操作数据，包括
论文笔记-Contrastive Learning for Unpaired Image-to-Image Translation kingsleyluoxin 计算机视觉论文笔记深度学习 python 计算机视觉机器学习人工智能深度学习
论文信息标题：ContrastiveLearningforUnpairedImage-to-ImageTranslation作者：TaesungPark,AlexeiA.Efros,RichardZhang,Jun-YanZhu机构：UniversityofCalifornia,Berkeley;AdobeResearch代码链接https://github.com/taesungp/contra
迁移学习入门 EmbodiedTech 人工智能大模型迁移学习人工智能机器学习
迁移学习1迁移学习的概念预训练模型定义:简单来说别人训练好的模型。一般预训练模型具备复杂的网络模型结构；一般是在大量的语料下训练完成的预训练语言模型的类别现在我们接触到的预训练语言模型，基本上都是基于transformer这个模型迭代而来的因此划分模型类别的时候，以transformer架构来划分：Encoder-Only:只有编码器部分的模型，代表：BERTDecoder-Only:只要解码器部
什么是机器视觉3D引导大模型视觉人机器视觉机器视觉3D 3d 数码相机机器人人工智能大数据
机器视觉3D引导大模型是结合深度学习、多模态数据融合与三维感知技术的智能化解决方案，旨在提升工业自动化、医疗、物流等领域的操作精度与效率。以下从技术架构、行业应用、挑战与未来趋势等方面综合分析：一、技术架构与核心原理多模态数据融合与深度学习3D视觉引导大模型通常整合RGB图像、点云数据、深度信息等多模态输入，通过深度学习算法（如卷积神经网络、Transformer）进行特征提取与融合。例如，油田机
深度学习在医学影像分析中的应用：DeepSeek系统的实践与探索 Evaporator Core #深度学习 #DeepSeek快速入门 DeepSeek进阶开发与应用深度学习人工智能
随着人工智能技术的迅猛发展，深度学习在医学领域的应用逐渐成为研究热点。医学影像分析作为医疗诊断的重要组成部分，正受益于深度学习技术的突破。DeepSeek系统是一种基于深度学习的医学影像分析平台，旨在通过高效、精准的算法辅助医生进行疾病诊断和治疗决策。本文将深入探讨DeepSeek系统的技术原理、实现方法及其在医学影像分析中的实际应用，并结合代码示例展示其核心功能。1.DeepSeek系统的技术架
【深度学习遥感分割|论文解读2】UNetFormer：一种类UNet的Transformer，用于高效的遥感城市场景图像语义分割 985小水博一枚呀论文解读深度学习 transformer 人工智能网络 cnn
【深度学习遥感分割|论文解读2】UNetFormer：一种类UNet的Transformer，用于高效的遥感城市场景图像语义分割【深度学习遥感分割|论文解读2】UNetFormer：一种类UNet的Transformer，用于高效的遥感城市场景图像语义分割文章目录【深度学习遥感分割|论文解读2】UNetFormer：一种类UNet的Transformer，用于高效的遥感城市场景图像语义分割2.Re
PyTorch 深度学习博客 Zoro｜ PyTorch Deep Learning 人工智能
PyTorch深度学习博客欢迎来到我的PyTorch深度学习博客！在这里，我将分享使用PyTorch学习和实践深度学习项目的点滴经验。本博客适用于初学者和有一定基础的开发者，旨在帮助大家快速搭建环境、掌握核心概念，并通过实例了解实际应用。环境配置为了确保项目的稳定性和兼容性，我选择了Python3.9环境，并在conda创建的虚拟环境中运行最新且稳定的PyTorch版本2.6.0。1.创建Pyth
深度学习五大模型：CNN、Transformer、BERT、RNN、GAN详细解析深度学习
卷积神经网络（ConvolutionalNeuralNetwork,CNN）原理：CNN主要由卷积层、池化层和全连接层组成。卷积层通过卷积核在输入数据上进行卷积运算，提取局部特征；池化层则对特征图进行下采样，降低特征维度，同时保留主要特征；全连接层将特征图展开为一维向量，并进行分类或回归计算。CNN利用卷积操作实现局部连接和权重共享，能够自动学习数据中的空间特征。适用场景：广泛应用于图像处理相关的
算力技术创新驱动多场景应用演进智能计算研究中心其他
内容概要算力技术创新正成为数字经济时代的基础性驱动力，从异构计算架构的多元融合到量子计算的颠覆性突破，技术演进不断突破物理与算法的双重边界。在工业互联网场景中，边缘计算通过分布式节点实现毫秒级响应，支撑智能制造产线的实时控制；智能安防系统依托深度学习模型与流计算技术，完成海量视频数据的动态解析；而科学计算领域通过分布式计算与模型压缩技术，将基因测序、气候模拟等复杂任务的效率提升至新量级。值得注意的
AI模型技术前沿与跨场景应用实践智能计算研究中心其他
内容概要当前AI模型技术正呈现多维度突破与跨领域融合的特征。从技术演进角度看，可解释性模型与量子计算框架的协同发展正在突破传统黑箱限制，而联邦学习、自适应优化等技术则为复杂场景建模提供了新的方法论支撑。应用层面，TensorFlow与PyTorch框架在医疗影像诊断、金融时序预测等领域的实战案例，验证了深度学习模型在垂直行业的泛化能力。值得关注的是，工具链整合已成为技术落地的关键环节，MXNet与
融合AMD与NVIDIA GPU集群的MLOps：异构计算环境中的分布式训练架构实践
在深度学习的背景下，NVIDIA的CUDA与AMD的ROCm框架缺乏有效的互操作性，导致基础设施资源利用率显著降低。随着模型规模不断扩大而预算约束日益严格，2-3年更换一次GPU的传统方式已不具可持续性。但是Pytorch的最近几次的更新可以有效利用异构计算集群，实现对所有可用GPU资源的充分调度，不受制于供应商限制。本文将深入探讨如何混合AMD/NVIDIAGPU集群以支持PyTorch分布式训
深度学习框架PyTorch——从入门到精通（4）数据转换 Fansv587 Torch框架学习深度学习 pytorch 人工智能 python 经验分享
转换（Transforms）很多时候，数据并不总是以训练机器学习算法所需的最终处理形式出现。所以我们需要使用变换对数据进行一些处理，使其适合训练。所有TorchVision数据集都有两个参数——transform来修改特征，target_transform来修改标签——接受包含转换逻辑的可调用项。torchvision.transform模块提供了几个开箱即用的转换。FashionMNIST数据集
深度学习框架PyTorch——从入门到精通（5）构建神经网络 Fansv587 Torch框架学习深度学习 pytorch 神经网络经验分享
构建神经网络获取训练设备定义类模型层nn.Flattennn.Linearnn.ReLUnn.Sequentialnn.Softmax模型参数补充说明argmax神经网络是由一些层或者模块组成的，这些层和模块会对数据进行各种操作。在PyTorch里，torch.nn这个命名空间提供了你搭建自己神经网络所需要的所有基础组件。PyTorch里的每一个模块都是nn.Module类的子类。一个神经网络本身
深度学习框架PyTorch——从入门到精通（5）自动微分 Fansv587 深度学习 pytorch 人工智能
使用torch.autograd自动微分张量、函数和计算图计算梯度禁用梯度追踪关于计算图的更多信息张量梯度和雅可比乘积在训练神经网络时，最常用的算法是反向传播。在该算法中，参数（模型权重）根据损失函数的梯度相对于给定参数进行调整。为了计算这些梯度，PyTorch有一个内置的微分引擎，名为torch.autograd。它支持为任何计算图自动计算梯度。考虑最简单的一层神经网络，具有输入x、参数w和b以
消融实验（Ablation Study） xwhking 深度学习机器学习深度学习消融实验
消融实验（AblationStudy）定义：消融实验是一种科学研究方法，通过逐步移除模型、算法或系统中的某个组件（如模块、层、特征、数据等），观察其对整体性能的影响，从而验证该组件的必要性和有效性。其名称来源于医学领域的“消融术”（切除部分组织以研究功能），在计算机视觉、机器学习和深度学习中被广泛用于分析模型设计。为什么要做消融实验？1.验证组件的有效性核心目的：确认模型中某个设计（如注意力机制、
数据集格式转换——json2txt、xml2txt、txt2json【复制就能用】 kay_545 YOLO11改进有效涨点 python 人工智能机器学习
秋招面试专栏推荐：深度学习算法工程师面试问题总结【百面算法工程师】——点击即可跳转本专栏所有程序均经过测试，可成功执行专栏地址：YOLO11入门+改进涨点——点击即可跳转欢迎订阅目录json2txt脚本xml2txttxt2json
AI人工智能深度学习算法：在量子计算中的应用 AI天才研究院 AI大模型企业级应用开发实战 AI大模型应用入门实战与进阶 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍随着科技的不断发展，人工智能和量子计算成为了当今世界的热门话题。人工智能的深度学习算法在处理大规模数据和复杂任务方面取得了显著的成果，而量子计算则具有强大的并行计算能力和高效的信息处理能力。将人工智能与量子计算相结合，为解决一些具有挑战性的问题提供了新的思路和方法。本文将探讨人工智能深度学习算法在量子计算中的应用，包括其背景、意义和应用场景。2.核心概念与联系在人工智能中，深度学习是一
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 [email protected] 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源