深圳季连AIgraphX

51-12 多模态论文串讲—BLIP 论文精读

视觉语言预训练VLP模型最近在各种多模态下游任务上获得了巨大的成功，目前还有两个主要局限性:

(1) 模型角度: 大多数方法要么采用encoder模型，要么采用encoder-decoder模型。然而，基于编码器的模型不太容易直接转换到文本生成任务（如图像字幕），而编码器-解码器模型尚未成功用于图像文本检索任务。

(2) 数据角度: 如CLIP、ALBEF等从web上收集到的图文对上进行预训练，目前用有噪声的网络文本训练效果是次优的。

为此，作者提出了BLIP: 引导语言图像预训练，以实现统一的视觉语言理解和生成。BLIP是一个新的VLP框架，与现有方法相比，它可以实现更广泛的下游任务。它分别从模型和数据角度有两个贡献:

(1) 多模态编码器-解码器混合（MED）：一种用于有效多任务预训练和灵活迁移学习的新模型架构。MED可以作为单模态编码器、基于图像的文本编码器或基于图像的文本解码器工作。该模型与三个视觉语言目标联合预训练：图像文本对比学习、图像文本匹配和图像条件语言建模。

(2) CapFilter：一种新的数据集增强方法，用于从噪声图像-文本对中学习。作者将预先训练的MED分为两个模块: 一个Captioner，用于生成给定web图像匹配的文本，以及一个Filter，用于从原始web文本和合成文本中删除嘈杂的文本。

BLIP，用这个Capfilter去生成更多更好的这个数据，然后给别的模型做训练用。你可以拿这个数据去训练VLMo，训练CoCA，训练BEiT3，去训练各种各样的多模的模型，因为它的目的，就是生成更好的数据。BLIP未来是一个非常通用的工具。

大家好，我们今天就接着上次多模态串讲，来说一说最近使用transformer encoder和decoder的一些方法。我们要过的第一篇论文叫做BLIP: Bootstrapping Language-Image Pre-training for Unified Vision-Language Understanding and Generation。题目中，有两个关键词，一个就是bootstrapping，另一个就是unified，也就他们这篇文章的两个贡献点。第一个bootstrapping，其实是从数据集角度出发的，他是说，如果你有一个从网页上爬下来的，很嘈杂的数据集。这时候，你先用它去训练一个模型，接下来，你再通过一些方法，去得到一些更干净的数据，然后再用这些更干净的数据，能不能串出更好的模型。那第二个贡献点，其实就从后面来看就非常明了，也就是这两个方向，一个是understanding，也就是Image Text Retrieval，方向，即VQA，VR，VE这些。还有就是Generation这种生成任务，譬如这些Image Captioning图像生成字幕这种任务。作者团队，全部来自于salesforce research，是我们上次讲过ALBEF那篇论文的原班人马。我们一会儿也可以看到，这篇论文它的模型，也有很多ALBEF的影子，而且它里面也用了很多ALBEF的训练技巧。

那接下来，我们直接进入引言部分，看看这篇文章的研究动机到底是什么。BLIP的引言，写的非常清晰，他上来就告诉你，我的研究动机，有两个部分，一个是从这个模型角度出发，一个是从数据角度出发。从模型上，作者说，最近的一些方法，他要么，就是用了Transformer encoder的一些模型，这里举的这个CLIP，还有他们自己的ALBEF。另外一条路，就是用了这种编码器解码器，Encoder，Decoder的结构，比如说后面这个，就是SimVLM。虽然说方法都有，但是作者这里说这种encoder only的模型，它没法很直接的用到这种text generation的任务去，比如说这是图像生成字幕。因为它只有编码器，没有解码器，那它用什么去生成？当然也不是完全不行，但就是说不够直接肯定你要杂七杂八的再加一些模块，才能让他去做这种generation的任务。那对于encoder，decoder模型来说，它虽然有了decoder，它虽然可以去做这种生成的任务。但是反过来，因为没有一个统一的框架，所以说它又不能直接的被用来做这种image text retrieval的任务。那我们读到这儿，其实发现，作者这里这个研究动机，跟我们上次讲的那个VLMo是完全一样的。都是说现有的框架，A可以干什么，不能干什么，B可以干什么不能干什么，但是这两条方向，都不能一个人把所有的活都干了。所以如何能提出一个unified，一个统一的框架。用一个模型，把所有的任务都解决，那该多好。那接下来，我们很快就可以看到，其实BLIP这篇论文，就是利用了很多VLMo的想法，把他的模型，设计成了一个很灵活的框架。从而构造了这么一个unified framework。那另外一个研究动机，就是说数据层面。作者说，目前，这是表现出色的这些方法，比如说clip。他们都是在大规模的，这种上爬下的非常noisy的数据集上，也就是这种上去预训练模型的。虽然说当你有足够多足够大的数据集的时候，它能够弥补一些，这些嘈杂数据集带来的影响，也就是说，你通过这个把这个数据集变大，你还是能够得到非常好的这个性能的提升的。但是，BLIP这篇论文就告诉你，使用这种noisy的数据集区域训练，还是不好的，它是一个sub optimal，不是最优解。那如何能够有效的去clean这个nosiy的data set，如何能够让模型更好的去利用数据的这个图像文本配对信息？在这篇论文里，作者就提出了这个captioner和filter这么一个module。Captioner的作用，就是说我给定任意一张图片，我就用这个captioner，去生成一些这个字幕。这样，我就会得到大量的这个合成数据synthetic data。然后同时，我再去训练这么一个filter model，它的作用，就是把那些图像和文本不匹配的对，都从这个数据集里删掉。

比如说在这个例子里，这就是一个巧克力蛋糕吧，那原来从网上直接扒下的这个图像文本里的文本？写的是blue sky bakery in sunset park。就是说一家位于这个日落公园，叫蓝天的蛋糕店，那我们可以很明显的看出来，这个图文，其实是完全不匹配的。那我们上次也提过，之所以他这个文本是这样，其实是因为有利于这个搜索引擎去搜索，因为大家看到这个蛋糕的图片之后，更想做的，是去知道这家蛋糕店在哪儿，我怎么能去买到这家蛋糕店。这样，搜索引擎才能收广告挣钱，这个蛋糕店的店主，也能得到更多的客流量。所以大部分你爬下来的那些数据集，不论你爬了几百万，几千万，上亿的图片文本，对里面大部分，都是这种不匹配的，Noisy的文本对。那我们这个时候可以看到，作者训练的这个captainer这个模型，它其实可以生成非常非常有描述性的这个文本。那所以在接下来，他们训练的这个filter模型来看，他们就会选择这个图像文本对去进行模型的训练，而不用原来的那个真实的图形文本去进行训练。

那快速过完了引言中的研究动机，接下来，我们废话不多说，直接来看文章的图二，看一下，整体的这个模型结构。

那在看图二之前，我想再回顾一下上一期讲的两个方法。因为之前我们说过，ALBEF提出，就是ViLT在和CLIP一系列工作之前的这个经验总结上得到。那我们今天要讲的这个BLIP，是不是也能用之前的经验总结而得到？那答案，是肯定的。

我们首先来看ALBEF的模型，分成三个结构，一个是这个视觉编码器，一个是文本编码器，还有一个是多模态编码器。

对于图像这端来说，就是一个图像，进入这个encoder，它一共有N层。然后一个文本，进入这个文本的编码器，它有L层。然后在得到对应的这个图像文本特征之后，他先做一个ITC这个对比学习的loss，去把图像和文本分别的这个特征好。然后，文本特征，继续进入这个self attention layer去学，然后图像特征，通过一个cross attention layer进来，然后文本特征去进行融合。然后经历了N-L层的这个多模态的编码器之后，最后得到了多模态的那个特征。然后最后，用这个多模态的特征去做这个image text matching任务，从而去训练更好的模型。

那为什么文本这端，要把一个N层的transform encoder硬生生的劈成L层和N-L层？至于作者，还想大概维持这个计算量不变，就是跟clip一样，左边一个12层的，右边也是一个12层的。他不想增加更多过量的这个多模态融合这部分的计算量。但是，多模态这一部分又特别的重要，然后相对而言，文本这端不那么重要，所以他就把这边12层的计算量，给分成了两部分。

但是同样的问题，VLMo是怎么解决的？VLMo觉得，你这样劈来劈去太麻烦了，而且也不够灵活。那我们现在来设计一个这个MoE这种网络，让它变得极其的灵活，就是说我只有一个网络。我的这个self attention层，全都是共享参数。我唯一根据模态不同而改变的地方，就是这个Feed Forward Netwrok FFN，我这个Feed Forward text，FF vision，FF modality。我用这个地方，去区别不同的modality，去训练不同的expert。这样，我就用统一的一个模型，就是在训练的时候是一个模型，但是我在做推理的时候，我可以根据不同的这个任务，去选择这个模型中的某一部分去做推理。而且这篇论文，用实验，大量的实验证明了这个self attention层，确实是可以共享参数的，它跟这个模态没什么关系。那大家一旦收到这个信号之后，肯定还是觉得VLMo这个结构更简单，至少直观上看起来更简单更优雅，所以说，结合了ALBEF和VLMo，作者就推出了BLIP这个模型。

我们先大体从粗略上来看一下。

这个模型，包含了四个部分。

一个，就是图像这边，它有一个完整的VIT的模型，一个N层的VIT模型，而且是非常标准的self attention，FFN。然后文本这边，它有三个模型。分别用来算三个不同的这个目标函数。这个，就跟VLMo已经非常像了，它根据你这个输入模态的不同，它根据你这个目标函数的不同，去选择一个大模型里不同的部分，去做这个模型的forward。那对于第一个文本模型来说，这里面它也是N层，而不像ALBEF里的L层了。它的目的，是根据你输入的文本，去做这么一个understanding，去做这么一个分类的任务，所以说当得到了这个文本特征之后，他就去跟这个视觉特征，去做ITC loss。那第二个文本模型，作者这里说，它叫image grounded text encoder，就是它是一个多模态的编码器。它这里，是借助了图像的信息，然后去完成一些多模态的任务，很显然那这个就是我们之前要做这个ITM loss。那这个时候其实我们发现，如果你把第3部分，直接放到图上面，其实它不就是ALBEF的网络结构吗。所以如果暂时我们先不看第三个这个文本编码器，其实左边这一部分，完完全全就是一个ALBEF。

但是他跟ALBEF有一点不同。就是他借鉴了VLMo，这个self attention层，是可以共享参数的。所以他就不需要把一个文本模型，P成两个部分去用了，他可以就用一个文本模型，但是，共享参数。所以这里我们也可以看到，作者说同样的颜色，代表同样的参数，就是共享参数的，它不是两个模型，那这里我们也可以看到，这个SA层，也是共享参数的。所以相当于，第一个文本编码器和第二个文本编码器，它基本就是一样的，它的这个SA和FF，全都是一致的，只不过第二个里头多了一个cross attention层，需要新去学习。那所以讲到这儿，也就回答了我们刚才的问题，我们确实可以通过看之前的方法，总结他们的经验，从而得到接下来的方法的这个大体的模型结构和创新点。

但是到这儿，我们会发现，目前的这个结构，它还是只能做这种VQA,VR,VE这种的任务，那怎么去做生成的任务，这个decoder在哪?

那有了VLMo这个想法之后，那一切就变得很简单了，对吧？如果你需要一个decoder，那就再加一个decoder不就完了吗？所以你就在后面，再加这么一个文本的decoder。但是，对于decoder来说，它的这个输入输出的形式，和尤其是第一层的这个self attention，是不太一样的。因为这个时候，他不能看到完整的这个句子，因为如果他已经看到完整的句子，他再去生成这个句子，那他肯定能100%生成出来这个句子，那就训练就没有难度了。那他必须像训练GPT模型一样，他把后面的这些句子，都挡住，都mask掉，他只通过前面的这些信息，去推测后面的句子到底长什么样，这才叫text generation。所以说，它的第一层用的是causal self attention，也就是因果关系的这个自注意力。就是你要去做一些这个因果推理，你要通过前面的这些文本，去推测后面的文本到底是什么。那因为这里，它做的是这种causal self attention，跟前面的这个self attention就不样，所以我们可以看到它这色是不一样，就是它俩是没办法共享数的。作者后面也做了实验，就是如果你硬要让他们去共享这个参数，这个性能是会下降。因为他确实是在做不同的任务。但是，除了第一层的这个自注意力之外，后面的这个cross attention和feed forward，它就跟前面，全都是共享参数的。所以说名义上，它新添加第三个这个text decoder，但事实上，参数量并没有增加多少，只是增加了一些causal的self attention。

最后的目标函数，就是用的GPT系的这种language model。也就是说给定一些词，还去预测剩下的那些词，这个叫language model。那对于MLM，也就是ALBEF和VLMo之前用的那个目标函数，那个是属于完形填空，就给一个句子，中间词扣掉，我去预测中间这个词。

所以说，LM和MLM其实是不一样的。

那在这篇论文里，因为作者要去做这种生成式的任务，所以更好的一个选择，是使用language model的目标函数。

那说到这儿，文章的模型部分，就基本已经说完了。

再来快速总结一下，就是说，对于图像，它就有一个VIT。但是对于文本来说，它对应了三个模型，分别是一个标准的这个text encoder，然后还有就是image grounded text encoder和image grounded text decoder。无论是encoder，还是decoder，模型的差距还是比较小的。譬如 image grounded text encoder，有一个新的cross attention。对image grounded text decoder呢，有一个causal的self attention。剩下的部分，其实基本都是共享参数的。然后就跟VLMo一样，当我们选择头两个模型的时候，我们就去算这个ITC loss。当我们选择第一个和第二个文本模型的时候，我们就去算ITM loss。

当我们选择第一个模型和第三个文本模型的时候，我们就去算这个LM loss。所以从目标函数角度来说，BLIP也是三个目标函数，头两个，跟ALBEF和VLMo都是一样的，只不过第三个从MLM换成LM。所以说，VLMo，BLIP推广的这一系列unified framework。虽然它不是真正意义上的，但确实是非常灵活，而且能把大部分的任务都融合到一个模型中来,大大加速了这个多模态学习的进展。

当然，文章中还有一些细节。比如对于三个文本模型来说，他们对应的这个token就不一样，第一个文本模型，就用的是cls token，第二个用的是encode token，第三个用的是decode token。

还有，就跟我们上次说的一样，这些模型都很难训练，训练的代价非常高，因为在做每一次这个trainning iteration的时候，图像端只需要做一次Forward，但其实文本端，在这里要做三次。要分别通过这三个模型，去得到对应的那个特征，然后去算对应的目标函数，所以还是非常费时间的。

另外，因为BLIP就是ALBEF的原班人马，所以说里面用到了很多ALBEF的技巧。譬如算ITC的时候，也用了momentum encoder动态蒸馏去做更好的knowledge distillation，也去做更好的这个数据的清理。同时，在算ITM loss的时候，也像ALBEF一样，利用ITC算的相似性去做Hard Negative mining，从而每次都用那个最难的负样本去算这个ITM，从而增加这个loss的有效性。总之，这就是BLIP的模型结构。文章中作者把这叫MED就是mixture of encoder and decoder，就是把编码和码混到一起了。那其实这个命名方式，跟VLMo也很像，VLMo提出的那个transformer block叫MoME，就是multimodality mixture of expert。BLIP不过就是把mixture of expert换成了mixture of encoder and decoder，但意思，都是一个意思。

那说完了模结构MED，下们讨论第二个贡献，也就是最重要的那个贡献CapFilter module。

他的出发点，或者研究动机，就是说，假如说你有很多这个数据集，这个D里面{(Iw,Tw)}+{(Ih,Th)}，可能有一些网上爬下的数据集，可能有一些手工标注的数据集。当然了，像CLIP模型的训练，他就没有用这个手工标注的数据集，就只用从网上爬下来的那400m。但是有的时候，反正手工标注的数据集，比如说coco也是存在的，那不用白不用，所以有的人也会用。对所有的现有的这个数据D来说，它最大的问题就是说从网页上爬上的数据集，这个图片文本论不匹配，也就是说这里的这个Tw不好，所以作者这里用红色来表示。这个coco，手工标注的，他认为这个文本就一定匹配，所以用绿色来表示。然后作者这里的论点就是说，如果你用这种noisy的数据集，去预训练一个这个模型，它的效果就不是最好。

那如果我们想清理一下这个数据集，从而去达到这个最优解，该怎么做？

那很自然的，我就需要训练一个模型，这个模型，最好是能给我一些像图像文本之间这个相似度。那相似度高的，就说明匹配，相似度不高的，可能就不匹配，所以这也就是filter这个模块的由来。至于filter是怎么训练的？作者就是把已经提前预训练好的这个MED，也就是把已经训练好的这个BLIP模型拿出来。然后把那个图像模型和两个文本模型，就是分别做ITC，ITM模型拿来，然后又在coco数据集上，就是在干净的数据集上又去做了一些很快的微调。然后先训练出来的这个，就是微调过后的这个MED，就叫做这个Filter了。那接下来，他只要用这个模型，去算一下这个图像文本的这个相似度，尤其是这个image text match的这个分数，那他就知道到底这个像和文本是不是一个match了，那不是match，自然他就可以把它拿掉。所以通过这个filter，作者就把原始这个爬下来的noisy的It的文本，比如说这个红色的Tw，就变成了这个稍微一点这个图像文本，就是这个绿色的Tw了。

那其实到这里这个任务其实就已经完成了，对吧，那为什么作者还要再去加一个Captioner。

主要原因，我觉得还是因为作者在训练出来那个decoder之后，他发现，这个BLIP模型训练好的decoder真的是非常的强。它有时候生成的那个句子比原始的那个图像文本段要好很多。就即使原来的那个图像文本段是一个match，它俩是匹配的，但是我新生成的这个文本，更匹配，它的质量更高。所以作者就想说，那我就试试看对吧，那我用生成的这些文本，去充当新的训练数据集，会不会得到更好的模型？那其实这里，作者也是在coco这个数据集{(Ih,Th)}上，去把已经训练好的这个image-grounded text decoder，又去微调了一下，然后就得到了这个Captioner。e然后给定任意一张从网上爬下来的图片，然后他就用这个captioner，去给这个图片去生成新的字幕，也就是红色的这里的{I我，Ts}。当然Ts的质量，可高可低，这个完全是由模型来决定，有的时候就描述的特别好，那有的时候可能就是非常差，这个可能甚至都不make sense，所以作者这里，还是用红色去表示的，因为是synthetic data。那最后，通过captioner和filter，我们得到的数据集，就从原来的这个D{(Iw,Tw)}+{(Ih,Th)}，就变成了现在这个D{(Iw,Tw)}+{(Iw,Ts)}+{(Ih,Th)}，我们就会发现多了一项。就原来的那个CC12m，假如说我们用CC12m来做例子的话。这个{(Iw,Tw)}，就是Filter过的CC12m，还是原来从网上爬下来的文本对，只不过filter了，变少了。那第二个这里的{(Iw,Ts)}，就是CC12m合成的新生的这些像文本。然后接下来，如果你使用这个手工标注的，比如coco数据集，{(Ih,Th)}，总之，你的数据集不仅变得更大了，而且质量变得更高了。

那这个时候，你再拿新的这个D，然后返回来，再去预训练一个BLIP模型。最后作者发现了BLIP模型的提升非常显著，而且还有很多有趣的应用。这个就是本文提出的第二个创新点，这个capfilter模型，从而做到了数据集上的这个bootstrapping。

那接下来，我们先看几张图，形象的了解一下这个capfilter模型到底有多强大。作者给了三个例子，上面的Tw，就是直接从网页端下载下来的那个文本，下面的这个Ts，就是他们的capfilter生成的文本。红色的，就代表被filter 掉的那些文本，绿色就代表filter以后保留下来的那个文本，也就是说跟图片更匹配的那个文本。

那现在我们来看一下第一个例子，看着像一个自然风光。

那原来从网上爬下来的，就是说在我家旁边，有一个桥上，可能照出来的这张图片。确实，也不能说不对，但是如果你看底下这个生成的这个句子，他说，在日落的时候，有一群鸟飞过了一个湖面，这个描述的简直是太精确了，把这个日落，湖和鸟全都包含在里面了，那如果你用这个图像文本段去训练模型，肯定训练出来的模型效果很好。因为语义是完全match上的。那我们再来看第三个例子，从网上爬下来的这个，说这是一个1180年建立的这么一个城堡，它是取代了九世纪的时候一个用木头做的一个城堡。但是这次的效果，就差强人意，也是对的，但是，他说这是一个很大的一个楼，上面有很多很多的窗户。那它就不够具体了，因为这里，这些有可能就是那些门洞，拱门，或而且整个，这就是一个castle，它不是一个大的building。所以这次，BLIP训练出来的这个filter就选择了上面，就原始的这个图片文本对。所以这里，我们不仅可以体会到，这个caption的强大之处，就你给定什么样的一张图，我都能给你生成比较reasonable的这个文本，同时，我们也能体会到这个filter的强大之处，就是我能够很准确的，从这个原始的文本和新生成的文本里去挑出来，哪个跟这个图像是更匹配的。所以我们看完这几个例子之后，我们就应该知道，Capfilter真的是把这个数据集清理的相当好了。

那这个时候我们再看上面这个图表，看到capfilter带来这个提升之后，我们也就不会再惊讶了。那接下来，我们就来看一下这个表一，就是一些主要的消融实验和主要的一些结果。

可以看到数据集大，模型越大，效果就越好。

那接下来，我们来看一下这篇文章独有的，这个caption filter模式，到底带来什么样的提升。

那这个C就代表caption，f就代表用了filter。我们第一个可以观察到的现象，就是说如果都不用，那这个结果肯定是最差的。然后不论是用了filter，还是用了这个captioner，效果都会有提升，而且比较神奇的，是用了captioner以后，这个提升是更加显著的，也就意味着说，这个captioner带来的这个data diversity，这种多样性是会更让这个模型受益的。

因为尤其是对大模型，或者大数据集的训练来说，你偶尔这个数据集有点noise，其实无所谓，模型都是能够handle的。但是，因为模型参数量太大，所以它非常非常的data hungry，它需要大量大量的数据，所以这个时候，你只要能生成更多更好的数据，它往往就能够受益。那最后，这个captioner和filter同时用，效果就达到最好了。当然这个，只是一个消融实验。

但是这个表格里，最最有意思，就是这两行B，B和L，L，都是打了这个对号，也就是说它都用了caption和filter。那为什么一个叫base，一个叫large。是因为，如果你回想我们这个bootstrapping的过程，它其实一个分阶段的训练，就跟VLMo一样分阶段，BLIP其实也是分阶段。他先是用嘈杂的数据集预训练的一个模型，这是训练stage one。然后这个时候，他用coco去fine tune captioner和filter，然后把数据集重新处理一遍，得到了一个新的更大的质量更好的数据集，这是stage two，然后第三个stage，就是他用这个新的数据集去又pre-train了一个blip。那这几个步骤，这三个stage，其实都是互不相干的，其实是可以分开训练或者分开使用的。所以作者这里的意思就是说，即使我的这个模型是VIT base，就我的模型可以很小，但是我在第二阶段生成这个新的数据集的时候，我可以用更大的这个模型，用更大的那个MED，更大的cap+filter模式，去生成更好质量更高的这个数据集。我并不一定说我这儿用的模型是base，我那个capfilter模型就一定要用base。生成数据这一步，完全是一个额外的步骤，完全是另外一步pseudo-label的过程，理论上我也可以用任何一种方式去生成这种pseudo-label。这个就很有意思，也就是说，理论上，你是可以拿训练出来的这个BLIP，这个capfilter去生成更好的这个数据，然后去给别的模型做训练用，你可以拿这个数据去训练VLMo，你也可以拿它去训练CoCA，训练BEiT3，去训练各种各样的多模的模型，因为它的目的，就是生成更好的数据。

所以BLIP是可以做一个非常通用的工具。

多模态论文串讲·下【论文精读·49】_哔哩哔哩_bilibili

https://arxiv.org/pdf/2201.12086.pdf

你可能感兴趣的:(AutoGPT,自动驾驶大模型,transformer,自动驾驶,智慧城市,人工智能,gpt-3)

iOS App 上架常见问题解决方案：六大难点与实战工具分工详解游戏开发爱好者8 http udp https websocket 网络安全网络协议 tcp/ip
作为一名主要负责移动端交付的工程师，iOS上架过程向来是开发周期中最容易“卡壳”的一环，特别是在跨平台项目、资源有限的团队中更为明显。在最近一个智能出行类App项目中，我们团队采用Flutter开发，最终要将成品应用发布至AppStore。在整个过程中，我们遇到了不少实际问题。本文将围绕“上架过程中最棘手的6个典型难点”，结合我们的解决方法和所用工具，进行一次全面复盘。难点一：没有Mac电脑，无法
大模型RLHF强化学习笔记（一）：强化学习基础梳理Part1 Gravity! 大模型笔记大模型 LLM 算法机器学习强化学习人工智能
【如果笔记对你有帮助，欢迎关注&点赞&收藏，收到正反馈会加快更新！谢谢支持！】一、强化学习基础1.1Intro定义：强化学习是一种机器学习方法，需要智能体通过与环境交互学习最优策略基本要素：状态（State）：智能体在决策过程中需要考虑的所有相关信息（环境描述）动作（Action）：在环境中可以采取的行为策略（Policy）：定义了在给定状态下智能体应该选择哪个动作，目标是最大化智能体的长期累积奖
高通 QCS8550 大模型性能深度解析：从算力基准到场景实测的全维度 Benchmark 伊利丹~怒风 Qualcomm 人工智能 AI编程 python arm 自然语言处理
前言在人工智能技术狂飙突进的时代，大模型正以前所未有的速度重塑各行业生态，从智能客服到多模态交互，从边缘推理到端侧部署，其应用场景不断拓展。而这一切革新的背后，离不开底层硬件的强力支撑。高通QCS8550作为面向下一代智能设备的旗舰级计算平台，凭借高达48TOPS的AI算力与先进的第七代高通AI引擎，在大模型性能表现上极具竞争力。其异构多核架构不仅能高效处理复杂的神经网络计算，还通过软硬件协同优化
【LlamaIndex核心组件指南 | 模型篇】一文通晓 LlamaIndex 模型层：LLM、Embedding 及多模态应用全景解析
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
【SequoiaDB】4 巨杉数据库SequoiaDB整体架构 Alen_Liu_SZ 巨杉数据库 SequoiaDB架构编目节点协调节点数据节点巨杉数据库
1整体架构SequoiaDB巨杉数据库作为分布式数据库，由数据库存储引擎与数据库实例两大模块组成。其中，数据库存储引擎模块是数据存储的核心，负责提供整个数据库的读写服务、数据的高可用与容灾、ACID与发你不是事务等全部核心数据服务能力。数据库实例模块则作为协议与语法的适配层，用户可根据需要创建包括MySQL、PostgreSQL与SparkSQL在内的结构化数据实例；支持JSON语法的MongoD
computed()、watch() 与 watchEffect() 前端岳大宝前端框架Vue vue.js javascript 前端
下面，我们来系统的梳理关于computed、watch与watchEffect的基本知识点：一、核心概念与响应式基础1.1响应式依赖关系Vue的响应式系统基于依赖收集和触发更新的机制：响应式数据依赖收集创建依赖关系数据变更触发更新执行副作用1.2三大API对比特性computedwatchwatchEffect返回值Ref对象停止函数停止函数依赖收集自动手动指定自动执行时机惰性求值响应变化立即执行
从零开始理解零样本学习：AI人工智能必学技术 AI天才研究院 Agentic AI 实战 AI人工智能与大数据 AI大模型企业级应用开发实战 ai
从零开始理解零样本学习：AI人工智能必学技术关键词：零样本学习、人工智能、机器学习、知识迁移、语义嵌入摘要：本文旨在全面深入地介绍零样本学习这一在人工智能领域具有重要意义的技术。首先阐述零样本学习的背景和基本概念，通过详细的解释和直观的示意图让读者建立起对零样本学习的初步认识。接着深入剖析其核心算法原理，结合Python代码进行详细说明，同时引入相关数学模型和公式并举例阐释。通过项目实战部分，带领
稳定币独角兽：Circle InnoLink_1024 区块链稳定币区块链
Circle公司背景分析CircleInternetFinancial（以下简称Circle）是一家成立于2013年的美国金融科技公司，总部位于波士顿，由JeremyAllaire和SeanNeville联合创立。公司最初专注于点对点加密货币支付和交易，后转型为全球领先的稳定币发行机构，其核心产品是与美元1:1挂钩的USDCoin（USDC），目前为全球第二大稳定币，仅次于Tether的USDT。
高斯混合模型（Gaussian Mixture Model, GMM）不想秃头的程序神经网络语音识别人工智能深度学习网络
高斯混合模型（GaussianMixtureModel,GMM）是一种概率模型，用于表示数据点由多个高斯分布（GaussianDistribution）混合生成的过程。它广泛应用于聚类分析、密度估计、图像分割、语音识别等领域，尤其适合处理非球形簇或多模态数据。以下是GMM的详细介绍：一、核心思想GMM假设数据是由多个高斯分布混合生成的，每个高斯分布代表一个簇（Cluster），并引入隐变量（Lat
卷积神经网络（Convolutional Neural Network, CNN）不想秃头的程序神经网络语音识别人工智能深度学习网络卷积神经网络
卷积神经网络（ConvolutionalNeuralNetwork,CNN）是一种专门用于处理图像、视频等网格数据的深度学习模型。它通过卷积层自动提取数据的特征，并利用空间共享权重和池化层减少参数量和计算复杂度，成为计算机视觉领域的核心技术。以下是CNN的详细介绍：一、核心思想CNN的核心目标是从图像中自动学习层次化特征，并通过空间共享权重和平移不变性减少参数量和计算成本。其关键组件包括：卷积层（
ResNet（Residual Network）不想秃头的程序神经网络语音识别人工智能深度学习网络残差网络神经网络
ResNet（ResidualNetwork）是深度学习中一种经典的卷积神经网络（CNN）架构，由微软研究院的KaimingHe等人在2015年提出。它通过引入残差连接（SkipConnection）解决了深度神经网络中的梯度消失问题，使得网络可以训练极深的模型（如上百层），并在图像分类、目标检测、语义分割等任务中取得了突破性成果。以下是ResNet的详细介绍：一、核心思想ResNet的核心创新是
平台再升级！接入DeepSeek AI，三大能力一键生成橙武科技低代码 AI deepseek 人工智能
在数字化项目落地过程中，很多企业都会面临相同的问题：数据库建模要写SQL表结构；业务流程需要画LogicFlow流程图；前端页面还要写AMISJSON配置。从想法到实现，中间至少要经历产品经理、架构师、后端、前端多轮沟通。每个环节都耗时，改起来还要推翻重来。demo地址：https://admin.cwcode.top✨我们的平台，现在直接整合了DeepSeekAI大模型只要输入一句需求，就能：✅
【重构推荐系统】国产大模型驱动的电商个性化推荐完整实战：架构设计、推理优化与在线部署闭环观熵国产大模型部署实战全流程指南重构人工智能 Agent 智能体落地方案
个人简介作者简介：全栈研发，具备端到端系统落地能力，专注大模型的压缩部署、多模态理解与Agent架构设计。热爱“结构”与“秩序”，相信复杂系统背后总有简洁可控的可能。我叫观熵。不是在控熵，就是在观测熵的流动个人主页：观熵个人邮箱：[email protected]座右铭：愿科技之光，不止照亮智能，也照亮人心！专栏导航观熵系列专栏导航：AI前沿探索：从大模型进化、多模态交互、AIGC内容生成，到
python 脚本遍历目录，并把目录下的非utf-8文件改成utf8 还债大湿兄 python 开发语言数据库
从网上下载的qt项目我本地编译里面经常包含中文，提示编译不过，实际上以前经常手动转，发觉还是用脚本不，毕竟这次下的有点大，我只改.h.cpp#pythonD:\python\filetoUtf.pyE:\EasyCanvas-master\EasyCanvas-masterimportosimportcodecsimportargparseimportsysdefconvert_to_utf8_b
FB-OCC: 3D Occupancy Prediction based on Forward-BackwardView Transformation justtoomuchforyou 智驾
NVidia，CVPR20233DOccupancyPredictionChallengeworkshoppaper：https://arxiv.org/pdf/2307.1492code：https://github.com/NVlabs/FB-BEV大参数量imagebackboneInternImage-H，1B外部数据集预训练：object365nuscenes：有点云label，强化网络
✨【Blender/Houdini 渲染必看】CPUⓥⓢGPU？3 分钟选对算力不踩坑！渲染101专业云渲染 blender houdini 分布式服务器 maya
核心问题速答Q：渲染该选CPU还是GPU？✅CPU：复杂场景/批量渲染/预算可控首选✅GPU：单帧速度/实时预览/急单交付必选维度1：硬件硬刚——CPU凭啥赢麻了？▫️多线程王者：16核/32核服务器矩阵，支持50-300台并行渲染▫️场景兼容性：粒子特效/全局光照/超复杂模型稳定输出秘密武器：CPU批量渲染100帧耗时=GPU单帧耗时，整体效率持平！⚙️维度2：动态计费逻辑——成本由什么决定？计
Golang Fiber框架最佳实践：如何构建企业级应用 Golang编程笔记 Golang编程笔记 Golang开发实战 golang 开发语言后端 ai
GolangFiber框架最佳实践：如何构建企业级应用关键词：Golang、Fiber框架、企业级应用、最佳实践、Web开发摘要：本文聚焦于GolangFiber框架在企业级应用构建中的最佳实践。详细介绍了Fiber框架的背景、核心概念、算法原理、数学模型等基础知识，通过具体的代码案例展示了如何搭建开发环境、实现和解读源代码。同时探讨了Fiber框架在实际应用场景中的应用，推荐了相关的学习资源、开
PillarNet: Real-Time and High-PerformancePillar-based 3D Object Detection justtoomuchforyou 目标检测人工智能计算机视觉智驾
ECCV2022paper：[2205.07403]PillarNet:Real-TimeandHigh-PerformancePillar-based3DObjectDetectioncode：https://github.com/VISION-SJTU/PillarNet-LTS纯点云基于pillar3D检测模型网络比较SECOND基于voxel，one-stage，基于sparse3Dc
深入研究 Golang 领域的 Fiber 框架架构 Golang编程笔记 golang 架构网络 ai
深入研究Golang领域的Fiber框架架构关键词：Golang、Fiber框架、架构、高性能、Web开发摘要：本文将深入探讨Golang领域的Fiber框架架构。我们会先介绍背景知识，包括目的、预期读者等。接着用通俗易懂的方式解释核心概念，如Fiber框架的各个组成部分，以及它们之间的关系。然后详细阐述核心算法原理、数学模型，通过实际代码案例展示其应用。还会介绍Fiber框架的实际应用场景、推荐
Prompt Engineering for Large Language Models 三月七꧁ ꧂ 论文合集llm+prompt prompt 语言模型人工智能自然语言处理 pdf javascript 前端
题目大型语言模型的快速工程简介随着OpenAI的ChatGPT和Google的Bard等软件的普及，大语言模型（LLM）已经渗透到生活和工作的许多方面。例如，ChatGPT可用于提供定制食谱，建议替换缺失的成分。它可用于起草研究提案、用多种编程语言编写工作代码、在语言之间翻译文本、协助政策制定等等（Gao2023）。用户通过“提示”或自然语言指令与大型语言模型进行交互。精心设计的提示可以带
[Python]-基础篇1- 从零开始的Python入门指南踏雪无痕老爷子 Python python 开发语言
无论你是尚未接触编程的新手，还是想从其他语言转向Python的开发者，这篇文章都是你的入门课。一、Python是什么？Python是一种解释型、高级、通用型编程语言，以简洁明了、简单易用着称。它可以应用于网站开发、自动化脚本、数据分析、人工智能、系统操作等多种场景。二、如何安装Python步骤：访问Python官方网站选择目前最新的Python3.x版本下载Windows用户请务必勾选“AddPy
RAG应用的评估（一） AI老炮 AIGC ai 机器学习人工智能语言模型
前言上篇文档主要是对Advanced-RAG的定义、策略和适用场景做了一个细致的分析，那么当我们准备将一个基于大模型的RAG应用投入生产时，如何去判断这个RAG是否合理呢？下面有一些问题是需要提前考并应付的：LLM输出的不确定性会带来一定的不可预知性。一个RAG应用在投入生产之前需要科学的测试以衡量这种不可预知性。在LLM应用上线后的持续维护中,需要科学、快速、可复用的手段来衡量其改进效果,比如回
MCP-Proxy：开发多LLM & 多MCP 支持并安全访问MCP Server的秘密 IT古董技术杂谈安全 MCP MCP-Proxy
在构建多模型、多协议、可控可信的大模型接入平台时，MCP-Proxy扮演着关键中枢。它不仅要支持多个LLM接入，还要保障对后端MCPServer的安全访问、请求审计、能力切换与资源隔离。什么是MCP/MCP-Proxy？MCP（ModelCapabilityProtocol）是新一代模型能力调用协议，类似于OpenAI的API，但可支持：多厂商大模型（OpenAI、DeepSeek、Yi、Chat
Linux I/O 文件操作详解：从系统调用到实际工程应用平凡灵感码头 linux学习 linux 运维服务器
一、写在前面在Linux或任何类Unix操作系统中，文件是一切的核心——无论是硬盘上的文本文件，还是串口设备、GPIO寄存器、甚至网络接口，几乎都被抽象为“文件”。理解Linux下的I/O文件操作机制，不仅是嵌入式开发的基础，也是进行系统编程与底层控制的关键。二、I/O的本质：一切皆文件Linux将外设抽象成文件的方式，统一了对各种资源的操作模型。你可以用open打开串口设备/dev/ttyS0，
Spring AI快速入门学java的cc spring 大数据 java
一、引入依赖org.springframework.aispring-ai-starter-model-openaiorg.springframework.aispring-ai-bom${spring-ai.version}pomimport二、配置模型spring：ai:openai:base-url:https://dashscope.aliyuncs.com/compatible-mode
【机器学习&深度学习】反向传播机制
目录一、一句话定义二、类比理解三、为什重要？四、用生活例子解释：神经网络=烹饪机器人4.1第一步：尝一口（前向传播）4.2第二步：倒着推原因（反向传播）五、换成人工智能流程说一遍六、图示类比：找山顶（最优参数）七、总结一句人话八、PyTorch代码示例：亲眼看到每一层的梯度九、梯度=损失函数对参数的偏导数十、类比总结反向传播（Backpropagation）是神经网络中训练过程的核心机制，它就像“
人脸识别算法赋能园区无人超市安防升级智驱力人工智能算法人工智能边缘计算人脸识别智慧园区智慧工地智慧煤矿
人脸识别算法赋能园区无人超市安防升级正文在园区无人超市的运营管理中，传统安防手段依赖人工巡检或基础监控设备，存在响应滞后、误报率高、环境适应性差等问题。本文从技术背景、实现路径、功能优势及应用场景四个维度，阐述如何通过人脸识别检测、人员入侵算法及疲劳检测算法的协同应用，构建高效、精准的智能安防体系。一、技术背景：视觉分析算法的核心支撑人脸识别算法基于深度学习的卷积神经网络（CNN）模型，通过提取面
企业级知识库私有化部署：腾讯混元+云容器服务TKE实战大熊计算机 #腾讯云语言模型
1.背景需求分析在金融、医疗等数据敏感行业，企业需要构建完全自主可控的知识库系统。本文以某证券机构智能投研系统为原型，演示如何基于腾讯混元大模型与TKE容器服务实现：千亿级参数模型的私有化部署金融领域垂直场景微调高并发低延迟推理服务全链路安全合规方案1.1典型技术挑战#性能基准测试数据（单位：QPS）|场景|裸机部署|容器化部署|优化后||--------------------|--------
简单介绍物联网MQTT协议 Zio_Zhou 计算机网络 linux
在学习mqtt应用层协议之前，我们先来介绍一下发布/订阅模型以及请求/响应模型两种模型。请求/响应模型是网络应用系统中最常见的模型。在这种模型中，一个客户端（如一个Web浏览器）向服务器发送一个请求，服务器处理这个请求并返回一个响应。这个过程是同步的，意味着客户端需要等待服务器的响应。这种模型的优点是简单和易于理解，但在处理大量并发请求时可能会导致性能问题。发布/订阅模型。在这种模型中，有一个或多
RAG 调优指南：Spring AI Alibaba 模块化 RAG 原理与使用 ApacheDubbo spring 人工智能架构 Spring AI RAG
>夏冬,SpringAIAlibabaContributorRAG简介什么是RAG（检索增强生成）RAG（RetrievalAugmentedGeneration，检索增强生成）是一种结合信息检索和文本生成的技术范式。核心设计理念RAG技术就像给AI装上了「实时百科大脑」，通过先查资料后回答的机制，让AI摆脱传统模型的"知识遗忘"困境。️四大核心步骤1.文档切割→建立智能档案库核心任务:将海量文档
java工厂模式 3213213333332132 java 抽象工厂
工厂模式有 1、工厂方法 2、抽象工厂方法。下面我的实现是抽象工厂方法, 给所有具体的产品类定一个通用的接口。 package 工厂模式; /** * 航天飞行接口 * * @Description * @author FuJianyong * 2015-7-14下午02:42:05 */ public interface SpaceF
nginx频率限制+python测试 ronin47 nginx 频率 python
部分内容参考：http://www.abc3210.com/2013/web_04/82.shtml 首先说一下遇到这个问题是因为网站被攻击，阿里云报警，想到要限制一下访问频率，而不是限制ip（限制ip的方案稍后给出）。nginx连接资源被吃空返回状态码是502，添加本方案限制后返回599，与正常状态码区别开。步骤如下：
java线程和线程池的使用 dyy_gusi ThreadPool thread Runnable timer
java线程和线程池一、创建多线程的方式 java多线程很常见，如何使用多线程，如何创建线程，java中有两种方式，第一种是让自己的类实现Runnable接口，第二种是让自己的类继承Thread类。其实Thread类自己也是实现了Runnable接口。具体使用实例如下： 1、通过实现Runnable接口方式 1 2
Linux 171815164 linux
ubuntu kernel http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.1.2-unstable/ 安卓sdk代理 mirrors.neusoft.edu.cn 80 输入法和jdk sudo apt-get install fcitx su
Tomcat JDBC Connection Pool g21121 Connection
Tomcat7 抛弃了以往的DBCP 采用了新的Tomcat Jdbc Pool 作为数据库连接组件，事实上DBCP已经被Hibernate 所抛弃，因为他存在很多问题，诸如：更新缓慢，bug较多，编译问题，代码复杂等等。 Tomcat Jdbc P
敲代码的一点想法永夜-极光 java 随笔感想
入门学习java编程已经半年了,一路敲代码下来,现在也才1w+行代码量,也就菜鸟水准吧,但是在整个学习过程中,我一直在想,为什么很多培训老师,网上的文章都是要我们背一些代码?比如学习Arraylist的时候,教师就让我们先参考源代码写一遍,然
jvm指令集程序员是怎么炼成的 jvm 指令集
转自：http://blog.csdn.net/hudashi/article/details/7062675#comments 将值推送至栈顶时 const ldc push load指令 const系列该系列命令主要负责把简单的数值类型送到栈顶。(从常量池或者局部变量push到栈顶时均使用) 0x02 &nbs
Oracle字符集的查看查询和Oracle字符集的设置修改 aijuans oracle
本文主要讨论以下几个部分：如何查看查询oracle字符集、修改设置字符集以及常见的oracle utf8字符集和oracle exp 字符集问题。一、什么是Oracle字符集 Oracle字符集是一个字节数据的解释的符号集合,有大小之分,有相互的包容关系。ORACLE 支持国家语言的体系结构允许你使用本地化语言来存储，处理，检索数据。它使数据库工具，错误消息，排序次序，日期，时间，货
png在Ie6下透明度处理方法 antonyup_2006 css 浏览器 Firebug IE
由于之前到深圳现场支撑上线，当时为了解决个控件下载，我机器上的IE8老报个错，不得以把ie8卸载掉，换个Ie6,问题解决了，今天出差回来，用ie6登入另一个正在开发的系统，遇到了Png图片的问题，当然升级到ie8(ie8自带的开发人员工具调试前端页面JS之类的还是比较方便的，和FireBug一样，呵呵)，这个问题就解决了，但稍微做了下这个问题的处理。我们知道PNG是图像文件存储格式，查询资
表查询常用命令高级查询方法(二) 百合不是茶 oracle 分页查询分组查询联合查询
----------------------------------------------------分组查询 group by having --平均工资和最高工资 select avg(sal)平均工资,max(sal) from emp ; --每个部门的平均工资和最高工资
uploadify3.1版本参数使用详解 bijian1013 JavaScript uploadify3.1
使用：绑定的界面元素<input id='gallery'type='file'/>$("#gallery").uploadify({设置参数，参数如下}); 设置的属性： id: jQuery(this).attr('id'),//绑定的input的ID langFile: 'http://ww
精通Oracle10编程SQL(17)使用ORACLE系统包 bijian1013 oracle 数据库 plsql
/* *使用ORACLE系统包 */ --1.DBMS_OUTPUT --ENABLE:用于激活过程PUT,PUT_LINE,NEW_LINE,GET_LINE和GET_LINES的调用 --语法：DBMS_OUTPUT.enable(buffer_size in integer default 20000); --DISABLE:用于禁止对过程PUT,PUT_LINE,NEW
【JVM一】JVM垃圾回收日志 bit1129 垃圾回收
将JVM垃圾回收的日志记录下来，对于分析垃圾回收的运行状态，进而调整内存分配(年轻代，老年代，永久代的内存分配)等是很有意义的。JVM与垃圾回收日志相关的参数包括： -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -Xloggc -XX:+PrintGC 通
Toast使用白糖_ toast
Android中的Toast是一种简易的消息提示框，toast提示框不能被用户点击，toast会根据用户设置的显示时间后自动消失。创建Toast 两个方法创建Toast makeText(Context context, int resId, int duration) 参数：context是toast显示在
angular.identity boyitech AngularJS AngularJS API
angular.identiy 描述: 返回它第一参数的函数. 此函数多用于函数是编程. 使用方法: angular.identity(value); 参数详解: Param Type Details value * to be returned. 返回值: 传入的value 实例代码: <!DOCTYPE HTML>
java-两整数相除，求循环节 bylijinnan java
import java.util.ArrayList; import java.util.List; public class CircleDigitsInDivision { /** * 题目：求循环节，若整除则返回NULL，否则返回char*指向循环节。先写思路。函数原型：char*get_circle_digits(unsigned k,unsigned j)
Java 日期周年 Chen.H java C++c C#
/** * java日期操作(月末、周末等的日期操作) * * @author * */ public class DateUtil { /** */ /** * 取得某天相加(减)後的那一天 * * @param date * @param num *
[高考与专业]欢迎广大高中毕业生加入自动控制与计算机应用专业 comsci 计算机
不知道现在的高校还设置这个宽口径专业没有,自动控制与计算机应用专业,我就是这个专业毕业的,这个专业的课程非常多,既要学习自动控制方面的课程,也要学习计算机专业的课程,对数学也要求比较高.....如果有这个专业,欢迎大家报考...毕业出来之后,就业的途径非常广..... 以后
分层查询（Hierarchical Queries） daizj oracle 递归查询层次查询
Hierarchical Queries If a table contains hierarchical data, then you can select rows in a hierarchical order using the hierarchical query clause: hierarchical_query_clause::= start with condi
数据迁移 daysinsun 数据迁移
最近公司在重构一个医疗系统，原来的系统是两个.Net系统，现需要重构到java中。数据库分别为SQL Server和Mysql，现需要将数据库统一为Hana数据库，发现了几个问题，但最后通过努力都解决了。 1、原本通过Hana的数据迁移工具把数据是可以迁移过去的，在MySQl里面的字段为TEXT类型的到Hana里面就存储不了了，最后不得不更改为clob。 2、在数据插入的时候有些字段特别长
C语言学习二进制的表示示例 dcj3sjt126com c basic
进制的表示示例 # include <stdio.h> int main(void) { int i = 0x32C; printf("i = %d\n", i); /* printf的用法 %d表示以十进制输出 %x或%X表示以十六进制的输出 %o表示以八进制输出 */ return 0; }
NsTimer 和 UITableViewCell 之间的控制 dcj3sjt126com ios
情况是这样的: 一个UITableView, 每个Cell的内容是我自定义的 viewA viewA上面有很多的动画, 我需要添加NSTimer来做动画, 由于TableView的复用机制, 我添加的动画会不断开启, 没有停止, 动画会执行越来越多. 解决办法: 在配置cell的时候开始动画, 然后在cell结束显示的时候停止动画查找cell结束显示的代理
MySql中case when then 的使用 fanxiaolong casewhenthenend
select "主键", "项目编号", "项目名称","项目创建时间", "项目状态","部门名称","创建人" union (select pp.id as "主键", pp.project_number as &
Ehcache（01）——简介、基本操作 234390216 cache ehcache 简介 CacheManager crud
Ehcache简介目录 1 CacheManager 1.1 构造方法构建 1.2 静态方法构建 2 Cache 2.1&
最容易懂的javascript闭包学习入门 jackyrong JavaScript
http://www.ruanyifeng.com/blog/2009/08/learning_javascript_closures.html 闭包（closure）是Javascript语言的一个难点，也是它的特色，很多高级应用都要依靠闭包实现。下面就是我的学习笔记，对于Javascript初学者应该是很有用的。一、变量的作用域要理解闭包，首先必须理解Javascript特殊
提升网站转化率的四步优化方案 php教程分享数据结构 PHP 数据挖掘 Google 活动
网站开发完成后,我们在进行网站优化最关键的问题就是如何提高整体的转化率，这也是营销策略里最最重要的方面之一，并且也是网站综合运营实例的结果。文中分享了四大优化策略：调查、研究、优化、评估，这四大策略可以很好地帮助用户设计出高效的优化方案。 PHP开发的网站优化一个网站最关键和棘手的是，如何提高整体的转化率，这是任何营销策略里最重要的方面之一，而提升网站转化率是网站综合运营实力的结果。今天，我就分
web开发里什么是HTML5的WebSocket？ naruto1990 Web html5 浏览器 socket
当前火起来的HTML5语言里面，很多学者们都还没有完全了解这语言的效果情况，我最喜欢的Web开发技术就是正迅速变得流行的 WebSocket API。WebSocket 提供了一个受欢迎的技术，以替代我们过去几年一直在用的Ajax技术。这个新的API提供了一个方法，从客户端使用简单的语法有效地推动消息到服务器。让我们看一看6个HTML5教程介绍里的 WebSocket API：它可用于客户端、服
Socket初步编程——简单实现群聊 Everyday都不同 socket 网络编程初步认识
初次接触到socket网络编程，也参考了网络上众前辈的文章。尝试自己也写了一下，记录下过程吧：服务端：（接收客户端消息并把它们打印出来） public class SocketServer { private List<Socket> socketList = new ArrayList<Socket>(); public s
面试：Hashtable与HashMap的区别（结合线程） toknowme
昨天去了某钱公司面试，面试过程中被问道 Hashtable与HashMap的区别？当时就是回答了一点，Hashtable是线程安全的，HashMap是线程不安全的，说白了，就是Hashtable是的同步的，HashMap不是同步的，需要额外的处理一下。今天就动手写了一个例子，直接看代码吧 package com.learn.lesson001; import java
MVC设计模式的总结 xp9802 设计模式 mvc 框架 IOC
随着Web应用的商业逻辑包含逐渐复杂的公式分析计算、决策支持等，使客户机越来越不堪重负，因此将系统的商业分离出来。单独形成一部分，这样三层结构产生了。其中‘层’是逻辑上的划分。三层体系结构是将整个系统划分为如图2.1所示的结构[3] （1）表现层（Presentation layer）：包含表示代码、用户交互GUI、数据验证。该层用于向客户端用户提供GUI交互，它允许用户