33奈何33

对比学习论文综述

对比学习论文综述【论文精读】_哔哩哔哩_bilibili

1. 百花齐放

2.CV双雄

3. 不用负样本

4. Transformer

对比学习论文综述【论文精读】_哔哩哔哩_bilibili

1. 百花齐放 18-19年中

方法、模型、目标函数、代理任务都还没有统一。

（1）InstDisc：https://arxiv.org/abs/1805.01978 Unsupervised Feature Learning via Non-Parametric Instance Discrimination。 2018

个体判别任务，把每一个Instance看成一个类别。通过一个卷积神经网络把所有图片编码成一个特征，希望特征在最后的特征空间尽可能分开，因为每个图片都是一个自己的类，希望和其他腿片分开。正样本为图片本身，负样本是数据集中的其他图片。所有图片特征存到memory bank里，意味着特征维度不能太高，否则存储代价太大，这里选择的128维。

首先经过ResNet50，得到2048D的特征，降维到128D，batch size是256，所以256个正样本，从memory bank中抽4096个负样本，然后用NCE loss，更新网络。再把这个mini batch的特征更新到memory bank中。

巧妙设计如 proximal Regularization，给模型训练加了一个约束，从而使memory bank中的特征进行动量式更新，与Moco想法一致。

不仅提出了个体判别的代理任务，而且用这个代理任务和NCE loss去做对比学习，从而取得了不错的无监督表征学习结果，同时还提出了用别的数据结构存大量负样本，以及如何对特征进行动量更新。

（2）InvaSpread：https://arxiv.org/abs/1904.03436 Unsupervised Embedding Learning via Invariant and Spreading Instance Feature。CVPR2019，SimCLR的前身。

没有用额外的数据结构存储大量负样本，正负样本来自于同一个batch，只使用一个编码器进行端到端的学习。对于相似图片相似物体的特征应该保持不变性，不相似物体应该尽量分散开。

batch size是256，每张图片进行数据增强，增强后的图片为正样本，负样本是所有剩下的图片(原始及增强后的) ，这样就可以用一个编码器进行端到端的训练，不用借助外部的数据结构存储大量负样本。目标函数是NCE loss的变体。为什么没取得好结果，负样本越多越好，但是本文作者没有TPU，batch size只是256，所以没有大量负样本。

（3）CPC：https://arxiv.org/abs/1807.03748 Representation Learning with Contrastive Predictive Coding。2018

很通用的结构，可以处理音频、图片、文字，也能用于强化学习。用预测的代理任务去做对比学习。

时序序列，输入之前时刻给编码器，返回的特征喂给自回归模型(图中gar，常见的为RNN，LSTM)，得到ct，上下文的特征表示，如果这个表示足够好，应该可以进行合理的预测，预测未来的输出。对比学习的体现在于，正样本就是未来的输入通过编码器得到的未来的输出(zt+1...zt+4)，负样本是任意选取输入得到的输出。

（4）CMC： https://arxiv.org/abs/1906.05849 Contrastive Multiview Coding。2019

定义正样本的方式更加广泛。人观察世界是通过很多传感器，比如眼睛、耳朵，来给大脑提供不同的信号。每个视角都有噪声，而且信息不完整，但是最重要的信息是在他们之间共享的。基于这个现象，想学特征，有视角不变性，增大互信息。

4个视角，原始图像、图像对应的深度信息（每个物体离观察者多远）、SwAV ace normal、物体的分割图像。不同模态互为正样本，随机挑一张图片，不配对的视角为负样本。不同视角、不同模态需要不同的编码器。

2.CV双雄

（1）MoCo：https://arxiv.org/abs/1911.05722 Momentum Contrast for Unsupervised Visual Representation Learning。 2019

把之前的对比学习方法归纳总结成了字典学习的问题。MoCo和InstDisc很像，用队列替代memory bank存负样本，用动量编码器取代原来loss的约束项，从而达到动量的更新编码器的目的，而不是动量的更新特征，从而得到更好的结果，采用InfoNCE，而非NCE。

（2）SimCLR：https://arxiv.org/abs/2002.05709 A Simple Framework for Contrastive Learning of Visual Representations。 ICML2020

加了一个projector层（即一层FC+Relu）。projector只在训练的时候使用，预测时不用。SimCLR和InvaSpread的区别就是，用了更多的数据增强，加了projector，用了更大的batchsize，训练的更久。

MoCo v2, SwAL，BYOL借鉴了projector，BYOL也借鉴了lars优化器。MoCo是直接拿Res50出来的特征做对比学习。

(3) MoCo v2: https://arxiv.org/abs/2003.04297 Improved Baselines with Momentum Contrastive Learning。 2020

把SimCLR的技术拿过来，MLP，更多的数据增强，训练的时候用了cosine的learning rate schedule，训练更多的epoch。

（4）SimCLR v2：https://arxiv.org/abs/2006.10029 Big Self-Supervised Models are Strong Semi-Supervised Learners。2020 NeurlPs

自监督的对比学习训练一个大的模型，再用一小部分有监督的数据做微调模型，就相当于有了一个teacher模型，就可以生成很多伪标签，就能在更多无标签数据上做自学习了。整个框架受启发于google的noisy student方法。

v1到v2：更大的模型，152层的ResNet；projector层由fc+relu变成fc relu fc relu，由1层MLP变成两层；使用动量编码器，但由于batch size已经很大了，负样本足够多了，所以动量编码器并没有带来很大的提升。

3. 不用负样本

(1) SwAV：https://arxiv.org/abs/2006.09882 Unsupervised Learning of Visual Features by Contrasting Cluster Assignments。NeurlPs2020

用一个视角得到的特征预测另外一个视角得到的特征。把对比学习和聚类的方法合到一起。相似的物体都聚集到某一个聚类中心附近，不相似的物体推开到其他的聚类中心。

借助先验信息，不跟大量负样本比，跟聚类中心比。此处选择了3000个聚类中心，在Image Net数据集常用的参数。右图中c是聚类中心，维度为D*K，D即向量的维度，K即聚类中心的个数。

得到特征z1、z2之后，先通过clustering的方法让特征z和prototype c去生成一个目标，即右图中的Q1、Q2，Q1、Q2就相当于ground truth的东西。真正要做的代理任务是，如果x1,x2是正样本的话，z1和z2就会很相似，按道理来说是可以互相做预测的，如果拿z1跟c去做点乘，应该可以预测Q2，反之，z2和c点乘可以预测Q1。所以，点乘之后的结果就是我们的预测，ground truth就是按照之前clustering分类得到的Q1和Q2。所以通过换位预测的方法对模型进行训练。

multi-crop的trick，之前方法用的是两个crop，而且裁剪的图片比较大，重叠区域比较多，更倾向于学习全局的特征。如果想学习局部的特征，可以多crop一些较小的图片作为正样本，但是正样本增多会增加计算成本。此处方法是将2*224变成2*160+4*96的正样本，正样本增多，计算代价也差不多。如果不用multi-crop，效果和MoCo v2相差并不多，所以提点主要是multi-crop这个tirck，后续被借鉴的更多也是这个trick。

(2) CPC v2：用了更大的模型，用了更大的图像块，做了更多方向上的预测任务，把batch norm换成了layer norm，还使用了更多的数据增强。一系列操作下来，CPC v1在ImageNet上40多的百分点被提升到了70多的百分点。

(3) Informin：CMC的作者做的分析性的延伸工作，提出了最小化互信息。之前都是最大化互信息，但是如果最大化互信息之后比所需要的互信息要多也是一种浪费，而且有可能泛化做的不好，此处是想要不多不少的互信息。

(4) BYOL：https://arxiv.org/abs/2006.07733 Bootstrap your own latent: A new approach to self-supervised Learning。2020.06,和SwAV是同期的工作。

Bootstrap的意识就是如果你已经有什么东西了，在它之上进行改造；latent是特征的意思。BYOL的意思是自己跟自己学，完全没有用任何形式的负样本。因为负样本其实对于对比学习来说是一种约束，如果只用正样本，让相似物体相似，那么模型很容易找到捷径解，就是所有的输入都是同样的输出，loss永远是0。

两层编码器结构相同，参数不同，上面那层是正常的梯度更新，下面那层和MoCo类似，使用动量方式更新。z是256维。与SimCLR不同的是，又加了新的一层prediction，q和g的网络结构是一样的，也是一层MLP。然后目标是让上面预测的q(z)和下面的z'尽可能的一致。把原来的匹配问题换成了预测问题，和SwAV比较像，但是SwAV还是借助了一个聚类中心。相当于用自己一个视角的特征去预测另外一个视角的特征。BYOL用的损失函数是MSE loss。

SimCLR中的projection head是 Linear-BN-ReLU-Linear-BN，MoCo v2的是Linear-ReLU-Linear。BYOL里面是Linear-BN-ReLU-Linear。如果BYOL没有BN的话，模型就坍塌了，因为有BN，所以可以把batch里的其他样本作为隐式负样本，相当于跟batch里的平均图片去做对比了。

作者又做了很多消融实验，发现了两个特例，一个是当BYOL的Encoder为-、projector为BN、predictor为-时，即使有BN，还是训练失败了；一个是当SimCLR的Encoder和Projector都为-时，没有BN，即使有显式的负样本，还是训练失败了。所以作者和提出该问题的大佬达成一致，BN的作用就是提高模型的训练稳健性，从而导致模型不会坍塌。

然后进一步延伸，如果一开始模型能初始化的比较好，后面的训练离开了BN也没问题。于是做了一个实验，用group norm（归一化的一种方式）和weight standardization（模型初始化方式），是VIT的原班作者在BEiT提出来的，ResNet v2就是用这种方式训练的，换上这种方式，BYOL又能训练的比较好了。

(5) SimSiam:https://arxiv.org/abs/2011.10566 Exploring Simple Siamese Representation Learning。CVPR 2020

既不需要负样本，不需要大的batch size，不需要动量编码器。

negative cosine similarity loss，其实也就是MSE loss。因为又了stop gradient的存在，所以模型不会坍塌，可以理解为EM算法。

4. Transformer

(1) MoCo v3：https://arxiv.org/abs/2104.02057 An Empirical Study of Training Self-Supervised Vision Transformers。ICCV 2021。

相当于MoCo v2和SimSiam的合体。整体框架还是两个网络，query编码器和key编码器，key编码器用了动量更新，最后的目标函数用的对比学习的loss。query编码器除了骨干网络还有projector和prediction，这个其实就是BYOL或者SimSiam。目标函数用的对称项，既算query1->key2，也算query2->key1，这个角度讲就是SimSiam。把骨干网络由ResNet换成了ViT。

（2）DINO：https://arxiv.org/abs/2104.14294 Emerging Properties in Self-Supervised Vision Transformers. CVPR2021

自监督训练Vision Transformer。完全不用任何标签信息训练出来的Vision Transformer，如果把它的自注意力图拿出来，会发现它能准确的抓住每个物体的轮廓，效果媲美做分割。

centering防止模型坍塌，整体和MocoV3非常像。

总结

InstDisc提出个体判别的任务，提出memory bank存储负样本，从而达到又大又一致的字典。不用外部结构的话，端到端的学习，也就是InvaSpread只用一个编码器，但受限于batch size太小，性能不够好。接下来是 CPC v1提出了InfoNCE loss,而且CPC v1是一个预测型的代理任务，不仅可以做图像，也可以做音频、视频、加强学习等，是一个非常全能的结构。最后还有CMC的工作，把两个视角的任务扩展到了多视角，给多模态多视角的对比学习打下了铺垫。deep cluster是基于聚类学习的，当时还没有用对比学习。

然后是第二阶段，MoCo v1是InstDisc的一个延伸性工作，把memeory bank变成了队列，把动量更新特征变成了动量更新编码器，从而能预训练一个很好的模型，也是第一个在很多视觉的下游任务上，让无监督模型比有监督模型表现好的方法，是属于使用外部数据结构的。SimCLR v1和InvaSpread是很像的，但它用了很多技术，比如加大batch size，用了更多的数据增强，训练更长时间。CPC v2也把一些技术拿来用，直接比v1升了30多个点。CMC把这些分析了一下，提出了InfoMin的原则，即两个视角的互信息要不多不少才是最好的。MoCo发现SimCLR的技术都很管用，而且是即插即用的，就拿过来用在MoCo上，有了MoCo v2，SimCLR也做了一些改动有了SimCLR v2,但它主要做半监督学习。SwAV是把聚类学习和对比学习结合起来的工作，也取得了不错的结果，主要提升来自于multi crop的技术，如果没有multi crop，和MoCo v2或者SimCLR的结果是差不多的。

第三阶段，BYOL的方法不用负样本，自己跟自己学，把对比任务变成了预测任务，损失函数由InfoNCE变成了MSE loss。然后SimSiam把之前的工作都总结了一下，化繁为简，提出了一个简单的孪生网络的方法，不需要大的batch size，不需要负样本，不需要动量编码器，照样能取得不错的方法，提出stop gradient是至关重要的，因为有这个操作所有SimSiam可以看作是一种EM算法，通过逐步更新的方式避免模型坍塌。BarlosTwins主要更换了目标函数，把之前大家做的对比或者预测，变成了两个矩阵之间去比相似性，但很快淹没在Vision Transformer的洪流当中。

最后来到了Vision Transformer。其实就是把骨干网络从残差换成了ViT，主要学习的方法其实没有改变，但是换成ViT之后面临的问题是训练不稳定或者不好训练，所以就提出了各自的方法。MoCo v3就提出把patch projection layer冻住(即tokenizen层)，DINO提出把teacher网络的输出先做归一化centering。这两种方式都能有效提高模型训练的稳健性，防止模型坍塌，让vision transformer用自监督的方法也能学习的比较好。

现在对比学习虽然没有Vision Transformer那么火，尤其是MAE火爆了之后，大家都去尝试y掩码学习了，所以对比学习又从火爆发展期变成了发展潜伏期。但是对比学习的前途还是很好的，毕竟多模态的对比学习还是一个主流，CLIP的效果就很好。

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element((1) 2401_84976182 程序员 c语言 c++学习
既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上CC++开发知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新如果你需要这些资料，可以戳这里获取#include#include#includeusingnamespacestd;boolcmp(int
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element(
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以添加戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！intmain(){vectormyvec{3,
冒泡、选择、插入排序：三大基础排序算法深度解析（C语言实现） xienda 算法排序算法数据结构
在算法学习道路上，排序算法是每位程序员必须掌握的基石。本文将深入解析冒泡排序、选择排序和插入排序这三种基础排序算法，通过C语言代码实现和对比分析，帮助读者彻底理解它们的差异与应用场景。算法原理与代码实现1.冒泡排序（BubbleSort）工作原理：通过重复比较相邻元素，将较大元素逐步"冒泡"到数组末尾。voidbubbleSort(intarr[],intn){ for(inti=0;iarr[
精通Canvas：15款时钟特效代码实现指南烟幕缭绕
本文还有配套的精品资源，点击获取简介：HTML5的Canvas是一个用于绘制矢量图形的API，通过JavaScript实现动态效果。本项目集合了15种不同的时钟特效代码，帮助开发者通过学习绘制圆形、线条、时间更新、旋转、颜色样式设置及动画效果等概念，深化对Canvas的理解和应用。项目中的CSS文件负责时钟的样式设定，而JS文件则包含实现各种特效的逻辑，通过不同的函数或类处理时间更新和动画绘制，提
高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）阿牛的药铺算法移植部署 fpga开发 verilog
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）引言：为什么这个FPGA入门路线能帮你快速上岗？本文设计了一条**"Verilog语法→工具链操作→光学项目实战→岗位技能对标"的阶梯式学习路径。不同于泛泛而谈的FPGA教程，我们聚焦光学类产品开发**核心能力（时序接口设计、图像处理算法移植、高速接口应用），通过3个递进式项目（从LED闪烁到图像边缘检测），
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
基于链家网的二手房数据采集清洗与可视化分析 Mint_Datazzh 项目 selenium 网络爬虫
个人学习内容笔记，仅供参考。项目链接：https://gitee.com/rongwu651/lianjia原文链接：基于链家网的二手房数据采集清洗与可视化分析–笔墨云烟研究内容该课题的主要目的是通过将二手房网站上的存量与已销售房源，构建一个二手房市场行情情况与房源特点的可视化平台。该平台通过HTML架构和Echarts完成可视化的搭建。因此，该课题的主要研究内容就是如何利用相关技术设计并实现这样
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
分布式学习笔记_04_复制模型 NzuCRAS 分布式学习笔记架构后端
常见复制模型使用复制的目的在分布式系统中，数据通常需要被分布在多台机器上，主要为了达到：拓展性：数据量因读写负载巨大，一台机器无法承载，数据分散在多台机器上仍然可以有效地进行负载均衡，达到灵活的横向拓展高容错&高可用：在分布式系统中单机故障是常态，在单机故障的情况下希望整体系统仍然能够正常工作，这时候就需要数据在多台机器上做冗余，在遇到单机故障时能够让其他机器接管统一的用户体验：如果系统客户端分布
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
OpenWebUI(12)源码学习-后端constants.py常量定义文件青苔猿猿 AI大模型 openwebui constants常量定义
目录文件名：`constants.py`功能概述：主要功能点详解1.**MESSAGES枚举类**2.**WEBHOOK_MESSAGES枚举类**3.**ERROR_MESSAGES枚举类**✅默认错误模板✅认证与用户相关错误✅资源冲突与重复错误✅验证失败类错误✅权限限制类错误✅文件上传与格式错误✅模型与API错误✅请求频率与安全限制✅数据库与配置错误4.**TASKS枚举类**✅总结实际应用场
RocketMQ 基础教程-应用篇-死信队列码炫课堂-码哥 rocketmq专题 rocketmq java
作者简介：大家好，我是smart哥，前中兴通讯、美团架构师，现某互联网公司CTO联系qq：184480602，加我进群，大家一起学习，一起进步，一起对抗互联网寒冬学习必须往深处挖，挖的越深，基础越扎实！阶段1、深入多线程阶段2、深入多线程设计模式阶段3、深入juc源码解析阶段4、深入jdk其余源码解析
OKHttp3源码分析——学习笔记 Sincerity_ 源码相关 Okhttp 源码解析读书笔记 httpclient cache
文章目录1.HttpClient与HttpUrlConnection的区别2.OKHttp源码分析使用步骤:dispatcher任务调度器,（后面有详细说明）Request请求RealCallAsyncCall3.OKHttp架构分析1.异步请求线程池,Dispather2.连接池清理线程池-ConnectionPool3.缓存整理线程池DisLruCache4.Http2异步事务线程池,http
JavaScript 基础09：Web APIs——日期对象、DOM节点梦想当全栈 JavaScript javascript 前端开发语言
JavaScript基础09：WebAPIs——日期对象、DOM节点进一步学习DOM相关知识，实现可交互的网页特效能够插入、删除和替换元素节点。能够依据元素节点关系查找节点。一、日期对象掌握Date日期对象的使用，动态获取当前计算机的时间。ECMAScript中内置了获取系统时间的对象Date，使用Date时与之前学习的内置对象console和Math不同，它需要借助new关键字才能使用。1.实例
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（Advanced RAG[1]）基于历史对话重新生成Query？ 985小水博一枚呀 AI大模型学习路线人工智能学习 langchain RAG
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）基于历史对话重新生成Query？【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）基于历史对话重新生成Query？文章目录【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）基于历史对话重新生成Q
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（Advanced RAG[1]）其他Query优化相关策略？ 985小水博一枚呀 AI大模型学习路线人工智能学习 langchain
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）其他Query优化相关策略？【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）其他Query优化相关策略？文章目录【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）其他Query优化相关策略？一
传奇修改map地图教程_传奇技能第三祭：NPC的增加、隐藏和脚本修改垃圾箱博物馆传奇修改map地图教程
技能献祭，Get新技能：传奇技能——NPC功能与实现跟航家学技能，用干货带你飞，现学现用，底部有配套学习资源本篇内容简介：通过对游戏内NPC的控制，可以让NPC出现在地图中的任意位置，还可以控制外观显示、自定义命名，新增与隐藏以及脚本功能的实现。一、NPC总控制文本所在路径：D:MirServerMir200EnvirEnvir目录下，找到NPC总控制文本：Merchant，游戏内的所有NPC都在
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
AI Agent开发学习系列 - langchain之Chains的使用(7)：用四种处理文档的预制链轻松实现文档对话 alex100 AI Agent 学习人工智能 langchain prompt 语言模型 python
在LangChain中，四种文档处理预制链（stuff、refine、mapreduce、mapre-rank）是实现文档问答、摘要等任务的常用高阶工具。它们的核心作用是：将长文档切分为块，分步处理，再整合结果，极大提升大模型处理长文档的能力。stuff直接拼接所有文档内容到prompt，一次性交给大模型处理。适合文档较短、token不超限的场景。refine递进式摘要。先对第一块文档生成初步答案
.NET 一款基于BGInfo的红队内网渗透工具 dot.Net安全矩阵网络 .net 安全 .netcore web安全矩阵
01阅读须知此文所提供的信息只为网络安全人员对自己所负责的网站、服务器等（包括但不限于）进行检测或维护参考，未经授权请勿利用文章中的技术资料对任何计算机系统进行入侵操作。利用此文所提供的信息而造成的直接或间接后果和损失，均由使用者本人负责。本文所提供的工具仅用于学习，禁止用于其他方面02基本介绍在内网渗透过程中，白名单绕过是红队常见的技术需求。Sharp4Bginfo.exe是一款基于微软签名工具
Python学习笔记5|条件语句和循环语句 iamecho9 Python从0到1学习笔记 python 学习笔记
一、条件语句条件语句用于根据不同的条件执行不同的代码块。1、if语句基本语法：if布尔型语句1:代码块#语句1为True时执行的代码示例：age=int(input("请输入你的年龄:"))ifage>=18:print("你已成年")2、if-else语句如果if条件不成立，则执行else代码块：if布尔型语句1:代码块#语句1为True时执行的代码else:代码块#语句1为False时执行的代
2025年渗透测试面试题总结-2025年HW(护网面试) 43（题目+回答）独行soc 2025年护网面试职场和发展 linux 科技渗透测试安全护网
安全领域各种资源，学习文档，以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具，欢迎关注。目录2025年HW(护网面试)431.自我介绍与职业规划2.Webshell源码级检测方案3.2025年新型Web漏洞TOP54.渗透中的高价值攻击点5.智能Fuzz平台架构设计6.堆栈溢出攻防演进7.插桩技术实战应用8.二进制安全能力矩阵9.C语言内存管理精要10.Pyth
Javaweb学习之Vue模板语法（三）不要数手指啦 vue.js 学习前端
目录学习资料前情回顾本期介绍（vue模板语法）文本插值Vue的Attribute绑定使用JavaScript表达式综合实例代码：学习资料Vue.js-渐进式JavaScript框架|Vue.js(vuejs.org)前情回顾项目的创建大家可以看这篇文章Vue学习之项目的创建-CSDN博客本期介绍（vue模板语法）首先，找到我们编写代码的地方找到自己项目的src文件夹，打开之后点击component
AI问答之手机相机专业拍照模式的主要几个参数解释 piaopiaolanghua 拍摄曝光时间 ISO感光度
一、背景近期突然想了解下手机的专业拍照模式，了解如何拍出拖尾效果，譬如拍摄运动的车辆，长曝光拍摄星空，甚至能够拍到卫星（再来个漂亮的拖尾），因此想到先了解下手机相机专业模式的参数再说，通过AI问答，学习了下，也就有了本文。二、主要参数详细解释截图显示了在“专业”模式下设置的典型核心参数。这些参数共同决定了照片的曝光、清晰度、色彩和焦点。下面逐一解释每个参数及其典型用法：1、ISO640解释：ISO
Python selenium 库 AI老李 python python selenium 开发语言
关键要点PythonSelenium库用于自动化Web浏览器，适合测试和爬虫，中文教程资源丰富。推荐菜鸟教程、CSDN博客和Selenium-Python中文文档，涵盖基础到进阶。学习需注意浏览器驱动匹配和动态加载处理，可能需显式等待。资源推荐以下是适合初学者和中级学习者的中文教程：菜鸟教程：提供全面的Selenium教程，包括安装和示例，详见Selenium教程。Selenium-Python中
Python3 内置函数 AI老李 python python
关键要点Python3的内置函数是解释器直接提供的，无需导入即可使用，涵盖数据类型转换、数学操作、序列处理等多种功能。推荐使用官方文档、菜鸟教程和腾讯云开发者社区的中文资源，适合初学者和中级学习者。资源提供详细解释和示例，学习时可结合实际项目实践。简介Python3的内置函数是编程中常用的工具，方便用户快速实现各种操作。以下是几个主要资源，帮助您学习这些函数的用法。资源推荐Python官方文档：内
js动画html标签（持续更新中） 843977358 html js 动画 media opacity
1.jQuery 效果 - animate() 方法改变 "div" 元素的高度： $(".btn1").click(function(){ $("#box").animate({height:"300px
springMVC学习笔记 caoyong springMVC
1、搭建开发环境 a>、添加jar文件，在ioc所需jar包的基础上添加spring-web.jar,spring-webmvc.jar b>、在web.xml中配置前端控制器 <servlet> &nbs
POI中设置Excel单元格格式 107x poi style 列宽合并单元格自动换行
引用：http://apps.hi.baidu.com/share/detail/17249059 POI中可能会用到一些需要设置EXCEL单元格格式的操作小结：先获取工作薄对象: HSSFWorkbook wb = new HSSFWorkbook(); HSSFSheet sheet = wb.createSheet(); HSSFCellStyle setBorder = wb.
jquery 获取A href 触发js方法的this参数无效的情况一炮送你回车库 jquery
html如下： <td class=\"bord-r-n bord-l-n c-333\"> <a class=\"table-icon edit\" onclick=\"editTrValues(this);\">修改</a> </td>" j
md5 3213213333332132 MD5
import java.security.MessageDigest; import java.security.NoSuchAlgorithmException; public class MDFive { public static void main(String[] args) { String md5Str = "cq
完全卸载干净Oracle11g sophia天雪 orale数据库卸载干净清理注册表
完全卸载干净Oracle11g A、存在OUI卸载工具的情况下：第一步：停用所有Oracle相关的已启动的服务；第二步：找到OUI卸载工具：在“开始”菜单中找到“oracle_OraDb11g_home”文件夹中 &
apache 的access.log 日志文件太大如何解决 darkranger apache
CustomLog logs/access.log common 此写法导致日志数据一致自增变大。直接注释上面的语法 #CustomLog logs/access.log common 增加： CustomLog "|bin/rotatelogs.exe -l logs/access-%Y-%m-d.log
Hadoop单机模式环境搭建关键步骤 aijuans 分布式
Hadoop环境需要sshd服务一直开启，故，在服务器上需要按照ssh服务，以Ubuntu Linux为例，按照ssh服务如下： sudo apt-get install ssh sudo apt-get install rsync 编辑HADOOP_HOME/conf/hadoop-env.sh文件，将JAVA_HOME设置为Java
PL/SQL DEVELOPER 使用的一些技巧 atongyeye java sql
1 记住密码这是个有争议的功能，因为记住密码会给带来数据安全的问题。但假如是开发用的库，密码甚至可以和用户名相同，每次输入密码实在没什么意义，可以考虑让PLSQL Developer记住密码。位置：Tools菜单－－Preferences－－Oracle－－Logon HIstory－－Store with password 2 特殊Copy 在SQL Window
PHP：在对象上动态添加一个新的方法 bardo 方法动态添加闭包
有关在一个对象上动态添加方法，如果你来自Ruby语言或您熟悉这门语言，你已经知道它是什么...... Ruby提供给你一种方式来获得一个instancied对象，并给这个对象添加一个额外的方法。好！不说Ruby了，让我们来谈谈PHP PHP未提供一个“标准的方式”做这样的事情，这也是没有核心的一部分... 但无论如何，它并没有说我们不能做这样
ThreadLocal与线程安全 bijian1013 java java多线程 threadLocal
首先来看一下线程安全问题产生的两个前提条件： 1.数据共享，多个线程访问同样的数据。 2.共享数据是可变的，多个线程对访问的共享数据作出了修改。实例：定义一个共享数据： public static int a = 0;
Tomcat 架包冲突解决征客丶 tomcat Web
环境： Tomcat 7.0.6 win7 x64 错误表象：【我的冲突的架包是：catalina.jar 与 tomcat-catalina-7.0.61.jar 冲突，不知道其他架包冲突时是不是也报这个错误】严重: End event threw exception java.lang.NoSuchMethodException: org.apache.catalina.dep
【Scala三】分析Spark源代码总结的Scala语法一 bit1129 scala
Scala语法 1. classOf运算符 Scala中的classOf[T]是一个class对象，等价于Java的T.class,比如classOf[TextInputFormat]等价于TextInputFormat.class 2. 方法默认值 defaultMinPartitions就是一个默认值，类似C++的方法默认值
java 线程池管理机制 BlueSkator java线程池管理机制
编辑 Add Tools jdk线程池一、引言第一：降低资源消耗。通过重复利用已创建的线程降低线程创建和销毁造成的消耗。第二：提高响应速度。当任务到达时，任务可以不需要等到线程创建就能立即执行。第三：提高线程的可管理性。线程是稀缺资源，如果无限制的创建，不仅会消耗系统资源，还会降低系统的稳定性，使用线程池可以进行统一的分配，调优和监控。
关于hql中使用本地sql函数的问题（问-答） BreakingBad HQL 存储函数
转自于：http://www.iteye.com/problems/23775 问：我在开发过程中，使用hql进行查询（mysql5）使用到了mysql自带的函数find_in_set()这个函数作为匹配字符串的来讲效率非常好，但是我直接把它写在hql语句里面（from ForumMemberInfo fm,ForumArea fa where find_in_set(fm.userId,f
读《研磨设计模式》-代码笔记-迭代器模式-Iterator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.Arrays; import java.util.List; /** * Iterator模式提供一种方法顺序访问一个聚合对象中各个元素，而又不暴露该对象内部表示 * * 个人觉得，为了不暴露该
常用SQL chenjunt3 oracle sql C++c C#
--NC建库 CREATE TABLESPACE NNC_DATA01 DATAFILE 'E:\oracle\product\10.2.0\oradata\orcl\nnc_data01.dbf' SIZE 500M AUTOEXTEND ON NEXT 50M EXTENT MANAGEMENT LOCAL UNIFORM SIZE 256K ; CREATE TABLESPA
数学是科学技术的语言 comsci 工作活动领域模型
从小学到大学都在学习数学，从小学开始了解数字的概念和背诵九九表到大学学习复变函数和离散数学，看起来好像掌握了这些数学知识，但是在工作中却很少真正用到这些知识，为什么？最近在研究一种开源软件-CARROT2的源代码的时候，又一次感觉到数学在计算机技术中的不可动摇的基础作用，CARROT2是一种用于自动语言分类（聚类）的工具性软件，用JAVA语言编写，它
Linux系统手动安装rzsz 软件包 daizj linux sz rz
1、下载软件 rzsz-3.34.tar.gz。登录linux，用命令 wget http://freeware.sgi.com/source/rzsz/rzsz-3.48.tar.gz下载。 2、解压 tar zxvf rzsz-3.34.tar.gz 3、安装 cd rzsz-3.34 ; make posix 。注意：这个软件安装与常规的GNU软件不
读源码之:ArrayBlockingQueue dieslrae java
ArrayBlockingQueue是concurrent包提供的一个线程安全的队列,由一个数组来保存队列元素.通过 takeIndex和 putIndex来分别记录出队列和入队列的下标,以保证在出队列时不进行元素移动. //在出队列或者入队列的时候对takeIndex或者putIndex进行累加,如果已经到了数组末尾就又从0开始,保证数
C语言学习九枚举的定义和应用 dcj3sjt126com c
枚举的定义 # include <stdio.h> enum WeekDay { MonDay, TuesDay, WednesDay, ThursDay, FriDay, SaturDay, SunDay }; int main(void) { //int day; //day定义成int类型不合适 enum WeekDay day = Wedne
Vagrant 三种网络配置详解 dcj3sjt126com vagrant
Forwarded port Private network Public network Vagrant 中一共有三种网络配置，下面我们将会详解三种网络配置各自优缺点。端口映射(Forwarded port)，顾名思义是指把宿主计算机的端口映射到虚拟机的某一个端口上，访问宿主计算机端口时，请求实际是被转发到虚拟机上指定端口的。Vagrantfile中设定语法为： c
16.性能优化-完结 frank1234 性能优化
性能调优是一个宏大的工程，需要从宏观架构(比如拆分，冗余，读写分离，集群，缓存等)，软件设计（比如多线程并行化，选择合适的数据结构），数据库设计层面（合理的表设计，汇总表，索引，分区，拆分，冗余等）以及微观（软件的配置，SQL语句的编写，操作系统配置等）根据软件的应用场景做综合的考虑和权衡，并经验实际测试验证才能达到最优。性能水很深，笔者经验尚浅，赶脚也就了解了点皮毛而已，我觉得
Word Search hcx2013 search
Given a 2D board and a word, find if the word exists in the grid. The word can be constructed from letters of sequentially adjacent cell, where "adjacent" cells are those horizontally or ve
Spring4新特性——Web开发的增强 jinnianshilongnian spring spring mvc spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装配置tengine并设置开机启动 liuxingguome centos
yum install gcc-c++ yum install pcre pcre-devel yum install zlib zlib-devel yum install openssl openssl-devel Ubuntu上可以这样安装 sudo aptitude install libdmalloc-dev libcurl4-opens
第14章工具函数（上） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Xelsius 2008 and SAP BW at a glance blueoxygen BO Xelsius
Xelsius提供了丰富多样的数据连接方式，其中为SAP BW专属提供的是BICS。那么Xelsius的各种连接的优缺点比较以及Xelsius是如何直接连接到BEx Query的呢？以下Wiki文章应该提供了全面的概览。 http://wiki.sdn.sap.com/wiki/display/BOBJ/Xcelsius+2008+and+SAP+NetWeaver+BW+Co
oracle表空间相关 tongsh6 oracle
在oracle数据库中，一个用户对应一个表空间，当表空间不足时，可以采用增加表空间的数据文件容量，也可以增加数据文件，方法有如下几种： 1.给表空间增加数据文件 ALTER TABLESPACE "表空间的名字" ADD DATAFILE '表空间的数据文件路径' SIZE 50M; &nb
.Net framework4.0安装失败 yangjuanjava .net windows
上午的.net framework 4.0，各种失败，查了好多答案，各种不靠谱，最后终于找到答案了和Windows Update有关系，给目录名重命名一下再次安装，即安装成功了！下载地址：http://www.microsoft.com/en-us/download/details.aspx?id=17113 方法： 1.运行cmd，输入net stop WuAuServ 2.点击开

对比学习论文综述

对比学习论文综述【论文精读】_哔哩哔哩_bilibili

1. 百花齐放 18-19年中

2.CV双雄

3. 不用负样本

4. Transformer

总结

你可能感兴趣的:(学习,深度学习,计算机视觉)