HERODING77

【学习笔记】多模态综述

多模态综述

前言
1. CLIP & ViLT
2. ALBEF
3. VLMO
4. BLIP
5. CoCa
6. BeiTv3
总结
参考链接

前言

本篇学习笔记虽然是多模态综述，本质上是对ViLT后多模态模型的总结，时间线为2021年至2022年，在这两年，多模态领域的模型也是卷的飞起，不断刷新领域的SOTA。在模型结构和数据上提出了很多高效有用的方法，如果你对多模态近两年的发展感兴趣，不妨看一看这一篇文章~

1. CLIP & ViLT

之所以将CLIP和ViLT放在一起，是因为在ViLT这篇论文中对这两项工作进行了很好的总结。从（a）到（d）是文图领域特征抽取模型的发展过程（到ViLT为止），其中（b）展示的就是CLIP的模型结构。它是一个典型的双塔模型，在训练时通过对比学习，将相同的图文对距离拉得很近，对于不同图文对的距离尽量拉得更远。抽取到的图文特征只需要进行简单的点乘就可以做很多多模态的任务。但是CLIP模态交互的部分过于简单，因此很难做复杂的理解任务。为此（c）中的方法在模态融合部分加入了复杂的模型，极大提升了效果。
在ViLT之前，几乎所有的工作都是目标检测的视觉抽取任务，由于都是提前抽取好特征缓存下来，研究人员并没有把过多的注意力放在计算复杂度和推理延迟上。显然在面对未见的下游任务场景时，视觉特征抽取部分的延迟是巨大的。因此ViLT应运而生，ViLT受到ViT的启发，ViT的工作证明了基于图像块的视觉特征和基于目标区域的视觉特征没有太大区别，也能很好拿来做目标检测任务。因此ViLT的作者将图像处理成图像块，和文本以相同的embedding形式输入到模态融合Transformer中，这大大降低了计算复杂度，并且对于下游任务来说，极大降低了推理延迟。
尽管如此，ViLT训练成本巨大，并且在性能上还是和（c）中的方法有一定的差距，可能的原因是在多模态中，视觉特征要远远大于文本特征，而ViLT中文本特征通过BERT的Tokenizer有很好的表征，但是视觉特征只是简单的随机初始化。
因此从结构上，一个好的多模态模型应该更接近于（c）的形式，视觉特征抽取模型要比文本特征抽取模型大，并且在模态融合上有更大的模型。对于训练目标，应该采用ITC+ITM+MLM方法的结合，即图文对比学习，图文匹配，完形填空，高效且性能出色。

2. ALBEF

ALBEF正是上面讨论的理想的多模态模型。ALBEF这篇工作来自于NeurIPS2021，与VILT出发的动机不同，ViLT只是为了提高模型的推理速度，而ALBEF的目的是在模型融合之前，就把图像和文本的特征align起来。具体来说，ALBEF有如下的贡献：

采用图文对比学习的方法提前将图文特征进行融合。
提出动量蒸馏方法解决噪声网络数据的问题。

对于第二个改进中提到的噪声网络数据，是指从网络中爬取的图文数据，文字内容大多都是关键词，而不是真正描述图像中的内容，因此成为了noisy的图文数据，导致模型很难学习到图文特征。

上图是ALBEF的整体模型架构。从简化模型的角度分析，左边是ViT，右边是劈成两半的BERT，前半部分输出和ViT的输出进行ITC的任务，后半部分对图文的特征进行融合。具体来说，图像这边打包成patch输入到ViT中，得到768维度的序列，文本这边转换为文本token序列喂入到6层的文本编码器中，输出768维的特征序列。接着图文token序列中的cls表征通过下采样和标准化降维到256维的特征，然后进行ITC的正负样本对比，让图像和文本的特征尽可能拉进，就完成了第一阶段的学习。
第二阶段，图像特征和文本特征共同输入到multimodal encoder中来实现模态的融合，通过ITM和MLM两个任务进行学习。ITM即图文匹配任务，判断当前的图片和文本是不是同一对，但是ITM任务过于简单，因此作者利用ITC任务中计算的余弦相似度，将最相似的样本作为负样本，来加大模型训练的难度，从而更好学习到特征的信息。MLM任务对输入的文本进行随机掩码，利用上下文和图像特征来预测mask的文本。这里也可以看出，虽然ITM和MLM画在一起，但是属于不同的前向过程，因此训练时间更长。
接着我们再探讨ALBEF另一个贡献点——动量蒸馏。由于预训练的图像对从互联网上收集，因此质量很差，图文经常不匹配。对于ITC学习，即使是负样本的文本也可能与图像匹配，对于MLM来说，可能存在更好的单词能够描述图像。但是ITC和MLM的one-hot标签仍然对这些结果进行惩罚，这会让模型的学习变得困难。作者提出采用动量模型生成的伪标签来帮助模型学习。训练时，作者训练基模型使其预测结果与动量模型的预测结果相匹配。具体来说，这个过程相当于为整个训练又额外添加了两个损失，即针对伪标签的ITC和MLM损失。

上图是伪标签和原始标签的对比，可以看到伪标签有时候更能有效捕获图像的相关信息。
预训练采用的数据集和ViLT一致，都是4million数据集。此外作者又额外加入了更多噪声的CC12million数据集，将性能进一步提高。
实验在五个不同任务的数据集上进行，首先是消融实验的结果：

可以看到加入了ITC后，模型的性能有了大幅度的提升，表明融合之前的模态对齐是很有必要的。并且更难的ITM、额外的两个伪标签loss以及更大的训练数据集都对模型的性能有所提升。

上表是在Flickr30K数据集上零样本的结果，ALBEF仅在4M数据集上预训练就超过了CLIP和ALIGN，二者都是在百倍大的规模数据集上进行预训练。微调结果也是同样的趋势：

此外，在多个下游任务上与其他SOTA模型相比也是大幅领先。

文中作者还从互信息的角度对ALBEF进行了理论分析，表明不同的训练任务可以解释为生成图像文本对视图的不同方式，即数据增强。总而言之，ALBEF无论在训练速度，还是在推理速度，亦或是通用性和性能表现上都非常亮眼，属于多模态领域里程碑式的工作。

3. VLMO

VLMO这篇工作来自于微软团队，中稿于NeurIPS2022，它主要提出两个贡献点：

模型结构上的改进，Mixture-of-Modality-Experts。
训练方式的改进，采用分阶段的模型预训练。

这些贡献点的动机也很明确。对于第一个贡献点，当前的双塔模型架构应用广泛，如CLIP和ALIGN，它们采用双编码器架构，分别对文本和图像进行编码，模态交互通过图像和文本特征的余弦相似度实现的。这种方法虽然计算高效，可以提前存储特征信息，但是交互简单难以处理复杂的任务。另一种模型架构是跨模态注意力融合编码器，它可以在复杂的VL分类任务上实现卓越的性能，但是需要计算所有可能的图文对，以计算检索任务的相似度，导致推理时间过慢。
因此本文的VLMO相当于这两种模型的融合，既可以做双编码器也可以做融合编码器，它通过引入Multiway Transformer实现，该模型应用模态expert来取代标准Transformer中的前馈网络，对于不同模态的数据，切换不同的expert来捕获特定于模态的信息，并使用跨模态共享自注意力来对齐视觉和语言信息。
对于第二个贡献点，由于多模态领域常用的数据集仅有4million大小，远远不能满足大规模预训练的要求，但是在单独的文本和图像模态数据集却十分丰富。因此作者提出一种分阶段预训练策略，将vision expert在视觉领域训练好，language expert在文本领域训练好，这样初始化好的参数再在多模态数据集上训练，就会在性能上有大幅的提升。

模型结构从形式上和ALBEF一致，单个Transformer块采用的是Multiway Transformer块，相对于Transformer，它在FFN上进行了改动，变成了V-FFN，L-FFN和VL-FFN，根据训练数据模态的不同调整更新不同的FFN。训练任务目标也和ALBEF一致，包括ITC，ITM和MLM，其中ITM也使用了Hard Negative Mining，即将一个batch中最相似的样本作为负样本。ITC的过程和CLIP一致，对V-FFN和L-FFN进行更新。ITM的过程是先单模态更新后模态融合，前L-F层分别对V-FFN和L-FFN进行更新，后F层对VL-FFN进行更新，执行二分类任务。MLM模型和ITM一致，只是拿最后一层对mask的token进行预测。

接下来就是本文的第二个贡献点具体实施过程，如上图所示。首先学习图像表征，更新V-FFN和多头自注意力机制的参数，接着冻住多头自注意力和视觉参数，对语言文本进行训练，更新L-FFN，最后所有参数都打开，在多模态数据下进行训练。这里有一个有趣的现象，作者是先在图像上进行训练，再在文本上进行训练，而不是反过来，因为实验发现反过来时效果会变差。

实验部分如上表所示，可以看到无论是base模型，还是large模型，亦或是Large++模型，VLMO的性能都要好于其他模型，并且随着模型增大，训练数据增多，模型的性能也进一步提升。
总结一下，本文提出了统一的视觉语言预训练模型VLMO，它既可以作为双编码器用于高效的视觉和语言的检索，又可以作为融合编码器为跨模态交互建模。此外，作者还表明利用大规模图像和纯文本语料的分阶段预训练极大改善了视觉语言预训练。实验部分表明，VLMO在各种视觉语言分类和检索基准上都要优于先前的先进模型。
未来作者将从以下几个方面对VLMO进行改进：

进一步扩大VLMO预训练模型的规模。
VLMO微调执行视觉语言生成任务是有趣的方向，比如根据图像生成字幕。
视觉-语言预训练在多大程度上可以帮助彼此，特别是Multiway Transformer自然融合了图文表征的时候。
可以尝试融入更多模态的信息（speech，video，structured knowledge），支持通用的多模态预训练。

4. BLIP

随着多模态领域的发展，近两年的工作采用了Transformer Encoder和Decoder的方法，典型的工作就有来自ICML2022的BLIP。BLIP的动机和上篇工作VLMO有异曲同工之妙。首先都是从模型角度出发，现有的方法大多数都是encoder架构的模型，可以在理解任务上有出色的表现，但是在生成任务上表现不佳。此外还有一些encoder-decoder架构的模型，它们可以做生成任务，但是又在图文检索等理解任务上表现不佳。第二个动机也是和数据有关。当前大多数模型都是在充满噪声的大规模数据集上预训练，虽然通过扩大数据集获得了性能上的提升，但是嘈杂的网络文本对视觉的学习并不是最优的。
因此，本文提出了BLIP模型，其主要贡献点如下：

Multimodal mixture of Encoder-Decoder（MED）：一个用于有效多任务预训练和灵活迁移学习的新模型架构。联合了三个联合预训练目标ITC、ITM和LM。
Captioning and Filtering（CapFilt）：一种新的数据集增强方法，用于从噪声文本对中学习。Captioner模块用于为图像生成描述，filter模块从原始网络文本和合成文本中删除嘈杂的标题。

上图是MED的整体架构。之前的工作如VLMO，它的MOME模型就是受到ALBEF的启发构建出来的，这里的MED模型同时受到ALBEF和VLMO启发，其Encoder就是ALBEF，其共享参数的形式就是参考了VLMO。具体来说，MED由四个模块组成，第一个模块是图像的编码器，将图像打包成patch抽取图像的特征。后面三个模块本质上是一个模型，只不过执行不同的任务，第一个模块对文本进行单独编码，和图像特征执行ITC任务，可以看成是CLIP模型。第二个模块将文本和图像的编码进行混合，执行ITM任务，学习模态融合的知识。第三个模块是解码器模块，在之前编码器基础上去除了Bi Self-Att，加入了Causal Self-Att，执行LM任务，让模型拥有生成的能力。由于这篇工作的作者都是ALBEF的原班人马，因此ALBEF中有用的trick也被搬到BLIP中，比如动量编码器，难负样本等。

接着就是BLIP第二个贡献CapFilt，如上图所示。左边部分是在原始的噪声数据集上训练并执行下游任务的模块，显然这些数据并不是最优的选择。因此作者提出了Captioning和Filtering，合成CapFilt，前者用于给定网络图像生成图像的caption，后者作为过滤器过滤噪声文本。二者都是通过相同的MED模型初始化，并在COCO数据集上微调，只不过前者基于ITC和ITM微调，后者基于LM微调。微调后的模型作用于噪声数据集，对数据集进行清洗，生成更可靠的caption。

为了进一步解释上述过程，上图展示了生成过滤的结果。第一张图生成的caption明显可以更好描述图像，因此选择生成的caption作为图像的文本，第三张图原始的文本更契合图像内容，因此保留原始的文本而丢弃生成的caption。

消融实验部分很好说明了大模型，大的更干净的数据集可以对模型性能有着更好的提升。

和别的模型相比，BLIP也是极具优越性，在COCO和Flickr30K数据集上都达到了SOTA。

5. CoCa

之前的工作证明了decoder模型的优越性，但是由于计算不同的loss需要多次前向过程，因此计算和时间成本过高。CoCa进一步简化了之前工作的设计，文本端只使用decoder模型，只需要一次的前向过程就可以计算ITC Loss和Captioning Loss。其结构和伪代码如下图所示：

可以看到整体的结构和ALBEF几乎一样，只不过在文本端全部换成了Decoder，图像特征也通过attention pooling用于模态的融合。整体的方法相当简洁，由于是decoder架构，所以作者在几十亿规模的数据集、21亿参数的模型上进行预训练，scale的能力是相当出色。

文中的多边形图也极大展示了CoCa的优势。CoCa在各个数据集以及零样本上都展现出强大的能力，刷新了各个榜单的SOTA。

6. BeiTv3

随着多模态领域的工作越来越丰富，研究人员开始追求真正的大一统模型。BeiTv3的目标非常明确，它就是为了做更大一统的多模态模型，无论是模型大小还是目标函数甚至是数据集的规模，都要求统一。这篇工作上来就卖弄它的结果，如下图所示：

性能可谓是全方位包围之前的模型。BEiTv3得出了两点结论：

目标函数不是越多越好，关键还是在于loss之间能否互相弥补。
数据不是越大越好，数据的质量更为关键。

为了达到大一统的目的，本篇工作本质上是融合了之前所有模型的优势，主要从以下三个方面展开：

Transformer提供统一编码，实现模态模型架构的统一。
mask-then-predict的训练目标，减少过多训练目标带来的效率低下和冗余。
扩大模型规模和预训练数据规模。

模型的具体结构如上图所示，其实就是VLMO的变体，并且预训练任务只做Masked Data Modeling。

在执行下游任务时，模型也能实现很好的迁移，如上图所示，通过调用模型中不同的模块来执行下游任务，而这些模块都在预训练阶段得到充分的训练，只需要简单微调甚至零样本就能得到很好的效果。

总结

上述的一系列工作可以总结为上面这张图。本文关于多模态的工作其实是从ViT出发的，之前多模态领域对于图像特征的抽取都需要借助CNN架构的模型和目标检测任务，效率低，性能差。随着ViT提出后，多模态领域终于实现文图框架上的统一，即ViLT工作的诞生。但是此时的工作还是在探索图像特征抽取模型、文本特征抽取模型和特征融合模型之间的权重，因此性能甚至还不如之前的模型。ALBEF的工作奠定了模型的权重关系，结合了CLIP的方法，在融合前先进行一次文图特征的对齐，整个训练过程设计了三个训练目标，在性能上实现了显著的提升。但是ALBEF针对不同的模态总共设计了三个模型，既然都是统一的Transformer架构的模型，为什么不能只使用一个模型呢？为此VLMO采用了Multiway Transformer，让所有的模态特征学习都在一个模型中进行，通过冻结FFN和共享自注意力机制实现，实验结果上也是优于ALBEF。但是之前这些工作都只能做多模态理解任务，BLIP开创了生成任务的先河，加入了decoder架构，执行LM任务，并且利用对图像生成caption的优势对数据进行质量上的提升，从而进一步提高模型的性能。CoCa进一步简化先前的工作，文本端只采用decoder架构模型，只需要一次的前向过程就可以计算ITC Loss和Captioning Loss。最后，BeiTv3总结前面所有的工作，目标是成为大一统的多模态模型，在模型和数据规模上都进一步scale，以搭积木的方式处理各种下游任务，结果全方位包围了多模态领域和多个单模态领域的SOTA。
上面主要是从模型结构角度来分析多模态领域方法的改进，其实数据上也有很多改进。因为多模态领域数据集和单模态比起来明显不足，于是很多工作都采用从网络中爬取的文本对进行训练，但是网络数据质量不佳。为此ALBEF提出动量蒸馏方法解决噪声网络数据的问题，VLMO利用单模态数据集进行预训练，而BLIP出色的生成能力让其可以为图像生成更准确的文本caption，从而进一步提升模型的性能。
实际上，虽然BeiTv3这篇工作的目标是成为大一统模型，并且能够做各种各样的下游任务，但都是需要通过模型的组合拼接实现的，从本质上并没有实现大一统，真正的大一统模型是不需要根据下游任务调整模型结构的，如现在的GPT-4等大模型，而这也正是当前多模态领域发展的方向。

参考链接

https://arxiv.org/pdf/2104.13921.pdf
http://proceedings.mlr.press/v139/radford21a/radford21a.pdf
https://arxiv.org/pdf/2107.07651.pdf
https://proceedings.neurips.cc/paper_files/paper/2022/file/d46662aa53e78a62afd980a29e0c37ed-Paper-Conference.pdf
https://proceedings.mlr.press/v162/li22n/li22n.pdf
https://arxiv.org/pdf/2205.01917.pdf
https://arxiv.org/pdf/2208.10442.pdf

【机器学习】算法分类 CH3_CH2_CHO 什么？！是机器学习！！机器学习算法有监督学习无监督学习半监督学习强化学习
1、有监督学习1.1定义使用带标签的数据训练模型。有监督学习是机器学习中最常见的一种类型，它利用已知的输入特征和对应的输出标签来训练模型，使模型能够学习到特征与标签之间的映射关系。在训练过程中，模型会不断地调整自身的参数，以最小化预测值与真实标签之间的误差，从而提高预测的准确性。1.2回归问题1.2.1目标预测连续值。回归问题的目标是预测一个连续的数值结果，模型的输出是一个实数值。1.2.2解释回
从零实现KV存储项目实战程序员老舅 C++Linux后端 c++c++存储 kv存储分布式存储后端项目 c++项目 cpp项目
本项目是从零实现一个完整的、兼容Redis协议的KV数据库项目。通过每一行代码的编写。你会对整个系统了如指拿，这样对自己基本功的锻炼、对编程能力的提升都是很大的项目提供完整的视频教程+代码下面是关于KV存储项目的技术大纲：如果你在学习的过程当中，遇到有任何问题，都可以在项目社群提出了，有专人给大家答疑的。适用人群这个KV存储项目对以下同学应该都非常的合适,包括但不限于:●想入门数据库的同学，存储对
MongoDB慢日志查询及索引创建 laolitou_1024 中间件微服务数据库 mongodb
MongoDB的慢日志（SlowQueryLog）对于运维和程序员来说都非常重要，因为它直接关系到数据库的性能和应用程序的稳定性。以下分享介绍下MongoDB慢日志查询及索引创建相关的一些笔记。一，准备1.使用db.currentOp()实时监控db.currentOp()可以查看当前正在执行的操作，适合捕捉瞬时的高CPU操作。db.currentOp()示例：过滤长时间运行的操作db.curre
图神经网络实战——分层自注意力网络盼小辉丶图神经网络从入门到项目实战神经网络人工智能深度学习
图神经网络实战——分层自注意力网络0.前言1.分层自注意力网络1.1模型架构1.2节点级注意力1.3语义级注意力1.4预测模块2.构建分层自注意力网络相关链接0.前言在异构图数据集上，异构图注意力网络的测试准确率为78.39%，比之同构版本有了较大提高，但我们还能进一步提高准确率。在本节中，我们将学习一种专门用于处理异构图的图神经网络架构，分层自注意力网络(hierarchicalself-att
Radiance Fields from VGGSfM和Mast3r:两种先进3D重建方法的比较与分析 2401_87458718 3d
VGGSfM和Mast3r:3D场景重建的新方向在计算机视觉和3D重建领域,如何从2D图像重建3D场景一直是一个充满挑战的研究课题。近年来,随着深度学习技术的发展,一些新的方法被提出并取得了显著的进展。本文将重点介绍两种最新的基于深度学习的3D重建方法:VGGSfM和Mast3r,并通过GaussianSplatting技术对它们的性能进行全面比较和分析。VGGSfM:基于视觉几何的深度结构运动恢
微服务即时通信系统---（五）框架学习 YangZ123123 微服务即时通信系统学习微服务算法
目录ODB介绍安装build2安装odb-compiler安装ODB运行时库安装mysql和客户端开发包安装boostprofile库安装总体打包安装总体卸载总体升级头文件包含和编译时指明库ODB常见操作介绍类型映射ODB编程类与接口介绍mysql连接池对象类mysql客户端操作句柄类mysql事务操作类针对可能为空的字段封装的类似于智能指针的类型针对查询结果所封装的容器类和条件类mysql操作句
基于 PyTorch 的 MNIST 手写数字分类模型欣然～ pytorch 分类人工智能
一、概述本代码使用PyTorch框架构建了一个简单的神经网络模型，用于解决MNIST手写数字分类任务。代码主要包括数据的加载与预处理、神经网络模型的构建、损失函数和优化器的定义、模型的训练、评估以及最终模型的保存等步骤。二、依赖库torch：PyTorch深度学习框架的核心库，提供了张量操作、自动求导等功能。torch.nn：PyTorch的神经网络模块，包含了各种神经网络层、损失函数等。torc
win32汇编环境,网络编程入门之九一品人家汇编
;在上一教程里，我们学习了在连接成功网站后，应该发送什么数据给网站;在前面的几个教程里，简单地运行了套接字机制连接网站的方式，这是字节级的网络连接，扩展几乎是无限的。;想了想，这个开个头就行了，暂时放下来，再讲下去越搞越复杂，还是把一些基础运用的方式讲一讲。以后回头再来研究它。;从这个教程开始，讲一下部分微软专用网络API的运用。;微软网络API有2个值得一提，1个是WinInet,还1个是Win
使用 Baseten 部署和运行机器学习模型的指南 shuoac 机器学习人工智能 python
随着机器学习模型在各个行业中的广泛应用，如何高效地部署和运行这些模型成为一个关键问题。本文将介绍如何使用Baseten平台来部署和服务机器学习模型。Baseten是LangChain生态系统中的一个重要提供者，它提供了所需的基础设施来高效地运行模型。无论是开源模型如Llama2和Mistral，还是专有或经过微调的模型，Baseten都能在专用GPU上运行。技术背景介绍Baseten提供了一种不同
Jarslink 是一个 SOFA 方舟插件，用于管理多应用部署后端java
前言大家好，我是老马。sofastack其实出来很久了，第一次应该是在2022年左右开始关注，但是一直没有深入研究。最近想学习一下SOFA对于生态的设计和思考。sofaboot系列SOFABoot-00-sofaboot概览SOFABoot-01-蚂蚁金服开源的sofaboot是什么黑科技？SOFABoot-02-模块化隔离方案SOFABoot-03-sofaboot介绍SOFABoot-04-快
CCNP之IGP学习笔记（2022）码龄4年审核中笔记 OSPF RIP EIGRP IGP CCNP
evecommunityedition2.0.3-92_v1.4.1.ovaOVF（OpenVirtualizationFormat：开放虚拟化格式）和OVA（OpenVirtualizationAppliance：开放虚拟化设备）appliance器具collaborative合作的；协力完成的translation翻译；译文；译本；转化CollaborativeTranslationFrame
学习-Java常用类之Calendar类 AIains Educoder—Java java
第1关：学习-Java常用类之Calendar类任务描述相关知识编程要求测试说明任务描述本关任务：获取给定年月的最后一天。相关知识我们通过之前的学习已经能够格式化并创建一个日期对象了，但是我们如何才能设置和获取日期数据的特定部分呢，比如说小时，日，或者分钟?我们又如何在日期的这些部分加上或者减去值呢?calendar类是一个抽象类，是Java日期处理的核心类之一。Calendar类为操作日历字段，
高效快速教你DeepSeek如何进行本地部署并且可视化对话大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 经验分享
科技文章：高效快速教你DeepSeek如何进行本地部署并且可视化对话摘要：随着自然语言处理（NLP）技术的进步，DeepSeek作为一款基于深度学习的语义搜索技术，广泛应用于文本理解、对话系统及信息检索等多个领域。本文将探讨如何高效快速地在本地部署DeepSeek，并结合可视化工具实现对话过程的监控与分析。通过详尽的步骤、案例分析与代码示例，帮助开发者更好地理解和应用DeepSeek技术。同时，本
【嵌入式学习2】指针 - 数组 XYN5114 嵌入式学习学习笔记嵌入式硬件 c语言
目录##概述##指针###指针特点##指针变量###指针变量特点##区别##指针变量的使用定义指针变量时：使用指针变量时：##通过指针间接修改变量的值##指针大小指针大小与数据类型无关：无论指针指向什么类型的数据（int、char、double等），指针本身的大小只取决于系统的位数（32位或64位）。##指针步长###指针步长的计算方式##空指针和野指针##多级指针##指针与常量##函数参数传递内
机器学习——分类、回归、聚类、LASSO回归、Ridge回归（自用）代码的建筑师模型学习模型训练机器学习机器学习分类回归正则化项 LASSO Ridge 朴素
纠正自己的误区：机器学习是一个大范围，并不是一个小的方向，比如：线性回归预测、卷积神经网络和强化学都是机器学习算法在不同场景的应用。机器学习最为关键的是要有数据，也就是数据集名词解释：数据集中的一行叫一条样本或者实例，列名称为特征或者属性。样本的数量称为数据量，特征的数量称为特征维度机器学习常用库：Numpy和sklearn朴素的意思是特征的各条件都是相互独立的机器学习（模型、策略、算法）损失函数
《AI医疗系统开发实战录》第6期——智能导诊系统实战骆驼_代码狂魔程序员的法宝人工智能 django python neo4j 知识图谱
关注我，后期文章全部免费开放，一起推进AI医疗的发展核心主题：如何构建95%准确率的智能导诊系统？技术突破：结合BERT+知识图谱的混合模型设计一、智能导诊架构设计python基于BERT的意图识别模型（PyTorch）fromtransformersimportBertTokenizer,BertForSequenceClassificationimporttorchclassTriageMod
RK平台下Buildroot驱动编译环境入门 ItJavawfc RK系统-驱动驱动学习 Kernel Ubuntu Buildroot
提示：低配置电脑下驱动编译环境搭建，驱动学习环境准备文章目录目的需求环境Ubuntu18Desk桌面开发环境Buildroot编译环境基本要求个人环境VM环境配置+Buildroot编译环境配置Buildroot编译总结目的搭建驱动开发编译环境硬件环境要求不达标如何进行配置规避，使编译环境编译OK为后续自己开发工作中，学习环境做一个简单的指导需求这里我需要搭建的环境是Ubuntu上面用Linux源
量化交易系统中如何处理机器学习模型的训练和部署？ openwin_top 量化交易系统开发机器学习人工智能量化交易
microPythonPython最小内核源码解析NI-motion运动控制c语言示例代码解析python编程示例系列python编程示例系列二python的Web神器Streamlit如何应聘高薪职位量化交易系统中，机器学习模型的训练和部署需要遵循一套严密的流程，以确保模型的可靠性、性能和安全性。以下是详细描述以及相关的示例：1.数据收集和预处理数据收集在量化交易中，数据是最重要的资产。收集的数
不懂英语可以学编程吗?,不懂英文可以学编程吗 P5688346 人工智能
大家好，给大家分享一下英语不好能学python编程吗，很多人还不知道这一点。下面详细解释一下。现在让我们来看看！Sourcecodedownload:本文相关源码提到人工智能，就不得不提Python编程语言，大多数人觉得编程语言肯定会涉及到很多代码，满屏的英文字母，想想就头疼，觉得自己不会英语，肯定学不好Python，但是不会英语到底能不能够学习Python呢，下面小编给大家分析分析。其实各位想要
sqlmap笔记君如尘网络安全-渗透笔记笔记
1.运行环境sqlmap是用Python编写的，因此首先需要确保你的系统上安装了Python。sqlmap支持Python2.6、2.7和Python3.4及以上版本。2.常用命令通用格式：bythonsqlmap.py-r注入点地址--参数-rpost请求-uget请求--level=测试等级--risk=测试风险-v显示详细信息级别-p针对某个注入点注入-threads更改线程数，加速--ba
C#基础学习（二）C#数组生存手册：从入门到“血压拉满“的奇妙旅程 FAREWELL00075 c#学习开发语言数组 Array
作为一只C#萌新，当你试图用数组装下整个世界时，系统可能会温柔地弹出一句**"Indexwasoutsidetheboundsofthearray."**。别慌！这份求生指南将用段子教你玩转数组一、数组是什么数组简单来说就是由相同元素组成的一个集合，数组里面不一定是数，还可能是bool,string等类型组成的集合。那么他有些什么特点呢：本质：装着相同类型元素的集装箱（比如一箱肥宅快乐水）特性：长
笔记：代码随想录算法训练营day60：并查集理论基础、寻找存在的路径 jingjingjing1111 笔记
本文为学习并查集理论基础|代码随想录、代码随想录过程中的思考find是找的顶头上司，而不是当前上司，最后怎么也得找到一个顶头上司的上司是自己，要不然这个结构也不成立使用issame替换会使被操作者为当前节点，而非根节点。join(u,v)的功能为将v的根节点挂到u的根节点下模拟过程可以看出，join中的find中的路径压缩要在长度大于2（路径大于1）的时候才会体现出来107.寻找存在的路径卡码网题
计算机基础：编码04，认识反码和补码水饺编程 MFC学习笔记 Win32学习笔记 windows c++mfc c语言
专栏导航本节文章分别属于《Win32学习笔记》和《MFC学习笔记》两个专栏，故划分为两个专栏导航。读者可以自行选择前往哪个专栏。（一）WIn32专栏导航上一篇：计算机基础：编码03，根据十进制数，求其原码回到目录下一篇：无（二）MFC专栏导航上一篇：计算机基础：编码03，根据十进制数，求其原码回到目录下一篇：无本节前言在前两节，我讲解了关于原码的知识。本节，我来讲解反码和补码。在学习本节之前，你需
【access开发】导入excel 并生成表 Access开发易登软件 vba Access开发 Excel html vba access excel 前端 access数据库低代码
hi，大家好呀！最近天气越来越暖了，在这个春暖花开的季节了，每天心情应该都是美美的，正所谓一年之计在于春，在这个美好的季节，大家一起努力学习学习吧！那我们来看看今天学点啥呢？大家在刚接触access时，很多都是excel的高手，学习的过程中，总会想着，怎么把现在的excel数据导入到access，那这个时候该怎么来操作呢？如果是新手，那肯定是导入excel就可以了，那如果你是一个爱show技术的e
Android Jetpack 应用架构指南小李子学编程 Android 开发文档指南 android android jetpack 学习
AndroidJetpack应用架构指南本指南涵盖Android应用开发的最佳实践和推荐架构，助力开发者构建健壮高效的应用程序。。前置要求本文假设您已具备Android框架基础知识。若需系统学习Android开发，建议先完成《Android基础知识》目录新架构设计背景移动应用交互特性核心架构原则分离关注点数据模型驱动界面单一数据源单向数据流分层架构设计界面层数据层领域层依赖管理方案工程实践指南参考
使用Python构建去中心化预测市场：从概念到实现 Echo_Wish Python！实战！python 去中心化开发语言
使用Python构建去中心化预测市场：从概念到实现大家好，我是Echo_Wish。今天，我们将深入探讨一个前沿的区块链应用——去中心化预测市场，并学习如何使用Python来构建一个简易的预测市场平台。预测市场是基于市场参与者对未来事件的预测来产生结果的地方，通常被用来预测政治事件、金融市场走向、体育比赛结果等。传统的预测市场如Augur、Polymarket等，基于去中心化平台，利用区块链技术确保
RocketMQ学习-Springboot整合RocketMQ wechatt_fee1024 面试 maven spring boot java
SpringBoot整合RocketMQ需要注意的是SpringBoot的starter集成包时，要注意版本。因为SpringBoot集成的RocketMQ的starter依赖由Spring社区提供，迭代比较快，版本之间的差异还是比较大的。可能版本不同，就导致使用的时候出现错误。maven依赖,直接把我的maven工程的配置放到这里了。普通消息maven工程创建我直接创建了一个空的maven工程，
Python爬虫笔记一（来自MOOC） Requests库入门小灰不停前进 #Python python pycharm 爬虫
Python爬虫笔记一通用代码框架：importrequestsdefgetHTMLText(url):try:r=requests.get(url,timeput=30)r.raise_for_status()#如果状态不是200，引发HTTPError异常r.encoding=r.apparemt_encodingreturnr.textexcept:return"产生异常"if__name_
回答我！！！如何用“快递分拣”讲明白OSI五层模型？茫忙然计算机网络网络
刚开始学习计算机网络时，会比较难理解计算机网络的五层协议，毕竟确实挺抽象的，接下来我用寄快递的过程来类比计算机网络的五层协议（物理层、数据链路层、网络层、传输层、应用层），帮助大家理解每一层的功能和作用。1.物理层（PhysicalLayer）——交通工具和道路快递中的比喻：卡车、飞机、轮船等运输工具，以及高速公路、铁路、航线等物理路径。功能：负责将包裹（数据）从一个地点物理传输到另一个地点，不关
Python基于深度学习的动物图片识别技术的研究与实现 Java老徐 Python 毕业设计 python 深度学习开发语言深度学习的动物图片识别技术 Python动物图片识别技术
博主介绍：✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w+、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌文末获取源码联系精彩专栏推荐订阅不然下次找不到哟2022-2024年最全的计算机软件毕业设计选题大全：1000个热门选题推荐✅Java项目精品实战案例《100套》Java微信小程序项目实战《100套》感兴趣的可以先收藏起来，还有大家
插入表主键冲突做更新 a-john
有以下场景：用户下了一个订单，订单内的内容较多，且来自多表，首次下单的时候，内容可能会不全（部分内容不是必须，出现有些表根本就没有没有该订单的值）。在以后更改订单时，有些内容会更改，有些内容会新增。问题：如果在sql语句中执行update操作，在没有数据的表中会出错。如果在逻辑代码中先做查询，查询结果有做更新，没有做插入，这样会将代码复杂化。解决： mysql中提供了一个sql语
Android xml资源文件中@、@android:type、@*、？、@+含义和区别 Cb123456 @+@?@*
一.@代表引用资源 1.引用自定义资源。格式：@[package:]type/name android：text="@string/hello" 2.引用系统资源。格式：@android:type/name android:textColor="@android:color/opaque_red"
数据结构的基本介绍天子之骄数据结构散列表树、图线性结构价格标签
数据结构的基本介绍数据结构就是数据的组织形式，用一种提前设计好的框架去存取数据，以便更方便，高效的对数据进行增删查改。正确选择合适的数据结构，对软件程序的高效执行的影响作用不亚于算法的设计。此外，在计算机系统中数据结构的作用也是非同小可。例如常常在编程语言中听到的栈，堆等，就是经典的数据结构。经典的数据结构大致如下：一：线性数据结构 (1)：列表 a
通过二维码开放平台的API快速生成二维码一炮送你回车库 api
现在很多网站都有通过扫二维码用手机连接的功能，联图网(http://www.liantu.com/pingtai/)的二维码开放平台开放了一个生成二维码图片的Api,挺方便使用的。闲着无聊，写了个前台快速生成二维码的方法。 html代码如下:(二维码将生成在这div下) ? 1 &nbs
ImageIO读取一张图片改变大小 3213213333332132 java IO image BufferedImage
package com.demo; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imageio.ImageIO; /** * @Description 读取一张图片改变大小 * @author FuJianyon
myeclipse集成svn（一针见血） 7454103 eclipse SVN MyEclipse
&n
装箱与拆箱----autoboxing和unboxing darkranger J2SE
4.2　自动装箱和拆箱基本数据(Primitive)类型的自动装箱(autoboxing)、拆箱(unboxing)是自J2SE 5.0开始提供的功能。虽然为您打包基本数据类型提供了方便，但提供方便的同时表示隐藏了细节，建议在能够区分基本数据类型与对象的差别时再使用。 4.2.1　autoboxing和unboxing 在Java中，所有要处理的东西几乎都是对象(Object)
ajax传统的方式制作ajax aijuans Ajax
//这是前台的代码 <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); String basePath = request.getScheme()+
只用jre的eclipse是怎么编译java源文件的？ avords java eclipse jdk tomcat
eclipse只需要jre就可以运行开发java程序了，也能自动编译java源代码，但是jre不是java的运行环境么，难道jre中也带有编译工具？还是eclipse自己实现的？谁能给解释一下呢问题补充：假设系统中没有安装jdk or jre，只在eclipse的目录中有一个jre，那么eclipse会采用该jre，问题是eclipse照样可以编译java源文件，为什么呢？ &nb
前端模块化 bee1314 模块化
背景：前端JavaScript模块化，其实已经不是什么新鲜事了。但是很多的项目还没有真正的使用起来，还处于刀耕火种的野蛮生长阶段。 JavaScript一直缺乏有效的包管理机制，造成了大量的全局变量，大量的方法冲突。我们多么渴望有天能像Java（import），Python (import)，Ruby(require)那样写代码。在没有包管理机制的年代，我们是怎么避免所
处理百万级以上的数据处理 bijian1013 oracle sql 数据库大数据查询
一.处理百万级以上的数据提高查询速度的方法： 1.应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描。 2.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 o
mac 卸载 java 1.7 或更高版本征客丶 java OS
卸载 java 1.7 或更高 sudo rm -rf /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin 成功执行此命令后，还可以执行 java 与 javac 命令 sudo rm -rf /Library/PreferencePanes/JavaControlPanel.prefPane 成功执行此命令后，还可以执行 java
【Spark六十一】Spark Streaming结合Flume、Kafka进行日志分析 bit1129 Stream
第一步，Flume和Kakfa对接，Flume抓取日志，写到Kafka中第二部，Spark Streaming读取Kafka中的数据，进行实时分析本文首先使用Kakfa自带的消息处理（脚本）来获取消息，走通Flume和Kafka的对接 1. Flume配置 1. 下载Flume和Kafka集成的插件，下载地址：https://github.com/beyondj2ee/f
Erlang vs TNSDL bookjovi erlang
TNSDL是Nokia内部用于开发电信交换软件的私有语言，是在SDL语言的基础上加以修改而成，TNSDL需翻译成C语言得以编译执行，TNSDL语言中实现了异步并行的特点，当然要完整实现异步并行还需要运行时动态库的支持，异步并行类似于Erlang的process（轻量级进程），TNSDL中则称之为hand，Erlang是基于vm(beam)开发，
非常希望有一个预防疲劳的java软件, 预防过劳死和眼睛疲劳,大家一起努力搞一个 ljy325 企业应用
　非常希望有一个预防疲劳的java软件，我看新闻和网站，国防科技大学的科学家累死了，太疲劳，老是加班，不休息，经常吃药，吃药根本就没用，根本原因是疲劳过度。我以前做java,那会公司垃圾，老想赶快学习到东西跳槽离开，搞得超负荷，不明理。深圳做软件开发经常累死人，总有不明理的人，有个软件提醒限制很好，可以挽救很多人的生命。相关新闻：（1）IT行业成五大疾病重灾区：过劳死平均37.9岁
读《研磨设计模式》-代码笔记-原型模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * Effective Java 建议使用copy constructor or copy factory来代替clone()方法： * 1.public Product copy(Product p){} * 2.publi
配置管理---svn工具之权限配置 chenyu19891124 SVN
今天花了大半天的功夫，终于弄懂svn权限配置。下面是今天收获的战绩。安装完svn后就是在svn中建立版本库，比如我本地的是版本库路径是C:\Repositories\pepos。pepos是我的版本库。在pepos的目录结构 pepos component webapps 在conf里面的auth里赋予的权限配置为 [groups]
浅谈程序员的数学修养 comsci 设计模式编程算法面试招聘
浅谈程序员的数学修养
批量执行 bulk collect与forall用法 daizj oracle sql bulk collect forall
BULK COLLECT 子句会批量检索结果，即一次性将结果集绑定到一个集合变量中，并从SQL引擎发送到PL/SQL引擎。通常可以在SELECT INTO、 FETCH INTO以及RETURNING INTO子句中使用BULK COLLECT。本文将逐一描述BULK COLLECT在这几种情形下的用法。有关FORALL语句的用法请参考：批量SQL之 F
Linux下使用rsync最快速删除海量文件的方法 dongwei_6688 OS
1、先安装rsync：yum install rsync 2、建立一个空的文件夹：mkdir /tmp/test 3、用rsync删除目标目录：rsync --delete-before -a -H -v --progress --stats /tmp/test/ log/这样我们要删除的log目录就会被清空了，删除的速度会非常快。rsync实际上用的是替换原理，处理数十万个文件也是秒删。
Yii CModel中rules验证规格 dcj3sjt126com rules yii validate
Yii cValidator主要用法分析： yii验证rulesit 分类： Yii yii的rules验证 cValidator主要属性 attributes ,builtInValidators,enableClientValidation,message,on,safe,skipOnError
基于vagrant的redis主从实验 dcj3sjt126com vagrant
平台: Mac 工具: Vagrant 系统: Centos6.5 实验目的: Redis主从实现思路制作一个基于sentos6.5, 已经安装好reids的box, 添加一个脚本配置从机, 然后作为后面主机从机的基础box 制作sentos6.5+redis的box mkdir vagrant_redis cd vagrant_
Memcached(二)、Centos安装Memcached服务器 frank1234 centos memcached
一、安装gcc rpm和yum安装memcached服务器连接没有找到，所以我使用的是make的方式安装，由于make依赖于gcc，所以要先安装gcc 开始安装，命令如下，[color=red][b]顺序一定不能出错[/b][/color]：建议可以先切换到root用户，不然可能会遇到权限问题：su root 输入密码...... rpm -ivh kernel-head
Remove Duplicates from Sorted List hcx2013 remove
Given a sorted linked list, delete all duplicates such that each element appear only once. For example,Given 1->1->2, return 1->2.Given 1->1->2->3->3, return&
Spring4新特性——JSR310日期时间API的支持 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
浅谈enum与单例设计模式 247687009 java 单例
在JDK1.5之前的单例实现方式有两种(懒汉式和饿汉式并无设计上的区别故看做一种)，两者同是私有构造器，导出静态成员变量，以便调用者访问。第一种 package singleton; public class Singleton { //导出全局成员 public final static Singleton INSTANCE = new S
使用switch条件语句需要注意的几点 openwrt c break switch
1. 当满足条件的case中没有break，程序将依次执行其后的每种条件（包括default）直到遇到break跳出 int main() { int n = 1; switch(n) { case 1: printf("--1--\n"); default: printf("defa
配置Spring Mybatis JUnit测试环境的应用上下文 schnell18 spring mybatis JUnit
Spring-test模块中的应用上下文和web及spring boot的有很大差异。主要试下来差异有：单元测试的app context不支持从外部properties文件注入属性 @Value注解不能解析带通配符的路径字符串解决第一个问题可以配置一个PropertyPlaceholderConfigurer的bean。第二个问题的具体实例是：
Java 定时任务总结一 tuoni java spring timer quartz timertask
Java定时任务总结一.从技术上分类大概分为以下三种方式： 1.Java自带的java.util.Timer类，这个类允许你调度一个java.util.TimerTask任务; 说明： java.util.Timer定时器，实际上是个线程，定时执行TimerTask类 &
一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法 yangshangchuan rank 相似度计算文本相似度词袋模型余弦相似度
本文描述了一种在ITEYE博客频道上面出现的新型的商业广告形式及其应对方法，对于其他的用户生成内容站点类型也具有同样的适用性。最近在ITEYE博客频道上面出现了一种新型的商业广告形式，方法如下： 1、注册多个账号（一般10个以上）。 2、从多个账号中选择一个账号，发表1-2篇博文