Debroon

跨越视觉-语言界限：BLIP的多任务精细处理策略

BLIP

核心思想

MED架构和CapFilt方法

效果

总结

CLIP模型 VS BLIP模型

CLIP模型

BLIP模型

核心思想

论文：https://proceedings.mlr.press/v162/li22n/li22n.pdf

代码：https://github.com/salesforce/BLIP

BLIP（Bootstrapping Language-Image Pre-training）是一个用于统一视觉-语言理解和生成任务的预训练框架。

专门设计来提升多种视觉和语言任务的性能，包括图像-文本检索、图像描述生成、视觉问答（VQA）、自然语言视觉推理（NLVR^2）、和视觉对话（VisDial）等。

组成：

多模态混合编解码器（Multimodal Mixture of Encoder-Decoder, MED）:
- BLIP提出了一个新的模型架构，称为MED。这个架构可以作为单模态编码器、图像基础文本编码器或图像基础文本解码器来操作。这种多功能性使得MED能够有效地进行多任务预训练，并灵活地迁移到多种下游任务。
数据集引导（Dataset Bootstrapping）:
- 为了有效利用从网上收集的含噪声的图像-文本对，BLIP通过一个称为CapFilt的机制来优化数据质量。CapFilt包括两个组件：一个标题生成器（Captioner）用于生成合成标题，和一个过滤器（Filter）用于移除不准确或噪声文本。这种机制使得BLIP能够从次优的监督数据中学习，并提高下游任务的性能。
预训练目标:
- BLIP在预训练时联合优化多个目标，包括图像-文本对比损失（ITC）、图像-文本匹配损失（ITM）和语言模型损失（LM）。这些目标帮助BLIP学习图像和文本间的对齐和细粒度关联，并生成文本描述。
零样本迁移学习:
- BLIP展现出强大的泛化能力，能够在零样本设置下直接迁移到视频-语言任务，这表明它学习到的视觉-语言表示具有广泛的适用性。
开源和可访问性:
- BLIP的代码和模型被开源，使得研究社区可以使用和进一步发展这个框架。

MED架构和CapFilt方法

BLIP的核心方法论，解决现有视觉-语言预训练模型在模型结构和数据噪声方面的局限性：

子问题1: 单一模型结构局限性
- 具体问题: 现有的视觉-语言预训练模型主要采用编码器模型或编码器-解码器模型。
- 现有模型要么擅长理解任务（如识别图片中的内容），要么擅长生成任务（如描述图片内容）。
- 需要一个模型架构，能够同时处理视觉理解和文本生成任务，以及有效学习视觉和语言之间的对齐。
- 子解法1: 引入多模态混合编码器-解码器（Multimodal mixture of Encoder-Decoder, MED）
  - 解法原因: MED模型架构能够有效地进行多任务预训练和灵活的迁移学习。
  - MED由于其设计，可以在不同模式间切换：作为编码器理解信息，作为解码器生成信息，或者两者结合起来。这种设计允许它适应多种不同的任务。

在图像描述生成任务中，MED以图像基础文本解码器的形式操作，通过学习图像内容来生成描述文本。

在图像-文本检索任务中，MED则以图像基础文本编码器的形式操作，匹配图像和文本之间的相似性。

MED提供了三种功能：单模态编码器、图像基础文本编码器、和图像基础文本解码器，使模型能够灵活地在不同的任务之间切换，并且通过共享某些层来提高训练效率和促进多任务学习。

这种结构的灵活性意味着同一个模型可以适应多种类型的任务，无需为每种任务定制单独的模型结构。

子问题2: 数据噪声问题
- 具体问题: 大多数先进方法获取大规模的图像-文本对，通常通过网络爬虫获取，尽管采用了简单的基于规则的过滤器，这些数据中仍然普遍存在噪声。
- 以往的工作往往忽略了数据噪声的负面影响，只是通过扩大数据集的规模来获得性能提升。
- 子解法2: 标题生成与过滤（Captioning and Filtering, CapFilt）
  - 解法原因: 通过对预训练的MED进行微调，分别生成合成标题并过滤掉噪声标题，可以从噪声的图像-文本对中有效学习。这种方法通过提高数据质量，直接解决了数据噪声问题。

假设有一张网络图像，其关联的文本是“蓝天下的一座桥”。

然而，这个文本与图像的实际内容不符，因为图像可能显示的是一场足球比赛。

标题生成器（Captioner）可能会生成一个更准确的描述，如“足球场上的比赛”，然后过滤器（Filter）会识别并去除原始不准确的描述，保留合成的准确描述。

这样，BLIP就能通过改善训练数据的质量来提升模型的性能。

通过引入MED架构和CapFilt方法，BLIP不仅能够在多个视觉-语言任务上实现最先进的性能，还能在零样本场景下直接迁移到视频-语言任务，展现出极强的泛化能力。

3. 子问题3: 知识蒸馏在视觉语言预训练中的应用限制

具体问题: 现有的知识蒸馏（KD）方法主要是简单地迫使学生模型拥有与教师模型相同的类别预测，这在VLP的上下文中不够有效。
子解法3: 通过CapFilt实现的知识蒸馏
- 解法原因: CapFilt可以被视为一种更有效的知识蒸馏方法，在VLP上下文中，通过语义丰富的合成标题进行知识传递，并通过移除噪声标题来精化学习内容。

比如老师用自己的方式解释了一幅画的含义，而学生们都尝试记住老师的解释。

但如果每个学生只是简单地复述老师的话，那么他们可能无法真正理解画的深层含义。

在BLIP模型中，通过CapFilt进行知识蒸馏就像是让学生们创造自己的故事来描述这幅画，然后老师会指出哪些故事真正理解了画的意义（过滤器移除不准确的故事）。

这样不仅学生能更深刻地理解画作，还能在类似的未来任务中更好地表现。

上图是使用标题生成器（Captioner, 缩写为Cap）和过滤器（Filter, 缩写为Filt）进行数据集引导（Bootstrapping）的过程。

标题生成器用于为网络图像生成合成标题，而过滤器用于移除噪声或不相关的标题。

一个巧克力蛋糕的图像和两个标题：“blue sky bakery in sunset park”被标记为红色的叉，表示过滤器已将其识别为噪声或不相关的标题。

而“chocolate cake with cream frosting and chocolate sprinkles on top”被标记为绿色的勾，表示过滤器已认可该标题准确且相关。

子问题4: 视觉语言任务中的数据增强方法局限
- 具体问题: 尽管数据增强（DA）在计算机视觉中被广泛采用，但对于语言任务而言，DA不够直接明了。
- 近期虽有生成性语言模型被用于NLP任务的样本合成，但这些方法主要关注于资源有限的纯语言任务。
- 子解法4: 利用合成标题进行数据增强
  - 解法原因: 通过生成合成标题为视觉-语言预训练提供数据增强，这种方法展示了在大规模视觉-语言预训练中合成标题的优势，有效扩充了训练样本的多样性和质量。

一位作家正在尝试为一系列的图片写下描述，为了训练自己的创造力，他不仅使用直接观察到的元素，还尝试添加一些虚构的细节来丰富故事。

BLIP模型中利用合成标题进行数据增强就像这位作家一样，它不仅使用现有的图片描述，还创造新的描述来扩展训练数据。

这样，BLIP模型就能学习到更丰富的语言表达和更多样化的场景理解。

当模型遇到一个新的图片时，它不仅能够识别图中明显的内容，还能够使用它在数据增强过程中学到的知识来创造出富有想象力和详细的描述。

这种方法大大超越了简单复制网络上现有描述的传统方法，使模型能够更好地理解和生成与图片内容相关的文本，增强了它处理视觉-语言任务的能力。

子问题5: 提高预训练效率与性能
- 具体问题5: 如何在预训练阶段同时优化多个目标，以提升模型在理解和生成任务上的性能。
- 子解法: 联合优化三个预训练目标
  - 解法原因: 通过联合优化图像-文本对比损失（ITC）、图像-文本匹配损失（ITM）和语言模型损失（LM），模型能够在单个前向传播中学习到视觉和语言的细粒度对齐以及生成连贯的文本描述。

一个厨师正在准备一顿大餐，他必须同时处理烤箱里的烤肉、锅里的汤，以及准备甜点。

每道菜都需要不同的技巧和注意力，但他需要确保它们全部都能按时完美地呈现出来。

这就像BLIP在预训练阶段做的工作。

它不仅需要确保能理解图像（像是烤肉需要正确的温度），还要能匹配相关的文本（就像汤要加对调料），并且生成吸引人的图像描述（就像制作诱人的甜点）。

通过同时关注这三个目标，BLIP确保在完成任务时能够取得最佳的综合性能，就像厨师确保每道菜都能达到最高标准一样。

子问题6: 提高合成标题的多样性
- 具体问题: 如何生成多样化的合成标题来提供模型学习的新信息。
- 子解法6: 采用核采样（nucleus sampling）生成合成标题
  - 解法原因: 核采样通过从概率累积超过阈值的候选集中采样每个令牌，生成更多样化和惊喜的标题，与确定性的束搜索（beam search）方法相比，提供了更多新信息，从而提高了模型性能。

一位艺术家正在为一本图画书创作插图，他可以用同样的风格画出所有的画面，这样虽然一致，但可能有些单调。

相反，如果他决定在每一页尝试不同的颜色和风格，那么图画书将会更加丰富多彩和吸引人。

BLIP模型使用核采样（nucleus sampling）来生成合成标题，就像这位艺术家在每页上尝试新风格一样，它创造出多样化的描述，使模型能从更广泛的样本中学习。

子问题7: 参数共享和解耦对模型性能的影响
- 具体问题: 在预训练阶段，文本编码器和解码器除了自注意力层外如何共享参数，以及在CapFilt过程中如何处理参数共享和解耦，以避免确认偏误。
- 子解法7: 预训练中共享除自注意力层外的所有参数，CapFilt中独立微调
  - 解法原因: 除自注意力层外共享参数可以提高训练效率并减小模型大小，而在CapFilt过程中独立微调避免了由于参数共享导致的确认偏误，提高了过滤噪声标题的能力。

一个设计团队正在创建一款新的电子产品。

如果团队的每个成员都在各自独立的部分上工作，而没有共享他们的设计理念，那么最终的产品可能会出现不协调的问题。

但是，如果他们在设计的大部分阶段共享想法，只在最后的细节上进行独立工作，那么产品就更可能成为一个协调一致的整体。

同样，在BLIP模型的预训练中，大部分参数（如前馈网络和嵌入层）被共享，以维持模型的一致性和效率，而在CapFilt过程中，通过独立微调captioner和filter来确保噪声数据能够被有效识别并去除，从而避免了因共享相同参数而可能导致的模型在去噪时的盲点。

效果

子问题1: 在图像-文本检索任务中实现性能提升
- 具体问题: 如何在COCO和Flickr30K数据集上提升图像到文本和文本到图像的检索性能。
- 子解法1: 使用图像-文本对比（ITC）和图像-文本匹配（ITM）损失进行微调
  - 解法原因: 通过使用这两种损失函数，BLIP能够更准确地学习图像和文本之间的特征相似性和配对关系，从而在检索任务上实现更高的准确率。

BLIP通过微调图像-文本对比（ITC）和图像-文本匹配（ITM）损失，显著提高了在COCO和Flickr30K数据集上的图像到文本和文本到图像的检索性能。

子问题2: 提升图像描述生成的性能
- 具体问题: 如何在NoCaps和COCO数据集上改善图像描述生成的准确性和质量。
- 子解法2: 采用语言建模（LM）损失并添加提示词进行微调
  - 解法原因: 通过引入LM损失和提示词“a picture of”，BLIP能够生成更自然、更相关的图像描述，即使在与使用更多预训练数据的方法相比时也能保持竞争力。

BLIP在NoCaps和COCO数据集上的图像描述生成任务中，通过采用语言模型（LM）损失并添加提示词进行微调，成功改善了图像描述的准确性和质量。

BLIP的预训练模型架构和目标：

该模型是一个多模态的编解码器混合体，具有三种功能：

单模态编码器通过图像-文本对比（ITC）损失训练，以对齐视觉和语言表示。
图像基础的文本编码器使用额外的交叉注意力层来模拟视觉-语言交互，并通过图像-文本匹配（ITM）损失训练，以区分正负图像-文本对。
图像基础的文本解码器替换了双向自注意力层，采用因果自注意力层，并且与编码器共享相同的交叉注意力层和前馈网络。解码器通过语言建模（LM）损失训练，以生成图像的文字描述。

子问题3: 在视觉问答（VQA）任务上超越现有方法
- 具体问题: 如何优化模型以在VQA任务上生成开放式答案，并超越现有的VLP方法。
- 子解法3: 将VQA视为一个答案生成任务，并使用LM损失进行微调
  - 解法原因: 这种开放式的答案生成方式使BLIP能够处理更多样化的问题和答案类型，通过LM损失优化使其在VQA任务上表现优于现有方法。

BLIP优化了模型，将VQA任务视为答案生成任务，并使用LM损失进行微调，从而在生成开放式答案方面超越了现有的VLP方法。

子问题4: 提高自然语言视觉推理（NLVR2）的准确率
- 具体问题: 如何在NLVR2任务上，即判断一个句子是否描述了一对图像，提高推理准确率。
- 子解法4: 对预训练模型进行简单修改以增强对双图像的处理能力
  - 解法原因: 通过引入两个交叉注意力层来分别处理两幅图像，并通过合并这些层的输出，BLIP能够更有效地进行图像之间的推理，从而在NLVR2任务上实现更高的性能。

BLIP在自然语言视觉推理（NLVR^2）任务中，通过对双图像处理能力的增强（两个交叉注意力层），提高了推理准确率。

子问题5: 在视觉对话（VisDial）任务中实现领先性能
- 具体问题: 如何在视觉对话任务中整合图像、问题、对话历史和图像的描述来预测答案。
- 子解法5: 通过交叉注意力连接图像和标题嵌入，并使用图像-文本匹配（ITM）损失训练对话编码器
  - 解法原因: 这种方法允许BLIP在对话设置中理解图像内容与历史对话之间的复杂关系，通过ITM损失优化能够更准确地评估答案的相关性，从而在VisDial任务上达到更高的性能。

在视觉对话（VisDial）任务中，BLIP通过整合图像、标题、对话历史，并使用ITM损失来训练对话编码器，实现了领先的性能。

BLIP模型在三种下游任务中的架构：视觉问答（VQA），自然语言视觉推理（NLVR^2），以及视觉对话（VisDial）：

每一部分的架构都被设计用于处理特定任务的需求：

(a) VQA部分：图像被一个编码器处理，问题被另一个编码器处理，然后将这些信息传递给答案解码器以生成答案。
(b) NLVR^2部分：处理两个图像的编码器通过交叉注意力层将两个图像合并，然后通过一个融合层，以判断文本是否描述了这对图像。

子问题6: 零样本转移到视频-语言任务上的性能提升
- 具体问题: 如何在没有针对视频数据进行特定训练的情况下，将图像-语言模型应用于视频-文本检索和视频问答任务，并实现优秀的性能。
- 子解法6: 直接评估在COCO上微调的模型，并对视频输入进行简单处理，如均匀采样帧
  - 解法原因: 尽管这种方法忽略了时间信息，但BLIP模型在视频-语言任务上展现出了强大的泛化能力，即使用简单的帧级特征融合也能在零样本设置下实现行业领先的性能。

BLIP在视频-语言任务上实现了出色的零样本性能，证明了即使在没有特定视频数据训练的情况下，通过对视频输入进行简单处理，如均匀采样帧，BLIP也能够有效地处理文本到视频的检索和视频问答任务。

总结

CLIP模型 VS BLIP模型

CLIP（Contrastive Language-Image Pre-training）模型和BLIP（Bootstrapping Language-Image Pre-training）模型虽然都是视觉-语言预训练模型，但它们在设计和功能上有一些关键的不同。

CLIP模型

https://blog.csdn.net/qq_41739364/article/details/135063268

训练方式:
- 对比学习：CLIP通过对比正负样本对的方式学习图像和文本之间的关联。
数据依赖:
- 自监督学习：CLIP使用了大量的互联网数据，依靠图像和相关联的文本信息进行自监督学习。
图像编码器:
- 混合结构：CLIP可以使用不同的图像编码器，如ResNet或Vision Transformer。
文本编码器:
- Transformer模型：CLIP使用了Transformer结构来编码文本信息。
Zero-shot学习:
- 动态文本特征：CLIP可以直接对类别进行分类，而无需进行模型的微调，通过动态构建文本特征向量进行zero-shot学习。

BLIP模型

训练方式:
- 数据集引导（Bootstrapping）：BLIP使用一个标题生成器产生合成标题，然后用过滤器去除噪声，优化数据质量。
数据依赖:
- 引导的数据集：BLIP在人工注释的数据集上进行微调，提高了模型的准确性和鲁棒性。
图像编码器:
- ViT：BLIP通常使用Vision Transformer作为图像编码器。
文本编码器与解码器:
- 多模态混合编解码器（MED）：BLIP设计了一种新的多功能模型架构，可以同时作为编码器和解码器。
应用领域:
- 多任务适用性：BLIP不仅在图像-文本检索和图像描述生成等任务中表现出色，还能处理更广泛的视觉-语言任务，如VQA和VisDial。

CLIP在设计上更侧重于通过大规模的数据和对比学习来学习强大的通用图像和文本表示.

BLIP则采用了更精细的数据处理方法来进一步提升模型的性能，特别是在多任务适用性方面进行了优化。

两者都展示了在各自领域内的先进性能，但BLIP在数据处理和任务适应性上更为灵活。

C语言初阶-ASCII表以及各种C语言的操作符
目录一、ASCII表二、C语言中的操作符观看之前记得先点赞谢谢大家啦一、ASCII表它的全称是“美国信息交换标准代码”。为保证人类和设备，设备和计算机之间能进行正确的信息交换，人们编制的统一的信息交换代码。二、C语言中的操作符
大型语言模型中的提示工程系统综述：技术与应用 AI专题精讲 Paper阅读语言模型人工智能自然语言处理
摘要提示工程已成为扩展大型语言模型（LLMs）和视觉语言模型（VLMs）能力的不可或缺的技术。这种方法利用任务特定的指令（称为prompt），在不修改核心模型参数的情况下增强模型效能。与更新模型参数不同，prompt仅通过给定指令即可引出所需的模型行为，从而实现预训练模型在下游任务中的无缝集成。prompt可以是提供上下文以引导模型的自然语言指令，也可以是激活相关知识的学习向量表示。这一新兴领域已
FreeRTOS 可重入
✅一、FreeRTOS是“可重入”的吗？FreeRTOS本身是设计为可重入的RTOS内核，但它的可重入性依赖于你使用的API和上下文环境（任务、ISR、中断嵌套等）。我们分情况来看：二、不同上下文下的可重入性分析1.FreeRTOS内核API（任务管理、调度器等）内核是多任务安全的（即线程安全/可重入）。大多数API内部使用了临界区保护（关中断/禁止调度），确保操作的原子性。✅可重入2.FreeR
GNSS+INS：揭秘导航技术中的“黄金组合“奥秘 EriccoShaanxi 技术文章无人机自动驾驶机器人
在导航技术领域，GNSS（全球导航卫星系统）和INS（惯性导航系统）的结合，一直被业界誉为"黄金搭档"。它们优势互补，克服了单一系统的局限性，为高精度、高可靠性的导航提供了完美解决方案。而ER-GNSS/MINS-05低成本组合导航系统的出现，更是让这一"黄金组合"走进了更广泛的应用场景，让高性能导航不再昂贵。GNSS与INS：天生互补的"最佳拍档"GNSS的强项与短板GNSS（如GPS、北斗、G
后端领域的自然语言处理技术应用大厂资深架构师 Spring Boot 开发实战自然语言处理 easyui 人工智能 ai
后端领域的自然语言处理技术应用关键词：后端领域、自然语言处理、技术应用、算法原理、实际案例摘要：本文聚焦于后端领域中自然语言处理技术的应用。首先介绍了相关背景，包括目的范围、预期读者等。接着阐述核心概念与联系，通过文本示意图和Mermaid流程图展示其原理和架构。详细讲解了核心算法原理并给出Python源代码示例，同时介绍了数学模型和公式。通过项目实战，展示代码实际案例并进行详细解释。分析了自然语
持续稳居前列：高排名公众号运营心法 xinxinseo_ 大数据微信搜索引擎微信公众平台百度
在微信公众号竞争激烈的环境下，短暂的高排名或许能凭借运气和短期策略实现，但想要持续稳居前列，绝非易事。这需要深入理解平台规则，以长远眼光和系统性思维进行运营，以下是助力公众号保持高排名的核心心法。内容为王：打造持续优质的内容生态优质内容是公众号立足的根本，更是维持高排名的核心。一方面，要保持内容的稳定性和连贯性，围绕公众号定位，建立完善的内容体系。例如，一个科技类公众号，可将内容划分为行业趋势解读
期待在 VR 森林体验模拟中实现与森林的 “虚拟复现” ykjhr_3d vr
VR森林体验模拟，无疑是科技与自然领域一次极具开创性意义的奇妙碰撞。它借助前沿的虚拟现实技术，以别出心裁、独树一帜的方式，为我们精心打造并带来了一场前所未有的森林探索奇幻之旅。在教育领域，于中小学的自然科学课堂上，学生们无需长途跋涉，就能通过VR森林体验模拟，身临其境地观察珍稀植物的生长细节，近距离感受森林生态系统的奥秘，极大地激发了他们对自然科学的浓厚兴趣;在专业的林业院校，这一技术更是成为了重
Excalidraw：开源手绘风格白板工具的技术与生态解析 wylee 开源
一、项目定位与核心价值Excalidraw是一款基于浏览器的开源虚拟手绘风格白板工具，由Excalidraw团队开发并维护。项目以MIT协议开源，旨在提供轻量级、高定制性的在线绘图解决方案，适用于流程图设计、原型绘制、教学演示等场景。截至2025年3月，项目已发布v0.18.0版本，月下载量超24.5万次，被GoogleCloud、Meta等企业集成，成为开源协作工具领域的标杆项目。二、核心功能与
TDengine 集群节点管理 TDengine （老段） TDengine SQL 手册 tdengine 数据库时序数据库大数据物联网 iotdb iot
简介组成TDengine集群的物理实体是dnode(datanode的缩写)，它是一个运行在操作系统之上的进程。在dnode中可以建立负责时序数据存储的vnode(virtualnode)，在多节点集群环境下当某个数据库的replica为3时，该数据库中的每个vgroup由3个vnode组成；当数据库的replica为1时，该数据库中的每个vgroup由1个vnode组成。如果要想配置某个数据库为
84.7k Star！Excalidraw：开源的在线白板工具，具备手绘风格和实时协作功能蚝油菜花每日 AI 项目与应用实例人工智能开源画板实时协作
❤️如果你也关注大模型与AI的发展现状，且对大模型应用开发非常感兴趣，我会快速跟你分享最新的感兴趣的AI应用和热点信息，也会不定期分享自己的想法和开源实例，欢迎关注我哦！微信公众号｜搜一搜：蚝油菜花快速阅读Excalidraw是一款开源的在线白板工具，具备手绘风格和实时协作功能。支持多种绘图工具、便捷导出、离线可用及跨平台兼容性。适用于远程协作、头脑风暴、产品设计和技术绘图等多个场景。正文（附运行
洛谷 B3627 立方根--二分法求解整数立方根问题 jdlxx_dongfangxing 算法 c++二分法
一、问题重述与数学建模给定一个正整数n，我们的目标是计算其立方根的整数部分，即找到最大的整数m满足m³≤n。这个问题可以形式化表述为：数学定义：⌊∛n⌋=max{x∈ℤ⁺|x³≤n}问题特性分析：单调性保证：立方函数f(x)=x³在正整数域上是严格单调递增的函数有界性：解的范围明确限定在[1,n]区间内离散性：我们需要寻找的是整数解而非实数解应用意义：该问题在实际中常用于需要快速估算立方根的场合，
基于单片机的住宅防火防盗报警系统设计启初科技 51单片机毕业设计单片机毕业设计单片机嵌入式硬件
文章目录一、系统概述二、项目内容和功能介绍三、效果图四、资料获取一、系统概述基于单片机的住宅防火防盗报警系统设计介绍一、系统设计背景与意义随着城市化进程的加快和居民生活水平的提高，住宅安全已成为人们关注的焦点。火灾和盗窃是威胁住宅安全的两大主要因素，传统的人工巡查和简单的安防设备已难以满足现代住宅的安全需求。基于单片机的住宅防火防盗报警系统集成了传感器技术、单片机控制技术和无线通信技术，能够实时监
VR重现红军过雪山：一场穿越时空的精神洗礼广州华锐视点 vr VR重现红军过雪山
VR重现红军过雪山这一创新形式，对大众了解长征历史、传承长征精神有着不可估量的重要意义，在红色文化传播的征程中留下了浓墨重彩的一笔。在教育领域，VR技术为历史教学带来了革命性的变革。传统的历史教学往往局限于书本知识和教师的口头讲述，学生很难真正理解历史事件的复杂性和历史人物的情感。而VR红军过雪山体验，让学生们从被动的知识接受者转变为主动的探索者。在课堂上，学生们戴上VR设备，便能穿越时空，与红军
HarmonyOS 入门到精通：为什么状态管理是鸿蒙开发的核心？逻极 harmonyos 鸿蒙笔记 harmonyos 华为鸿蒙入门到精通状态管理状态模式 arkts
在现代应用开发中，状态管理是构建响应式应用的基石。对于鸿蒙这种面向全场景的分布式操作系统，状态管理机制显得尤为重要。它不仅是实现复杂交互逻辑的关键，还直接关系到应用的性能、可维护性和用户体验。什么是状态管理？状态是指UI组件所依赖的、会随时间变化的数据。状态管理则是对这些变化数据的有效组织和控制，包括：状态的创建与初始化：在应用启动或组件加载时，为状态变量分配初始值，确保组件能够正确渲染初始界面。
企业内网系统：从传统开发到智能赋能的进化之路飞算JavaAI开发助手科技人工智能大数据 java
在当今数字化浪潮中，企业内网系统作为支撑日常运营的核心基础设施，其开发效率与质量直接关系到企业的竞争力。传统开发模式下，程序员需要手动完成需求分析、架构设计、代码编写、测试调试等全流程工作，不仅耗时费力，还容易因人为疏忽导致质量隐患。而随着人工智能技术的突破性进展，以飞算JavaAI为代表的智能开发工具正在重塑企业内网系统的开发范式，为程序员提供从设计到落地的全链路智能支持。一、传统企业内网系统开
B端模块（1）：用户管理模块的定义、功能、页面和设计原则。
B端管理系统都是各个模块的有机结合，保证系统的正常运转，这点和人体系统一样，比如消化、呼吸、循环系统等等。从本期开始，贝格前端工场将详细B端各个模块，一共分为20期，本期是第一期，欢迎老铁们持续关注。B端的用户管理指的是针对企业或者组织内部的业务用户进行管理和控制的一种系统功能。在B端（BusinesstoBusiness）场景中，企业通常需要对其内部员工、合作伙伴、供应商等业务用户进行管理，以确
MCP协议采用客户端-服务器架构的深层逻辑与架构对比分析
一、架构选择的核心动因1.功能解耦与安全边界的强制性要求MCP采用客户端-服务器（C/S）架构的核心动因源于AI系统与真实世界交互的特殊性：权限分层控制：主机（Host）作为协调层，严格划分客户端（Client）与服务端（Server）的操作权限。例如医疗场景中，诊断模型（Client）仅能通过医院授权的主机访问脱敏病历服务器，无法直接接触原始数据。沙箱隔离需求：每个MCP服务器运行在独立容器中（
使用 p6spy，拦截到持久层执行的sql及参数 Peter-OK 一些问题 p6spy sql
声明：文章内容是自己使用后整理，大部分工具代码出自大牛，但因无法确认出处，故仅在此处由衷的对无私分享源代码的作者表示感谢与致敬！本人在拦截到sql的基础上加了分析功能和异常告警功能1、导入p6spy的jar包，如果是maven项目引入pomp6spyp6spy3.9.12、修改datasource数据源的driverClassName驱动和url地址为com.p6spy.engine.spy.P6
4.服务注册发现：微服务的神经系统
在微服务架构中，服务之间不再是固定连接，而是高度动态、短暂存在的。如何让每个服务准确找到彼此，是分布式系统治理的核心问题之一。服务注册发现机制，正如神经系统之于人体，承担着连接、协调、感知变化的关键角色。本文将围绕Netflix开源的服务注册发现组件Eureka展开，深入剖析其原理，并以SpringCloud实战为导向，帮助你掌握服务治理的第一步。一、为什么需要服务注册发现？在单体架构中，服务调用
华为云服务器debain11.1 安装zerotier,并改成moon节点碎风影华为云服务器运维
看到华为云，46元一年2c2g的云服务器，果断入手。首先用它“安装zerotier,并改成moon节点”，据说可以提升两台机器之间的网速Debian11.1系统中安装ZeroTier的步骤首先，您需要更新您的系统以确保所有的包都是最新的。这可以通过运行以下命令来完成：aptupdate&&aptupgrade接下来，您需要下载ZeroTier的安装脚本。可以通过运行以下命令来实现：curl-sht
内网环境部署Deepseek+Dify，构建企业私有化AI应用我是鲁阿姨
0.简介#公司为生产安全和保密，内部的服务器不可连接外部网络，为了可以在内网环境下部署，采用的方案为ollama(Docker)+Dify(DockerCompose)，方便内网环境下迁移和备份，下文将介绍部署的全部过程。1.镜像拉取#镜像拉取为准备工作，因服务器在内网环境，需要先在可以连接外网的电脑上拉取相关镜像或文件。由于公司笔记本的Windows系统屏蔽了MicrosoftStore，导致D
微服务世界的“导航仪”！Spring Cloud五大注册中心选型指南，从此不再迷路！码农技术栈微服务微服务 spring cloud 架构 spring boot java 后端
引言：为什么微服务需要“导航仪”？想象一下，你走进一座巨大的迷宫（微服务集群），里面有成百上千个房间（服务实例），每个房间都在动态变化位置（服务扩缩容）。注册中心就像迷宫里的导航仪，实时记录所有房间的位置，告诉你怎么最快找到目标。没有它？你可能会永远迷失在“服务调用”的迷宫里！注册中心的核心作用服务注册：服务启动时，主动上报自己的地址和状态。服务发现：调用方通过注册中心查询目标服务的位置。健康监测
clickhouse分布式表插入数据不用带ON CLUSTER 时时刻刻看着自己的心 clickhouse 分布式
向分布式表插入数据时，通常不需要使用ONCLUSTER，因为分布式表的写入操作会自动将数据分发到底层表（bm_online_user_count_part）的对应节点。但对于DDL（数据定义语句，例如ALTERTABLE）操作，在分布式环境中修改底层表时，建议使用ONCLUSTER，以确保所有相关节点上的表结构和数据同步。区分DDL和DMLDML（数据操作语句，例如INSERT）向分布式表插入数据
【二分答案】-----【扑克牌】 float_com 二分答案算法二分答案贪心
扑克牌题目链接题目描述你有nnn种普通牌，第iii种牌的数量为cic_ici。另外你还有mmm张特殊的Joker牌。你可以使用以下两种方式来组成一套合法的牌组：不使用Joker，选择nnn种普通牌各一张；使用一张Joker，选择其余n−1n-1n−1种普通牌各一张（Joker可替代任意一种牌）。例如，当n=3n=3n=3时，一共有以下四种组合方式：{1,2,3}\{1,2,3\}{1,2,3}{J
从互联网电脑迁移Dify到内网部署Dify方法记录
一、在互联网电脑上准备迁移文件1.保存Docker镜像#获取所有Dify相关镜像（根据实际容器名调整）dockerps--filter"name=dify"--format"{{.Image}}"|sort-u>dify-images.list#保存镜像为.tar文件dockersave$(catdify-images.list)-odify-images.tar2.备份数据卷or直接复制路径(1
C++系列（十）：面向对象编程终极指南！从封装到多态，彻底掌握类与对象的核心奥秘傅里叶的耶 C++语言系列（教程 +实战）c++类和对象
引言面向对象编程（OOP）是现代软件开发的核心范式，C++通过封装、继承和多态三大特性提供了强大的面向对象能力。这些特性使代码更易维护、扩展和复用，是构建复杂系统的基石。本章将深入探讨C++类和对象的方方面面，从基础封装到高级多态应用，帮助您掌握面向对象编程的精髓。最后，如果大家喜欢我的创作风格，请大家多多关注up主，你们的支持就是我创作最大的动力！如果各位观众老爷觉得我哪些地方需要改进，请一定在
MCP Streamable HTTP 样例（qbit） pythonagent
前言模型上下文协议（ModelContextProtocol，MCP），是由Anthropic推出的开源协议，旨在实现大语言模型与外部数据源和工具的集成，用来在大模型和数据源之间建立安全双向的连接。本文代码技术栈Python3.11.8FastMCP2.10.3MCP的传输机制StandardInput/Output(stdio)StreamableHTTPServer-SentEvents(SS
2025 轻松部署 ERPNext linux
在数字化转型浪潮不断推进的2025年，企业对高效、灵活的企业资源计划（ERP）系统需求日益增长。作为一款开源且功能全面的ERP系统，ERPNext以其模块化、易用性和强大的自定义能力，受到越来越多中小企业的青睐。然而，部署ERPNext仍然是许多企业信息化过程中的一大挑战。本文将介绍如何借助云平台实现快速、轻松、安全地部署ERPNext系统。什么是ERPNext？ERPNext是一个开源的ERP系
uiautomatorviewer工具在Android 9.0上的应用及优势小馬锅
本文还有配套的精品资源，点击获取简介：uiautomatorviewer是AndroidSDK中的自动化测试和UI分析工具，特别适用于Android9.0版本。它支持扫描和分析应用UI控件，获取关键UI元素信息以编写自动化测试脚本。工具采用XPath定位技术，对于复杂布局中的UI元素精确定位尤为有效。同时，uiautomatorviewer与Appium自动化测试框架在功能上具有重叠，但各有优势。
华为电脑和手机一碰传_华为手机怎么一碰传连接电脑传输照片和文件 weixin_39630762 华为电脑和手机一碰传
现在咱们的手机随便拍一拍就有几百张照片，如何快速传至电脑，有一种黑科技，让互传文件不是事儿，相信不少的小人类也是为这些烦恼过，以往的传送方式都是是用数据线什么的，感觉比较繁琐，现在不用了，轻轻一“碰”就可以轻松搞定了，只要你的手机升级MagicUI3.0(也就是EMUI110.0)的系统，轻轻一“碰就可以开启智慧生活！一碰就能连接电脑的神技看这里1：在电脑上，打开WLAN和蓝牙，同时打开电脑管家，
TOMCAT在POST方法提交参数丢失问题 357029540 java tomcat jsp
摘自http://my.oschina.net/luckyi/blog/213209 昨天在解决一个BUG时发现一个奇怪的问题，一个AJAX提交数据在之前都是木有问题的，突然提交出错影响其他处理流程。检查时发现页面处理数据较多，起初以为是提交顺序不正确修改后发现不是由此问题引起。于是删除掉一部分数据进行提交，较少数据能够提交成功。恢复较多数据后跟踪提交FORM DATA ，发现数
在MyEclipse中增加JSP模板删除-2008-08-18 ljy325 jsp xml MyEclipse
在D:\Program Files\MyEclipse 6.0\myeclipse\eclipse\plugins\com.genuitec.eclipse.wizards_6.0.1.zmyeclipse601200710\templates\jsp 目录下找到Jsp.vtl，复制一份，重命名为jsp2.vtl,然后把里面的内容修改为自己想要的格式，保存。然后在 D:\Progr
JavaScript常用验证脚本总结 eksliang JavaScript javaScript表单验证
转载请出自出处：http://eksliang.iteye.com/blog/2098985 下面这些验证脚本，是我在这几年开发中的总结，今天把他放出来，也算是一种分享吧，现在在我的项目中也在用！包括日期验证、比较，非空验证、身份证验证、数值验证、Email验证、电话验证等等...! &nb
微软BI（4） 18289753290 微软BI SSIS
1） Q:查看ssis里面某个控件输出的结果： A MessageBox.Show(Dts.Variables["v_lastTimestamp"].Value.ToString()); 这是我们在包里面定义的变量 2):在关联目的端表的时候如果是一对多的关系，一定要选择唯一的那个键作为关联字段。 3) Q：ssis里面如果将多个数据源的数据插入目的端一
定时对大数据量的表进行分表对数据备份酷的飞上天空大数据量
工作中遇到数据库中一个表的数据量比较大，属于日志表。正常情况下是不会有查询操作的，但如果不进行分表数据太多，执行一条简单sql语句要等好几分钟。。分表工具：linux的shell + mysql自身提供的管理命令原理：使用一个和原表数据结构一样的表，替换原表。 linux shell内容如下： =======================开始
本质的描述与因材施教永夜-极光感想随笔
不管碰到什么事,我都下意识的想去探索本质,找寻一个最形象的描述方式。我坚信,世界上对一件事物的描述和解释,肯定有一种最形象,最贴近本质,最容易让人理解 &
很迷茫。。。随便小屋随笔
小弟我今年研一，也是从事的咱们现在最流行的专业（计算机）。本科三流学校，为了能有个更好的跳板，进入了考研大军，非常有幸能进入研究生的行业（具体学校就不说了，怕把学校的名誉给损了）。先说一下自身的条件，本科专业软件工程。主要学习就是软件开发，几乎和计算机没有什么区别。因为学校本身三流，也就是让老师带着学生学点东西，然后让学生毕业就行了。对专业性的东西了解的非常浅。就那学的语言来说
23种设计模式的意图和适用范围 aijuans 设计模式
Factory Method 意图定义一个用于创建对象的接口，让子类决定实例化哪一个类。Factory Method 使一个类的实例化延迟到其子类。　　适用性当一个类不知道它所必须创建的对象的类的时候。　　当一个类希望由它的子类来指定它所创建的对象的时候。　　当类将创建对象的职责委托给多个帮助子类中的某一个，并且你希望将哪一个帮助子类是代理者这一信息局部化的时候。 Abstr
Java中的synchronized和volatile aoyouzi java volatile synchronized
说到Java的线程同步问题肯定要说到两个关键字synchronized和volatile。说到这两个关键字，又要说道JVM的内存模型。JVM里内存分为main memory和working memory。 Main memory是所有线程共享的，working memory则是线程的工作内存，它保存有部分main memory变量的拷贝，对这些变量的更新直接发生在working memo
js数组的操作和this关键字百合不是茶 js 数组操作 this关键字
js数组的操作; 一:数组的创建: 1、数组的创建 var array = new Array();　//创建一个数组 var array = new Array([size]);　//创建一个数组并指定长度，注意不是上限，是长度 var arrayObj = new Array([element0[, element1[, ...[, elementN]]]
别人的阿里面试感悟 bijian1013 面试分享工作感悟阿里面试
原文如下：http://greemranqq.iteye.com/blog/2007170 一直做企业系统，虽然也自己一直学习技术，但是感觉还是有所欠缺，准备花几个月的时间，把互联网的东西，以及一些基础更加的深入透析，结果这次比较意外，有点突然，下面分享一下感受吧！ &nb
淘宝的测试框架Itest Bill_chen spring maven 框架单元测试 JUnit
Itest测试框架是TaoBao测试部门开发的一套单元测试框架，以Junit4为核心，集合DbUnit、Unitils等主流测试框架，应该算是比较好用的了。近期项目中用了下，有关itest的具体使用如下： 1.在Maven中引入itest框架： <dependency> <groupId>com.taobao.test</groupId&g
【Java多线程二】多路条件解决生产者消费者问题 bit1129 java多线程
package com.tom; import java.util.LinkedList; import java.util.Queue; import java.util.concurrent.ThreadLocalRandom; import java.util.concurrent.locks.Condition; import java.util.concurrent.loc
汉字转拼音pinyin4j 白糖_ pinyin4j
以前在项目中遇到汉字转拼音的情况，于是在网上找到了pinyin4j这个工具包，非常有用，别的不说了，直接下代码： import java.util.HashSet; import java.util.Set; import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin
org.hibernate.TransactionException: JDBC begin failed解决方案 bozch ssh 数据库异常 DBCP
org.hibernate.TransactionException: JDBC begin failed: at org.hibernate.transaction.JDBCTransaction.begin(JDBCTransaction.java:68) at org.hibernate.impl.SessionImp
java-并查集（Disjoint-set）-将多个集合合并成没有交集的集合 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.HashMap; import java.util.HashSet; import java.util.Iterator; import java.util.List; import java.util.Map; import java.ut
Java PrintWriter打印乱码 chenbowen00 java
一个小程序读写文件，发现PrintWriter输出后文件存在乱码，解决办法主要统一输入输出流编码格式。读文件： BufferedReader 从字符输入流中读取文本，缓冲各个字符，从而提供字符、数组和行的高效读取。可以指定缓冲区的大小，或者可使用默认的大小。大多数情况下，默认值就足够大了。通常，Reader 所作的每个读取请求都会导致对基础字符或字节流进行相应的读取请求。因
[天气与气候]极端气候环境 comsci 环境
如果空间环境出现异变...外星文明并未出现,而只是用某种气象武器对地球的气候系统进行攻击,并挑唆地球国家间的战争,经过一段时间的准备...最大限度的削弱地球文明的整体力量,然后再进行入侵...... 那么地球上的国家应该做什么样的防备工作呢? &n
oracle order by与union一起使用的用法 daizj UNION oracle order by
当使用union操作时，排序语句必须放在最后面才正确，如下：只能在union的最后一个子查询中使用order by，而这个order by是针对整个unioning后的结果集的。So：如果unoin的几个子查询列名不同，如 Sql代码 select supplier_id, supplier_name from suppliers UNI
zeus持久层读写分离单元测试 deng520159 单元测试
本文是zeus读写分离单元测试,距离分库分表,只有一步了.上代码: 1.ZeusMasterSlaveTest.java package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Assert; import org.j
Yii 截取字符串(UTF-8) 使用组件 dcj3sjt126com yii
1.将Helper.php放进protected\components文件夹下。 2.调用方法： Helper::truncate_utf8_string($content,20,false); //不显示省略号 Helper::truncate_utf8_string($content,20); //显示省略号 &n
安装memcache及php扩展 dcj3sjt126com PHP
安装memcache tar zxvf memcache-2.2.5.tgz cd memcache-2.2.5/ /usr/local/php/bin/phpize (?) ./configure --with-php-confi
JsonObject 处理日期 feifeilinlin521 java json JsonOjbect JsonArray JSONException
写这边文章的初衷就是遇到了json在转换日期格式出现了异常 net.sf.json.JSONException: java.lang.reflect.InvocationTargetException 原因是当你用Map接收数据库返回了java.sql.Date 日期的数据进行json转换出的问题话不多说直接上代码 &n
Ehcache（06）——监听器 234390216 监听器 listener ehcache
监听器 Ehcache中监听器有两种，监听CacheManager的CacheManagerEventListener和监听Cache的CacheEventListener。在Ehcache中，Listener是通过对应的监听器工厂来生产和发生作用的。下面我们将来介绍一下这两种类型的监听器。
activiti 自带设计器中chrome 34版本不能打开bug的解决 jackyrong Activiti
在acitivti modeler中，如果是chrome 34，则不能打开该设计器，其他浏览器可以，经证实为bug，参考 http://forums.activiti.org/content/activiti-modeler-doesnt-work-chrome-v34 修改为，找到 oryx.debug.js 在最头部增加 if (!Document.
微信收货地址共享接口-终极解决 laotu5i0 微信开发
最近要接入微信的收货地址共享接口，总是不成功，折腾了好几天，实在没办法网上搜到的帖子也是骂声一片。我把我碰到并解决问题的过程分享出来，希望能给微信的接口文档起到一个辅助作用，让后面进来的开发者能快速的接入，而不需要像我们一样苦逼的浪费好几天，甚至一周的青春。各种羞辱、谩骂的话就不说了，本人还算文明。如果你能搜到本贴，说明你已经碰到了各种 ed
关于人才 netkiller.github.com 工作面试招聘 netkiller 人才
关于人才每个月我都会接到许多猎头的电话，有些猎头比较专业，但绝大多数在我看来与猎头二字还是有很大差距的。与猎头接触多了，自然也了解了他们的工作，包括操作手法，总体上国内的猎头行业还处在初级阶段。总结就是“盲目推荐，以量取胜”。目前现状许多从事人力资源工作的人，根本不懂得怎么找人才。处在人才找不到企业，企业找不到人才的尴尬处境。企业招聘，通常是需要用人的部门提出招聘条件，由人
搭建 CentOS 6 服务器 - 目录 rensanning centos
(1) 安装CentOS ISO（desktop/minimal）、Cloud（AWS/阿里云）、Virtualization（VMWare、VirtualBox）详细内容 (2) Linux常用命令 cd、ls、rm、chmod...... 详细内容 (3) 初始环境设置用户管理、网络设置、安全设置...... 详细内容 (4) 常驻服务Daemon
【求助】mongoDB无法更新主键 toknowme mongodb
Query query = new Query(); query.addCriteria(new Criteria("_id").is(o.getId())); &n
jquery 页面滚动到底部自动加载插件集合 xp9802 jquery
很多社交网站都使用无限滚动的翻页技术来提高用户体验，当你页面滑到列表底部时候无需点击就自动加载更多的内容。下面为你推荐 10 个 jQuery 的无限滚动的插件： 1. jQuery ScrollPagination jQuery ScrollPagination plugin 是一个 jQuery 实现的支持无限滚动加载数据的插件。 2. jQuery Screw S