jcfszxc

【深度学习：多关节嵌入模型】 Meta 解释的 ImageBind 多关节嵌入模型

- Meta 发布开源人工智能工具的历史
- - 分段任何模型
  - DINOv2
- 什么是多模态学习？
- 什么是嵌入？
- 什么是 ImageBind？
- 集成在 ImageBind 中的模式
- - 图像绑定架构
  - 特定模式编码器
  - 跨模态注意力模块
  - 联合嵌入
  - ImageBind 训练数据
  - ImageBind 性能
  - ImageBind 是开源的吗？
- 利用 ImageBind 进行多模态学习的未来潜力
- - ImageBind 如何开辟新途径
  - 多模态学习的未来
- 结论

在不断发展的人工智能领域，Meta 凭借其开源模型 ImageBind 再次提高了标准，突破了可能性的界限，让我们更接近类人学习。

创新是 Meta 使命的核心，他们的最新产品 ImageBind 证明了这一承诺。虽然 Midjourney、Stable Diffusion 和 DALL-E 2 等生成式 AI 模型在单词与图像配对方面取得了重大进展，但 ImageBind 更进一步，撒下了一张涵盖更广泛感官数据的网。

ImageBind 标志着一个框架的诞生，该框架可以通过文本提示、图像或音频记录等简单输入生成复杂的虚拟环境。例如，想象一下仅通过文字或声音即可创建熙熙攘攘的城市或宁静的森林的真实虚拟表示的可能性。

ImageBind 的独特之处在于它能够集成六种类型的数据：视觉数据（图像和视频）、热数据（红外图像）、文本、音频、深度信息，以及有趣的是来自惯性测量单元的运动读数（惯性测量单元）。这种将多种数据类型集成到单个嵌入空间中的概念只会推动生成人工智能的持续繁荣。

该模型利用广泛的图像配对数据来建立统一的表示空间。与传统模型不同，ImageBind 不要求所有模态同时出现在同一数据集中。相反，它利用图像固有的链接性质，证明将每种模态的嵌入与图像嵌入对齐会产生紧急的跨模态对齐。

虽然 ImageBind 目前是一个研究项目，但它是多模式模型未来的有力指标。它还强调了 Meta 致力于分享人工智能研究成果，而其许多竞争对手（如 OpenAI 和谷歌）都保持着保密的面纱。

在本解释中，我们将介绍以下内容：

What is multimodal learning 什么是多模态学习
What is an embedding 什么是嵌入
ImageBind Architecture 图像绑定架构
ImageBind Performance 图像绑定性能
Use cases of ImageBind ImageBind 的用例

Meta 发布开源人工智能工具的历史

在过去的两个月里，Meta 的发布取得了令人难以置信的成功。

分段任何模型

MetaAI 的分段任意模型 (SAM) 通过应用自然语言处理中传统使用的基础模型，改变了未来的图像分割。

SAM 使用即时工程来适应各种分割问题。该模型使用户能够通过使用边界框、关键点、网格或文本与提示进行交互来选择要分割的对象。

当要分割的对象不确定时，SAM可以产生多个有效的掩模，并且可以自动识别和掩模图像中的所有对象。

最值得注意的是，与标签平台集成后，一旦预先计算图像嵌入，SAM 就可以提供实时分割掩模，这对于正常尺寸的图像来说只需几秒钟的时间。

SAM 在降低标签成本方面展现出巨大潜力，为人工智能辅助标签提供了期待已久的解决方案。无论是医疗应用、地理空间分析还是自动驾驶汽车，SAM 都将彻底改变计算机视觉领域。

DINOv2

DINOv2 是一种先进的自监督学习技术，旨在在不使用标记数据的情况下从图像中学习视觉表示，这比依赖大量标记数据进行训练的监督学习模型具有显着优势。

DINO 可以用作强大的特征提取器，用于图像分类或对象检测等任务。该过程通常涉及两个阶段：预训练和微调。

预训练：在此阶段，DINO 模型在未标记图像的大型数据集上进行预训练。目标是使用自我监督学习来学习有用的视觉表示。模型训练完成后，权重将被保存以供下一阶段使用。
微调：在此阶段，预训练的 DINO 模型在特定于任务的数据集上进行微调，该数据集通常包含标记数据。对于图像分类或对象检测任务，您可以使用 DINO 模型作为主干或特征提取器，然后是特定于任务的层（例如用于分类的全连接层或用于对象检测的边界框回归层）。

SSL 的挑战仍然在于设计实际任务、处理域转换以及理解模型的可解释性和鲁棒性。然而，DINOv2 使用无标签自蒸馏 (DINO) 等技术克服了这些挑战，该技术使用 SSL 和知识蒸馏方法将知识从较大模型转移到较小模型。

什么是多模态学习？

多模态学习涉及处理和集成来自多种模态的信息，例如图像、文本、音频、视频和其他形式的数据。

它结合了不同的信息源，以获得对特定概念或现象的更深入的理解。

与重点关注单一模态（例如纯文本或纯图像）的单模态学习相反，多媒体学习利用多种模态的互补性来改善学习成果。

多模态学习旨在使机器学习算法能够从不同来源的复杂数据中学习和理解。它允许人工智能像人类一样全面分析不同类型的数据。

什么是嵌入？

嵌入是高维向量的低维表示，可简化对代表数据的稀疏向量等重要输入的处理。提取嵌入的目的是通过在更低维的空间中表示输入数据来捕捉输入数据的语义，从而使语义相似的样本彼此接近。

嵌入解决了机器学习中的 "维度诅咒 "问题，即输入空间过于庞大和稀疏，传统机器学习算法无法高效处理。通过将高维输入数据映射到低维嵌入空间，我们可以降低数据的维度，从而更容易学习输入数据之间的模式和关系。

当输入空间通常非常高维和稀疏时，嵌入就特别有用，比如文本数据。对于文本数据来说，每个单词都由一个单点向量表示，这就是嵌入。通过学习单词的嵌入，我们可以捕捉到单词的语义，并以更紧凑、信息量更大的方式来表示它们。

嵌入式在机器学习中很有价值，因为它们可以从大量数据中学习，并在各种模型中使用。

什么是 ImageBind？

ImageBind 是一种学习六种模式联合嵌入空间的全新方法。该模型由 Meta AI 的 FAIR 实验室开发，于 2023 年 5 月 9 日在 GitHub 上发布，您也可以在 GitHub 上找到 ImageBind 代码。

ImageBind 的出现标志着机器学习和人工智能的重大转变，因为它推动了多模态学习的发展。

通过整合和理解来自多种模式的信息，ImageBind 为更先进的人工智能系统铺平了道路，使其能够更人性化地处理和分析数据。

集成在 ImageBind 中的模式

ImageBind 设计用于处理六种不同的模式，使其能够更全面、整体地学习和处理信息。这些模式包括

文本：书面内容或描述，传达意义、背景或有关主题的具体细节。
图像/视频：捕捉场景、物体和事件的可视化数据，提供丰富的上下文信息，并在数据中的不同元素之间建立联系。
音频：为视觉或文本信息提供额外上下文的声音数据，例如物体发出的噪音或特定环境的声景。
深度（三维）：三维数据可提供物体之间的空间关系信息，使人们更好地了解物体之间的位置和大小。
热图：捕捉物体及其周围环境温度变化的数据，让人了解场景中不同元素的热特征。
IMU：记录运动和位置的传感器数据，让人工智能系统了解特定环境中物体的运动和动态。

通过整合这六种模式，ImageBind 可以创建一个统一的表示空间，使您能够学习和分析各种信息形式的数据。

这可以提高模型对周围世界的理解，使其能够根据处理的数据做出更好的预测，生成更准确的结果。

图像绑定架构

由于 Meta 团队尚未发布 ImageBind 框架，因此该框架仍有可能发生变化。这里讨论的架构是基于该团队发表的研究论文中的信息。

ImageBind 框架为图像、文本、音频、热图像、深度图像和 IMU 模式使用单独的编码器。每个编码器都添加了一个特定于模式的线性投影头，以获得固定维度的嵌入。这种嵌入经过归一化处理后用于 InfoNCE 损失。

ImageBind 的结构由三个主要部分组成：

A modality-specific encoder 特定模式编码器
Cross-model attention module 跨模型关注模块
A joint embedding space 联合嵌入空间

特定模式编码器

第一部分是为每种数据类型训练特定模态的编码器。接下来，编码器将原始数据转换为联合嵌入空间，在此空间中，模型可以学习不同模态之间的关系。

模态编码器采用变换器架构。编码器采用标准的反向传播方法进行训练，损失函数鼓励不同模态的嵌入向量在相关的情况下相互靠近，在不相关的情况下相互远离。

对于图像和视频，它使用 Vision Transformer （ViT）。对于视频输入，在 2 秒的持续时间内对 2 帧视频剪辑进行采样。
使用 AST 中概述的方法将音频输入转换为 2D Mel-Spectrogram 图：音频频谱图转换器，该方法涉及以 26kHz 转换 2 秒的音频样本。由于梅尔频谱图是类似于图像的二维信号，因此使用ViT模型对其进行处理。
对于文本，使用递归神经网络（RNN）或转换器作为编码器。转换器将原始文本作为输入，并生成一系列隐藏状态，然后聚合这些状态以生成音频嵌入向量。
热输入和深度输入被视为单通道图像，分别使用 ViT-B 和 ViT-S 编码器。

跨模态注意力模块

第二个部分是跨模态注意力模块，由三个主要子部分组成：

特定模式的注意力模块
跨模态注意力融合模块
跨模态注意力模块

特定模态注意力模块将每种模态的嵌入向量作为输入。该模块会产生一组注意力权重，以显示每种模态中不同元素的相对重要性。这样，模型就能关注与任务相关的每种模态的特定方面。

跨模态注意力融合模块从每种模态中提取注意力权重，并将其组合在一起，生成一组单一的注意力权重，以确定在执行任务时对每种模态的重视程度。通过根据不同模态在当前任务中的重要性对其进行选择性关注，该模型可以有效捕捉不同数据类型之间的复杂关系和相互作用。

跨模态注意力模块与模型的其他部分采用反向传播和特定任务损失函数进行端到端训练。通过联合学习特定模态注意力权重和跨模态注意力融合权重，该模型可以有效整合来自多种模态的信息，从而提高各种多模态机器学习任务的性能。

联合嵌入

第三部分是联合嵌入空间，所有模态都在一个单一的向量空间中表示。嵌入向量通过共享投影层映射到一个共同的联合嵌入空间，该投影层也是在训练过程中学习的。这一过程确保不同模态的嵌入向量位于同一空间，可以直接进行比较和组合。

联合嵌入空间旨在捕捉不同模式之间的复杂关系和相互作用。例如，相关的图像和文本应相互靠近，而不相关的图像和文本应相互远离。

ImageBind 使用联合嵌入空间，可以直接比较和组合不同的模态，可以有效地整合来自多种模态的信息，以提高各种多模态机器学习任务的性能。

ImageBind 训练数据

ImageBind 是一种新颖的多模态学习方法，它利用图像固有的“绑定”属性来连接不同的感官体验。

它使用图像配对数据（image，X）进行训练，这意味着每个图像都与其他五种类型的数据（X）之一相关联：文本，音频，深度，IMU或热数据。在 ImageBind 训练期间，图像和文本编码器模型不会更新，而其他模式的编码器会更新。

OpenCLIP ViT-H 编码器：此编码器用于初始化和冻结图像和文本编码器。ViT-H 编码器是 OpenCLIP 模型的一部分，OpenCLIP 模型是一种强大的视觉语言模型，可提供丰富的图像和文本表示。
音频嵌入：ImageBind 使用 Audioset 数据集来训练音频嵌入。Audioset 是音频事件注释和录音的综合集合，为模型提供了广泛的学习声音。
深度嵌入：SUN RGB-D 数据集用于训练深度嵌入。该数据集包括使用深度信息注释的图像，使模型能够理解图像中的空间关系。
IMU 数据：Ego4D 数据集用于 IMU 数据。该数据集提供 IMU 读数，有助于理解与图像相关的运动和方向。
热嵌入：LLVIP 数据集用于训练热嵌入。该数据集提供热成像数据，为模型对图像的理解增加了另一层信息。

ImageBind 性能

ImageBind 模型的性能以几种最先进的方法为基准。此外，它还与之前在零样本检索和分类任务中的工作进行了比较。

ImageBIND 在训练期间无需对音频进行任何文本配对，即可实现更好的零样本文本到音频检索和分类性能。例如，在 Clotho 数据集上，与监督式 AudioCLIP 模型相比，ImageBIND 的性能是 AVFIC 的两倍，并且在 ESC 上实现了相当的音频分类性能。在 AudioSet 数据集上，它可以使用预训练的 DALLE-2 解码器从音频输入生成高质量图像。

ImageBind 是开源的吗？

可悲的是，ImageBind 的代码和模型权重是在 CC-BY-NC 4.0 许可下发布的。这意味着它只能用于研究目的，并且严格禁止所有商业用例。

利用 ImageBind 进行多模态学习的未来潜力

凭借其结合来自六种不同模式的信息的能力，ImageBind 有可能创建令人兴奋的新 AI 应用程序，特别是对于创作者和 AI 研究社区。

ImageBind 如何开辟新途径

ImageBind 的多模态功能有望开启一个充满创意可能性的世界。无缝集成各种数据表单使创作者能够：

生成富媒体内容：ImageBind 绑定多种模态的能力使创作者能够生成更具沉浸感和上下文相关的内容。例如，想象一下根据音频输入创建图像或视频，例如生成与繁华的市场、幸福的热带雨林或繁忙街道的声音相匹配的视觉效果。
通过跨模态检索增强内容：创作者可以轻松搜索并整合来自不同模态的相关内容，以增强他们的工作。例如，电影制作人可以使用 ImageBind 找到与特定视觉场景相匹配的完美音频剪辑，从而简化创作过程。
结合不同模态的嵌入：联合嵌入空间允许我们组合两个嵌入：例如，桌子上的水果图像+鸟儿的啁啾声，并检索包含这两个概念的图像，即树上的果实与鸟。涌现的组合性可能会使广泛的组合任务成为可能，它允许将来自各种模态的语义内容组合在一起。
开发身临其境的体验：ImageBind 能够处理和理解来自各种传感器（如深度和 IMU）的数据，为开发更逼真、更具吸引力的虚拟现实和增强现实体验打开了大门。

在更传统的行业中，其他未来的用例包括：

自动驾驶汽车：凭借其理解深度和运动数据的能力，ImageBind可以在开发自动驾驶汽车方面发挥关键作用，帮助它们更有效地感知和解释周围环境。
医疗保健和医学成像：ImageBind 可用于处理和理解各种类型的医疗数据（视觉、听觉、PDF 等），以协助诊断、治疗计划和患者监测。
智能家居和物联网：ImageBind 可以通过使智能家居设备能够处理和理解各种形式的感官数据来增强智能家居设备的功能，从而实现更直观、更有效的自动化。
环境监测：ImageBind 可用于无人机或其他监测设备，以分析各种环境数据并检测变化或异常，从而有助于野生动物跟踪、气候监测或灾难响应等任务。
安全和监控：通过处理和理解视觉、热和运动数据，ImageBind 可以提高安全系统的有效性，使其能够更准确、更高效地检测和响应威胁。

多模态学习的未来

ImageBind 代表了多模态学习的重大飞跃。这对人工智能和多模态学习的未来有几点影响：

扩展模式：随着研究人员继续探索和整合其他模式，如触觉、语音、嗅觉，甚至大脑信号，像 ImageBind 这样的模型可以在开发更丰富、更以人为本的 AI 系统方面发挥关键作用。
降低数据需求：ImageBind 表明，无需大量配对数据即可跨多种模态学习联合嵌入空间，从而可能减少训练所需的数据并使 AI 系统更高效。
跨学科应用：ImageBind在多模态学习方面的成功可以激发新的跨学科应用，例如将人工智能与神经科学、语言学和认知科学相结合，进一步增强我们对人类智能和认知的理解。

随着多模态学习领域的发展，ImageBind 有望在塑造 AI 的未来方面发挥关键作用，并为创作者和研究人员开启新的可能性。

结论

ImageBind是第一个将六种模态信息绑定在一起的模型，无疑是人工智能和多模态学习领域的游戏规则改变者。

它能够跨多种形式的数据创建单一的共享表示空间，这是朝着可以像人类一样全面分析数据的机器迈出的重要一步。对于人工智能研究社区和创作者来说，这是一个令人兴奋的前景，他们可以在未来利用这些功能来制作更丰富、更身临其境的内容。

此外，ImageBind 为未来的开源模型提供了蓝图，表明使用特定的图像配对数据可以跨多种模态创建联合嵌入空间。这可能会导致更高效、更强大的模型，这些模型可以以以前无法想象的方式学习和适应。

但是，该模型仍处于非商业许可之下，因此，我们将不得不拭目以待，看看该模型如何整合到商业应用中。在 2023 年底之前，是否会有多个完全开源的类似模型可用，这是值得怀疑的。

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element((1) 2401_84976182 程序员 c语言 c++学习
既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上CC++开发知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新如果你需要这些资料，可以戳这里获取#include#include#includeusingnamespacestd;boolcmp(int
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element(
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以添加戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！intmain(){vectormyvec{3,
上位机知识篇---SD卡&U盘镜像
常用的镜像烧录软件balenaEtcherbalenaEtcher是一个开源的、跨平台的工具，用于将操作系统镜像文件（如ISO和IMG文件）烧录到SD卡和USB驱动器中。以下是其使用方法、使用场景和使用注意事项的介绍：使用方法下载安装：根据自己的操作系统，从官方网站下载对应的安装包。Windows系统下载.exe文件后双击安装；Linux系统若下载的是.deb文件，可在终端执行“sudodpkg-
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
cvc降噪和主动降噪_音频知识：CVC降噪和ANC主动降噪的区别和应用汪国 cvc降噪和主动降噪
原标题：音频知识：CVC降噪和ANC主动降噪的区别和应用降噪，对于需要长时间戴耳机的人群来讲，起到了很好的保护作用。然而在购买蓝牙耳机时总会听到商家在宣传耳机所具备的CVC、ANC降噪功能，尽管听过很多商家描述，有些小伙伴依然不是很明白这两者之间的区别以及应用。现在简单和大家介绍这两个看不懂的降噪名词。CVC降噪(ClearVoiceCapture)是通话软件降噪技术。工作原理是是通过耳机内置的消
利用技术分享提升个人影响力 AI天才研究院计算 AI人工智能与大数据 AI大模型企业级应用开发实战 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
《利用技术分享提升个人影响力》关键词：技术分享、个人品牌、影响力、内容创作、互动反馈、持续成长摘要：本文将深入探讨技术分享在个人发展中的重要作用，通过详细分析技术分享的意义、平台选择、内容创作、互动反馈及个人影响力提升策略，帮助读者掌握利用技术分享提升个人影响力的实用方法。第一部分：引言与基础第1章：技术分享的意义与价值1.1.1技术分享的历史与发展技术分享作为一种知识传播的方式，其历史可以追溯到
JavaScript 基础09：Web APIs——日期对象、DOM节点梦想当全栈 JavaScript javascript 前端开发语言
JavaScript基础09：WebAPIs——日期对象、DOM节点进一步学习DOM相关知识，实现可交互的网页特效能够插入、删除和替换元素节点。能够依据元素节点关系查找节点。一、日期对象掌握Date日期对象的使用，动态获取当前计算机的时间。ECMAScript中内置了获取系统时间的对象Date，使用Date时与之前学习的内置对象console和Math不同，它需要借助new关键字才能使用。1.实例
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
【证明】对极几何：本质矩阵内在性质 Powerful_QI slam 线性代数矩阵
--这是目录--1.本质矩阵内在性质表述2.预备知识2.1线性代数基础2.1.1奇异值与特征值的关系2.1.2矩阵加减单位阵后特征值的变化2.2引理：一个常用的矩阵变换3.证明1.本质矩阵内在性质表述本质矩阵(EssentialMatrix)EEE是一个3阶方阵，满足E=t∧RE=t^{\land}RE=t∧R其中RRR为旋转矩阵，ttt为平移量，t∧t^{\land}t∧运算定义如下（参考了
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
苦练Python第9天：if-else分支九剑 python后端前端人工智能
苦练Python第9天：if-else分支九剑前言大家好，我是倔强青铜三。是一名热情的软件工程师，我热衷于分享和传播IT技术，致力于通过我的知识和技能推动技术交流与创新，欢迎关注我，微信公众号：倔强青铜三。欢迎点赞、收藏、关注，一键三连！！！欢迎来到100天Python挑战第9天！今天我们不练循环，改磨“分支剑法”——ifelse三式：单分支、双分支、多分支，以及嵌套和三元运算符，全部实战演练，让
苦练Python第8天：while 循环之妙用 python后端前端人工智能
苦练Python第8天：while循环之妙用原文链接：https://dev.to/therahul_gupta/day-9100-while-loops-with-real-world-examples-528f作者：RahulGupta译者：倔强青铜三前言大家好，我是倔强青铜三。是一名热情的软件工程师，我热衷于分享和传播IT技术，致力于通过我的知识和技能推动技术交流与创新，欢迎关注我，微信公众
苦练Python第5天：字符串从入门到格式化 python后端人工智能前端
苦练Python第5天：字符串从入门到格式化原文链接：https://dev.to/therahul_gupta/day-5100-working-with-strings-basics-to-formatting-2kkn作者：RahulGupta译者：倔强青铜三前言大家好，我是倔强青铜三。是一名热情的软件工程师，我热衷于分享和传播IT技术，致力于通过我的知识和技能推动技术交流与创新，欢迎关注我
flutter知识点 ZhDan91 flutter
#时隔4年了#4年前用flutter开发海外项目和医疗项目。绘制界面的语法与html还是较类似的。把这些封印的记忆和技术回顾一下，最开始是开发Android出身的，所以开发起flutter来依旧是用的androidstudio开发工具。整理下用到的知识点：整理来源：flutter面试题——基础篇（1）-CSDN博客1、Dart是单线程的。在单线程中以消息循环来运行的。其中敖汉两个任务队列。一个是微
视频分析：让AI看懂动态画面随机森林404 计算机视觉音视频人工智能 microsoft
引言：动态视觉理解的革命在数字信息爆炸的时代，视频已成为最主要的媒介形式。据统计，每分钟有超过500小时的视频内容被上传到YouTube平台，而全球互联网流量的82%来自视频数据传输。面对如此海量的视频内容，传统的人工处理方式已无法满足需求，这正是人工智能视频分析技术大显身手的舞台。视频分析技术赋予机器"看懂"动态画面的能力，使其能够自动理解、解释甚至预测视频中的内容，这一突破正在彻底改变我们与视
requests的使用
一·概念requests作为爬虫的基础库，在我们快速爬取和反爬破解中起到很重要的作用，其中的知识点大概有以下几个方面：二·内容一，request：1-requests.get…get请求获取数据2-requests.post…post请求获取数据二，response:1-response.text.响应体str类型2-response.encoding从HTTPheader中获取响应内容的编码方式
V少JS基础班之第五弹 V少在逆向 JS基础班 javascript 开发语言 ecmascript
文章目录一、前言二、本节涉及知识点三、重点内容1-函数的定义2-函数的构成1.函数参数详解1）参数个数不固定2）默认参数3）arguments对象（类数组）4）剩余参数（Rest参数）5）函数参数是按值传递的6）解构参数传递7）参数校验技巧（JavaScript没有类型限制，需要手动校验）2.函数返回值详解3-函数的分类1-函数声明式：2-函数表达式：3-箭头函数：4-构造函数：5-IIFE：6-
2025.07.09华为机考真题解析-第一题100分春秋招笔试突围最新互联网春秋招试题合集华为
点击直达笔试专栏《大厂笔试突围》春秋招笔试突围在线OJ笔试突围OJ01.花园灯具照明设计问题描述K小姐正在为她的私人花园设计照明系统。花园是一条长廊，由nnn
css遗忘的知识2(grid布局，&父类选择器与:has() 讲解) 不断努力的根号七 css css 前端 javascript
---grid布局1.基础Grid布局定义gird布局和行宽.container{display:grid;grid-template-columns:100px200px300px;/*三列，宽度分别为100px,200px,300px*/grid-template-rows:100px200px;/*两行，高度分别为100px,200px*/}常用单位fr(fractionalunit)：可用
three前置课程知识
学习中文网(1.threejs文件包下载和目录简介|Three.js中文网)threejs官方文件包所有版本：https://github.com/mrdoob/three.js/releases更新迭代较快，要选择对应版本使用---下载zip压缩包Threejs官网中文文档链接：https://threejs.org/docs/index.html#manual/zh/重要的内容docs包:文档
【Qualcomm】高通SNPE框架简介、下载与使用 Jackilina_Stone 人工智能 Qualcomm SNPE
目录一高通SNPE框架1SNPE简介2QNN与SNPE3Capabilities4工作流程二SNPE的安装与使用1下载2Setup3SNPE的使用概述一高通SNPE框架1SNPE简介SNPE（SnapdragonNeuralProcessingEngine），是高通公司推出的面向移动端和物联网设备的深度学习推理框架。SNPE提供了一套完整的深度学习推理框架，能够支持多种深度学习模型，包括Pytor
《Python星球日记》第35天：全栈开发（综合项目） Code_流苏 Python星球日记编程项目实战 Python全栈开发 Django Flask 后端开发博客系统
名人说：路漫漫其修远兮，吾将上下而求索。——屈原《离骚》创作者：Code_流苏(CSDN)（一个喜欢古诗词和编程的Coder）专栏：《Python星球日记》，限时特价订阅中ing目录一、全栈开发概述1.全栈开发的优势2.全栈开发技能组合二、博客系统项目需求分析1.功能需求2.技术栈选择3.项目结构规划三、数据库设计1.实体关系分析2.Django模型设计四、后端开发1.Django项目创建2.视图
学习日记-spring-day45-7.10 永日45670 学习 spring java
知识点：1.初始化Bean单例池完成getBeancreateBean（1）知识点核心内容重点单例词初始化在容器初始化阶段预先创建单例对象，避免在getBean时动态创建单例词必须在容器初始化时完成加载，否则会触发异常getBean方法逻辑1.从beanDefinitionMap查询BeanDefinition2.根据scope判断单例/多例3.单例：直接从单例词获取4.多例：反射动态创建新对象多
C++面试核心知识点全面解析：从基础到高级
掌握这些核心知识点，轻松应对90%的C++技术面试一、基础语法与关键字1.1const关键字的多种用法//1.常量变量constintMAX_SIZE=100;//2.常量指针与指针常量constint*ptr1=&var;//指向常量的指针int*constptr2=&var;//常量指针constint*constptr3=&var;//指向常量的常量指针//3.常量成员函数classMyCl
上位机知识篇---文件系统 Atticus-Orion 上位机知识篇文件系统 windows linux FAT NTFS ext4 ZFS
文章目录前言1.FAT（FileAllocationTable）版本FAT12FAT16FAT32优势兼容性好简单轻量适合小文件存储劣势不支持大文件性能较差缺乏高级功能使用场景2.NTFS（NewTechnologyFileSystem）优势支持大文件和大分区高性能日记功能权限控制劣势兼容性差不适合嵌入式设备使用场景3.exFAT（ExtendedFileAllocationTable）优势支持大
上位机知识篇---Linux中的文件挂载 Atticus-Orion 上位机操作篇 linux 运维网络文件挂载
文章目录前言1.挂载的基本概念文件系统挂载点设备文件2.挂载的命令挂载文件系统示例卸载文件系统示例3.挂载的常用选项示例4.自动挂载（/etc/fstab文件）示例使用UUID挂载5.挂载网络文件系统（NFS）挂载NFS示例6.挂载ISO文件挂载ISO文件示例7.查看已挂载的文件系统8.挂载的注意事项9.挂载的常见问题挂载失败卸载失败10.总结前言在Linux系统中，文件挂载是指将一个文件系统（如
上位机知识篇---常见的文件系统
文件系统是操作系统用于管理和组织存储设备上文件的机制，它决定了文件的存储方式、命名规则、访问权限、数据结构等。以下是常见的文件系统及其应用场景、优势和劣势的详细介绍：一、Windows常用文件系统1.FAT32（FileAllocationTable32）基本特点：采用32位文件分配表，是FAT系列的升级版，支持最大单文件4GB，最大分区容量理论上为8TB（实际常用2TB以内）。应用场景：U盘、存
深度学习篇---昇腾NPU&CANN 工具包 Atticus-Orion 上位机知识篇图像处理篇深度学习篇深度学习人工智能 NPU 昇腾 CANN
介绍昇腾NPU是华为推出的神经网络处理器，具有强大的AI计算能力，而CANN工具包则是面向AI场景的异构计算架构，用于发挥昇腾NPU的性能优势。以下是详细介绍：昇腾NPU架构设计：采用达芬奇架构，是一个片上系统，主要由特制的计算单元、大容量的存储单元和相应的控制单元组成。集成了多个CPU核心，包括控制CPU和AICPU，前者用于控制处理器整体运行，后者承担非矩阵类复杂计算。此外，还拥有AICore
js动画html标签（持续更新中） 843977358 html js 动画 media opacity
1.jQuery 效果 - animate() 方法改变 "div" 元素的高度： $(".btn1").click(function(){ $("#box").animate({height:"300px
springMVC学习笔记 caoyong springMVC
1、搭建开发环境 a>、添加jar文件，在ioc所需jar包的基础上添加spring-web.jar,spring-webmvc.jar b>、在web.xml中配置前端控制器 <servlet> &nbs
POI中设置Excel单元格格式 107x poi style 列宽合并单元格自动换行
引用：http://apps.hi.baidu.com/share/detail/17249059 POI中可能会用到一些需要设置EXCEL单元格格式的操作小结：先获取工作薄对象: HSSFWorkbook wb = new HSSFWorkbook(); HSSFSheet sheet = wb.createSheet(); HSSFCellStyle setBorder = wb.
jquery 获取A href 触发js方法的this参数无效的情况一炮送你回车库 jquery
html如下： <td class=\"bord-r-n bord-l-n c-333\"> <a class=\"table-icon edit\" onclick=\"editTrValues(this);\">修改</a> </td>" j
md5 3213213333332132 MD5
import java.security.MessageDigest; import java.security.NoSuchAlgorithmException; public class MDFive { public static void main(String[] args) { String md5Str = "cq
完全卸载干净Oracle11g sophia天雪 orale数据库卸载干净清理注册表
完全卸载干净Oracle11g A、存在OUI卸载工具的情况下：第一步：停用所有Oracle相关的已启动的服务；第二步：找到OUI卸载工具：在“开始”菜单中找到“oracle_OraDb11g_home”文件夹中 &
apache 的access.log 日志文件太大如何解决 darkranger apache
CustomLog logs/access.log common 此写法导致日志数据一致自增变大。直接注释上面的语法 #CustomLog logs/access.log common 增加： CustomLog "|bin/rotatelogs.exe -l logs/access-%Y-%m-d.log
Hadoop单机模式环境搭建关键步骤 aijuans 分布式
Hadoop环境需要sshd服务一直开启，故，在服务器上需要按照ssh服务，以Ubuntu Linux为例，按照ssh服务如下： sudo apt-get install ssh sudo apt-get install rsync 编辑HADOOP_HOME/conf/hadoop-env.sh文件，将JAVA_HOME设置为Java
PL/SQL DEVELOPER 使用的一些技巧 atongyeye java sql
1 记住密码这是个有争议的功能，因为记住密码会给带来数据安全的问题。但假如是开发用的库，密码甚至可以和用户名相同，每次输入密码实在没什么意义，可以考虑让PLSQL Developer记住密码。位置：Tools菜单－－Preferences－－Oracle－－Logon HIstory－－Store with password 2 特殊Copy 在SQL Window
PHP：在对象上动态添加一个新的方法 bardo 方法动态添加闭包
有关在一个对象上动态添加方法，如果你来自Ruby语言或您熟悉这门语言，你已经知道它是什么...... Ruby提供给你一种方式来获得一个instancied对象，并给这个对象添加一个额外的方法。好！不说Ruby了，让我们来谈谈PHP PHP未提供一个“标准的方式”做这样的事情，这也是没有核心的一部分... 但无论如何，它并没有说我们不能做这样
ThreadLocal与线程安全 bijian1013 java java多线程 threadLocal
首先来看一下线程安全问题产生的两个前提条件： 1.数据共享，多个线程访问同样的数据。 2.共享数据是可变的，多个线程对访问的共享数据作出了修改。实例：定义一个共享数据： public static int a = 0;
Tomcat 架包冲突解决征客丶 tomcat Web
环境： Tomcat 7.0.6 win7 x64 错误表象：【我的冲突的架包是：catalina.jar 与 tomcat-catalina-7.0.61.jar 冲突，不知道其他架包冲突时是不是也报这个错误】严重: End event threw exception java.lang.NoSuchMethodException: org.apache.catalina.dep
【Scala三】分析Spark源代码总结的Scala语法一 bit1129 scala
Scala语法 1. classOf运算符 Scala中的classOf[T]是一个class对象，等价于Java的T.class,比如classOf[TextInputFormat]等价于TextInputFormat.class 2. 方法默认值 defaultMinPartitions就是一个默认值，类似C++的方法默认值
java 线程池管理机制 BlueSkator java线程池管理机制
编辑 Add Tools jdk线程池一、引言第一：降低资源消耗。通过重复利用已创建的线程降低线程创建和销毁造成的消耗。第二：提高响应速度。当任务到达时，任务可以不需要等到线程创建就能立即执行。第三：提高线程的可管理性。线程是稀缺资源，如果无限制的创建，不仅会消耗系统资源，还会降低系统的稳定性，使用线程池可以进行统一的分配，调优和监控。
关于hql中使用本地sql函数的问题（问-答） BreakingBad HQL 存储函数
转自于：http://www.iteye.com/problems/23775 问：我在开发过程中，使用hql进行查询（mysql5）使用到了mysql自带的函数find_in_set()这个函数作为匹配字符串的来讲效率非常好，但是我直接把它写在hql语句里面（from ForumMemberInfo fm,ForumArea fa where find_in_set(fm.userId,f
读《研磨设计模式》-代码笔记-迭代器模式-Iterator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.Arrays; import java.util.List; /** * Iterator模式提供一种方法顺序访问一个聚合对象中各个元素，而又不暴露该对象内部表示 * * 个人觉得，为了不暴露该
常用SQL chenjunt3 oracle sql C++c C#
--NC建库 CREATE TABLESPACE NNC_DATA01 DATAFILE 'E:\oracle\product\10.2.0\oradata\orcl\nnc_data01.dbf' SIZE 500M AUTOEXTEND ON NEXT 50M EXTENT MANAGEMENT LOCAL UNIFORM SIZE 256K ; CREATE TABLESPA
数学是科学技术的语言 comsci 工作活动领域模型
从小学到大学都在学习数学，从小学开始了解数字的概念和背诵九九表到大学学习复变函数和离散数学，看起来好像掌握了这些数学知识，但是在工作中却很少真正用到这些知识，为什么？最近在研究一种开源软件-CARROT2的源代码的时候，又一次感觉到数学在计算机技术中的不可动摇的基础作用，CARROT2是一种用于自动语言分类（聚类）的工具性软件，用JAVA语言编写，它
Linux系统手动安装rzsz 软件包 daizj linux sz rz
1、下载软件 rzsz-3.34.tar.gz。登录linux，用命令 wget http://freeware.sgi.com/source/rzsz/rzsz-3.48.tar.gz下载。 2、解压 tar zxvf rzsz-3.34.tar.gz 3、安装 cd rzsz-3.34 ; make posix 。注意：这个软件安装与常规的GNU软件不
读源码之:ArrayBlockingQueue dieslrae java
ArrayBlockingQueue是concurrent包提供的一个线程安全的队列,由一个数组来保存队列元素.通过 takeIndex和 putIndex来分别记录出队列和入队列的下标,以保证在出队列时不进行元素移动. //在出队列或者入队列的时候对takeIndex或者putIndex进行累加,如果已经到了数组末尾就又从0开始,保证数
C语言学习九枚举的定义和应用 dcj3sjt126com c
枚举的定义 # include <stdio.h> enum WeekDay { MonDay, TuesDay, WednesDay, ThursDay, FriDay, SaturDay, SunDay }; int main(void) { //int day; //day定义成int类型不合适 enum WeekDay day = Wedne
Vagrant 三种网络配置详解 dcj3sjt126com vagrant
Forwarded port Private network Public network Vagrant 中一共有三种网络配置，下面我们将会详解三种网络配置各自优缺点。端口映射(Forwarded port)，顾名思义是指把宿主计算机的端口映射到虚拟机的某一个端口上，访问宿主计算机端口时，请求实际是被转发到虚拟机上指定端口的。Vagrantfile中设定语法为： c
16.性能优化-完结 frank1234 性能优化
性能调优是一个宏大的工程，需要从宏观架构(比如拆分，冗余，读写分离，集群，缓存等)，软件设计（比如多线程并行化，选择合适的数据结构），数据库设计层面（合理的表设计，汇总表，索引，分区，拆分，冗余等）以及微观（软件的配置，SQL语句的编写，操作系统配置等）根据软件的应用场景做综合的考虑和权衡，并经验实际测试验证才能达到最优。性能水很深，笔者经验尚浅，赶脚也就了解了点皮毛而已，我觉得
Word Search hcx2013 search
Given a 2D board and a word, find if the word exists in the grid. The word can be constructed from letters of sequentially adjacent cell, where "adjacent" cells are those horizontally or ve
Spring4新特性——Web开发的增强 jinnianshilongnian spring spring mvc spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装配置tengine并设置开机启动 liuxingguome centos
yum install gcc-c++ yum install pcre pcre-devel yum install zlib zlib-devel yum install openssl openssl-devel Ubuntu上可以这样安装 sudo aptitude install libdmalloc-dev libcurl4-opens
第14章工具函数（上） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Xelsius 2008 and SAP BW at a glance blueoxygen BO Xelsius
Xelsius提供了丰富多样的数据连接方式，其中为SAP BW专属提供的是BICS。那么Xelsius的各种连接的优缺点比较以及Xelsius是如何直接连接到BEx Query的呢？以下Wiki文章应该提供了全面的概览。 http://wiki.sdn.sap.com/wiki/display/BOBJ/Xcelsius+2008+and+SAP+NetWeaver+BW+Co
oracle表空间相关 tongsh6 oracle
在oracle数据库中，一个用户对应一个表空间，当表空间不足时，可以采用增加表空间的数据文件容量，也可以增加数据文件，方法有如下几种： 1.给表空间增加数据文件 ALTER TABLESPACE "表空间的名字" ADD DATAFILE '表空间的数据文件路径' SIZE 50M; &nb
.Net framework4.0安装失败 yangjuanjava .net windows
上午的.net framework 4.0，各种失败，查了好多答案，各种不靠谱，最后终于找到答案了和Windows Update有关系，给目录名重命名一下再次安装，即安装成功了！下载地址：http://www.microsoft.com/en-us/download/details.aspx?id=17113 方法： 1.运行cmd，输入net stop WuAuServ 2.点击开

【深度学习：多关节嵌入模型】 Meta 解释的 ImageBind 多关节嵌入模型

【深度学习：多关节嵌入模型】 Meta 解释的 ImageBind 多关节嵌入模型

Meta 发布开源人工智能工具的历史

分段任何模型

DINOv2

什么是多模态学习？

什么是嵌入？

什么是 ImageBind？

集成在 ImageBind 中的模式

图像绑定架构

特定模式编码器

跨模态注意力模块

联合嵌入

ImageBind 训练数据

ImageBind 性能

ImageBind 是开源的吗？

利用 ImageBind 进行多模态学习的未来潜力

ImageBind 如何开辟新途径

多模态学习的未来

结论

你可能感兴趣的:(深度学习知识专栏,深度学习,人工智能)