华为云

从5大挑战带你了解多模态机器学习

本文分享自华为云社区《多模态学习综述》，原文作者：Finetune小能手。

前言

一种模态指事物发生或体验的方式，关于多模态研究的问题就是指包含多种模态。

多模态机器学习旨在从多种模态建立一种模型，能够处理和关联多种模态的信息

考虑到数据的异构性，MMML（Multimodal Machine Learning）领域带来了许多独特的挑战，总体而言五种：

- - 表示：最为基础的挑战，学习利用多种模态的互补性和冗余性，来表示和概括模态数据的方法。模态的异构性为这种表示带来挑战。例如：语言通常是符号表示，而语音通常是信号表示。
  - 转化：如何转换（映射）一种模态的数据到另一种模态。多模态不仅数据异构，而且模态间的关系通常是开放的或者说是主观的。例如，有许多种正确的方法来描述一张图片，其中可能并不存在最好的模态转译。
  - 对齐：模态对齐主要是识别多种模态的要素（子要素）间的直接联系。例如，将菜谱的每一步和做菜的视频进行对应。解决这个问题需要衡量不同模态的间的相似性，而且要考虑可能的长距离依赖和歧义。
  - 融合：将多种模态的信息进行连接，从而完成推理。例如，视听语音识别，视觉描述的嘴唇的运动与音频信号进行混合来完成所说的词的推理。当可能至少一种模态数据丢失的时候，来自不同模态的信息在推理中有不同的预测能力和噪声拓扑。
  - 协同学习：在不同模态、表示、预测模型间进行知识迁移。协同训练、conceptual grounding和zero-shot learning中有典型应用。当某一种模态资源有限时（标注数据很少）有很大意义。

应用：应用很多，包括视听语音识别（AVSR），多媒体数据索引和搜索，社交互动行为理解，视频描述等

一、多模态表示

多模态表示需解决问题：异构数据如何结合，不同级别的噪声如何处理，丢失数据如何处理

Bengio指出，好的特征表示应该：

- - 平滑
  - 时空一致
  - 稀疏
  - 自然聚类

Srivastava et.al.补充三点

- - 表征空间应该反映对应概念相似性
  - 即便一些模态不存在，表征应该易于获得
  - 使填充丢失的模态成为可能

在之前的研究中（before 2019)，大部分多模态表征简单的将单模态特征进行连接，两种多模态表征方法：联合表示（joint representation)，协同表示（coordinated representation）

联合表示

每个模态为x_ixi，x_m = f(x_1, \dots, x_n)xm=f(x1,…,xn)

联合表示常用于训练推理均为多模态数据的任务中，最为简单的方法就是特征拼接

深度学习方法：深度学习特征后几层天然的包含高层语义信息，常用最后或倒数第二层特征

由于深度学习网络需要大量标注数据，常会利用无监督方法，例如自编码器，进行特征表示预训练，深度学习不能天然的解决数据丢失问题。

概率图模型：利用隐随机变量构建特征表示

最常见的基于图模型的特征表示方法，利用深度玻尔兹曼机(DBM)、受限玻尔兹曼机(RBM)作为模块构建，类似深度学习，特征分层，是无监督方法。也有用深度信念网络(DBN)表征每个模态然后进行联合表示的。

利用多模态深度玻尔兹曼机学习多模态特征表示，由于天然的生成特性，能够轻松处理丢失数据问题，整个模态数据丢失也可以自然解决；还可以用某种模态来生成另一种种模态的样本；DBM缺陷在于难训练，计算代价高，需要变分近似训练方法

序列表征

当数据的长度是变长序列时，例如句子、视频或者音频流，使用序列表征

RNN，LSTM当前主要用于表示单模态序列，而RNN的某个时刻的hidden state，可以看做在这个时刻前的所有序列的特征的整合，AVSR中Cosi等人使用RNN来表示多模态特征。

协同表示

每个模态为x_ixi，f(x_1) \sim g(x_2)f(x1)∼g(x2)，每个模态有对应的映射函数，将它映射到多模态空间中，每个模态的投影过程是独立的，但是最终的多模态空间是通过某种限制来协同表示的。

两种协同表示方式：相似度模型，结构化模型，前者保证特征表示的相似性，后者加强在特征结果空间中的结构化。

相似度模型：相似度模型最小化不同模态在协同表示空间中的距离，例如狗和狗的图像的距离，小于狗和车的图像的距离。深度神经网络在协同表示中的优势在于能够以端到端的方式进行协同表示的联合学习。

结构化协同空间模型：结构化协同表示模型加强了不同模态表示的附加限制，具体的结构化限制根据应用而异。

结构化协同表示空间常用在跨模态哈希中，将高维的数据压缩到紧凑的二进制表示使得相似的object有相似的编码，常用于跨模态检索中。哈希的方法迫使最终多模态空间表示有如下限制：1) N维的汉明空间，可控位数的二进制表示；2) 不同模态的相同object有着相似的哈希编码；3) 多模态空间必须保持数据相似性。

另一种结构化协同表示的方法来源于图像和语言的“顺序嵌入”。

例如，Vendrov et al. 在多模态空间中强化了一种不相似度量，它是非对称的偏序关系。主要思想是在语言和图像的表示中抓住了一种偏序关系，强制了一种层级结构。对于一张图像，这种偏序关系为“a woman walking her dog” > “woman walking her dog” > “woman walking”。

一种特殊的结构化协同空间是基于典型相关分析（CCA）。CCA利用线性投影最大化两个随机变量相关性，增强了新空间的正交性。CCA模型多用于跨模态搜索，和语音视觉信号分析。

利用核方法，CCA可以扩展为KCCA，这种非参数的方法随着训练数据规模的增长可扩展性较差。深度典型相关分析DCCA作为KCCA的替代品被提出，解决了可扩展性问题，可以得到更好的相关表示空间。深度相关性RBM也可以作为跨模态搜索的方法。

KCCA，CCA，DCCA都是非监督的方法，仅能优化特征表示的相关性，能够获取到跨模态的共享特征。

其它的方法例如，深度典型相关自编码器，语义相关性最大化方法也用于结构化协同空间表示中

小结：

联合和协同表示方法是多模态特征表示的两种主要方法。

联合特征表示方法将多模态数据投影到一个共同的特征表示空间，最适用于推理时所有模态的数据都出现的场景。
协同特征表示方法将每个模态投影到分离但相关的空间，这种方法适用于推理时仅有一种模态出现的情况。

联合表示方法已经用在构建多于两种模态表示的场景，而协同空间表示常限定为两种模态。

二、多模态转化

从一种模态转化为另一种模态是很多多模态机器学习关注的内容。

多模态转化的任务是给定一个模态中的一个实体，生成另一种模态中的相同实体。例如，给定一张图像，我们可以生成一句话来描述这张图像，或者，给定一个文字描述，我们能够生成与之匹配的图像。多模态转化已经研究了很长时间，早期的语音合成、视听语音生成，视频描述，跨模态检索。近来，NLP和CV领域的结合，以及大规模多模态数据都推动这方面发展。

热门应用：视觉场景描述（图像、视频描述），除了识别主体部分、理解视觉场景，还需要生成语法正确，理解精确的描述语句。

多模态转化可以分为两类，基于实例的方法和生成式方法，前者使用字典实现模态转化，后者使用模型生成转化结果

考虑到生成式模型需要生成信号或者符号序列（句子），生成式模型方法挑战更大。所以早期很多方法都倾向于基于实例的方法进行模态转化。然而随着深度学习的发展，生成式模型也具备了生成图像、声音、文本的能力。

基于实例的方法

基于实例的方法受限于训练数据——字典（源模态、目标模态构成的实例对）

两种算法：基于检索的方法，基于组合的方法，前者直接使用搜索到的转化结果，不会修改它们，后者依赖于更复杂的规则，基于大量搜索到的实例建立模态转化结果

基于检索的方法：基于检索的方法是多模态转化最简单的方法，它依赖字典中搜索到的最近的样本，利用它作为转化的结果，检索在单模态空间中完成，也可以在中间语义空间中完成。

给定一个待转化的源模态的实例，单模态检索通过在字典中查找最近的源模态实例实现模态转化，本质上就是通过KNN找到源模态到目标模态的映射。一些典型应用场景比如TTS，图像描述等。这种方法的好处是仅需要单一模态的表示，就可以通过检索实现。但也是由于采用搜索的方法，所以需要考虑搜索结果的重排序问题。这种方法的问题在于，在单模态空间中相似度高实例的并不一定就是好的模态转化。

另一种方法是利用中间语义空间来实现相似性比较。这种方法一般会搭配协同表示使用，应该是由于协同表示空间本身就对向量表示进行了相似性限制。在语义空间中进行模态检索的方法比单模态检索的方法效果更好，因为它的搜索空间同时反映了两种模态，更具有含义。同时，它支持双向的转化，这在单模态检索中不是很直接。然而，中间语义空间检索的方法需要学习一个语义空间，这需要大量的训练字典（源模态、目标模态样本对）。

基于组合的方法：通过将检索结果进行有意义的组合来得到更好的模态转化结果，基于组合的媒体描述（media description）主要是基于图像的描述语句都有着相同的简单结构这一特点。通常组合的规则都是人工指定的或者启发式生成的。

基于实例的方法面临的最大问题在于它的模型就是整个字典，模型会随着数据集的增加而不断增大，而且推理会变慢；另一个问题就是除非整个字典非常大，否则不能覆盖所有可能的源模态查询。这个问题可以通过多种模型组合解决。基于实例的方法进行多模态转化是单方向的，基于语义空间的方法可以在源模态和目标模态间双向转化。

生成式方法

生成式方法在多模态转化中构建的模型能够对给定单一模态实例进行多模态转化，挑战在于需要理解源模态来生成目标序列、信号，可能正确的转化结果非常多，因此这类方法较难评估。

三种生成式方法：基于语法，编码器-解码器，连续生成模型，第一种方法利用语法来限定目标域，例如生成基于<主语，宾语，动词>这种模板限定的句子；编码器解码器模型先将原模态编码到一个隐空间表示，然后解码器生成目标模态；第三种方法基于源模态的一个流式输入连续生成目标模态，特别适用于时序句子翻译如TTS。

基于语法规则的模型：依赖于为了生成特定模式而预先定义的语法。这种方法先从源模态中检测高层含义，例如图像中的实体、视频中的行为；然后将这些检测结果送入一个机遇预定义语法的生成过程来得到目标模态。

一些基于语法的方法依赖于图模型生成目标模式

基于语法的方法有事在于更倾向于生成语句结构上或者逻辑上正确的实例，因为他们是基于预先定义模板的、限定的语法。缺点在于生成语法化的结果而不是创新式的转化，没有生成新的内容；而且基于语法的方法依赖于复杂的概念，这些概念的detection的pipeline很复杂，每个概念的提取可能需要单独的模型和独立的训练集

编码器解码器模型：基于端到端神经网络训练，是最近最流行的多模态转化技术，核心思想是受限将源模态编码一种向量表示，然后利用解码器模块生成目标模态。起初用于机器翻译，当前已经成功用于图片解说，视频描述；当前主要用于生成文本，也可以用于生成图像和连续的语音、声音。

编码：首先将源实例进行特定模态编码。对声音信号比较流行的编码方法是RNN和DBN；对词、句子编码常用distributional semantics和RNN的变种；对于图像用CNN；视频编码仍然常用人工特征。也可以使用单一的模态表示方法，例如利用协同表示，能够得到更好的结果。

解码：通常利用RNN或者LSTM，将编码后的特征表示作为初始隐藏状态。Venugopalan et al.验证了利用预训练的LSTM解码器用于图像解说对于视频描述任务是有益的。利用RNN面临的问题在于模型需要从单一的图像、句子或者视频向量表示来生成一种描述。当需要生成长序列时，模型会忘记初始输入。这个问题可以通过注意力机制解决，让网络在生成过程中更关注与图像、句子、视频的部分内容。基于注意力的生成式RNN也被用于从句子生成图像的任务，不真实但是有潜质。

基于编码器解码器的网络虽然成功但是仍面临很多问题。Devlin et al.指出网络可能记住了训练数据，而不是学习到了如何理解和生成视觉场景。他观察到kNN模型生成的结果和编解码网络的生成结果非常相似。编解码模型需要的训练数据规模非常大。

连续生成模型：连续生成模型用于序列翻译和在线的方式在每个时间戳生成输出，当sequence到sequence转化时，这种方法很有效，例如文本转语音，语音转文本，视频转文本。

许多其它的方法也被提出用于这种建模：图模型，连续编解码方法，各种其它的回归分类方法。这些模型需要额外解决的问题是模态间的时序一致性问题。近来，Encoder-Decoder模型常用于序列转化建模。

小结和讨论

多模态转化所面临的一大挑战是很难进行评估，有些任务（例如语音识别）有一个正确的translation，而像语音合成和媒体描述则没有。有时就像在语言翻译场景中一样，多种答案都是正确的，哪种翻译更好通常非常主观。当前，大量近似自动化评价的标准也在辅助模态转化结果评估。

人的评价标准是最理想的。一些自动化评价指标例如在媒体描述中常用的：BLEU、ROUGE、Meteor、CIDEr也被提出，但是褒贬不一。

解决评估问题非常重要，不但能够用于比较不同的方法，而且能够提供更好的优化目标。

三、多模态对齐

多模态对齐是指找到两种或多种模态的instances中sub-components之间的对应关系，例如：给定一张图片和一个描述，找到词或者短语对应图片中的区域；另一个例子是给定一个电影，将它和字幕或者书中的章节对齐。

多模态对齐分成两类：隐式对齐和显示对齐，显示对齐显示的关注模态间sub-components的对应关系，例如将视频和菜谱中对应的步骤对齐；隐式对齐常作为其它任务的一个环节，例如基于文本的图像搜索中，将关键词和图片的区域进行对齐

显示对齐

sub-components间的相似性衡量是显示对齐的基础，两类算法无监督方法和（弱）监督方法

无监督方法：无监督方法不需要模态间对齐的标注，Dynamic time warping衡量两个序列的相似性，找到一个optimal的match，是一种dynamic programming的方法。由于DTW需要预定义的相似性度量，可以利用CCA（典型相关性分析）将模态映射到一个协同表达空间。DTW和CCA都是线性变换，不能找到模态间的非线性关系。图模型也可以用于无监督多模态序列的对齐。

DTW和图模型的方法用于多模态对齐需要遵循一些限制条件，例如时序一致性、时间上没有很大的跳跃、单调性。DTW能够同时学习相似性度量和模态对齐，图模型方法在建模过程中需要专家知识。

（弱）监督方法：监督方法需要标注好的模态对齐实例，用于训练模态对齐中的相似性度量，许多监督式序列对齐方法收到非监督方法的启发，当前深度学习方法用于模态对齐更加常见。

隐式对齐

常用作其它任务的中间步骤，使得例如语音识别、机器翻译、多媒体描述和视觉问答达到更好的性能。早期工作基于图模型，当前更多基于神经网络。

图模型：需要人工构建模态间的映射关系

神经网络：模态转换如果能够使用模态对齐，任务的性能可以得到提升

单纯的使用encoder只能通过调整权重来总结整张图片、句子、视频，作为单一的向量表示；注意力机制的引入，使得decoder能够关注到sub-components。注意力机制会让decoder更多的关注sub-components

注意力机制可以认为是深度学习模态对齐的一种惯用方法。

小结

模态对齐面临着许多困难：少有显示标注模态对齐的数据集；很难设计模态间的相似性度量；存在多种可能的模态对齐，而且一个模态中的elements可能在另一个模态中没有对应。

四、多模态融合

多模态融合就是整合多种模态的信息进行分类或者回归任务，多模态融合研究可以追溯到25年前。多模态融合带来的好处有：（1）同一个现象的不同模态表示能够产生更robust的推理结果；（2）从多种规模中能够得到辅助的信息，这些信息在单一模态中是不可见的；（3）对于一个多模态系统而言，模态融合能够在某一种模态消失时仍正常运行。

当前多模态表示和融合的界限愈发模糊，因为在深度学习中，表示学习和分类/回归任务交织在一起。

两种多模态混合方法：模型无关和基于模型的方法，前者不直接依赖于一种特定的机器学习方法，后者显示的在构建过程中进行融合（核方法、图模型、神经网络）。

模型无关方法

模型无关的方法有三种：前期融合、后期融合和混合融合。前期融合是特征级别的融合，后期融合是推理结果的融合，混合融合同时包括两种融合方法。

模型无关的融合方法好处是：可以兼容任何一种分类器或者回归器

前期融合可以看做是多模态表示的一种前期尝试

后期融合利用单一模态的预测结果，通过投票机制、加权、signal variance或者一个模型进行融合。后期融合忽略了模态底层特征之间的关系

基于模型的方法

多核学习（MKL）：kernel SVM的扩展，对于不同模态使用不同的kernel

MKL方法是深度学习之前最常用的方法，优势在于loss function是凸的，模型训练可以使用标准的优化package和全局优化方法，劣势在于测试时对于数据集的依赖推理速度慢。

图模型

在本篇综述中仅考虑浅层的图模型，深度图模型例如DBN可以参考前面章节内容，大多数图模型可以分成两类：生成式（联合概率）和判别式（条件概率）

图模型能够很容易的发掘数据中的空间和时序结构，同时可以将专家知识嵌入到模型中，模型也可解释

神经网络

神经网络用于模态融合所使用的模态、优化方法可能不同，通过joint hidden layers进行信息融合的思路是一致的。神经网络也用于时序多模态融合，通常采用RNN和LSTM，典型的应用是audio-visual情感分类，图片解说

深度神经网络用于模态融合优点：（1）可以从大量数据学习；（2）端到端学习多模态特征表示和融合；（3）和非深度学习方法相比性能好，能学习复杂的decision boundary

缺点：可解释性差，不知道网络根据什么进行推理，也不知道每个模态起的作用；需要大量训练数据才能得到好的效果

小结

多模态融合任务中有如下挑战：1）signal可能不是时序对齐的，例如密集的连续信号vs稀疏的事件；2）很难建立一个模型来发掘补充信息而非辅助信息；3）每个模态在不同时间点可能展现出不同类型、不同级别的噪声。

五、多模态共同学习

多模态共同学习旨在通过发掘另一种模态的信息来帮助当前模态建模

相关场景：一种模态的资源有限，缺乏标注数据或者输入噪声大，标签可靠性低

三种co-learning的方法：并行，非并行，混合；第一种方法需要一种模态的observation和另一种模态的observation直接连接，例如在audio-visual speech数据及上，video和speech sample来自同一个speaker；非并行数据方法不需要两种observation的直接连接，通常利用类别间的交集，例如在zero shot learning中利用Wiki的文本数据扩展传统的视觉目标识别数据集提升目标识别的性能；混合数据的方法通过一种共享模态或者数据连接起来。

并行数据

模态之间共享一个实例集合，两种方法：协同训练和表征学习

协同训练：当某一个模态的标记数据非常少时，可以利用协同训练生成更多的标注训练数据，或者利用模态间的不一致性过滤不可靠标注样本

协同训练方法能够生成更多的标注数据，但也可能会导致overfitting

迁移学习：多模态玻尔兹曼机或者多模态自编码器将一种模态特征表示转化为另一种，这样不仅能得到多模态表征，而且对于单模态而言推理过程中也能得到更好的性能。

非并行数据

不需要依赖模态间共享的实例，有共享的类别或者概念（concept）即可

迁移学习：迁移学习能够从一个数据充分、干净的模态学习特征表示迁移到另一个数据稀缺、噪声大的模态，这种迁移学习常用多模态协同特征表示实现。

Conceptual grounding：通过语言以及其他附加模态，例如视觉、声音、甚至味觉，学习语义含义，单纯的利用文本信息不能很好的学习到语义含义，例如人学习一个概念的时候利用的是所有的感知信息而非单纯的符号。

grounding通常通过寻找特征表征间的共同隐空间或者分别学习每个模态的特征表示然后进行拼接，conceptual grounding和多模态特征对齐之间有很高的重合部分,因为视觉场景和对应描述对齐本身能够带来更好的文本或者视觉特征表示。

需要注意的是，grounding并不能在所有情况下带来性能的提升，仅当grounding与具体任务相关时有效，例如在视觉相关任务中利用图像进行grounding

Zero-shot learning：ZSL任务是指在没有显示的见过任何sample的情况下识别一种概念，例如不提供任何猫的图片对图片中的猫进行分类。

两种方法：单模态方法和多模态方法

单模态方法：关注待识别类别的组成部分和属性，例如视觉方面通过颜色、大小、形状等属性去预测为见过的类别

多模态方法：利用另一个模态的信息，在另一个模态中该类别出现过

混合数据：通过共享的模态或者数据集连接两种非数据并行的模态，典型的任务例如多种语言进行图像描述，图片会与至少一种语言之间建立联系，语言之间的可以利用机器翻译任务建立起联系。

目标任务如果仅有少量标注数据，也可利用类似或相关任务去提升性能，例如利用大量文本语料指导图像分割任务。

小结

多模态协同学习通过寻找模态之间的互补信息，使一种模态影响另一种模态的训练过程。

多模态协同学习是与任务无关的，可以用于更好的多模态特征融合、转换和对齐。

点击关注，第一时间了解华为云新鲜技术~

你可能感兴趣的:(技术交流,多模态机器学习,机器学习,多模态,异构数据)

卷积神经网络Batch Normalization的作用 arron8899 cnn batch 人工智能
BatchNormalization的作用（通俗版）1.像“稳定器”一样校准每层输入想象你在烤多层蛋糕，每层蛋糕的烘烤温度不同（相当于神经网络的每一层数据分布不同）。没有BN时，烤箱温度忽高忽低，导致有的层烤焦（梯度爆炸），有的层不熟（梯度消失）。BN的作用相当于给每一层装了一个自动温度调节器，实时将输入数据调整到标准温度（均值为0，方差为1），保证每层都能均匀受热，训练更稳定。2.让模型训练“少
DS/ML：数据科学技术之数据科学生命周期(四大层次+机器学习六大阶段+数据挖掘【5+6+6+4+4+1】步骤)的全流程最强学习路线讲解之详细攻略一个处女座的程序猿资深文章(前沿/经验/创新)DataScience ML 数据科学数据科学的生命周期机器学习
DS/ML：数据科学技术之数据科学生命周期(四大层次+机器学习六大阶段+数据挖掘【5+6+6+4+4+1】步骤)的全流程最强学习路线讲解之详细攻略导读：本文章是博主在数据科学和机器学习领域，先后实战过几百个应用案例之后的精心总结，应该是完全覆盖了数据科学的整个生命周期及其各个阶段的要点。其中机器学习领域六大阶段更是在整个数据科学生命周期中扮演着极其重要的角色。同时，因为涉及到博主出书中出版社要求在
深入了解盘古大模型：技术、应用与未来 Hardess-god Literature review 人工智能
随着人工智能技术的迅猛发展，预训练大模型已成为AI领域最前沿、最热门的研究方向之一。近年来，中国自主研发的大模型之一——盘古模型（PanGuModel）逐渐进入公众视野，凭借其强大的性能和广泛的应用前景，引发了行业内外的广泛关注。什么是盘古大模型？盘古大模型是华为公司联合多家科研机构共同研发的超大规模预训练语言模型。该模型以中文数据为主进行训练，旨在推动中文自然语言处理（NLP）以及跨模态应用的技
零基础上手Python数据分析 (6)：Python 异常处理，告别程序崩溃的烦恼！ kakaZhui python 数据分析数据库 excel 数据挖掘
回顾一下，前几篇博客我们学习了Python的基本语法、数据结构和文件操作。现在，我们已经掌握了Python编程的基础知识，可以开始编写更复杂的数据分析代码了。但是，在实际的数据分析工作中，程序并非总能一帆风顺地运行，总会遇到各种意外情况，例如：文件找不到：程序尝试读取一个不存在的数据文件。数据格式错误：数据文件中包含非预期的格式，例如本应是数字的列包含了文本。网络连接中断：程序尝试从网络获取数据，
复习JVM LMQ6 jvm
JVM的三个主要主题:1.java内存区域划分:a.堆b.栈c.元数据区d.程序计数器2.类加载a.加载:打开.class文件,读取内容b.验证:验证.class文件的格式是否符合要求.c.准备:给类对象分配内存空间d.解析:初始化字符串常量e.初始化:对类对象中的各个部分初始化,比如静态代码块,静态成员的初始化等经典面试题:双亲委派模型他出现在"加载"环节,根据"全限定名称"寻找对应的.clas
MySQL 8.0新特性深度解析：窗口函数与JSON数据处理的10大技巧墨瑾轩一起学学数据库【一】mysql json
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣第1章：MySQL8.0简介嗨，亲爱的小伙伴们！欢迎来到MySQL8.0的奇妙世界，这里充满了新鲜和惊喜。MySQL8.0是一个数据库界的超级英雄，它带着一系列令人兴奋的新特性，比如窗口函数和JSON数据处理，来拯救我们的数据处理任务。1.1MySQL8.0的
第三十一篇数据仓库（DW）与商业智能（BI）架构设计与实践指南随缘而动，随遇而安数据库 sql 数据仓库大数据数据库架构
目录一、DW/BI架构核心理论与选型策略1.1主流架构模式对比（1）Kimball维度建模架构（2）Inmon企业工厂架构（3）混合架构二、架构设计方法论与实施步骤2.1维度建模实战指南（1）模型选择决策树（2）ETL开发规范2.2实时BI技术栈选型三、全链路实施与优化策略3.1五阶段实施框架3.2数据治理体系构建四、行业场景深度实践4.1电商用户行为分析4.2金融风控实时预警五、关键问题解析Q1
【MySQL】事务熬夜超级玩家 MySQL数据库 mysql android 数据库
目录基本概念事务操作自动提交事务开启事务提交事务回滚事务代码示例事务的特性ACID事务的隔离级别读未提交readuncommitted读已提交readcommitted可重复读repeatableread序列化（串行）serializable操作示例基本概念在MySQL中的事务（Transaction）是由存储引擎实现的，在MySQL中，只有InnoDB存储引擎才支持事务事务处理可以用来维护数据库
使用Annoy进行高效的近似最近邻搜索 eahba 前端 javascript angular.js python
在处理大型数据集时，我们经常面临需要快速、准确地查找与给定查询点相近的数据点的问题。Annoy（ApproximateNearestNeighborsOhYeah）就是为解决此类问题而生的一个强大工具。Annoy是一个用C++编写并具有Python绑定的库，专用于在空间中搜索与给定查询点相近的点。它能够创建大型的只读文件数据结构，并映射到内存中，以便于多个进程共享相同的数据。技术背景介绍Annoy
平衡二叉树（AVL树）：数据结构特性与自平衡技术详解 One Key Variable 课程设计
摘要平衡二叉树，尤其是AVL树，在追求高效数据存储与检索的场景中占据重要地位。本文深入剖析AVL树的数据结构特性，详细解读其自平衡技术原理与实现，帮助读者理解AVL树如何在动态数据操作中维持高效性能。一、引言在数据处理过程中，二叉搜索树虽能实现快速查找，但在频繁插入和删除节点时，可能因结构失衡导致查找效率大幅下降。AVL树作为一种自平衡二叉搜索树，通过严格的平衡条件和自平衡技术，确保树在动态操作下
比特币全节点同步加速记录（使用Bitcoin Core钱包） wusimpl 区块链区块链全节点同步加速 bitcoin core
1.预先下载或从别的地方拷贝区块数据而不是直接在BitcoinCore钱包中下载这方面可以参考截止到2022年8月的区块数据2.将区块头数据和区块实体数据分开存储区块头数据放到SSD中，区块实体数据放到HDD中这方面可以参考BitcoinCore节点同步加速原理和方法实验-CodeAntenna3.使用代理下载剩余的数据最好用全局代理，并且在bitcoin.conf中配置proxy可添加离自己区域
Vue2与Vue3组件开发全维度对比实战指南 Forever丿顾北专题文章 vue.js 前端前端框架
Vue2与Vue3组件开发全维度对比实战指南一、组件基础架构对比1.1组件定义方式演进Vue2OptionsAPI详解在Vue2中，组件主要通过OptionsAPI来定义。OptionsAPI将组件的不同方面，如数据、方法、生命周期钩子等，分开定义在一个对象中。这种方式对于初学者来说，易于理解和上手。以一个简单的计数器组件为例：{{count}}增加exportdefault{data(){ret
微软 LIDA 库：基于大模型的自动化数据分析与可视化窝窝和牛牛 microsoft 数据分析
微软LIDA库：基于大模型的自动化数据分析与可视化一、核心架构与LLM交互流程调用LLM生成数据摘要基于LLM推理分析目标LLM生成可视化代码结合图像生成模型优化原始数据Summarizer模块结构化摘要GoalExplorer模块可视化目标列表VizGenerator模块可执行图表代码Infographer模块风格化信息图表二、LLM交互核心功能1.多模型支持架构兼容主流LLM服务商：通过统一接
【LetMeFly】牛客-美团暑期2025-20250322-前两题和第三题的思路 Tisfy 题解 #牛客NowCoder 题解牛客美团笔试字符串回文暴力
【LetMeFly】牛客-美团暑期2025-20250322-前两题和第三题的思路第三题刚开始想复杂了，后面想到了个思路但是没来得及实现。一：对称回文串标签：回文串题目描述判断一个字符串有多少个长度大于1的对称回文子串。一个字符串为对称回文串当且仅当：该字符串为回文串该字符串只由字母AHIMOTUVWXY组成数据范围：字符串长度不超过100100100解题思路O(n2)O(n^2)O(n2)枚举每
C++中map和set的详解程序员Hagei c++算法开发语言
C++中map和set的介绍与使用在C++编程中，map和set是标准模板库（STL）中两种非常重要的关联容器。它们基于平衡二叉搜索树（通常是红黑树）的数据结构来实现，提供了高效的数据存储和检索功能。本文将详细介绍map和set的特点、用法以及一些常见的操作示例。一、map的介绍与使用1.map的基本概念map是一个键值对容器，其中每个键都是唯一的，且按照升序排序。map的内部结构是红黑树，这使得
堆数据结构：从基础原理到高效算法实现的技术探讨 Everyrt 课程设计
摘要堆作为一种特殊的树形数据结构，在多种算法场景中发挥着核心作用。本文深入剖析堆的基础原理，详细阐述堆的构建、插入、删除等操作的实现细节，并探讨其在优先队列、堆排序等高效算法中的应用，助力读者全面掌握堆数据结构及其应用技术。一、引言堆数据结构以其独特的特性，能够高效地获取集合中的最大（或最小）元素。无论是操作系统中的进程调度，还是搜索算法中的最优解筛选，堆都扮演着不可或缺的角色。理解堆的原理与实现
C语言基础与进阶学习指南（附运行效果图及术语解析）算法练习生 C语言 c语言开发语言
C语言基础与进阶学习指南（附运行效果图及术语解析）目录C语言标准与编译流程CPU与内存基础C语言基础语法数据类型详解变量与内存管理运算符与表达式输入输出函数函数与内存管理指针与内存操作结构体与高级应用1.C语言标准与编译流程1.1C语言标准演进K&RC（1978）：最初由DennisRitchie和BrianKernighan开发，无标准，依赖文档。ANSIC/C89（1989）：首个国际标准，定
Vue相关面试题努力的搬砖人. vue.js
以下是150道Vue相关面试题及详细答案：Vue基础1.Vue.js是什么？Vue.js是一个用于构建用户界面的渐进式JavaScript框架，专注于视图层，允许开发者以声明式的方式构建用户界面，具有轻量、高效、易上手等特点。2.Vue实例的作用是什么？Vue实例是应用程序的核心，它管理数据、方法、生命周期钩子等，通过数据双向绑定将数据与视图层连接起来，实现数据驱动视图。3.如何创建一个Vue实例
STM32八股【2】-----ARM架构 Invinciblenuonuo stm32 arm开发架构
1、架构包含哪几部分内容寄存器处理模式流水线MMU指令集中断FPU总线架构2、以STM32为例进行介绍2.1寄存器寄存器名称作用R0-R3通用寄存器用于数据传递、计算及函数参数传递；R0也用于存储函数返回值。R4-R12通用寄存器用于存储局部变量，减少频繁的内存访问。R13栈指针(SP)指向当前栈顶，负责管理栈操作。分为主栈指针(MSP)和进程栈指针(PSP)：系统中断处理和普通任务可以使用不同的
OpenGL ES 如何渲染 16bit 图像？字节流动 OpenGL ES 3.0 OpenGLES 音视频图形渲染 Android c++
未经作者（微信ID：Byte-Flow）允许，禁止转载文章首发于公众号：字节流动最近有不少读者私信问OpenGLES如何处理16bit图像（P010）？然后我直接贴给他们一段在OpenGL环境下验证过的上传16bit图像数据的代码glTexImage2D(GL_TEXTURE_2D,0,GL_R16UI,width,height,0,GL_RED_INTEGER,GL_UNSIGNED_SHORT
位图思想详解：用一个小小的比特征服整个世界 Joseit 优选算法 java 算法
位图思想详解：用一个小小的比特征服整个世界一、什么是位图？二、位图的形象理解三、位图的Java实现四、位图的算法原理剖析五、实际应用案例：网站用户活跃度统计五、真实的应用场景：布隆过滤器的基础六、算法题：判断字符是否唯一（easy）一、什么是位图？位图是一种超级节省空间的数据结构，他利用二进制位（0/1）来表示某个元素是否存在或某种状态是否为真。想象一下，用一个小小的比特位就能记录一个信息，这简直
给普通人看的深度学习说明书：用快递系统理解AI如何思考嵌入式Jerry Python AI 人工智能深度学习
第一章：理解AI的思维方式（快递版）1.1快递分拣站的故事假设你管理一个快递分拣站：传统方法：手动制定规则（比如根据邮编分拣）机器学习：观察老员工的分拣记录，总结规律深度学习：搭建自动分拣流水线，自主发现隐藏规则1.2神经网络就像智能分拣机传送带（输入层）：接收包裹信息（图片像素/文字等）#就像扫描快递单input_data=[0.2,0.7,0.1]#归一化后的特征数据分拣工人（隐藏层）：每个工
Node.js系列（2）--性能优化指南一进制ᅟᅠ ‌‍‎‏ Node.js node.js 性能优化
Node.js性能优化指南⚡引言Node.js应用的性能优化是确保应用高效运行的关键。本文将深入探讨Node.js性能优化的各个方面，包括内存管理、CPU优化、I/O优化等，帮助开发者构建高性能的Node.js应用。性能优化概述Node.js性能优化主要包括以下方面：内存优化：内存泄漏检测、垃圾回收优化CPU优化：代码执行效率、异步处理、工作线程I/O优化：文件操作、网络请求、数据库访问缓存优化：
简单理解机器学习中top_k、top_p、temperature三个参数的作用无级程序员机器学习人工智能
在机器学习中，top_k、top_p和temperature是用于控制生成模型（如语言模型）输出质量的参数，尤其在文本生成任务中常见。然而，网上文章很多很全，但大多晦涩难懂，今天我们来用最简单的语言谈谈它们的具体作用：1.点菜式筛选法：top_k参数英文全称：top-k中文名称：前k个具体意义：top_k参数就像是你在餐厅点菜时，服务员只给你推荐菜单上前k名的招牌菜。在AI文本生成中，top_k参
Spring Boot 事务详解 Dong雨 spring boot 后端 java
SpringBoot事务详解引言在现代应用程序中，事务管理是确保数据一致性和完整性的重要机制。SpringBoot提供了强大的事务管理功能，使得开发者可以轻松地定义和管理事务。本文将详细介绍SpringBoot中的事务管理，包括事务传播行为、事务属性以及声明式和编程式事务管理。声明式事务管理声明式事务管理是通过注解的方式来管理事务，最常用的注解是@Transactional。这种方式简单直观，适合
查询数据库中第n行数据 weixin_44231698
一般情况下分页的时候是需要的关键字。Oracle中则是rownum，MSSQL中是top关键字，MySQL中是limit关键字。查第n条数据，如：（1）select*from(SELECTROWNUMrn,A.*FROMTABLEA)bwhereb.rn=n;(2)selecttop1*fromTABLEAwhereidnotin(selecttopn-1idfromTABLEA);(3)用mys
STM32八股【3】------RAM和片上FLASH Invinciblenuonuo stm32 嵌入式硬件单片机
1、RAM和FLASH构成1.RAM┌──────────────────────────┐│栈区(Stack)│←从RAM顶端向下扩展（存储局部变量、函数调用信息）│--------------------------││堆区(Heap)│←从.bss段底部向上扩展（动态分配的内存，如malloc）│--------------------------││.bss未初始化数据区│←未初始化的全局
算法及数据结构系列 - 动态规划诺亚凹凸曼算法及数据结构算法数据结构动态规划
系列文章目录算法及数据结构系列-二分查找算法及数据结构系列-BFS算法文章目录框架思路子序列问题解题模板一维dp数组二维dp数组经典题型322.零钱兑换暴力递归带备忘录的暴力递归动态规划300.最长上升子序列1143.最长公共子序列72.编辑距离框架思路动态规划问题的一般形式就是求最值。动态规划其实是运筹学的一种最优化方法，只不过在计算机问题上应用比较多，比如说求最长递增子序列，最小编辑距离等等。
深度剖析哈希表数据结构：原理、冲突解决与优化策略麻辣酸甜笔记
摘要哈希表作为一种高效的数据结构，在计算机科学领域广泛应用。本文深入探讨哈希表的工作原理，详细分析常见的冲突解决方法，如开放地址法、链地址法等，并进一步研究哈希表在不同场景下的优化策略，旨在帮助读者全面理解哈希表数据结构及其应用。一、引言在计算机程序中，快速查找和插入数据是常见需求。哈希表以其平均时间复杂度为O(1)的高效查找和插入特性，成为解决这类问题的有力工具。从数据库索引到编程语言的集合类实
PyTorch数据归一化处理：transforms 2401_87555420 pytorch 人工智能 python
##1.数据归一化处理：transforms.Normalize###1.1理解torchvision*torchvision.transforms：常用的图像预处理方法*torchvision.datasets：常用的数据集Dataset实现*torchvision.models：常用的CV（预训练）模型实现torchvision.transforms:常用的数据预处理方法，提升泛化能力，包括：
ASM系列五利用TreeApi 解析生成Class lijingyao8206 ASM 字节码动态生成 ClassNode TreeAPI
前面CoreApi的介绍部分基本涵盖了ASMCore包下面的主要API及功能，其中还有一部分关于MetaData的解析和生成就不再赘述。这篇开始介绍ASM另一部分主要的Api。TreeApi。这一部分源码是关联的asm-tree-5.0.4的版本。在介绍前，先要知道一点， Tree工程的接口基本可以完
链表树——复合数据结构应用实例 bardo 数据结构树型结构表结构设计链表菜单排序
我们清楚：数据库设计中，表结构设计的好坏，直接影响程序的复杂度。所以，本文就无限级分类（目录）树与链表的复合在表设计中的应用进行探讨。当然，什么是树，什么是链表，这里不作介绍。有兴趣可以去看相关的教材。需求简介：经常遇到这样的需求，我们希望能将保存在数据库中的树结构能够按确定的顺序读出来。比如，多级菜单、组织结构、商品分类。更具体的，我们希望某个二级菜单在这一级别中就是第一个。虽然它是最后
为啥要用位运算代替取模呢 chenchao051 位运算哈希汇编
在hash中查找key的时候，经常会发现用&取代%，先看两段代码吧， JDK6中的HashMap中的indexFor方法： /** * Returns index for hash code h. */ static int indexFor(int h, int length) {
最近的情况麦田的设计者生活感悟计划软考想
今天是2015年4月27号整理一下最近的思绪以及要完成的任务 1、最近在驾校科目二练车，每周四天，练三周。其实做什么都要用心，追求合理的途径解决。为
PHP去掉字符串中最后一个字符的方法 IT独行者 PHP 字符串
今天在PHP项目开发中遇到一个需求，去掉字符串中的最后一个字符原字符串1,2,3,4,5,6, 去掉最后一个字符","，最终结果为1,2,3,4,5,6 代码如下： $str = "1,2,3,4,5,6,"; $newstr = substr($str,0,strlen($str)-1); echo $newstr;
hadoop在linux上单机安装过程 _wy_ linux hadoop
1、安装JDK jdk版本最好是1.6以上，可以使用执行命令java -version查看当前JAVA版本号，如果报命令不存在或版本比较低，则需要安装一个高版本的JDK，并在/etc/profile的文件末尾，根据本机JDK实际的安装位置加上以下几行： export JAVA_HOME=/usr/java/jdk1.7.0_25
JAVA进阶----分布式事务的一种简单处理方法无量多系统交互分布式事务
每个方法都是原子操作：提供第三方服务的系统，要同时提供执行方法和对应的回滚方法 A系统调用B,C,D系统完成分布式事务 =========执行开始======== A.aa(); try { B.bb(); } catch(Exception e) { A.rollbackAa(); } try { C.cc(); } catch(Excep
安墨移动广告：移动DSP厚积薄发引领未来广告业发展命脉矮蛋蛋 hadoop 互联网
　　“谁掌握了强大的DSP技术，谁将引领未来的广告行业发展命脉。”2014年，移动广告行业的热点非移动DSP莫属。各个圈子都在纷纷谈论，认为移动DSP是行业突破点，一时间许多移动广告联盟风起云涌，竞相推出专属移动DSP产品。　　到底什么是移动DSP呢? 　　DSP(Demand-SidePlatform)，就是需求方平台，为解决广告主投放的各种需求，真正实现人群定位的精准广
myelipse设置 alafqq IP
在一个项目的完整的生命周期中，其维护费用，往往是其开发费用的数倍。因此项目的可维护性、可复用性是衡量一个项目好坏的关键。而注释则是可维护性中必不可少的一环。注释模板导入步骤安装方法：打开eclipse/myeclipse 选择 window-->Preferences-->JAVA-->Code-->Code
java数组百合不是茶 java数组
java数组的声明创建初始化； java支持C语言数组中的每个数都有唯一的一个下标一维数组的定义声明： int[] a = new int[3];声明数组中有三个数int[3] int[] a 中有三个数，下标从0开始，可以同过for来遍历数组中的数
javascript读取表单数据 bijian1013 JavaScript
利用javascript读取表单数据，可以利用以下三种方法获取： 1、通过表单ID属性：var a = document.getElementByIdx_x_x("id"); 2、通过表单名称属性：var b = document.getElementsByName("name"); 3、直接通过表单名字获取：var c = form.content.
探索JUnit4扩展：使用Theory bijian1013 java JUnit Theory
理论机制（Theory）一.为什么要引用理论机制（Theory）当今软件开发中，测试驱动开发（TDD — Test-driven development）越发流行。为什么 TDD 会如此流行呢？因为它确实拥有很多优点，它允许开发人员通过简单的例子来指定和表明他们代码的行为意图。 TDD 的优点： &nb
[Spring Data Mongo一]Spring Mongo Template操作MongoDB bit1129 template
什么是Spring Data Mongo Spring Data MongoDB项目对访问MongoDB的Java客户端API进行了封装，这种封装类似于Spring封装Hibernate和JDBC而提供的HibernateTemplate和JDBCTemplate，主要能力包括 1. 封装客户端跟MongoDB的链接管理 2. 文档-对象映射，通过注解:@Document(collectio
【Kafka八】Zookeeper上关于Kafka的配置信息 bit1129 zookeeper
问题： 1. Kafka的哪些信息记录在Zookeeper中 2. Consumer Group消费的每个Partition的Offset信息存放在什么位置 3. Topic的每个Partition存放在哪个Broker上的信息存放在哪里 4. Producer跟Zookeeper究竟有没有关系？没有关系！！！ //consumers、config、brokers、cont
java OOM内存异常的四种类型及异常与解决方案 ronin47 java OOM 内存异常
　OOM异常的四种类型：　　　　　一：　StackOverflowError ：通常因为递归函数引起（死递归，递归太深）。-Xss 128k 一般够用。　二：　out Of memory: PermGen Space：通常是动态类大多，比如web 服务器自动更新部署时引起。-Xmx
java-实现链表反转-递归和非递归实现 bylijinnan java
20120422更新：对链表中部分节点进行反转操作，这些节点相隔k个： 0->1->2->3->4->5->6->7->8->9 k=2 8->1->6->3->4->5->2->7->0->9 注意1 3 5 7 9 位置是不变的。解法：将链表拆成两部分： a.0-&
Netty源码学习-DelimiterBasedFrameDecoder bylijinnan java netty
看DelimiterBasedFrameDecoder的API，有举例：接收到的ChannelBuffer如下： +--------------+ | ABC\nDEF\r\n | +--------------+ 经过DelimiterBasedFrameDecoder(Delimiters.lineDelimiter())之后，得到： +-----+----
linux的一些命令 -查看cc攻击-网口ip统计等 hotsunshine linux
Linux判断CC攻击命令详解 2011年12月23日 ⁄ 安全 ⁄ 暂无评论查看所有80端口的连接数 netstat -nat|grep -i '80'|wc -l 对连接的IP按连接数量进行排序 netstat -ntu | awk '{print $5}' | cut -d: -f1 | sort | uniq -c | sort -n 查看TCP连接状态 n
Spring获取SessionFactory ctrain sessionFactory
String sql = "select sysdate from dual"; WebApplicationContext wac = ContextLoader.getCurrentWebApplicationContext(); String[] names = wac.getBeanDefinitionNames(); for(int i=0; i&
Hive几种导出数据方式 daizj hive 数据导出
Hive几种导出数据方式 1.拷贝文件如果数据文件恰好是用户需要的格式，那么只需要拷贝文件或文件夹就可以。 hadoop fs –cp source_path target_path 2.导出到本地文件系统 --不能使用insert into local directory来导出数据，会报错 --只能使用
编程之美 dcj3sjt126com 编程 PHP 重构
我个人的 PHP 编程经验中，递归调用常常与静态变量使用。静态变量的含义可以参考 PHP 手册。希望下面的代码，会更有利于对递归以及静态变量的理解 header("Content-type: text/plain"); function static_function () { static $i = 0; if ($i++ < 1
Android保存用户名和密码 dcj3sjt126com android
转自：http://www.2cto.com/kf/201401/272336.html 我们不管在开发一个项目或者使用别人的项目，都有用户登录功能，为了让用户的体验效果更好，我们通常会做一个功能，叫做保存用户，这样做的目地就是为了让用户下一次再使用该程序不会重新输入用户名和密码，这里我使用3种方式来存储用户名和密码 1、通过普通的txt文本存储 2、通过properties属性文件进行存
Oracle 复习笔记之同义词 eksliang Oracle 同义词 Oracle synonym
转载请出自出处：http://eksliang.iteye.com/blog/2098861 1.什么是同义词同义词是现有模式对象的一个别名。概念性的东西，什么是模式呢？创建一个用户，就相应的创建了一个模式。模式是指数据库对象，是对用户所创建的数据对象的总称。模式对象包括表、视图、索引、同义词、序列、过
Ajax案例 gongmeitao Ajax jsp
数据库采用Sql Server2005 项目名称为:Ajax_Demo 1.com.demo.conn包 package com.demo.conn; import java.sql.Connection;import java.sql.DriverManager;import java.sql.SQLException; //获取数据库连接的类public class DBConnec
ASP.NET中Request.RawUrl、Request.Url的区别 hvt .net Web C#asp.net hovertree
如果访问的地址是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree%3C&n=myslider#zonemenu那么Request.Url.ToString() 的值是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree<&
SVG 教程（七）SVG 实例，SVG 参考手册天梯梦 svg
SVG 实例在线实例下面的例子是把SVG代码直接嵌入到HTML代码中。谷歌Chrome，火狐，Internet Explorer9，和Safari都支持。注意：下面的例子将不会在Opera运行，即使Opera支持SVG - 它也不支持SVG在HTML代码中直接使用。 SVG 实例 SVG基本形状一个圆矩形不透明矩形一个矩形不透明2 一个带圆角矩
事务管理 luyulong java spring 编程事务
事物管理 spring事物的好处为不同的事物API提供了一致的编程模型支持声明式事务管理提供比大多数事务API更简单更易于使用的编程式事务管理API 整合spring的各种数据访问抽象 TransactionDefinition 定义了事务策略 int getIsolationLevel()得到当前事务的隔离级别 READ_COMMITTED
基础数据结构和算法十一：Red-black binary search tree sunwinner Algorithm Red-black
The insertion algorithm for 2-3 trees just described is not difficult to understand; now, we will see that it is also not difficult to implement. We will consider a simple representation known
centos同步时间 stunizhengjia linux 集群同步时间
做了集群，时间的同步就显得非常必要了。以下是查到的如何做时间同步。在CentOS 5不再区分客户端和服务器，只要配置了NTP，它就会提供NTP服务。 1)确认已经ntp程序包： # yum install ntp 2)配置时间源（默认就行，不需要修改） # vi /etc/ntp.conf server pool.ntp.o
ITeye 9月技术图书有奖试读获奖名单公布 ITeye管理员 ITeye
ITeye携手博文视点举办的9月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 9月试读活动回顾：http://webmaster.iteye.com/blog/2118112本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《NFC：Arduino、Andro

从5大挑战带你了解多模态机器学习

前言

一、多模态表示

联合表示

序列表征

协同表示

小结：

二、多模态转化

基于实例的方法

生成式方法

小结和讨论

三、多模态对齐

显示对齐

隐式对齐

小结

四、多模态融合

模型无关方法

基于模型的方法

图模型

神经网络

小结

五、多模态共同学习

并行数据

非并行数据

小结

你可能感兴趣的:(技术交流,多模态机器学习,机器学习,多模态,异构数据)