wangxiaojie6688

Yu, Y.； Buchanan, S.； Pai, D.； Chu, T.； Wu, Z.； Tong, S.； Haeffele, B.D.； Ma, Y. White-Box Tra 阅读

文献阅读报告

论文题目： Yu, Y.; Buchanan, S.; Pai, D.; Chu, T.; Wu, Z.; Tong, S.; Haeffele, B.D.; Ma, Y. White-Box Transformers via Sparse Rate Reduction. arXiv preprint arXiv:2306.01129 2023.

文献概述

1、解决的问题

提出了一种具有数学上可解释性的White-Box Transformers架构，在数据的压缩和稀疏表示学习的研究中取得了进展；与传统Transformer模型类似，该框架可以通过堆叠多层以实现更好的性能，层数及其他参数设置随应用场景而定；提出的架构可以用于图像，自然语言处理，音频处理等多个领域，本文的实验部分在视觉数据的常用数据集上进行了模型性能评估，得到了近似ViT（Vision Transformer）的性能表现。
有助于弥合深度神经网络理论与实践之间的差距，并有助于统一看似独立的学习和表示数据分布的方法，为随后设计和证明新的、可能更强大的、深度的表示学习架构提供了理论指导。

2、怎么解决的

上面的第一张图即为提出的White-Box Transformer架构，右边为传统的Transformer架构。
从结构上来看，提出的新架构与Transformer相似，但区别在于新架构在设计时便充分考虑了模型的可解释性，所提出架构的各个模块在数学上都是解释的，在对各模块的介绍中在数学上也给出了可解释性。

3、解决的程度

作者详尽的解释了模型各个模块背后的数学原理，并在文章的附录部分进行了充分的补充说明，是一个完全可以在数学上解释的架构，这也是文章的主要关注点。
作者对所提出的新架构进行了充分的消融实验及不同规模大小的模型的表现，如下图：

图五最后一层稀疏度度量的增加是由于额外的线性层用于分类性能。

在论文的实验部分，作者通过实验表明该模型在逐层级别上与其设计目标一致，在视觉领域常用上的数据集上表明该模型取得了与进行精心设计的ViT相似的性能，如下图：

文献详细介绍

1、文章关注的问题的国内外研究现状

研究者/机构

观点

研究成果

Ashish Vaswani

Attention Is All You Need

提出了Transformer,但并没有充分说明模型各个模块的可解释性。在文章的最后作者计划将 Transformer 扩展到涉及文本以外的输入和输出模式的问题上，并且研究局部受限注意力机制，以高效处理大型输入和输出如图像、音频和视频。另一个研究目标是降低生成的顺序性。

1引入了自注意力机制，提出了Transformer模型。

2实现了端到端的训练和推断：通过使用Transformer模型，论文实现了端到端的训练和推断，避免了传统的编码器-解码器框架中的复杂性和信息丢失问题。

3在多个自然语言处理任务中取得了优秀的性能。

Alexey Dosovitskiy

An image is worth 16x16 words: Transformers for image recognition at scale

论文提出了一种使用 Transformer模型进行大规模图像识别的方法，也并未对Transformer的可解释性进行说明。实验表明将Transformer模型应用于图像识别任务是可行的，并且在大规模图像数据集上取得了优秀的性能。这为进一步研究和应用Transformer在计算机视觉领域提供了重要的启示。

1提出了Vision Transformer（ViT）模型。

2在大规模图像数据集上取得了优秀的性能。

3探索了不同的训练策略和模型结构。

Rene Vidal

Self-Expression Is All You Need

本文认为使用稀疏正则化自动选择最相关的系数，是处理大量数据token的一种更具原则性的方法；而不是像criss-cross attention（2019）那样将注意力限制在任意的局部近邻。

本文证明了，注意力建立在流形学习和图像处理的长期历史上，包括基于核的回归、非局部均值、局部线性嵌入、子空间聚类和稀疏编码等方法。特别是，本文表明，注意力背后的许多关键思想，例如它捕捉全局远程交互的能力（这些互动是可学习的和适应输入的），已经出现在其它文献中。

Hongkang Li

A Theoretical Understanding of shallow Vision Transformers: Learning, Generalization, and Sample Complexity

它探讨了浅层视觉 Transformer 模型的学习、泛化和样本复杂度的理论理解。

1理论分析浅层视觉Transformer模型的学习能力.

2研究浅层视觉Transformer模型的泛化能力.

3分析浅层视觉Transformer模型的样本复杂度.

Bradley Efron

Tweedie’s Formula and Selection Bias

该论文主要探讨了在统计学中的最优去噪问题，即如何通过去除噪声来获得最准确的估计结果。

作者引入了 Tweedie 公式，这是一种用于估计参数的数学公式，可以在去噪过程中考虑到选择偏差的影响。该论文通过使用 Tweedie 公式来解决选择偏差问题，并提出了一种基于 Tweedie 公式的最优去噪估计方法。通过考虑选择偏差，该方法可以更准确地估计参数，并提高去噪结果的质量。

Yang Song

Consistency models

Consistency Models 作为一种生成模型，核心设计思想是支持 single-step 生成，同时仍然允许迭代生成，支持零样本（zero-shot）数据编辑，权衡了样本质量与计算量。没有在初始特征和数据样本之间建立任何明确的对应关系

1一致性模型的分类和定义：研究者们对一致性模型进行了分类和定义，例如强一致性、弱一致性、最终一致性等。

2一致性模型的性质和特点：研究者们研究了不同一致性模型的性质和特点，例如可线性化、可序列化、可并发等。

3一致性模型的实现和优化：研究者们提出了各种算法和技术来实现和优化一致性模型，例如分布式事务、副本控制、协议设计等。

Bruno A Olshausen and David J Field

Sparse coding with an overcomplete basis set: A strategy employed by V1

这篇论文主要讨论了V1区域（视觉皮层的一个区域）中的稀疏编码策略。论文指出，V1区域的神经元对于视觉输入的编码采用了一种稀疏编码策略，作者提出了一种基于过完备基函数集的稀疏编码方法。论文还讨论了V1区域中稀疏编码的优势和应用。稀疏编码可以提高对输入信号的表示能力和鲁棒性，并且可以适应不同的视觉任务和环境条件。

1提出了稀疏编码的概念：论文提出了稀疏编码的概念，即通过使用过完备基函数集合来表示输入信号，并通过最小化表示中的非零系数的数量来实现信号的稀疏表示。

2探索了V1区域的稀疏编码策略：论文研究了V1区域中神经元的响应特性，并发现V1神经元的响应可以通过稀疏编码的方式来解释。具体而言，V1神经元的响应可以通过选择适当的过完备基函数集合来实现信号的稀疏表示。

3分析了稀疏编码的优势：论文分析了稀疏编码的优势，包括对信号的冗余表示、鲁棒性和泛化能力等方面的优势。这些优势使得稀疏编码成为V1区域中的一种有效的信息处理策略。

René Vidal

Generalized Principal Component Analysis

在这篇论文中，作者介绍了广义主成分分析（GPCA）作为对传统PCA的扩展。GPCA方法通过引入非线性变换和噪声模型，可以更好地处理非线性数据和噪声数据，并提取出更具有判别性的特征。论文详细介绍了GPCA的数学原理和算法，并提供了实验结果和应用案例。它展示了GPCA在图像处理、模式识别、信号处理等领域的应用，并与传统PCA方法进行了比较和分析。

1算法开发：研究者们提出了不同的GPCA算法，用于处理不同类型的数据。这些算法包括基于最大似然估计的GPCA、基于核方法的GPCA、基于稀疏表示的GPCA等。这些算法通过引入新的数学模型和优化方法，提高了GPCA的性能和效率。

2理论分析：研究者们对GPCA的理论进行了深入分析，探讨了其在数据降维和特征提取中的优势和限制。他们研究了GPCA的收敛性、稳定性和鲁棒性等方面的性质，为进一步改进和应用GPCA提供了理论指导。

3应用领域：GPCA在多个领域得到了广泛应用，包括计算机视觉、模式识别、信号处理等。研究者们将GPCA应用于图像处理、人脸识别、运动分析等问题，取得了一系列有价值的研究成果。

Daniel A Spielman

Exact Recovery of Sparsely-Used Dictionaries

这篇论文主要讨论了在稀疏表示学习中，如何实现对稀疏字典的精确恢复。在这篇论文中，作者研究了在给定稀疏字典和一组稀疏表示的情况下，如何准确地恢复原始信号。具体而言，他们研究了在什么条件下，可以通过最小化稀疏表示的L0范数来实现对原始信号的精确恢复。论文提出了一种条件，称为稀疏恢复条件，该条件描述了在给定稀疏字典和稀疏表示的情况下，能够精确恢复原始信号的充分条件。作者还提出了一种算法，称为OMP（Orthogonal Matching Pursuit），用于实现稀疏恢复。

1. 提出了稀疏表示的问题：论文首先提出了稀疏表示的问题，即如何使用尽可能少的非零系数来表示信号。稀疏表示在信号处理、图像处理和机器学习等领域具有广泛的应用。

2. 探索了稀疏字典的恢复问题：论文研究了在已知稀疏字典的情况下，如何准确恢复使用该字典的信号。具体而言，论文提出了一些算法和理论分析，用于确保恢复过程的准确性和稳定性。

3. 分析了恢复条件和限制：论文分析了恢复稀疏字典的条件和限制。它研究了字典的稀疏性、信号的稀疏度和噪声水平等因素对恢复过程的影响，并提出了一些理论结果和算法改进来解决这些问题。

Rémi Gribonval

Sparse and spurious: dictionary learning with noise and outliers

这篇论文主要讨论了在字典学习中处理噪声和异常值的问题。在这篇论文中，作者研究了在存在噪声和异常值的情况下，如何进行字典学习。他们提出了一种鲁棒的字典学习方法，旨在通过考虑噪声和异常值的影响，提高字典学习的鲁棒性和准确性。论文中介绍了一种基于稀疏表示和鲁棒统计估计的字典学习算法。该算法通过最小化稀疏表示的重构误差，并结合鲁棒统计估计方法，可以有效地处理噪声和异常值，从而提高字典学习的性能。

1. 提出了噪声和异常值对字典学习的影响：论文研究了在字典学习过程中，噪声和异常值对稀疏表示的影响。它探讨了噪声和异常值如何干扰字典学习的过程，导致生成的字典和稀疏表示出现偏差和错误。

2. 开发了鲁棒字典学习算法：为了应对噪声和异常值的影响，论文提出了一些鲁棒字典学习算法。这些算法通过引入稀疏正则化、鲁棒损失函数或异常值检测等技术，提高了字典学习的鲁棒性和稳定性。

3. 分析了算法的性能和限制：论文对鲁棒字典学习算法的性能和限制进行了分析。它研究了算法在不同噪声和异常值条件下的恢复能力和稳定性，并提出了一些改进策略和理论结果来解决这些问题。

Yuexiang Zhai

Complete dictionary learning via l 4-norm maximization over the orthogonal group

这篇论文主要讨论了通过在正交群上最大化l4范数来实现完整字典学习的方法。字典学习是一种表示学习方法，旨在通过学习一组基向量（字典），以稀疏线性组合的方式来表示输入信号。传统的字典学习方法通常使用l1或l2范数来约束字典的稀疏性，但这些范数可能无法捕捉到字典中的高阶统计特性。在这篇论文中，作者提出了一种新的字典学习方法，通过在正交群上最大化l4范数来实现完整字典学习。正交群是一组正交矩阵的集合，它可以表示字典的旋转和变换。通过最大化l4范数，可以促使字典的基向量具有更高的阶数，从而更好地捕捉输入信号的高阶统计特性。

1. 提出了基于正交群的字典学习方法：论文提出了一种基于正交群的字典学习方法，通过在正交群上最大化L4范数来学习完备的字典。这种方法可以有效地提取信号的稀疏表示，并具有较好的鲁棒性和泛化能力。

2. 分析了字典学习的优化问题：论文对字典学习的优化问题进行了深入分析，研究了在正交群上最大化L4范数的优化算法和理论性质。它探讨了算法的收敛性、稳定性和复杂性等方面的问题，并提出了一些改进策略和理论结果。

3. 验证了方法的有效性：论文通过在信号处理和图像处理等领域的实验验证了该方法的有效性。实验结果表明，基于正交群的字典学习方法在信号重构、图像压缩和模式识别等任务中取得了较好的性能。

Yaodong Yu

Learning Diverse and Discriminative Representations via the Principle of Maximal Coding Rate Reduction 46

这篇论文讨论了通过最大编码速率减少原则来学习表示的方法。论文提出了一种学习多样且有区分度的表示的框架。它引入了最大编码速率减少原则，旨在找到在最小化编码速率的同时最大化信息内容的表示。论文提出了一种结合自监督学习和信息论的方法来实现多样且有区分度的表示。它利用交互信息的概念来衡量表示不同部分之间共享的信息量。通过最大化交互信息同时最小化编码速率，该方法旨在学习既具有信息量又高效的表示。

1. 提出了最大编码率减少原则：论文提出了最大编码率减少原则，该原则旨在学习多样化和有区分性的表示。通过最大化表示的编码率减少，可以使得不同类别的样本在表示空间中更加分散和可区分。

2. 开发了相应的学习算法：论文开发了相应的学习算法来实现最大编码率减少原则。这些算法通过优化目标函数，使得表示的编码率减少最大化，并且能够学习到多样化和有区分性的表示。

3. 验证了方法的有效性：论文通过在图像分类、目标检测等任务上的实验验证了该方法的有效性。实验结果表明，基于最大编码率减少原则的学习方法能够获得更好的分类性能和目标检测准确率。

Yi Ma

Segmentation of multivariate mixed data via lossy data coding and compression 6

这篇论文讨论了一种通过损失数据编码和压缩的方法来进行多变量混合数据的分割。论文的目标是解决多变量混合数据分割的问题，其中数据包含多个不同类型的变量，如数值型、分类型和文本型数据。传统的分割方法往往难以处理这种混合数据，因为不同类型的变量具有不同的特征和分布。该论文提出了一种基于损失数据编码和压缩的分割方法。该方法首先将多变量混合数据进行编码和压缩，以减少数据的维度和冗余信息。然后，利用编码后的数据进行分割，通过对编码数据进行聚类或分类来识别不同的数据子集。通过损失数据编码和压缩，该方法可以在保留关键信息的同时减少数据的维度，从而提高分割的效果。此外，该方法还可以处理不同类型的变量，并充分利用它们之间的关联性。

1. 提出了基于有损数据编码和压缩的分割方法：论文提出了一种基于有损数据编码和压缩的分割方法，用于处理多变量混合数据。该方法通过对数据进行编码和压缩，从中提取出关键特征，然后利用这些特征进行数据分割。

2. 开发了相应的算法和模型：论文开发了相应的算法和模型来实现基于有损数据编码和压缩的分割方法。这些算法和模型可以根据数据的特点和需求进行定制，以实现更准确和高效的分割结果。

3. 验证了方法的有效性：论文通过在实际数据集上的实验验证了该方法的有效性。实验结果表明，基于有损数据编码和压缩的分割方法能够在多变量混合数据的分割任务中取得较好的性能，具有较高的准确度和鲁棒性。

Kwan Ho Ryan Chan

ReduNet: A White-box Deep Network from the Principle of Maximizing Rate Reduction

这篇论文讨论了ReduNet框架，它是一种基于最大化速率减少原则的白盒深度网络架构。论文介绍了速率减少的概念，它指的是减少表示数据所需的信息量的过程。最大化速率减少原则旨在找到一种最优表示，既能最小化所需的信息量，又能保留关键信息。ReduNet框架旨在通过将速率减少作为指导原则来实现这一目标。它由多个层组成，每个层执行特定的操作来压缩和稀疏化数据表示。该框架利用梯度下降和迭代优化等技术，通过迭代改进表示并最大化速率减少。

1. 提出了最大化率减少原则：论文提出了最大化率减少原则，该原则旨在构建白盒深度网络。通过最大化输入和隐藏层之间的信息率减少，可以使得网络的表示更加紧凑和有区分性。

2. 构建了ReduNet网络结构：论文基于最大化率减少原则构建了ReduNet网络结构。该网络结构具有一定的灵活性，可以根据任务的需求进行定制，同时保持了较好的可解释性和可解读性。

3. 验证了方法的有效性：论文通过在多个数据集上的实验验证了ReduNet的有效性。实验结果表明，ReduNet在图像分类、目标检测等任务中取得了与其他深度网络相媲美甚至更好的性能。

John Wright and Yi Ma

High-Dimensional Data Analysis with Low-Dimensional Models: Principles, Computation, and Applications

书中介绍了高维数据分析面临的挑战，包括维度灾难、过拟合、计算复杂度等问题。高维数据的特点使得传统的分析方法不再适用，因此需要引入低维模型来进行数据分析。

详细介绍了各种低维模型的原理，包括主成分分析（PCA）、流形学习、稀疏表示等。这些低维模型可以将高维数据映射到低维空间，并保留数据的重要特征。

讨论了低维模型的计算方法，包括降维算法、优化算法等。这些方法可以有效地计算低维模型，并处理大规模高维数据。

书中还介绍了低维模型在各个领域的应用，包括图像处理、文本分析、生物信息学等。通过使用低维模型，可以提取数据的关键特征，并实现数据的可视化、分类、聚类等任务。

2、本文章提出方法的主要思想

方法概述:

上图介绍了CRATE白盒深度网络设计的“主循环”，新架构中的 Zℓ（Z0=X ）可为任意类型的数据，对于语言转换器，token大致对应单词，而对于视觉转换器，token大致对应图像块。本文以图像为例，CRATE构建了一个深度网络，该网络通过对分布的局部模型进行连续压缩(生成Z ℓ+1/2)和对全局字典进行稀疏化(生成Z ℓ +1)，将数据转换为低维子空间的规范配置。反复堆叠这些块，并通过反向传播训练模型参数，产生强大且可解释的数据表示。

新架构中各块所对应的数学方程已在下图中进行补充。其中U[K]为所有高斯基的集合。D∈R d×d是一个(完全)非相干或正交字典，字典D是全局的，即用于同时稀疏所有令牌。

提出的模型架构与对应的数学方法

在新架构中与Transform对应的Q，K，V 由Uk*表示。

新架构的目标函数如下图所示：

算法

实验
1. 数据集

1.ImageNer 2.ImageNet Real 3.CIPARIO 4.CIFARI0O 5.Oxford Flowers-102 6.Oxford-IIT Pets

本文用到了六个数据集，进行图像分类任务。

1. 实验设置

1. 实验结果与分析

结论

本文提出了一个新的理论框架，该框架允许我们推导出深度变压器式网络架构作为增量优化方案，以学习输入数据(或令牌集)的压缩和稀疏表示。如此推导和学习的深度架构不仅在数学上完全可解释，而且在逐层的级别上与其设计目标一致。尽管可以说是所有可能的设计中最简单的，但这些网络已经在大规模的现实世界数据集和接近经验丰富的变压器的任务上展示了性能。我们相信这项工作确实有助于弥合深度神经网络理论与实践之间的差距，并有助于统一看似独立的学习和表示数据分布的方法。也许对从业者来说更重要的是，我们的框架为设计和证明新的、可能更强大的、深度的表示学习架构提供了理论指导。

蛋白质结构预测/功能注释/交互识别/按需设计，中国海洋大学张树刚团队直击蛋白质智能计算核心任务 hyperai
蛋白质作为生命活动的主要承担者，在人体生理功能中扮演关键角色。然而传统研究面临结构解析成本高昂、功能注释严重滞后、新型蛋白质设计效率低下等挑战。近年来，生命科学对蛋白质复杂特性解析的需求日益迫切，大数据、深度学习、多模态计算等技术的突破性发展，为构建蛋白质智能计算体系提供了全新的发展契机。蛋白质智能计算体系的构建，使得蛋白质在大规模功能注释、交互预测及三维结构建模等领域取得显著成果，为药物发现与生
【心灵鸡汤】深度学习技能形成树：从零基础到AI专家的成长路径全解析智算菩萨人工智能深度学习
引言：技能树的生长哲学在这个人工智能浪潮汹涌的时代，深度学习犹如一棵参天大树，其根系深深扎入数学与计算科学的沃土，主干挺拔地承载着机器学习的核心理念，而枝叶则繁茂地延伸至计算机视觉、自然语言处理、强化学习等各个应用领域。对于初入此领域的新手而言，理解这棵技能树的生长规律，掌握其形成过程中的关键节点和发展阶段，将直接决定其在人工智能道路上能够走多远、攀多高。技能树的概念源于游戏设计，但在学习深度学习
【TVM 教程】如何处理 TVM 报错
ApacheTVM是一个深度的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/运行TVM时，可能会遇到如下报错：---------------------------------------------------------------AnerroroccurredduringtheexecutionofTVM.F
多模态大模型的技术应用与未来展望：重构AI交互范式的新引擎 zhaoyi_he 重构人工智能
一、引言：为什么多模态是AI发展的下一场革命？过去十年，深度学习推动了计算机视觉和自然语言处理的飞跃，但两者的发展路径长期割裂。随着生成式AI和大模型时代的到来，**多模态大模型（MultimodalFoundationModels）**以统一的建模方式处理图像、文本、音频、视频等多源数据，重塑了“感知-认知-决策”链条，为AGI迈出关键一步。OpenAI的GPT-4o、Google的Gemini
【机器学习&深度学习】多分类评估策略一叶千舟深度学习【理论】深度学习【应用必备常识】大数据人工智能
目录前言一、多分类3大策略✅宏平均（MacroAverage）✅加权平均（WeightedAverage）✅微平均（MicroAverage）二、类比理解2.1宏平均（MacroAverage）2.1.1计算方式2.1.2适合场景2.1.3宏平均不适用的场景2.1.4宏平均一般用在哪些指标上？2.1.5怎么看macroavg指标？2.1.6宏平均值低说明了什么？2.1.7从宏平均指标中定位模型短板
大语言模型应用指南：ReAct 框架 AI大模型应用实战 java python javascript kotlin golang 架构人工智能
大语言模型应用指南：ReAct框架关键词：大语言模型,ReAct框架,自然语言处理(NLP),模型融合,多模态学习,深度学习,深度学习框架1.背景介绍1.1问题由来近年来，深度学习技术在自然语言处理(NLP)领域取得了显著进展。尤其是大语言模型(LargeLanguageModels,LLMs)，如BERT、GPT系列等，通过在大规模无标签数据上进行预训练，获得了强大的语言理解和生成能力。然而，预
大语言模型原理基础与前沿基于语言反馈进行微调 AI天才研究院计算 AI大模型企业级应用开发实战 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大语言模型原理基础与前沿基于语言反馈进行微调作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着深度学习技术的飞速发展，自然语言处理（NLP）领域取得了显著的进展。大语言模型（LargeLanguageModels，LLMs）如GPT-3、BERT等在各项NLP任务上取得了令人瞩目的成绩。然而，如何进一步提高大语言模型的理
探索AI人工智能医疗NLP实体识别系统的架构设计 AI学长带你学AI 人工智能自然语言处理 easyui ai
探索AI人工智能医疗NLP实体识别系统的架构设计关键词：人工智能、医疗NLP、实体识别、系统架构、深度学习、自然语言处理、医疗信息化摘要：本文将深入探讨医疗领域NLP实体识别系统的架构设计。我们将从基础概念出发，逐步解析医疗文本处理的特殊性，详细介绍实体识别技术的核心原理，并通过实际案例展示如何构建一个高效可靠的医疗实体识别系统。文章还将探讨当前技术面临的挑战和未来发展方向，为医疗AI领域的从业者
人工智能动画展示人类的特征 AGI大模型与大数据研究院 AI大模型应用开发实战 java python javascript kotlin golang 架构人工智能
人工智能，动画，人类特征，情感识别，行为模拟，机器学习，深度学习，自然语言处理1.背景介绍人工智能（AI）技术近年来发展迅速，已渗透到生活的方方面面。从智能语音助手到自动驾驶汽车，AI正在改变着我们的世界。然而，尽管AI技术取得了令人瞩目的成就，但它仍然难以完全模拟人类的复杂行为和特征。人类的特征是多方面的，包括情感、认知、社交和创造力等。这些特征是人类区别于其他生物的重要标志，也是人类社会文明发
深度学习篇---简单果实分类网络
下面我将提供一个使用Python从零实现果实分类模型的完整流程，包括数据准备、模型构建、训练和部署，不依赖任何深度学习框架，仅使用NumPy进行数值计算。1.数据准备与预处理首先需要准备果实图像数据集，将其分为好果和坏果两类，并进行预处理：importosimportnumpyasnpfromPILimportImagefromsklearn.model_selectionimporttrain_
Python深度学习：3步实现AI人脸识别，效果堪比专业软件！小筱在线 python 人工智能 python 深度学习
引言：AI人脸识别的时代已经到来在当今数字化时代，人脸识别技术已经从科幻电影走进了我们的日常生活。从手机解锁到机场安检，从银行身份验证到智能门禁系统，这项技术正以前所未有的速度改变着我们的生活方式。而令人振奋的是，借助Python和深度学习技术，普通人也能构建出专业级的人脸识别系统。本文将带领您通过三个关键步骤，使用Python深度学习技术实现一个准确率高达99%的人脸识别系统。这个系统不仅原理简
【推荐算法课程二】推荐算法介绍-深度学习算法盒子6910 运维视角下的广告业务算法推荐算法深度学习运维开发运维人工智能
三、深度学习在推荐系统中的应用3.1深度学习推荐模型的演化关系图3.2AutoRec——单隐层神经网络推荐模型3.2.1AutoRec模型的基本原理AutoRec模型是一个标准的自编码器，它的基本原理是利用协同过滤中的共现矩阵，完成物品向量或者用户向量的自编码。再利用自编码的结果得到用户对物品的预估评分，进而进行推荐排序。什么是自编码器？自编码器是指能够完成数据“自编码”的模型。无论是图像、音频，
【AI智能推荐系统】第二篇：深度学习在推荐系统中的架构设计与优化实践 DeepFaye 人工智能深度学习
第二篇：深度学习在推荐系统中的架构设计与优化实践提示语：“从Wide&Deep到Transformer，深度推荐模型如何突破性能瓶颈？本文将揭秘Netflix、淘宝都在用的深度学习推荐架构，手把手教你设计高精度推荐系统！”目录深度学习推荐系统的核心优势主流深度学习推荐架构解析2.1Wide&Deep模型2.2DeepFM与xDeepFM2.3神经协同过滤(NCF)2.4基于Transformer的
【深度学习】神经网络剪枝方法的分类烟锁池塘柳0 机器学习与深度学习深度学习神经网络剪枝
神经网络剪枝方法的分类摘要随着深度学习模型，特别是大语言模型（LLM）的参数量爆炸式增长，模型的部署和推理成本变得异常高昂。如何在保持模型性能的同时，降低其计算和存储需求，成为了工业界和学术界的核心议题。神经网络剪枝（Pruning）作为模型压缩的关键技术之一，应运而生。本文将解析剪枝技术的不同分类，深入探讨其原理、优缺点。文章目录神经网络剪枝方法的分类摘要1为什么我们需要剪枝？2分类方法一：剪什
Python 图像分类入门超龄超能程序猿机器学习 python 分类开发语言
一、介绍图像分类作为深度学习的基础任务，旨在将输入图像划分到预定义的类别集合中。在实际的业务中，图像分类技术是比较常用的一种技术技能。例如，在安防监控中，可通过图像分类识别异常行为；在智能交通系统中，实现对交通标志和车辆类型的快速识别等。本文将通过安装包已有数据带你逐步了解使用Python进行图像分类的全过程。二、环境搭建在开始图像分类项目前，需要确保Python环境中安装了必要的库。主要包括：T
初始CNN(卷积神经网络) 超龄超能程序猿机器学习 cnn 人工智能神经网络
卷积神经网络（ConvolutionalNeuralNetwork，简称CNN）作为深度学习的重要分支，在图像识别、目标检测、语义分割等领域大放异彩。无论是手机上的人脸识别解锁，还是自动驾驶汽车对道路和行人的识别，背后都离不开CNN的强大能力一、CNN诞生的背景与意义在CNN出现之前，传统的图像识别方法主要依赖人工提取特征，例如使用SIFT（尺度不变特征变换）、HOG（方向梯度直方图）等算法。这些
深度学习实验：GPU加速，突破性能瓶颈 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
深度学习实验：GPU加速，突破性能瓶颈1.背景介绍随着深度学习模型变得越来越复杂和庞大，传统的CPU已经无法满足训练和推理的计算需求。GPU凭借其强大的并行计算能力和专门为矩阵运算优化的架构，成为了深度学习领域的核心加速器。本文将探讨如何利用GPU加速深度学习实验,突破性能瓶颈,提高模型训练和推理的效率。2.核心概念与联系2.1GPU架构GPU(图形处理器)最初是为了加速图形渲染而设计的,但由于其
深度学习相关指标工作笔记 Victor Zhong AI 框架深度学习笔记人工智能
这里写目录标题检测指标iou/Ｇou/Ｄiou/ＣiouMSE(MeanSquaredError)(均方误差)(回归问题)交叉熵损失函数(CrossEntropyErrorFunction)(分类问题)检测指标iou/Ｇou/Ｄiou/ＣiouIntersectionoverUnion(IoU)是目标检测里一种重要的评价值交并比令人遗憾的是IoU无法优化无重叠的bboxes如果用IoU作为loss
【深度学习新浪潮】基于扩散模型的图像编辑加速方法小米玄戒Andrew 深度学习新浪潮深度学习人工智能扩散模型 Transformer DiT 图像编辑模型加速
在基于扩散模型的图像编辑任务中，实现高质量与高效加速的平衡需要综合运用模型架构优化、采样策略创新、条件控制增强及硬件加速等多维度技术。一、一步反演与掩码引导的编辑框架通过一步反演框架将输入图像映射到可编辑的潜在空间，结合掩码引导的注意力重缩放机制，实现文本引导的局部编辑。例如，SwiftEdit通过一步反演和注意力重缩放，将编辑时间压缩至0.23秒，比传统多步方法快50倍。具体步骤包括：一步反演：
《从Backprop到Diffusion：深度学习的算法进化树全景图》 HeartException 学习人工智能
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站《从Backprop到Diffusion：深度学习的算法进化树全景图》**展开系统性解析。全文基于算法原理-技术突破-产业重塑的三层逻辑链，融合2025年最新研究成果与产业数据，呈现深度学习四十年的底层技术迁徙路径从Backprop到Diffusion：深度学习的算法进化树全景图副标题：一部算法
多模态大模型：技术原理与实战看清GPT的进化史和创新点 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
多模态大模型：技术原理与实战看清GPT的进化史和创新点1.背景介绍1.1人工智能的发展历程1.1.1早期人工智能1.1.2机器学习时代1.1.3深度学习的崛起1.2自然语言处理的演进1.2.1基于规则的方法1.2.2统计机器学习方法1.2.3深度学习方法1.3大语言模型的出现1.3.1Transformer架构的提出1.3.2GPT系列模型的发展1.3.3多模态大模型的兴起2.核心概念与联系2.1
结合创新idea：机器学习+运筹优化=CCF高端局 Ai多利机器学习人工智能
2024深度学习发论文&模型涨点之——机器学习+运筹优化机器学习是人工智能的一个分支，它使计算机系统能够从数据中学习并改进其性能，而无需进行明确的编程。运筹优化，也称为运筹学或运营管理，是应用数学的一个分支，它使用数学模型和算法来支持复杂决策过程的制定。机器学习与运筹优化的结合是一个前沿且活跃的研究领域，它们相互补充，为解决复杂问题提供了新的思路和方法。小编整理了一些机器学习+运筹优化【论文+代码
JuPyter(IPython) Notebooks中使用pip安装Python的模块 weixin_34218890 开发工具 python 人工智能
问题描述：没有带GPU的电脑，搞深度学习不是耍流氓嘛，我网上看到有个云平台，免费使用了一下，小姐姐很热情。使用过程如下：他们给的接口是Jupyter编辑平台，我就在上面跑了一个小例子。tensorflow和python环境是他们配置好的，不过我的例子中需要导入matplotlib.pylot模块。可是他们没有提供，怎么办呢？网上查了一下啊解决方法：采用如下方法：importpipdefMyPipi
happy-llm 第一章 NLP 基础概念 weixin_38374194 自然语言处理人工智能学习
文章目录一、什么是NLP？二、NLP发展三大阶段三、NLP核心任务精要四、文本表示演进史1.传统方法：统计表征2.神经网络：语义向量化课程地址：happy-llmNLP基础概念一、什么是NLP？核心目标：让计算机理解、生成、处理人类语言，实现人机自然交互。现状与挑战：成就：深度学习推动文本分类、翻译等任务达到近人类水平。瓶颈：歧义性、隐喻理解、跨文化差异等。二、NLP发展三大阶段时期代表技术核心思
供应链风险管理：AI预测潜在风险 AI智能应用 AI大模型应用入门实战与进阶 java python javascript kotlin golang 架构人工智能
供应链风险管理,AI预测,机器学习,深度学习,自然语言处理,风险评估,供应链可视化1.背景介绍在当今全球化经济体系中，供应链的复杂性和脆弱性日益凸显。供应链风险是指任何可能对供应链正常运行造成负面影响的事件或因素。这些风险可能来自自然灾害、政治动荡、经济波动、技术故障、供应商违约等方面。一旦供应链风险爆发，可能会导致生产中断、产品短缺、成本飙升、品牌形象受损等严重后果。传统供应链风险管理方法主要依
供应链风险管理：AI如何预测供应链风险 AI大模型应用之禅 java python javascript kotlin golang 架构人工智能
供应链风险管理,AI预测,机器学习,深度学习,自然语言处理,时间序列分析,风险评估1.背景介绍在当今全球化经济体系中，供应链风险已成为企业面临的重大挑战。供应链的复杂性和不可预测性使得企业更容易受到各种风险的影响，例如自然灾害、政治动荡、经济波动、疫情爆发等。这些风险可能导致供应中断、成本增加、交付延迟，甚至损害企业声誉。传统供应链风险管理方法主要依赖于经验和专家判断，缺乏数据驱动和预测能力。随着
【极光优化算法+分解对比】VMD-PLO-Transformer-LSTM多变量时间序列光伏功率预测Matlab代码 matlab科研助手算法 transformer lstm
✅作者简介：热爱数据处理、建模、算法设计的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击：Matlab科研工作室个人信条：格物致知。内容介绍光伏发电作为一种清洁能源，其功率预测对于电网稳定运行和电力系统调度至关重要。然而，光伏功率具有高度的非线性和波动性，传统的预测方法难以准确捕捉其动态特性。近年来，深度学习技术在时间序列预测领域取得了显著进展，为提高光伏功率预测精度提供了新的途径
【python深度学习】DAY 51 复习日抽风的雨610 【打卡】Python训练营 python 深度学习开发语言
作业：day43的时候我们安排大家对自己找的数据集用简单cnn训练，现在可以尝试下借助这几天的知识来实现精度的进一步提高1.读取数据使用CIFAR-10图像数据importtorchfromtorchvisionimportdatasets,transforms#数据预处理transform=transforms.Compose([transforms.ToTensor(),transforms.
用Python解锁图像处理之力：从基础到智能应用的深度探索熊猫钓鱼>_> python 图像处理开发语言
在像素构成的数字世界里，Python已成为解码图像奥秘的核心引擎。一、为何选择Python处理图像？超越工具的本质思考当人们谈论图像处理时，往往会陷入工具对比的漩涡（PythonvsMATLABvsC++）。但Python的真正价值在于其构建的完整生态闭环：科学计算基石：NumPy的ndarray结构完美对应图像的多维矩阵本质算法实现自由：从传统算子到深度学习模型的无缝衔接可视化即战力：Matpl
深度学习数据集加载 Ethan@LM 深度学习人工智能
数据集结构E:\Mytest\test20250622\pythonProject\dataset├──rose│├──rose1.jpg│├──rose2.jpg│└──...└──sunflower├──sunflower1.jpg├──sunflower2.jpg└──...主要只有的两个类fromtorch.utils.dataimportDatasetfromtorchvisionimp
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>