Ddddnk

【无标题】

文献阅读笔记 Aligning Domain-Specific Distribution and Classifier for Cross-Domain Classification from Multiple Sources

摘要

无监督域适应算法（仅在源域存在有标签数据）近年来被学者们进行了广泛的研究，很多算法以及理论结果聚焦于单源域的无监督域适应（Single-domain Unsupervised Domain Adaptation, SUDA)。然而，在实际的场景中，通常可以从不同的源头中获得有标签的数据，这些数据不仅不同于目标域数据，而且各自之间也并不相同。因此，来自不同来源的域适应器可以用相同的方式进行建模。近来，基于深度学习的多源域无监督域适应（Multi-source Unsupervised Domain Adaptation,MUDA）的算法通过在特征空间联合所有的源域和目标域组合的方法，聚焦于提取所有域的域不变表示。然而，在MUDA中，对所有的域提取相同的域不变表示存在一定困难。此外，这些方法在进行分布匹配时没有考虑到每个域中的不同类之间的决策边界。为了解决这种问题，我们提出了一个包含两种联合阶段的MUDA的全新的网络结构，这种结构不仅仅单独地对多个特定的特征空间中不同的源域和目标域组合进行了联合，同时也利用域特定的决策边界来联合分类器的输出。通过广泛的实验，我们证明了所提出的方法可以在流行的图像分类基准数据集上获得显著的效果

引言

近来，深度学习领域的发展在一系列的视觉学习任务中显著提升了前沿的方法的表现。这些成果大多来自于监督学习中的大量可利用的有标签数据，对于一个缺少有标签数据的任务来说，利用相关源域上的丰富有标签数据来建立一个高效的learner是目前较强的趋势。然而，由于域迁移的存在，学习到的模型的标签在目标域上可能会大幅降低。
在训练和测试数据的分布中存在域迁移的情况下，学习判别模型的过程称为域适应。近年来，大部分的域适应算法都聚焦于单源域适应问题（SUDA），其中仅在单一的源域上存在有标签数据。所提出的SUDA方法包括重新对训练数据赋予权重，然后在一个低维的流形中发现可以将源域和目标域子空间拉近的方法。近年来，大部分的SUDA算法通过最小化域分布差异的方法学习如何将两个域进行匹配，并且源域的分类器可以随后直接应用到目标域的样本中。
然后，实际上，很大可能上我们具有多个源域。于是，MUDA方法不仅在实际中更可行，而且在提升表现方面也更有价值。因此，MUDA的方法在实际上的应用领域获得了大量的关注。将所有的源域组合仅一个单独的源域，并且使用类似SUDA的方法将分布联合是一种通用的、直接的方法。基于数据扩展，这种方法可能会提升表现，然而，这种提升的空间可能斌不大，因此，发现一个更好地利用多源域数据的方法很有必要。
尽管基于深度学习的SUDA方法获得了快速的发展，目前也有一部分学者研究基于深度学习的MUDA方法，这中方法更具挑战性。近年来，使用深度学习方法进行MUDA的研究已经被提出，这些方法中都存在两个类似的问题。首先，他们尝试将所有的源域和目标域数据映射到一个通用的特征空间中，进而通用的域不变特征。然而，即使在单源域和单目标域的情况下，学习域不变特征也不容易。图1中给出了直观的例子，我们无法移除单源域和单目标域之间的迁移，当我们尝试将多源域和目标域进行联合时，更大的不匹配度可能导致不理想的结果。第二点是，他们假设目标域可以被多个域特定分类器进行区分，因为目标域和源域进行了联合。然而，这种方法可能无法提取分类特征，因为在进行分布联合时，并没有考虑到目标域样本与域特定决策边界之间的关系。
在这篇文章中，我们提出了一种包括两阶段联合的全新MUDA结构，用于克服上述两种问题。第一个阶段是联合域特定分布，即我们分别将每个源域和目标域的组合映射至不同特征空间中，并且联合域特定分布来学习多个域不变特征。然后我们使用多个域不变特征训练多个域特定分类器。第二阶段是联合域特定分类器。不同分类器预测到的接近域特定决策边界的目标域样本可能会是不同的标签。因此，利用域特定决策边界，我们对分类器针对目标域样本的输出进行了联合。广泛的实验表明了我们的方法在公共基准数据集上，相对于前沿的方法，可以为MUDA方法获得卓越的成果。
这篇文章的贡献可以概述为以下：（1）我们为MUDA方法提出了一种新的两阶段联合结构，这种结构对多个特征空间中各个源域和目标域组合的域特定分布进行了联合，并且针对目标域样本将域特定分类器的输出进行联合；（2）我们在三个基准数据集上进行了复杂的实验，实验结果验证了我们提出的模型的有效性。

图1.在SUDA中，源域和目标域的分布无法较好匹配。而在MUDA中，基于多源域之间的迁移，将所有的源域和目标域进行匹配则更加困难。

两阶段联合网络结构

我们的结构包含三个部分，即：一个通用特征提取器，域特定特征提取器，域特定分类器，如图2所示。

图2.所提出的两阶段联合结构的概述。我们的结构接受带有确定标签的多源域数据，并且进行自适应调整以区分目标域样本。对于不同的源域具有特定的特征提取器和分类器（以颜色区分）

通用特征提取器

我们提出了一种通用的自网络f()用于提取所有域的通用特征表示，这一部分可以将来自于原始特征空间的图像映射到通用的特征空间中

域特定特征提取器

我们希望每个源域和目标域的组合都能被映射到一个特定的特征空间中。给出一个batch的来自于源域
的图像
以及一个batch的来自目标域Xt的图像xt，这些域特定的特征提取器接收来自通用特征提取器的通用特征
然后，对于每个源域，都有N个不共享权重的域特定的自网络，可以将每个源域个目标域组合映射到一个特定的特征空间中。
域适应的目标是学习域不变表示，近年来存在一系列的实现此目标的方法，包括mmd损失，对抗损失，coral损失，重构损失等，这里我们选取MMD方法来降低域之间的分布差异。

域特定分类器

C是一个有N个域特定预测器组成的多输出网络，每个预测器Ci都是一个softmax分类器，接受来自于域特定特征提取器后的域不变特征。对于每个分类器，我们使用交叉熵添加了一个分类损失，可以用如下公式来表示：

域特定分布联合

为了实现第一个联合阶段（对每个源域和目标域组合的分布进行联合），我们选择MMD作为评估两个域之间差异的方法。MMD是一种核二样本检验（kernel two-sample test，不知道怎么翻译），根据观察的样本接受或拒绝原假设p=q。MMD背后的思想是，如果生成分布是相同的，则所有的统计数据都相同。正式地，MMD定义了一下的差异度量：

其中H是具有特征核k的再生希尔伯特空间。这里 φ(·) 表明将原始样本映射到再生希尔伯特空间中的映射方法，核k表示
其中
表示向量内积。（核方法简要而言就是通过核函数直接计算内积，避免了求解特征向量的向高维空间的复杂映射过程）。主要的理论结果是，当且仅当
时p=q。实际上，MMD的估计将经验核均值嵌入之间的平方距离进行了对比，经验核均值嵌入如下：

其中D（帽）H(p,q)是D（p,q）的无偏估计。我们使用公式4作为不同源域和目标域之间的距离估计，MMD损失可以重新定义为：

通过最小化公式（5）中的损失，特定特征提取器可以学习到不同的源域和目标域组合的域不变特征。

域特定分类器联合

在源域样本中学习到的分类器很有可能将目标域中接近决策边界的样本进行错分。分类器在不同的源域上进行训练，因此其在目标域样本，尤其是目标域中接近决策边界的样本区分上可能会产生不同意见。直觉上，不同分类器预测到的目标域样本应该有相同的预测结果。因此，第二个联合阶段就是最小化不同分类器的差异。在这篇文章中，我们利用了所有的成对分类器在目标域数上的概率输出的均值差异作为差异损失：

在Xu等的文章中，他们提出了一种目标域区分操作，将多个源域分类器进行组合，然而，使用这种方法对目标域样本标签进行投票十分复杂。通过最小化公式（6）中的损失，所有分类器的概率输出都相同，最终，为了预测目标域样本的标签，我们计算了所有分类器输出的均值。

多特征空间适应网络（MFSAN）

对于多源域而言，学习到通用的域不变特征具有一定难度。此外，在目标域中接近决策边界的样本可能被错分。为此，我们提出了一种多特征空间自适应网络（Multi Feature Spaces Adapt Network）。具体而言，这种网络包含了两种联合阶段，分别是学习源域特定域不变特征以及针对目标域样本进行分类器的输出联合。我们的结构包含一个通用特征提取器，N个域特定特征提取器以及N各源域特定分类器。总体而言，我们的方法的损失包含三个部分，分类损失，mmd损失以及disc损失。细节上说，通过最小化分类损失，网络可以准确将源域数据进行分类；通过最小化mmd损失，可以学习到域不变特征；通过最小化disc损失，可以降低不同分类器之间的差异。总体损失可以用下式定义：

由于训练深度CNN需要大量有标签数据，这对于很多域适应的应用来说是难以接受的，我们使用了在ImageNet2012上训练并且微调的模型。训练过程主要遵循标准的随机梯度下降算法。我们的方法是一个针对MUDA的通用结构。其中的mmd损失可以使用其他的自适应方法代替，例如对抗损失，coral损失等。disc损失可以使用其他损失代替，例如L2正则化。总体的流程在算法1中进行了概述。

实验

我们在三个数据集：ImageCLEF-DA， Office31以及Office-Home数据集上，将所提出的MFSAN与前沿的域适应方法进行了对比。我们的代码在https://github.com/easezyc/deep-transfer-learning中。

数据准备

ImageCLEF-DA

ImageCLEF-DA 是ImageCLEF 2014 域适应挑战的基准数据集，由以下三个的公共数据集中采集到12个通用的类别，每个都被作为一个域，分别是Caltech-256 ©, ImageNet ILSVRC 2012 (I), 和PascalVOC 2012 §。每个类别中有50个图像，每个域中有600个图像。我们使用了所有的域组合，建立了三个迁移任务：I, C → P; I, P → C; C,P → I。

Office31

Office31是域适应的标准数据集，包含31个种类共4110张图片。其中包含三个域：Amazon（A）,其中包含从amazon.com上下载的图像，Webcam（W）以及DSLR（D），分别通过网络摄像头以及数字SLR摄像头，通过不同摄像设定获取的图片。每个域中的图像是不均衡的，为了实现无偏差估计，我们在所有的三个迁移任务：A, W → D; A, D → W; D, W → A评估了所有的方法。

Office-Home

Office-Home是一个新数据集，其中包含大于前两个数据集的15588张图像数据。包含四个不同的域：Artistic images (A), Clip Art ©, Product images §和Real-World images ®。每个域中包含从办公或家庭场景中采集到的65个物体类别，我们使用了所有的域组合，建立了迁移任务：C, P, R → A; A, P, R → C; A, C, R → P; A, C, P → R.

Baseline和应用细节

Baseline

在现实世界的视觉识别基准上有少量的MUDA工作。在我们的工作中，我们在多源baseline上引入了一种近期的深度MUDA方法Deep Cocktail Network（DCTN），我们将MFSAN与不同种类的SUDA方法，包括深度卷积神经网络ResNet，深度域混淆（Deep Domain Confusion，DDC），深度自适应网络（Deep Adaption Network，DAN），Deep Coral，RevGrad以及残差迁移网络（Residual Transfer Network，RTN）进行对比。因为这些方法都是在设置单一源域的前提下进行的，我们以不同的目的引入三种MUDA标准：（1）源域组合：将所有的源域组合到一起，形成一个传统的单源域单目标域设定；（2）单一最佳：在所有的源域中，我们仅报告最佳的迁移结果；（3）多源域：使用MUDA的结果。第一个标准测试多源域是否有价值开发；第二个标准测试我们是否可以通过其他源域来提升最佳的SUDA表现；第三个标准描述了我们的MUDA方法的有效性。
为了进一步验证mmd损失和diff损失的有效性，我们也评估了多个不同的MFSAN变种：（1）MFSANdisc，没有考虑mmd损失；（2）MFSANmmd没有考虑disc损失；（3）MFSAN，同时考虑了mmd损失和disc损失。对于所有的域特定特征提取器，我们使用了相同的结构（conv（1×1），conv（1×3），conv（1×1）），在网络最后，我们想DDC网络一样，将通道数降低值256.

应用细节

所有的深度方法都是在pytorch架构的基础上应用的，使用了pytorch提供的微调ResNet结构。我们微调了所有的卷积和池化层，并且通过反向传播训练了分类层。因为域特定特征提取器和分类器都是从头训练的，我们将其学习率设置为其他层的10倍。我们使用SGD优化方法，动量为0.9，使用了RevGrad中的学习率退火策略：因为网格搜索的方法计算消耗太大，在使用SGD的过程中，使用如下公式进行调整：

其中p表示训练从0到1的训练进度，η0=0.01，α=10，β=0.75，通过优化可以提升收敛，降低源域上的分类错误。为了抑制训练早期的噪音激活函数，我们没有使用固定的自适应参数λ和γ，而是通过以下公式将其逐渐从0调整到1：

实验过程中，θ固定为10。这种渐进策略显著地稳定了参数的敏感性，降低了MFSAN模型选择的难度。

结果

我们在三个数据集上将MFSAN与baseline进行对比，结果如图表1,2，3分别所示。我们也将MFSAN在Office-31数据集上与本身有或者没有disc损失进行了对比，在表4中列出了来自不同源域的分类器结果以及平均投票。从这些结果中，我们有了入一下观察结果：
（1）将所有的源域结合到一起比使用单源域最忌结果要好，表明在大多数迁移任务重，将所有的源域结合到一个单一源域中是有效的。这可能归功于数据丰富；
（2）MFSAN在多源域迁移任务上比所有对比的baseline’方法表现要好。结果表明对每个源域和目标域的组合进行域不变特征表示的学习，而不考虑域特定的类别边界是重要的。
（3）将MFSANmmd与DAN（源域结合）进行对比，唯一的区别就是MSFANmmd在多个特征空间中提取了多个域不变特征表示，而DAN在一个通用的特征空间中提取了通用的域不变特征表示，这表明对所有域都提取通用特征表示难度更大。
（4）在多数多源迁移任务上，MFSANdisc比与其对比的方法表现要好，这证明了考虑所有的域特定类别边界，进而降低所有的分类器差距可以帮助每个分类器从其他分类器上学习知识。
（5）将MFSAN与没有disc损失的MFSANdisc进行对比，我们发现有disc损失的MFSAN的分类器在不同源上的结果之间非常接近，而没有disc损失的MFSAN的分类器在不同源上的差距很大。结果阐明了在降低分类器差距时引入disc损失的重要性。

分析

特征可视化

在图3中，我们将在D→A（单源域）DAN学习的和D,W→A中DAN以及MFSAN学习的潜在特征表示使用t-SNE嵌入方法进行了可视化。
从图3中，我们可以看出：1）3b和3c中的结果比3a要好，表明我们可以使用多个源域获得更好的结果：图3d和3e中的结果比3a到3c中要好，再次谭政了我们的模型将多余域特定分布以及分类器结合的有效性。

算法收敛

为了探究我们算法的收敛以及disc损失的影响，我们记录了MFSAN以及MFSANmmd在D,W→A任务迭代中的表现，如图4a所示。我们可以发现所有的算法在1.5×10^4个迭代后可以收敛。同样，MFSAN在有disc损失时，分类器之间的差异较小，可以获得更高准确率。

参数敏感性

为了简便性，我们在实验中将权重参数λ和γ设置为同一个数值，分别控制mmd损失以及disc损失的重要性。我们研究λ的敏感性，我们在{0.01, 0.02, 0.05, 0.1, 0.2, 0.5, 1, 2}中选取该参数，并且在D,W→A以及I,C→P中进行了实验。所有的实验结果在图4b中显示，我们发现准确率一开始提升，随后下降，显示为一个钟形曲线。最后，我们将λ设置为0.5以获取最佳表现。

结论

很多之前的基于深度学习的多源域适应方法聚焦于提取针对所有域的域不变表示，而没有考虑域特定的分类边界。在这篇文章中，我们提出了一种多特征空间自适应网络（Multiple Feature Space Adaption Network，MFSAN），通过学习多个域不变表示以及来自多个源的分类器输出来联合每个源域和目标域组合的域特定分布。在图像数据集上进行了广泛的实验，描述了所提出的网络结构的有效性。此外，我们的模型是一个通用的网络架构，可以整合不同种类的mmd损失和disc损失函数。

PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
视频分析：让AI看懂动态画面随机森林404 计算机视觉音视频人工智能 microsoft
引言：动态视觉理解的革命在数字信息爆炸的时代，视频已成为最主要的媒介形式。据统计，每分钟有超过500小时的视频内容被上传到YouTube平台，而全球互联网流量的82%来自视频数据传输。面对如此海量的视频内容，传统的人工处理方式已无法满足需求，这正是人工智能视频分析技术大显身手的舞台。视频分析技术赋予机器"看懂"动态画面的能力，使其能够自动理解、解释甚至预测视频中的内容，这一突破正在彻底改变我们与视
【Qualcomm】高通SNPE框架简介、下载与使用 Jackilina_Stone 人工智能 Qualcomm SNPE
目录一高通SNPE框架1SNPE简介2QNN与SNPE3Capabilities4工作流程二SNPE的安装与使用1下载2Setup3SNPE的使用概述一高通SNPE框架1SNPE简介SNPE（SnapdragonNeuralProcessingEngine），是高通公司推出的面向移动端和物联网设备的深度学习推理框架。SNPE提供了一套完整的深度学习推理框架，能够支持多种深度学习模型，包括Pytor
Python的科学计算库NumPy（一） linlin_1998 python numpy 开发语言
NumPy(NumericalPython)是Python中最基础、最重要的科学计算库之一，提供了高性能的多维数组（ndarray）对象和大量数学函数，是许多数据科学、机器学习库（如Pandas、SciPy、TensorFlow等）的基础依赖。1.创建一个numpy里面的一维数组importnumpyasnp###通过array方法创建一个ndarrayarray1=np.array([1,2,3
深度学习篇---昇腾NPU&CANN 工具包 Atticus-Orion 上位机知识篇图像处理篇深度学习篇深度学习人工智能 NPU 昇腾 CANN
介绍昇腾NPU是华为推出的神经网络处理器，具有强大的AI计算能力，而CANN工具包则是面向AI场景的异构计算架构，用于发挥昇腾NPU的性能优势。以下是详细介绍：昇腾NPU架构设计：采用达芬奇架构，是一个片上系统，主要由特制的计算单元、大容量的存储单元和相应的控制单元组成。集成了多个CPU核心，包括控制CPU和AICPU，前者用于控制处理器整体运行，后者承担非矩阵类复杂计算。此外，还拥有AICore
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
法律科技领域人工智能代理构建的十个经验教训，一位人工智能工程师通过构建、部署和维护智能代理的经验教训来优化法律工作流程的历程。知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 ai
目录介绍什么是代理人？为什么它对法律如此重要？法律技术中代理用例示例-合同审查代理-法律研究代理在LegalTech中使用代理的十个教训-教训1：即使代理很酷，它们也不能解决所有问题-教训2：选择最适合您用例的框架-教训3：能够快速迭代不同的模型-教训4：从简单开始，必要时扩展-教训5：使用跟踪解决方案；您将需要它-教训6：确保跟踪成本，代理循环可能很昂贵-教训7：将控制权交给最终用户（人在环路中
Llama-Omni会说话的人工智能“语音到语音LLM” 利用低延迟、高质量语音转语音 AI 彻底改变对话方式（教程含源码）知识大胖 NVIDIA GPU和大语言模型开发教程 llama 人工智能 nvidia llm
介绍“单靠技术是不够的——技术与文科、人文学科的结合，才能产生让我们心花怒放的成果。”——史蒂夫·乔布斯近年来，人机交互领域发生了重大变化，尤其是随着ChatGPT、GPT-4等大型语言模型(LLM)的出现。虽然这些模型主要基于文本，但人们对语音交互的兴趣日益浓厚，以使人机对话更加无缝和自然。然而，实现语音交互而不受语音转文本处理中常见的延迟和错误的影响仍然是一个挑战。关键字：Llama-Omni
什么是热力学计算？它如何帮助人工智能发展？知识大胖 NVIDIA GPU和大语言模型开发教程人工智能量子计算
现代计算的基础是晶体管，这是一种微型电子开关，可以用它构建逻辑门，从而创建CPU或GPU等复杂的数字电路。随着技术的进步，晶体管变得越来越小。根据摩尔定律，集成电路中晶体管的数量大约每两年增加一倍。这种指数级增长使得计算技术呈指数级发展。然而，晶体管尺寸的缩小是有限度的。我们很快就会达到晶体管无法工作的阈值。此外，人工智能的进步使得对计算能力的需求比以往任何时候都更加迫切。根本问题是自然是随机的（
上海交大：工具增强推理agent
标题：SciMaster:TowardsGeneral-PurposeScientificAIAgentsPartI.X-MasterasFoundation-CanWeLeadonHumanity’sLastExam?来源：arXiv,2507.05241摘要人工智能代理的快速发展激发了利用它们加速科学发现的长期雄心。实现这一目标需要深入了解人类知识的前沿。因此，人类的最后一次考试（HLE）为评
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
中国银联豪掷1亿采购海光C86架构服务器信创新态势海光芯片 C86 国产芯片海光信息
近日，中国银联国产服务器采购大单正式敲定，基于海光C86架构的服务器产品中标，项目金额超过1亿元。接下来，C86服务器将用于支撑中国银联的虚拟化、大数据、人工智能、研发测试等技术场景，进一步提升其业务处理能力、用户服务效率和信息安全水平。作为我国重要的银行卡组织和金融基础设施，中国银联在全球183个国家和地区设有银联受理网络，境内外成员机构超过2600家，是世界三大银行卡品牌之一。此次中国银联发力
AI人工智能浪潮中文心一言的独特优势
AI人工智能浪潮中文心一言的独特优势：为什么它是中国市场的“AI主力军”？关键词：文心一言,AI大模型,中文处理,多模态融合,产业落地,安全可控,百度ERNIE摘要：在全球AI大模型浪潮中，百度文心一言（ERNIEBot）凭借“懂中文、会多模态、能落地、守规矩”的四大核心优势，成为中国市场最具竞争力的AI产品之一。本文将用“超级大脑”的比喻，从中文理解、多模态能力、产业生态融合、安全可控性四个维度
正义的算法迷宫—人工智能重构司法体系的技术悖论与文明试炼
一、法庭的数字化迁徙当美国威斯康星州法院采纳COMPAS算法评估被告再犯风险，当中国"智慧法院"系统年处理1.2亿件案件，司法体系正经历从石柱法典到代码裁判的范式革命。这场转型的核心驱动力是司法效率与公正的永恒张力：美国重罪案件平均审理周期达18个月，中国基层法官年人均结案357件（是德国同行的6倍），而算法能在0.3秒内完成百万份文书比对。人工智能渗透司法引发三重裂变：证据分析从经验推断转向数据
NumPy-@运算符详解 GG不是gg numpy numpy
NumPy-@运算符详解一、@运算符的起源与设计目标1.从数学到代码：符号的统一2.设计目标二、@运算符的核心语法与运算规则1.基础用法：二维矩阵乘法2.一维向量的矩阵语义3.高维数组：批次矩阵运算4.广播机制：灵活的形状匹配三、@运算符与其他乘法方式的核心区别1.对比`np.dot()`2.对比元素级乘法`*`3.对比`np.matrix`的`*`运算符四、典型应用场景：从基础到高阶1.深度学习
【python实战】不玩微博，一封邮件就能知道实时热榜，天秀吃瓜一条coding 从实战学python 人工智能 python linux 爬虫
❤️欢迎订阅《从实战学python》专栏，用python实现办公自动化、数据可视化、人工智能等各个方向的实战案例，有趣又有用！❤️更多精品专栏简介点这里有的人金玉其表败絮其中，有的人却若彩虹般绚烂，怦然心动前言哈喽，大家好，我是一条。在生活中我是一个不太喜欢逛娱乐平台的人，抖音、快手、微博我手机里都没装，甚至微信朋友圈都不看，但是自从开始写博客，有些热度不得不蹭。所以就有了这样一个需求，能不能让微
NLP_知识图谱_大模型——个人学习记录 macken9999 自然语言处理知识图谱大模型自然语言处理知识图谱学习
1.自然语言处理、知识图谱、对话系统三大技术研究与应用https://github.com/lihanghang/NLP-Knowledge-Graph深度学习-自然语言处理(NLP)-知识图谱：知识图谱构建流程【本体构建、知识抽取（实体抽取、关系抽取、属性抽取）、知识表示、知识融合、知识存储】-元気森林-博客园https://www.cnblogs.com/-402/p/16529422.htm
解决 Python 包安装失败问题：以 accelerate 为例
在使用Python开发项目时，我们经常会遇到依赖包安装失败的问题。今天，我们就以accelerate包为例，详细探讨一下可能的原因以及解决方法。通过这篇文章，你将了解到Python包安装失败的常见原因、如何切换镜像源、如何手动安装包，以及一些实用的注意事项。一、问题背景在开发一个深度学习项目时，我需要安装accelerate包来优化模型的训练过程。然而，当我运行以下命令时：bash复制pipins
在mac m1基于llama.cpp运行deepseek
lama.cpp是一个高效的机器学习推理库，目标是在各种硬件上实现LLM推断，保持最小设置和最先进性能。llama.cpp支持1.5位、2位、3位、4位、5位、6位和8位整数量化，通过ARMNEON、Accelerate和Metal支持Apple芯片，使得在MACM1处理器上运行Deepseek大模型成为可能。1下载llama.cppgitclonehttps://github.com/ggerg
MCP协议：AI时代的“万能插座”如何重构IT生态与未来
MCP协议：AI时代的“万能插座”如何重构IT生态与未来在人工智能技术爆炸式发展的浪潮中，一个名为ModelContextProtocol（MCP）的技术协议正以惊人的速度重塑IT行业的底层逻辑。2024年11月由Anthropic首次发布，MCP在短短半年内获得OpenAI、谷歌、亚马逊、阿里、腾讯等全球科技巨头的支持，被业内誉为AI时代的HTTP协议或USB-C接口，正在成为连接大模型与现实世
从RNN循环神经网络到Transformer注意力机制：解析神经网络架构的华丽蜕变熊猫钓鱼>_> 神经网络 rnn transformer
1.引言在自然语言处理和序列建模领域，神经网络架构经历了显著的演变。从早期的循环神经网络（RNN）到现代的Transformer架构，这一演变代表了深度学习方法在处理序列数据方面的重大进步。本文将深入比较这两种架构，分析它们的工作原理、优缺点，并通过实验结果展示它们在实际应用中的性能差异。2.循环神经网络（RNN）2.1基本原理循环神经网络是专门为处理序列数据而设计的神经网络架构。RNN的核心思想
《算法备案全攻略：规范与流程引领数字时代新秩序》算法及大模型备案顾问刘老师算法备案深度学习 AIGC 语言模型算法人工智能
一、算法备案：开启合规新征程（一）备案规定的起源与发展2022年国家互联网信息办公室、工业和信息化部、公安部、国家市场监督管理总局联合发布《互联网信息服务算法推荐管理规定》，自2022年3月1日起施行。此后，相关规定不断完善和演进。如国家网信办于2022年8月、10月及2023年1月先后三次公布了《境内互联网信息服务算法备案清单》。同时，2022年发布的最高人民法院《关于规范和加强人工智能司法应用
【机器学习笔记Ⅰ】9 特征缩放巴伦是只猫机器学习机器学习笔记人工智能
特征缩放（FeatureScaling）详解特征缩放是机器学习数据预处理的关键步骤，旨在将不同特征的数值范围统一到相近的尺度，从而加速模型训练、提升性能并避免某些特征主导模型。1.为什么需要特征缩放？(1)问题背景量纲不一致：例如：特征1：年龄（范围0-100）特征2：收入（范围0-1,000,000）梯度下降的困境：量纲大的特征（如收入）会导致梯度更新方向偏离最优路径，收敛缓慢。量纲小的特征（如
C语言学生成绩管理系统<；自创>；(功能7有小错误,但可运行） han_xue_feng java
腾讯云加速企业和个人开发创新公开直播预告直播预告：07/18(周四)15:00-16:00随着人工智能与大模型的蓬勃发展，我们正步入一个由技微信实习第一天周五入职，早上早早来到了公司，发现好多人都没上班，到十点才陆陆续续有人来，办理完入职后，mentor中联夏令营遗憾没有入选不过hr的回复真的很好，辛苦啦#提前批简历挂麻了怎么办##机械制造投递记录#大数据开发的工作有点过于简单了吧sq大数据开发的
Python 实战人工智能数学基础：推荐系统应用 AI天才研究院 AI大模型企业级应用开发实战大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术文章目录1.背景介绍2.核心概念与联系2.1用户画像2.2相似性计算2.2.1基于物品的相似度2.2.2基于用户的相似度2.3协同过滤算法2.3.1基于用户的协同过滤算法2.3.2基于物品的协同过滤算法2.3.3基于上下文的协同过滤算法3.核心算法原理和具体操作步骤以及数学模型公式详细讲解3.1基于用户的协同过滤算法3.2基于物品的协同过滤算法3.3混合协同过滤算法3.
Python桌面应用开发的未来——智能化工具与大模型赋能 IronwoodStag78
开发AI智能应用，就下载InsCodeAIIDE，一键接入DeepSeek-R1满血版大模型！标题：Python桌面应用开发的未来——智能化工具与大模型赋能随着人工智能技术的飞速发展，传统软件开发模式正在被重新定义。Python作为一门功能强大且灵活的语言，在桌面应用开发领域一直占据重要地位。然而，面对日益复杂的用户需求和快速变化的技术环境，如何提升开发效率、降低开发门槛，成为开发者亟需解决的问题
html页面js获取参数值 0624chenhong html
1.js获取参数值js function GetQueryString(name) { var reg = new RegExp("(^|&)"+ name +"=([^&]*)(&|$)"); var r = windo
MongoDB 在多线程高并发下的问题 BigCat2013 mongodb DB 高并发重复数据
最近项目用到 MongoDB , 主要是一些读取数据及改状态位的操作. 因为是结合了最近流行的 Storm进行大数据的分析处理，并将分析结果插入Vertica数据库，所以在多线程高并发的情境下, 会发现 Vertica 数据库中有部分重复的数据. 这到底是什么原因导致的呢？笔者开始也是一筹莫展，重复去看 MongoDB 的 API , 终于有了新发现： com.mongodb.DB 这个类有
c++ 用类模版实现链表(c++语言程序设计第四版示例代码) CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T> class Node { private: Node<T> * next; public: T data;
最近情况麦田的设计者感慨考试生活
在五月黄梅天的岁月里，一年两次的软考又要开始了。到目前为止，我已经考了多达三次的软考，最后的结果就是通过了初级考试（程序员）。人啊，就是不满足，考了初级就希望考中级，于是，这学期我就报考了中级，明天就要考试。感觉机会不大，期待奇迹发生吧。这个学期忙于练车，写项目，反正最后是一团糟。后天还要考试科目二。这个星期真的是很艰难的一周，希望能快点度过。
linux系统中用pkill踢出在线登录用户被触发 linux
由于linux服务器允许多用户登录，公司很多人知道密码，工作造成一定的障碍所以需要有时踢出指定的用户 1/#who 查出当前有那些终端登录（用 w 命令更详细） # who root pts/0 2010-10-28 09:36 (192
仿QQ聊天第二版肆无忌惮_ qq
在第一版之上的改进内容: 第一版链接: http://479001499.iteye.com/admin/blogs/2100893 用map存起来号码对应的聊天窗口对象,解决私聊的时候所有消息发到一个窗口的问题. 增加ViewInfo类,这个是信息预览的窗口,如果是自己的信息,则可以进行编辑. 信息修改后上传至服务器再告诉所有用户,自己的窗口
java读取配置文件知了ing
1，java读取.properties配置文件 InputStream in; try { in = test.class.getClassLoader().getResourceAsStream("config/ipnetOracle.properties");//配置文件的路径 Properties p = new Properties()
__attribute__ 你知多少？矮蛋蛋 C++gcc
原文地址: http://www.cnblogs.com/astwish/p/3460618.html GNU C 的一大特色就是__attribute__ 机制。__attribute__ 可以设置函数属性（Function Attribute ）、变量属性（Variable Attribute ）和类型属性（Type Attribute ）。 __attribute__ 书写特征是：
jsoup使用笔记 alleni123 java 爬虫 JSoup
<dependency> <groupId>org.jsoup</groupId> <artifactId>jsoup</artifactId> <version>1.7.3</version> </dependency> 2014/08/28 今天遇到这种形式，
JAVA中的集合 Collectio 和Map的简单使用及方法百合不是茶 list map set
List ,set ,map的使用方法和区别 java容器类类库的用途是保存对象，并将其分为两个概念： Collection集合：一个独立的序列，这些序列都服从一条或多条规则;List必须按顺序保存元素，set不能重复元素；Queue按照排队规则来确定对象产生的顺序（通常与他们被插入的
杀LINUX的JOB进程 bijian1013 linux unix
今天发现数据库一个JOB一直在执行，都执行了好几个小时还在执行，所以想办法给删除掉系统环境： ORACLE 10G Linux操作系统操作步骤如下：第一步.查询出来那个job在运行，找个对应的SID字段 select * from dba_jobs_running--找到job对应的sid &n
Spring AOP详解 bijian1013 java spring AOP
最近项目中遇到了以下几点需求，仔细思考之后，觉得采用AOP来解决。一方面是为了以更加灵活的方式来解决问题，另一方面是借此机会深入学习Spring AOP相关的内容。例如，以下需求不用AOP肯定也能解决，至于是否牵强附会，仁者见仁智者见智。 1.对部分函数的调用进行日志记录，用于观察特定问题在运行过程中的函数调用
[Gson六]Gson类型适配器(TypeAdapter) bit1129 Adapter
TypeAdapter的使用动机 Gson在序列化和反序列化时，默认情况下，是按照POJO类的字段属性名和JSON串键进行一一映射匹配，然后把JSON串的键对应的值转换成POJO相同字段对应的值，反之亦然，在这个过程中有一个JSON串Key对应的Value和对象之间如何转换(序列化/反序列化)的问题。以Date为例，在序列化和反序列化时，Gson默认使用java.
【spark八十七】给定Driver Program，如何判断哪些代码在Driver运行，哪些代码在Worker上执行 bit1129 driver
Driver Program是用户编写的提交给Spark集群执行的application，它包含两部分作为驱动： Driver与Master、Worker协作完成application进程的启动、DAG划分、计算任务封装、计算任务分发到各个计算节点(Worker)、计算资源的分配等。计算逻辑本身，当计算任务在Worker执行时，执行计算逻辑完成application的计算任务
nginx 经验总结 ronin47 nginx 总结
　　　深感nginx的强大，只学了皮毛，把学下的记录。　　　获取Header 信息，一般是以$http_XX（ＸＸ是小写）获取body,通过接口，再展开，根据Ｋ取Ｖ　　　获取uri,以$arg_XX &n
轩辕互动-1.求三个整数中第二大的数2.整型数组的平衡点 bylijinnan 数组
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class ExoWeb { public static void main(String[] args) { ExoWeb ew=new ExoWeb(); System.out.pri
Netty源码学习-Java-NIO-Reactor bylijinnan java 多线程 netty
Netty里面采用了NIO-based Reactor Pattern 了解这个模式对学习Netty非常有帮助参考以下两篇文章： http://jeewanthad.blogspot.com/2013/02/reactor-pattern-explained-part-1.html http://gee.cs.oswego.edu/dl/cpjslides/nio.pdf
AOP通俗理解 cngolon spring AOP
1.我所知道的aop 初看aop,上来就是一大堆术语，而且还有个拉风的名字，面向切面编程，都说是OOP的一种有益补充等等。一下子让你不知所措，心想着：怪不得很多人都和我说aop多难多难。当我看进去以后，我才发现：它就是一些java基础上的朴实无华的应用，包括ioc，包括许许多多这样的名词，都是万变不离其宗而已。 2.为什么用aop&nb
cursor variable 实例 ctrain variable
create or replace procedure proc_test01 as type emp_row is record( empno emp.empno%type, ename emp.ename%type, job emp.job%type, mgr emp.mgr%type, hiberdate emp.hiredate%type, sal emp.sal%t
shell报bash: service: command not found解决方法 daizj linux shell service jps
今天在执行一个脚本时，本来是想在脚本中启动hdfs和hive等程序，可以在执行到service hive-server start等启动服务的命令时会报错，最终解决方法记录一下：脚本报错如下： ./olap_quick_intall.sh: line 57: service: command not found ./olap_quick_intall.sh: line 59
40个迹象表明你还是PHP菜鸟 dcj3sjt126com 设计模式 PHP 正则表达式 oop
你是PHP菜鸟，如果你：1. 不会利用如phpDoc 这样的工具来恰当地注释你的代码2. 对优秀的集成开发环境如Zend Studio 或Eclipse PDT 视而不见3. 从未用过任何形式的版本控制系统，如Subclipse4. 不采用某种编码与命名标准，以及通用约定，不能在项目开发周期里贯彻落实5. 不使用统一开发方式6. 不转换（或）也不验证某些输入或SQL查询串（译注：参考PHP相关函
Android逐帧动画的实现 dcj3sjt126com android
一、代码实现： private ImageView iv; private AnimationDrawable ad; @Override protected void onCreate(Bundle savedInstanceState) { super.onCreate(savedInstanceState); setContentView(R.layout
java远程调用linux的命令或者脚本 eksliang linux ganymed-ssh2
转载请出自出处： http://eksliang.iteye.com/blog/2105862 Java通过SSH2协议执行远程Shell脚本(ganymed-ssh2-build210.jar) 使用步骤如下： 1.导包官网下载: http://www.ganymed.ethz.ch/ssh2/ ma
adb端口被占用问题 gqdy365 adb
最近重新安装的电脑，配置了新环境，老是出现： adb server is out of date. killing... ADB server didn't ACK * failed to start daemon * 百度了一下，说是端口被占用，我开个eclipse，然后打开cmd，就提示这个，很烦人。一个比较彻底的解决办法就是修改
ASP.NET使用FileUpload上传文件 hvt .net C#hovertree asp.net webform
前台代码： <asp:FileUpload ID="fuKeleyi" runat="server" /> <asp:Button ID="BtnUp" runat="server" onclick="BtnUp_Click" Text="上传" />
代码之谜（四）- 浮点数（从惊讶到思考） justjavac 浮点数精度代码之谜 IEEE
在『代码之谜』系列的前几篇文章中，很多次出现了浮点数。浮点数在很多编程语言中被称为简单数据类型，其实，浮点数比起那些复杂数据类型（比如字符串）来说，一点都不简单。单单是说明 IEEE浮点数就可以写一本书了，我将用几篇博文来简单的说说我所理解的浮点数，算是抛砖引玉吧。一次面试记得多年前我招聘 Java 程序员时的一次关于浮点数、二分法、编码的面试，多年以后，他已经称为了一名很出色的
数据结构随记_1 lx.asymmetric 数据结构笔记
第一章 1.数据结构包括数据的逻辑结构、数据的物理/存储结构和数据的逻辑关系这三个方面的内容。 2.数据的存储结构可用四种基本的存储方法表示，它们分别是顺序存储、链式存储、索引存储和散列存储。 3.数据运算最常用的有五种，分别是查找/检索、排序、插入、删除、修改。 4.算法主要有以下五个特性：输入、输出、可行性、确定性和有穷性。 5.算法分析的
linux的会话和进程组网络接口 linux
会话：一个或多个进程组。起于用户登录，终止于用户退出。此期间所有进程都属于这个会话期。会话首进程：调用setsid创建会话的进程1.规定组长进程不能调用setsid，因为调用setsid后，调用进程会成为新的进程组的组长进程.如何保证？先调用fork，然后终止父进程，此时由于子进程的进程组ID为父进程的进程组ID，而子进程的ID是重新分配的，所以保证子进程不会是进程组长，从而子进程可以调用se
二维数组元素的连续求解 1140566087 二维数组 ACM
import java.util.HashMap; public class Title { public static void main(String[] args){ f(); } // 二位数组的应用 //12、二维数组中，哪一行或哪一列的连续存放的0的个数最多，是几个0。注意，是“连续”。 public static void f(){
也谈什么时候Java比C++快 windshome java C++
刚打开iteye就看到这个标题“Java什么时候比C++快”，觉得很好笑。你要比，就比同等水平的基础上的相比，笨蛋写得C代码和C++代码，去和高手写的Java代码比效率，有什么意义呢？我是写密码算法的，深刻知道算法C和C++实现和Java实现之间的效率差，甚至也比对过C代码和汇编代码的效率差，计算机是个死的东西，再怎么优化，Java也就是和C