一瞬にして失う

《AdaFace: Quality Adaptive Margin for Face Recognition》用于人脸识别的图像质量自适应边缘损失

方法简介：

（1）介绍了损失函数中自适应性的另一个方面，即图像质量。

（2）强调误分类样本的策略应根据其图像质量进行调整。

（3）提出了一种新的损失函数，该函数根据图像质量强调不同困难的样本。

1、图像质量

图像质量是一组属性的组合，指示图像捕捉原始场景的真实程度。影响图像质量的因素包括亮度、对比度、锐度、噪声、颜色恒定性、分辨率、色调再现等。人脸图像是本文的重点，可以在各种照明、姿势和面部表情设置下拍摄，有时还可以在极端的视觉变化下拍摄。这些参数设置使得学习人脸识别模型的识别任务变得困难。尽管如此，这项任务是可以实现的，因为人类或模型通常可以在这些困难的环境下识别人脸。然而，当人脸图像质量较低时，有时识别任务变得不可行。

低质量图像正日益成为人脸识别数据集的重要组成部分，因为它们在监控视频和无人机镜头中遇到。鉴于SoTA FR方法能够在相对高质量的数据集中获得98%以上的验证精度，最近的FR挑战已转移到低质量的数据集。尽管挑战是在低质量数据集上实现高精度，但大多数流行的训练数据集仍然由高质量图像组成。由于只有一小部分训练数据质量较低，因此在训练期间适当利用它很重要。

主要工作：

（1）提出了一种损失函数AdaFace，该函数根据样本的图像质量对样本的不同困难赋予不同的重要性。通过结合图像质量，避免了强调无法识别的图像，而集中在难以识别的样本上。

（2）表明角度边界根据训练样本的难度来缩放学习梯度。这一观察促使自适应地改变边界函数，以在图像质量较高时强调硬样本，而如果图像质量低就会忽略难以识别的样本。

（3）证明了特征范数可以作为图像质量的表示。它不需要额外的模块来估计图像质量。因此，在不增加复杂性的情况下实现了自适应边界函数。

（4）通过对9个不同质量的数据集（LFW、CFP-FP、CPLFW、AgeDB、CALFW、IJB-B、IJB-C、IJB-S和TinyFace）进行广泛评估，验证了该方法的有效性。表明在保持高质量数据集性能的同时，可以极大地提高低质量数据集的识别性能。

2、相关工作

(1)基于边界的损失函数（SphereFace、CosFace、ArcFace）

提出初衷：将边界添加到softmax中是因为没有边距，学习的特征就没有足够的区分性。

形式：

$\iota =-log\frac{exp\left ( f\left ( \theta _{y_{i}} \right )\\, m \right )}{exp\left ( f\left ( \theta _{y_{i}} \right )\\, m \right )+\sum_{n}^{j\neq y_{i}}exp(s\cos\theta _{j})}$

${\color{Blue} \theta _{j}}$ :特征向量和第j个分类器权重向量之间的角度;

${\color{Blue} y_{i}}$ :地面真值（GT）标签的索引;

m:边距，标量超参数。

f:一个边界函数。

对于不同的边界函数，可以将f标记为：

$f(\theta _{j}, m)_{SphereFace}=\left\{\begin{matrix} s\cos\left ( m\theta _{j} \right )\ \ \ j=y_{i}\\ s\cos\theta _{j}\ \ \ j\neq y_{i} \end{matrix}\right.$

$f(\theta _{j}, m)_{CosFace}=\left\{\begin{matrix} s\left ( cos\theta _{j} -m\right )\ \ \ j=y_{i}\\ s\cos\theta _{j}\ \ \ j\neq y_{i} \end{matrix}\right.$

$f(\theta _{j}, m)_{ArcFace}=\left\{\begin{matrix} s\left ( cos\theta _{j} +m\right )\ \ \ j=y_{i}\\ s\cos\theta _{j}\ \ \ j\neq y_{i} \end{matrix}\right.$

这里s是一个用于缩放的超参数。

本文方法是将边界m建模为图像质量的函数，因为 $f\left (\theta _{j}\\, m\right )$ 对训练期间样本贡献更多梯度（即学习信号）有影响。

(2)自适应损失函数（Adaptive Loss Functions）

所用问题：硬样本挖掘、训练期间的调度困难、寻找最优超参数。

CurricularFace ：将课程学习的理念引入进损失函数。在训练的初始阶段， $cos\theta _{j}$ （负余弦相似性）的边界设置为较小值，以便可以学习简单样本。在训练时，边界逐渐增加，以便学习硬样本。

$f(\theta _{j}, m)_{Curricular}=\left\{\begin{matrix} s\left ( cos\theta _{j} +m\right )\ \ \ j=y_{i}\\ N\left ( t,cos\theta _{j} \right )\ \ \ j\neq y_{i} \end{matrix}\right.$

其中：

$N\left ( t,cos\theta _{j} \right )=\left\{\begin{matrix} cos\theta _{j}\ \ \ s\ cos\left ( \theta _{y_{i}}+m \right )\geqslant cos\theta _{j}\\ cos\theta _{j}\left ( t+cos\theta _{j} \right )\ \ \ s\ cos\left ( \theta _{y_{i}}+m \right )< cos\theta _{j} \end{matrix}\right.$

t是一个随着训练进度而增加的参数。

本文认为边界的自适应性应基于图像质量。我们认为，在高质量图像中，如果样本很难（相对于模型），网络应该学会利用图像中的信息；但在低质量图像中，如果样本很难，则更有可能缺乏适当的身份线索，网络不应该努力适应它。

3、AdaFace方法

样本 $x_{i}$ 的交叉熵softmax损失可以标记为：

$\iota _{CE}\left ( x_{i} \right )=-log\frac{exp\left ( W_{y_{i}} z_{i}+b_{y_{i}}\right )}{\sum_{j=1}^{C}exp\left (W _{j}z_{j} +b_{j}\right )}$

${\color{Blue}z_{i} }$ : $x_{i}$ 的特征嵌入； $z_{i}\in R^{d}$

${\color{Blue} y_{i}}$ :第i类的标签；

${\color{Blue} W_{j}}$ :最后一个全连接层权重矩阵的第j列； $W\in R^{d\times C}$

${\color{Blue} b_{j}}$ :相应的偏置项；

C：类别的数量。

在测试期间，任意一对图像样本 $x_{p}$ 和 $x_{q}$ ，其余弦相似度度量为 $\frac{z_{p}\cdot z_{q}}{\left \| z_{p} \right \|\left \| z_{q} \right \|}$ ，用于查找最接近的匹配身份。

为了使训练目标直接优化余弦距离，使用归一化softmax，其中偏置项设置为零，特征 $z_{i}$ 在训练期间归一化并用s重新缩放。公式就变形为：

$\iota _{CE}\left ( x_{i} \right )=-log\frac{exp\left ( s\cdot cos\theta _{y_{i}} \right )}{\sum_{j=1}^{C}exp(s\cdot cos\theta _{j})}$

${\color{Blue} \theta _{j}}$ : $z_{i}$ 和 $W_{j}$ 之间的角度；

然后引入边界m来减少类内差异，就变形为原始的边界损失函数。

(1)边界形式和梯度

目的：在反向传播过程中，由于边缘引起的梯度变化具有缩放样本相对于其他样本重要性的效果。

方法：角度边界可以在梯度方程中引入一个附加项，根据样本的难度来缩放信号。

假设 $P_{j}^{\left ( i \right )}$ 是样本 $x_{i}$ 进行softmax运算后在第j类的概率输出，推导结果如下：

$P_{j}^{\left ( i \right )}=\frac{exp\left ( f\left ( cos\theta _{y_{i}} \right ) \right )}{exp\left ( f\left ( cos\theta _{y_{i}} \right ) \right )+\sum_{j\neq y_{i}}^{n}exp\left ( s\cdot cos\theta _{j} \right )}$

$\frac{\partial \iota _{CE}}{\partial W_{j}}=\left ( P_{j}^{\left ( i \right )} -\parallel \left ( y_{i} =j\right )\right )\frac{\partial f\left ( cos\theta _{j} \right )}{\partial cos\theta _{j}}\frac{\partial cos\theta _{j}}{\partial W_{j}}$

$\frac{\partial \iota _{CE}}{\partial x_{i}}=\sum_{k=1}^{C}\left ( P_{k}^{\left ( i \right )} -\parallel \left ( y_{i} =k\right )\right )\frac{\partial f\left ( cos\theta _{k} \right )}{\partial cos\theta _{k}}\frac{\partial cos\theta _{k}}{\partial x_{i}}$

前两项 $\left ( P_{j}^{\left ( i \right )} -\parallel \left ( y_{i} =j\right )\right )$ 和 $\frac{\partial f\left ( cos\theta _{j} \right )}{\partial cos\theta _{j}}$ 是标量。此外，这两项是唯一受参数m影响的项。作为方向项， $\frac{\partial cos\theta _{j}}{\partial W_{j}}$ 不含m，我们可以将前两个标量项视为梯度标度项（GST），并表示为：

$g:=\left ( P_{j}^{\left ( i \right )} -\parallel \left ( y_{i} =j\right )\right )\frac{\partial f\left ( cos\theta _{j} \right )}{\partial cos\theta _{j}}$

为了进行GST分析，考虑类别指数 $j=y_{i}$ ,因为所有负类 $j\neq y_{i}$ 在等式中没有边界。

（1.1）归一化后的softmax的GST为：

$g_{softmax}=\left ( P_{y_{i}}^{\left ( i \right )}-1 \right )s$

此时 $f\left ( cos\theta _{y_{i}} \right )=s\cdot cos\theta _{y_{i}}$ 且 $\frac{\partial f\left ( cos\theta _{y_{i}} \right )}{\partial cos\theta _{y_{i}}}=s$ 。

（1.2）CosFace的GST为：

$g_{CosFace}=\left ( P_{y_{i}}^{\left ( i \right )} -1\right )s$

此时 $f\left ( cos\theta _{y_{i}} \right )=s\cdot \left ( cos\theta _{y_{i}}-m \right )$ 且 $\frac{\partial f\left ( cos\theta _{y_{i}} \right )}{\partial cos\theta _{y_{i}}}=s$

(1.3)ArcFace的GST为：

$g_{ArcFace}=\left ( P_{y_{i}}^{\left ( i \right )} -1\right )s\left ( cos\left ( m \right ) +\frac{cos\theta _{y_{i}}sin\left ( m \right )}{\sqrt{1-cos^{2}\theta _{y_{i}}}}\right )$

因为GST是 $\theta _{y_{i}}$ 和m的函数，可以用它来控制在训练期间基于难度的样本重点。

GST可视化如下图所示：

(2)范数和图像质量

图像质量是一个综合术语，涵盖亮度、对比度和清晰度等特征。图像质量评估（IQA）在计算机视觉中得到广泛研究。SER-FIQ是一种用于人脸IQA的无监督蒸馏方法。BRISQUE是一种用于盲/无参考IQA的流行算法。然而，这种方法在训练期间使用的计算成本很高。本文避免引入计算图像质量的额外模块，使用特征范数作为图像质量的代理。我们观察到，在使用基于边缘的softmax损失训练的模型中，特征范数呈现出与图像质量相关的趋势。

下图中a部分展示了特征范数和用（1-BRISQUE）计算的图像质量（IQ）分数之间的相关图，图中的绿色曲线。本文还将概率输出 $P_{y_{i}}$ 和IQ分数之间的相关图显示为橙色曲线。

b部分显示了特征范数和IQ分数之间的散点图，c部分显示了Pyi和IQ分数之间的散点图。

特征范数和IQ分数之间的高度相关性支持我们使用特征范数作为图像质量的代理。

特征范数的相关性始终高于 $P_{y_{i}}$ 。从训练的早期阶段就可以看到特征范数和IQ分数之间的相关性。

所以根据样本难度调整样本重要性时，考虑图像质量是有意义的。

(3)AdaFace：基于范数的自适应边界

目的：为了解决由无法识别的图像引起的问题，本文提出了基于特征范数的边界函数。

基础：a、不同的边界函数可以强调样本的不同困难；

b、特征范数是一种寻找低质量图像的好方法。

(3.1)图像质量指示器

作为特征范数， $\left \| z_{i} \right \|$ 是一个依赖于模型的量，使用 $\mu _{z}$ 和 $\sigma _{z}$ 对其进行归一化，标记为：

$\widehat{\left \| z_{i} \right \|}=\left [ \frac{\left \| z_{i} \right \|-\mu _{z}}{\frac{\sigma _{z}}{h}} \right ]_{-1}^{1}$

${\color{Blue}\mu _{z}}$ ：平均值；

${\color{Blue} \sigma _{z}}$ ：标准差；

${\color{Blue} \left [ \cdot \right ]}$ ：指将值剪裁在−1和1，并阻止梯度流动。

大约68%的单位高斯分布介于−1和1，所以我们引入h项来控制浓度，使得大多数的结果在-1到1之间。

如果批尺寸太小， ${\color{Blue}\mu _{z}}$ 和 ${\color{Blue} \sigma _{z}}$ 就会不稳定。因此，我们在多个步骤中使用 ${\color{Blue}\mu _{z}}$ 和 ${\color{Blue} \sigma _{z}}$ 的指数移动平均（EMA）来稳定批次统计。具体来说，让 $u^{\left ( k \right )}$ 和 $\sigma ^{\left ( k \right )}$ 作为 $\left \| z_{i} \right \|$ 的第k步批次统计值：

$u_{z}=\alpha \mu _{z}^{\left ( k \right )}+\left ( 1-\alpha \right )\mu _{z}^{\left ( k-1 \right )}$

(3.2)自适应边界函数

a、如果图像质量高，我们强调硬样本；

b、如果图像质量较低，我们将不强调硬样本。

我们使用两个自适应项 $g_{angle}$ 和 $g_{add}$ 来实现这一点，分别指角度边界和附加边界。具体来说，我们让：

$f(\theta _{j}, m)_{AdaFace}=\left\{\begin{matrix} s\left ( cos\theta _{j} +g_{angle}\right )-g_{add}\ \ \ j=y_{i}\\ s\cos\theta _{j}\ \ \ j\neq y_{i} \end{matrix}\right.$

其中 $g_{angle}=-m\cdot \widehat{\left \| z_{i} \right \|}$ ， $g_{add}=m\cdot \widehat{\left \| z_{i} \right \|}+m$ 。

当 $\widehat{\left \| z_{i} \right \|}=-1$ 就变为ArcFace，为0就变为CosFace，为1就会变成随着偏移变为负角度边界。

高范数特征将在远离决策边界的地方获得更高的梯度尺度，而低范数特征将在靠近决策边界的地方获得更高的梯度尺度。

对于低范数特征，不强调远离边界的较硬样本，即图像质量较低的情况。

4、总结

本文解决了训练数据集中无法识别的人脸图像引起的问题。数据收集过程或数据增强在训练数据中引入这些图像。受基于图像质量的可识别性差异的影响，通过：

1）使用特征范数作为图像质量的代理；

2）基于特征范数自适应地改变边界函数来控制分配给不同质量图像的梯度尺度来解决该问题。

我们评估了所提出的自适应损失对不同质量数据集的有效性，并实现了混合和低质量人脸数据集的SoTA。

(1)局限性

解决了训练数据中存在无法识别的图像的问题。然而，噪声标签也是大规模人脸训练数据集的显著特征之一。我们的损失函数不会对标签错误的样本进行特殊处理。由于自适应损失非常重视高质量的困难样本，因此可能会错误地强调高质量的错误标记图像。相信未来的工作可以同时自适应地处理不可识别性和标签噪声。

(2)潜在的社会影响

计算机视觉界作为一个整体应努力将负面社会影响降至最低。我们的实验使用了训练数据集MS1MV*，它是MS Celeb的副产品，该数据集由其创建者提取。为了在公平的基础上将我们的结果与SoTA方法进行比较，我们需要使用MS1MV*。然而，我们认为社区应该转向新的数据集，因此我们纳入了新发布的WebFace4M的结果，以促进未来的研究。在科学界，收集人类数据需要IRB批准，以确保知情同意。虽然IRB状态通常不由数据集创建者提供，但由于收集过程的性质，假设大多数FR数据集（IJB-S除外）没有IRB。FR社区的一个方向是在知情同意的情况下收集大型数据集，在没有社会顾虑的情况下促进研发。

AIOps：解决企业IT挑战的智能利器雅菲奥朗认证培训 AIOps SRE 可观测性
前言：在当今数字化的时代，企业IT基础设施和应用程序规模不断扩大，面临着日益复杂的挑战。在这种情况下，AIOps人工智能运维成为解决企业IT运维困境的智能利器。AIOps与可观测性密切相关，可观测性是实现AIOps的基础。通过收集、监视和理解系统数据，AIOps能够自动化运维任务、实时监控系统状态、预测潜在问题，从而提高效率和稳定性。AIOps尤其适用于IT运维部门，这是一个迫切需要此类技术的群体
使用AIOps进行更好的事件管理茵赛飞3D CAD数据转换软件 pagerduty devops 人工智能运维
DevOps为科技界带来了更加协作和高效的工作流程。随着AIOps的集成，自动化更进一步，使用人工智能为团队提供更快的根本原因分析和算法降噪。主要从采用AIOps中受益的主要领域之一是事件管理。AIOps可以帮助DevOps团队自动化工作流程，以实现更智能、更高效的事件管理，从而腾出时间让IT运营团队成员专注于创新以改善用户体验。在本文中，我们将了解AIOps如何从检测和识别到响应改进事件管理，以
AI大模型编程能力对比：Deepseek&Claude&Gemini 黑夜路人（heiyeluren） AI人工智能人工智能 ai AIGC 语言模型
在当今快速发展的技术领域，人工智能（AI）模型在编程和数据处理方面的应用越来越广泛。不同的AI模型因其独特的设计理念和技术优势，适用于不同的编程任务和场景。本文将对三种主流的AI模型——DeepSeekv3、GeminiFlash2.0和Claude3.5Sonnet的编程能力进行详细对比，帮助读者根据具体需求选择最合适的工具。同时对DeepSeekv3、GeminiFlash2.0和Claude
DeepSeek：智能搜索与分析的新纪元 XRC2231 学习
在人工智能浪潮席卷全球的今天，DeepSeek如同一颗璀璨的新星，以其独特的魅力和强大的功能，在AI领域脱颖而出。DeepSeek，这一基于深度学习和数据挖掘技术的智能搜索与分析系统，不仅重新定义了搜索引擎的边界，更以其卓越的性能和广泛的应用场景，为全球用户带来了前所未有的智能体验。本文将从DeepSeek的定义、特点、应用场景、优势等方面进行全面而深入的介绍，带您领略这一新兴技术的独特魅力。一、
哈尔滨工业大学DeepSeek公开课人工智能：大模型原理技术与应用-从GPT到DeepSeek｜附视频下载方法你觉得205 人工智能机器学习大数据 ai 知识图谱 python 运维
导读INTRODUCTION今天继续哈尔滨工业大学车万翔教授带来了一场主题为“DeepSeek技术前沿与应用”的报告。本报告深入探讨了大语言模型在自然语言处理（NLP）领域的核心地位及其发展历程，从基础概念出发，延伸至语言模型在机器翻译、拼音输入法、语音识别等任务中的关键作用。强调了语言模型不仅辅助其他NLP任务，本身也蕴含大量知识，如地理信息、语义理解和推理能力。随着技术的发展，尤其是trans
大模型学习终极指南：从新手到专家的必经之路，全网最详尽解析，你敢挑战吗？大模型入门教程学习人工智能 AI 大模型大模型学习大模型教程 AI大模型
随着人工智能技术的飞速发展，大模型（Large-ScaleModels）已经成为推动自然语言处理（NLP）、计算机视觉（CV）等领域进步的关键因素。本文将为您详细介绍从零开始学习大模型直至成为专家的全过程，包括所需掌握的知识点、学习资源以及实践建议等。无论您是初学者还是有一定基础的专业人士，都能从中获得有价值的指导。一、基础知识准备在开始学习大模型之前，需要先掌握一些基础知识，这些知识将为后续的学
编程内容简述！恶霸不委屈开发语言青少年编程汇编 java python
编程是指通过计算机语言来开发软件、程序和应用的过程，通常通过编写一系列的指令，来让计算机完成特定的任务。编程可以涉及多个领域和技术，以下是一些主要的编程内容：1.编程语言编程语言是程序员与计算机进行沟通的桥梁，不同的编程语言适用于不同的任务。常见的编程语言有：Python：简单易学，适用于数据分析、人工智能、网页开发等。JavaScript：网页开发中不可或缺的语言，用于动态网页和前端开发。Jav
大模型Agent 和 RAG 的关系大数据追光猿大模型语言模型人工智能学习方法 transformer
Agent和RAG（Retrieval-AugmentedGeneration）是两种在自然语言处理（NLP）和人工智能领域中广泛使用的技术，它们在功能、目标和实现方式上既有区别又有联系。以下是它们的关系及其协同作用的详细分析。1.Agent和RAG的定义（1）Agent定义：Agent是一种智能体，能够感知环境并采取行动以完成特定任务。在NLP领域，Agent通常指一个基于大语言模型（LLM）的
国产模型能否挑战 GPT-4？一文拆解 DeepSeek-V3 架构与实战应用 AI筑梦师人工智能学习框架架构深度学习 python agi 人工智能 tensorflow
✳️一、引言✅1.1DeepSeek-V3发布背景与定位随着大模型技术的快速演进，从GPT-3到GPT-4，全球在通用人工智能方向取得了长足进展。但与此同时，开源社区始终缺乏一个真正兼顾性能、效率、中文能力和实用性的高质量大模型。DeepSeek-V3的推出正是在这个背景下的一次关键突破。DeepSeek-V3是由中国团队DeepSeek开发的第三代大语言模型，它具备以下几个核心特性：开源可商用：
大数据技术实战---项目中遇到的问题及项目经验一个“不专业”的阿凡大数据
问题导读：1、项目中遇到过哪些问题？2、Kafka消息数据积压，Kafka消费能力不足怎么处理？3、Sqoop数据导出一致性问题？4、整体项目框架如何设计？项目中遇到过哪些问题7.1Hadoop宕机（1）如果MR造成系统宕机。此时要控制Yarn同时运行的任务数，和每个任务申请的最大内存。调整参数：yarn.scheduler.maximum-allocation-mb（单个任务可申请的最多物理内存
Agent、RAG、LangChain的概念及作用北极冰雨大模型人工智能
Agent：概念：在人工智能中，Agent通常指的是能够执行任务或做出决策的实体，可以是简单的程序，也可以是复杂的系统，如自动化客服助手、推荐系统等，甚至可以是软件代理、机器人或虚拟助手等各种形式。作用：它能利用内置的大语言模型来做出规划，决定执行哪些步骤，以及每个步骤需要调用哪些工具（如RAG），之后调用相应的工具，最终完成任务。例如，在客服问答场景中，Agent可以根据用户的问题，规划出需要查
AI模型技术演进与行业应用图谱智能计算研究中心其他
内容概要当前AI模型技术正经历从基础架构到行业落地的系统性革新。主流深度学习框架如TensorFlow和PyTorch持续优化动态计算图与分布式训练能力，而MXNet凭借高效的异构计算支持在边缘场景崭露头角。与此同时，模型压缩技术通过量化和知识蒸馏将参数量降低60%-80%，联邦学习则通过加密梯度交换实现多机构数据协同训练。在应用层面，医疗诊断模型通过迁移学习在CT影像分类任务中达到98.2%的准
DeepSeek多语言AI高效应用实践智能计算研究中心其他
内容概要在人工智能技术快速迭代的背景下，DeepSeek系列模型凭借混合专家架构（MoE）与670亿参数规模，在多语言处理、视觉语言理解及复杂任务生成领域实现了突破性进展。本文系统性拆解其技术架构设计逻辑，聚焦论文写作、代码生成、SEO关键词拓展三大核心场景，分析模型在高生成质量、低使用成本维度的差异化优势。技术维度DeepSeekProver传统单模态模型多语言支持97种语言动态切换单一语种优化
Apache大数据旭哥优选大数据选题 Apache大数据旭大数据定制选题 java hadoop spark 开发语言 idea hive 数据库架构
定制旭哥服务，一对一，无中介包安装+答疑+售后态度和技术都很重要定制按需求做要求不高就实惠一点定制需提前沟通好怎么做，这样才能避免不必要的麻烦python、flask、Django、mapreduce、mysqljava、springboot、vue、echarts、hadoop、spark、hive、hbase、flink、SparkStreaming、kafka、flume、sqoop分析+推
AI大模型训练教程 Small踢倒coffee_氕氘氚 python自学经验分享笔记
1.引言随着人工智能技术的快速发展，大模型（如GPT-3、BERT等）在自然语言处理、计算机视觉等领域取得了显著的成果。训练一个大模型需要大量的计算资源、数据和专业知识。本教程将带你了解如何从零开始训练一个AI大模型。2.准备工作2.1硬件要求GPU：推荐使用NVIDIA的高性能GPU，如A100、V100等。内存：至少64GBRAM。存储：SSD存储，至少1TB。#2.2软件环境操作系统：Lin
Java后端开发技术详解小二爱编程· java 开发语言
Java作为一门成熟的编程语言，已广泛应用于后端开发领域。其强大的生态系统和广泛的支持库使得Java成为许多企业和开发者的首选后端开发语言。随着云计算、微服务架构和大数据技术的兴起，Java后端开发的技术栈也不断演进。本文将详细介绍Java后端开发的核心技术，包括Java基础、常见框架、数据库操作、缓存技术、异步编程等。1.Java基础：理解面向对象的编程Java是一种面向对象的编程语言，面向对象
使用Jupyter Notebook进行深度学习编程 - 深度学习教程 shandianfk_com ChatGPT AI jupyter 深度学习 ide
大家好，今天我们要聊聊如何使用JupyterNotebook进行深度学习编程。深度学习是人工智能领域中的一项重要技术，通过模仿人脑神经网络的方式进行学习和分析。JupyterNotebook作为一个强大的工具，可以帮助我们轻松地进行深度学习编程，尤其适合初学者和研究人员。本文将带领大家一步步了解如何在JupyterNotebook中开展深度学习项目。一、什么是JupyterNotebook？Jup
Opencv之计算机视觉一闭月之泪舞计算机视觉计算机视觉 opencv python
一、环境准备使用opencv库来实现简单的计算机视觉。需要安装两个库：opencv-python和opencv-contrib-python，版本可以自行选择，注意不同版本的opencv中的某些函数名和用法可能不同pipinstallopencv-python==3.4.18.65-ihttps://pypi.tuna.tsinghua.edu.cn/simplepipinstallopencv-
计算机视觉总结 Trank-Lw 计算机视觉深度学习人工智能
以下是针对上述问题的详细解答，并结合代码示例进行说明：1.改进YOLOv5人脸检测模块，复杂光照场景准确率从98.2%提升至99.5%优化具体过程：光照补偿：在数据预处理阶段，采用自适应光照补偿算法，对图像进行实时增强，以减少光照变化对人脸检测的影响。数据增强：在训练数据中增加复杂光照场景下的样本，如强光、弱光、背光等，通过数据增强提高模型对不同光照条件的适应性。模型调整：对YOLOv5模型的网络
英伟达常用GPU参数速查表，含B300..... Ai17316391579 深度学习服务器人工智能机器学习服务器电脑计算机视觉深度学习神经网络
英伟达常用GPU参数速查表，收藏备用：含RTX5090、RTX4090D、L40、L20、A100、A800、H100、H800、H20、H200、B200、B300、GB300.....专注于高性能计算人工智能细分领域kyfwq001#5090##4090##英伟达“新核弹”B200发布##英伟达##英伟达B300##GPU##服务器##显卡##英伟达H800/A800芯片将禁售#
深度学习 Deep Learning 第8章深度学习优化 odoo中国 AI编程人工智能深度学习人工智能优化
深度学习第8章深度学习的优化章节概述本章深入探讨了深度学习中的优化技术，旨在解决模型训练过程中面临的各种挑战。优化是深度学习的核心环节，直接关系到模型的训练效率和最终性能。本章首先介绍了优化在深度学习中的特殊性，然后详细讨论了多种优化算法，包括随机梯度下降（SGD）、动量法、Nesterov动量法、AdaGrad、RMSProp和Adam等。此外，还探讨了参数初始化策略、自适应学习率方法以及二阶优
景联文科技提供高质量文本标注服务，驱动AI技术发展景联文科技科技人工智能
文本标注是指在原始文本数据上添加标签的过程，这些标签可以用来指示特定的实体、关系、事件等信息，以帮助计算机理解和处理这些数据。文本标注是自然语言处理（NLP）领域的一个重要环节，它通过为文本的不同部分提供具体的含义和上下文信息，增强机器学习和深度学习模型对文本内容的理解能力。标注类型情感分析情感极性：确定文本表达的情感倾向，如正面、负面或中立。强度评估：衡量情感的强烈程度，从轻微到极端不等。命名实
IDC权威认证！永洪科技入选 IDC「GBI图谱」，点亮生成式 BI 价值灯塔永洪科技科技人工智能 BI 大数据数据分析
大数据市场正在稳步前进，生成式AI已成为厂商服务的重点方向，其发展离不开数据底座建设和数据工程管理，反过来AI也会帮助开发运维人员、业务人员和管理层更好地使用、查询数据。IDC调研数据显示，在生成式AI的驱动下，未来5年企业在数据管理和数据分析基础设施建设的投资增长率将分别达到8.7%和9.2%。近日，国际咨询机构IDC发布了《中国数据智能市场生态图谱V5.0》，在这一领域，永洪科技以其创新前沿的
打造金融数据新引擎，看永洪科技助力头部农信社搭建一站式分析平台永洪科技金融数据可视化 BI 数据分析大数据
在数字化转型的浪潮中，金融行业作为经济发展的核心引擎，正加速探索数字化、智能化的新路径。永洪科技，近日成功助力某省农村信用社联合社（简称：Z企业）完成了其数字化转型的重要一步，通过部署先进的商业智能解决方案，为Z企业的业务升级与效能提升注入了强劲动力。随着智能金融时代的来临，以大数据、人工智能、移动互联等新兴技术为核心的金融科技持续赋能银行金融业务数字化、智能化、开放化的发展，为金融机构营销体系的
景联文科技：以高质量数据标注推动人工智能领域创新与发展景联文科技科技人工智能数据标注
在当今这个由数据驱动的时代，高质量的数据标注对于推动机器学习、自然语言处理（NLP）、计算机视觉等领域的发展具有不可替代的重要性。数据标注过程涉及对原始数据进行加工，通过标注特定对象的特征来生成能够被机器学习模型识别和使用的编码格式，从而使数据更具有意义和可解读性。数据标注的主要类型包括：图像标注：指在图片中标识出目标物体的位置、形状或类别等信息，如自动驾驶技术中的行人、车辆及交通标志的识别。文本
读书笔记五 ---大数据之路--数仓分层 qq_38215991 big data 大数据
数据分层在流式数据模型中,数据模型整体上分为五层。ODS层跟离线系统的定义一样,ODS层属于操作数据层,是直接从业务系统采集过来的最原始数据（进行了数据清洗）,包含了所有业务的变更过程,数据粒度也是最细的。在这一层,实时和离线在源头上是统一的,这样的好处是用同一份数据加工出来的指标,口径基本是统一的,可以更方便进行实时和离线问数据比对。例如:原始的订单变更记录数据、服务器引擎的访同日志。（原始数据
人工智能与网络信息技术的深度融合鸭鸭鸭进京赶烤学术会议人工智能 AI编程 ai 机器人计算机视觉网络计算机网络
在当今时代，人工智能（AI）和网络信息技术正以前所未有的速度推动着社会变革。从通用人工智能（AGI）到具身智能的普及，AI不仅实现了技术上的飞跃，也在各个行业展现出巨大的应用潜力。随着技术的不断迭代，我们迎来了许多创新应用，例如AI在电子信息技术中的应用，通过算法优化与升级，显著提高了处理效率和准确性。网络信息技术同样在飞速发展。面向2030年的未来网络发展趋势表明，网络将支撑万亿级、人机物、全时
深度学习篇---对角矩阵&矩阵的秩&奇异矩阵 Ronin-Lotus 程序代码篇深度学习篇深度学习矩阵人工智能线性代数
文章目录前言一、对角矩阵（DiagonalMatrix）1.1定义1.2特性行列式运算简化1.3应用领域深度学习信号处理量子力学经济学二、矩阵的秩（RankofaMatrix）2.1定义2.2特性满秩降秩影响2.3应用领域深度学习图像压缩推荐系统控制理论三、奇异矩阵（SingularMatrix）3.1定义3.2特性秩不足行列式为零3.3应用领域深度学习正则化损失函数结构工程统计学数值计算四、跨领
DeepSeek、Grok 与 ChatGPT 三巨头：技术架构与应用场景的全方位解析云策量化 Deepseek chatgpt deepseek grok
前言在当今人工智能领域，DeepSeek、Grok和ChatGPT作为语言模型的三巨头，各自凭借独特的技术架构和广泛的应用场景，在自然语言处理领域占据着重要地位。本文将对这三款模型的技术架构和应用场景进行全方位解析，以期为读者提供深入的了解和有价值的参考。一、技术架构（一）DeepSeekDeepSeek是由DeepSeek团队开发的一款大型语言模型，其技术架构基于深度学习中的Transforme
探索AI模型的巅峰之战：ChatGPT、DeepSeek与Grok 3，谁才是最强？温暖阳光阿斌人工智能 chatgpt
近年来，人工智能领域正处于一场高速迭代的革命中。大型语言模型（LLMs）如ChatGPT、DeepSeek和Grok3纷纷亮相，各展所长，为人们带来了前所未有的体验。在这场"谁是最强"的竞争中，每一方都展现出了令人惊叹的能力和独特的优势。然而，这些模型之间的差异和特点，究竟是什么？它们各自的优势在哪里？又有哪些隐藏的短板？本文将带您深入了解这三位AI巨头的亮点与争议，共同探讨它们在AI领域的位置，
redis学习笔记——不仅仅是存取数据 Everyday都不同 returnSource expire/del incr/lpush 数据库分区 redis
最近项目中用到比较多redis，感觉之前对它一直局限于get/set数据的层面。其实作为一个强大的NoSql数据库产品，如果好好利用它，会带来很多意想不到的效果。（因为我搞java，所以就从jedis的角度来补充一点东西吧。PS：不一定全，只是个人理解，不喜勿喷） 1、关于JedisPool.returnSource(Jedis jeids) 这个方法是从red
SQL性能优化-持续更新中。。。。。。 atongyeye oracle sql
1 通过ROWID访问表--索引你可以采用基于ROWID的访问方式情况,提高访问表的效率, , ROWID包含了表中记录的物理位置信息..ORACLE采用索引(INDEX)实现了数据和存放数据的物理位置(ROWID)之间的联系. 通常索引提供了快速访问ROWID的方法,因此那些基于索引列的查询就可以得到性能上的提高. 2 共享SQL语句--相同的sql放入缓存 3 选择最有效率的表
[JAVA语言]JAVA虚拟机对底层硬件的操控还不完善 comsci JAVA虚拟机
如果我们用汇编语言编写一个直接读写CPU寄存器的代码段，然后利用这个代码段去控制被操作系统屏蔽的硬件资源，这对于JVM虚拟机显然是不合法的，对操作系统来讲，这样也是不合法的，但是如果是一个工程项目的确需要这样做，合同已经签了，我们又不能够这样做，怎么办呢？那么一个精通汇编语言的那种X客，是否在这个时候就会发生某种至关重要的作用呢？ &n
lvs- real 男人50 LVS
#!/bin/bash # # Script to start LVS DR real server. # description: LVS DR real server # #. /etc/rc.d/init.d/functions VIP=10.10.6.252 host='/bin/hostname' case "$1" in sta
生成公钥和私钥 oloz DSA 安全加密
package com.msserver.core.util; import java.security.KeyPair; import java.security.PrivateKey; import java.security.PublicKey; import java.security.SecureRandom; public class SecurityUtil {
UIView 中加入的cocos2d，背景透明 374016526 cocos2d glClearColor
要点是首先pixelFormat:kEAGLColorFormatRGBA8，必须有alpha层才能透明。然后view设置为透明glView.opaque = NO;[director setOpenGLView:glView];[self.viewController.view setBackgroundColor:[UIColor clearColor]];[self.viewControll
mysql常用命令香水浓 mysql
连接数据库 mysql -u troy -ptroy 备份表 mysqldump -u troy -ptroy mm_database mm_user_tbl > user.sql 恢复表（与恢复数据库命令相同） mysql -u troy -ptroy mm_database < user.sql 备份数据库 mysqldump -u troy -ptroy
我的架构经验系列文章 - 后端架构 - 系统层面 agevs JavaScript jquery css html5
系统层面：高可用性所谓高可用性也就是通过避免单独故障加上快速故障转移实现一旦某台物理服务器出现故障能实现故障快速恢复。一般来说，可以采用两种方式，如果可以做业务可以做负载均衡则通过负载均衡实现集群，然后针对每一台服务器进行监控，一旦发生故障则从集群中移除；如果业务只能有单点入口那么可以通过实现Standby机加上虚拟IP机制，实现Active机在出现故障之后虚拟IP转移到Standby的快速
利用ant进行远程tomcat部署 aijuans tomcat
在javaEE项目中，需要将工程部署到远程服务器上，如果部署的频率比较高，手动部署的方式就比较麻烦，可以利用Ant工具实现快捷的部署。这篇博文详细介绍了ant配置的步骤（http://www.cnblogs.com/GloriousOnion/archive/2012/12/18/2822817.html），但是在tomcat7以上不适用，需要修改配置，具体如下： 1.配置tomcat的用户角色
获取复利总收入 baalwolf 获取
public static void main(String args[]){ int money=200; int year=1; double rate=0.1; &
eclipse.ini解释 BigBird2012 eclipse
大多数java开发者使用的都是eclipse，今天感兴趣去eclipse官网搜了一下eclipse.ini的配置，供大家参考，我会把关键的部分给大家用中文解释一下。还是推荐有问题不会直接搜谷歌，看官方文档，这样我们会知道问题的真面目是什么，对问题也有一个全面清晰的认识。 Overview 1、Eclipse.ini的作用 Eclipse startup is controlled by th
AngularJS实现分页功能 bijian1013 JavaScript AngularJS 分页
对于大多数web应用来说显示项目列表是一种很常见的任务。通常情况下，我们的数据会比较多，无法很好地显示在单个页面中。在这种情况下，我们需要把数据以页的方式来展示，同时带有转到上一页和下一页的功能。既然在整个应用中这是一种很常见的需求，那么把这一功能抽象成一个通用的、可复用的分页（Paginator）服务是很有意义的。 &nbs
[Maven学习笔记三]Maven archetype bit1129 ArcheType
archetype的英文意思是原型，Maven archetype表示创建Maven模块的模版，比如创建web项目，创建Spring项目等等. mvn archetype提供了一种命令行交互式创建Maven项目或者模块的方式， mvn archetype 1.在LearnMaven-ch03目录下，执行命令mvn archetype:gener
【Java命令三】jps bit1129 Java命令
jps很简单，用于显示当前运行的Java进程，也可以连接到远程服务器去查看 [hadoop@hadoop bin]$ jps -help usage: jps [-help] jps [-q] [-mlvV] [<hostid>] Definitions: <hostid>: <hostname>[:
ZABBIX2.2 2.4 等各版本之间的兼容性 ronin47
zabbix更新很快，从2009年到现在已经更新多个版本，为了使用更多zabbix的新特性，随之而来的便是升级版本，zabbix版本兼容性是必须优先考虑的一点客户端AGENT兼容 zabbix1.x到zabbix2.x的所有agent都兼容zabbix server2.4：如果你升级zabbix server，客户端是可以不做任何改变，除非你想使用agent的一些新特性。 Zabbix代理（p
unity 3d还是cocos2dx哪个适合游戏？ brotherlamp unity自学 unity教程 unity视频 unity资料 unity
unity 3d还是cocos2dx哪个适合游戏？问：unity 3d还是cocos2dx哪个适合游戏？答：首先目前来看unity视频教程因为是3d引擎，目前对2d支持并不完善，unity 3d 目前做2d普遍两种思路，一种是正交相机，3d画面2d视角，另一种是通过一些插件，动态创建mesh来绘制图形单元目前用的较多的是2d toolkit，ex2d，smooth moves，sm2，
百度笔试题：一个已经排序好的很大的数组，现在给它划分成m段，每段长度不定，段长最长为k，然后段内打乱顺序，请设计一个算法对其进行重新排序 bylijinnan java 算法面试百度招聘
import java.util.Arrays; /** * 最早是在陈利人老师的微博看到这道题： * #面试题#An array with n elements which is K most sorted，就是每个element的初始位置和它最终的排序后的位置的距离不超过常数K * 设计一个排序算法。It should be faster than O(n*lgn)。
获取checkbox复选框的值 chiangfai checkbox
<title>CheckBox</title> <script type = "text/javascript"> doGetVal: function doGetVal() { //var fruitName = document.getElementById("apple").value;//根据
MySQLdb用户指南 chenchao051 mysqldb
原网页被墙，放这里备用。 MySQLdb User's Guide Contents Introduction Installation _mysql MySQL C API translation MySQL C API function mapping Some _mysql examples MySQLdb
HIVE 窗口及分析函数 daizj hive 窗口函数分析函数
窗口函数应用场景：（1）用于分区排序（2）动态Group By （3）Top N （4）累计计算（5）层次查询一、分析函数用于等级、百分点、n分片等。函数说明 RANK() &nbs
PHP ZipArchive 实现压缩解压Zip文件 dcj3sjt126com PHP zip
PHP ZipArchive 是PHP自带的扩展类，可以轻松实现ZIP文件的压缩和解压，使用前首先要确保PHP ZIP 扩展已经开启，具体开启方法就不说了，不同的平台开启PHP扩增的方法网上都有，如有疑问欢迎交流。这里整理一下常用的示例供参考。一、解压缩zip文件 01 02 03 04 05 06 07 08 09 10 11
精彩英语贺词 dcj3sjt126com 英语
I'm always here 我会一直在这里支持你 &nb
基于Java注解的Spring的IoC功能 e200702084 java spring bean IOC Office
java模拟post请求 geeksun java
一般API接收客户端（比如网页、APP或其他应用服务）的请求，但在测试时需要模拟来自外界的请求，经探索，使用HttpComponentshttpClient可模拟Post提交请求。此处用HttpComponents的httpclient来完成使命。 import org.apache.http.HttpEntity ; import org.apache.http.HttpRespon
Swift语法之 ---- ?和!区别 hongtoushizi ?swift !
转载自： http://blog.sina.com.cn/s/blog_71715bf80102ux3v.html Swift语言使用var定义变量，但和别的语言不同，Swift里不会自动给变量赋初始值，也就是说变量不会有默认值，所以要求使用变量之前必须要对其初始化。如果在使用变量之前不进行初始化就会报错： var stringValue : String //
centos7安装jdk1.7 jisonami jdk centos
安装JDK1.7 步骤1、解压tar包在当前目录 [root@localhost usr]#tar -xzvf jdk-7u75-linux-x64.tar.gz 步骤2：配置环境变量在etc/profile文件下添加 export JAVA_HOME=/usr/java/jdk1.7.0_75 export CLASSPATH=/usr/java/jdk1.7.0_75/lib
数据源架构模式之数据映射器 home198979 PHP 架构数据映射器 datamapper
前面分别介绍了数据源架构模式之表数据入口、数据源架构模式之行和数据入口数据源架构模式之活动记录，相较于这三种数据源架构模式，数据映射器显得更加“高大上”。一、概念数据映射器（Data Mapper）：在保持对象和数据库（以及映射器本身）彼此独立的情况下，在二者之间移动数据的一个映射器层。概念永远都是抽象的，简单的说，数据映射器就是一个负责将数据映射到对象的类数据。 &nb
在Python中使用MYSQL pda158 mysql python
缘由　　近期在折腾一个小东西须要抓取网上的页面。然后进行解析。将结果放到数据库中。　　了解到 Python在这方面有优势，便选用之。　　由于我有台 server上面安装有 mysql，自然使用之。在进行数据库的这个操作过程中遇到了不少问题，这里记录一下，大家共勉。　　 python中mysql的调用　　百度之后能够通过MySQLdb进行数据库操作。
单例模式 hxl1988_0311 java 单例设计模式单件
package com.sosop.designpattern.singleton; /* * 单件模式：保证一个类必须只有一个实例，并提供全局的访问点 * * 所以单例模式必须有私有的构造器，没有私有构造器根本不用谈单件 * * 必须考虑到并发情况下创建了多个实例对象 * */ /** * 虽然有锁，但是只在第一次创建对象的时候加锁，并发时不会存在效率
27种迹象显示你应该辞掉程序员的工作 vipshichg 工作
1、你仍然在等待老板在2010年答应的要提拔你的暗示。 2、你的上级近10年没有开发过任何代码。 3、老板假装懂你说的这些技术，但实际上他完全不知道你在说什么。 4、你干完的项目6个月后才部署到现场服务器上。 5、时不时的，老板在检查你刚刚完成的工作时，要求按新想法重新开发。 6、而最终这个软件只有12个用户。 7、时间全浪费在办公室政治中，而不是用在开发好的软件上。 8、部署前5分钟才开始测试。

《AdaFace: Quality Adaptive Margin for Face Recognition》用于人脸识别的图像质量自适应边缘损失

你可能感兴趣的:(低分辨率人脸识别,大数据,计算机视觉,深度学习,图像处理,人工智能)