Mango_Holi

2022年斯坦福AI指数报告中文全解读-第二章 2.1 机器视觉——图像

斯坦福大学的人工智能机构 Stanford Institute for Human-Centered Artificial Intelligence (HAI)发布的这第五版《AI指数报告》（2022）英文版一共230页。为了方便阅读，我将他翻译成中文记录下来，本文仅摘取重要且有趣的部分，且有部分自己的阅读感受和见解，需要阅读原文的请至链接2022年斯坦福AI指数报告-深度学习文档类资源-CSDN下载。

人工智能指数报告跟踪、整理、提炼和可视化与人工智能相关的数据。这份报告的使命是为政策制定者、研究人员、企业高管、媒体记者提供公正、经过严格审查的全球数据，使得公众对复杂的人工智能领域有更透彻、更细致入微的理解。它旨在成为世界上最可信、最权威的人工智能数据和见解来源。

第二章. 人工智能模型性能

今年，模型性能章节包含了对人工智能更多技术子领域的分析，包括计算机视觉、语言、语音、推荐、强化学习、硬件和机器人技术。本次调研使用了许多量化测量方法，从常见的人工智能基准算法和对泛化领域调研的大赛挑战，来突出表现那些最佳人工智能模型的发展历程。

概要：

数据，数据，数据：基于实验室基准条件的模型技术结果则越来越依赖于使用更多的训练数据来获得更先进的结果。换言之，模型本身的设计好坏往往差别不大，而更多的训练数据能带来更好的实验效果。截至 2021 年，斯坦福大学AI指标报告中的 10 个基准测试中有 9 个最先进的 AI 系统经过了更多的训练。这种趋势隐隐指引着私营参与者倾向去寻找大量的数据集。
对特定计算机视觉子任务的兴趣日益浓厚：2021 年，研究界在一些具体的计算机视觉子任务上有着更高的兴趣水平，例如医学图像分割和蒙面人脸识别（我的导师张百灵教授在2015年左右就在研究这几个领域的具体任务，我想现在研究界只是有更多来自工程学院和生物学院的教授关心这类识别为他们在特定领域研究带来的创新成果，仅此而已）。例如，2020年前只有 3 篇研究论文针对 Kvasir-SEG 医学成像测试了系统基准。2021 年，有 25 篇研究论文。这种增长表明人工智能研究是在转向更直接、更实际应用的研究。
AI 尚未掌握复杂的语言任务：AI 在基本阅读技术基准的性能上已经超过了人类的水平，SuperGLUE 和 SQuAD 等阅读理解基准表现提高了 1%–5%。虽然人工智能系统仍然无法在更复杂的语言任务上达到可媲美人类的表现，例如溯因自然语言推理（aNLI），但差异正在缩小。2019年，人类的表现仅领先 9个百分点（aNLI）。截至 2021 年，这一差距已缩小到 1%。
转向更通用的强化学习：在过去十年中，人工智能系统已经能够掌握一定限制条件下的强化学习任务。这要求系统最大限度地提高某项特定技能的表现，例如国际象棋。顶级国际象棋软件引擎现在比 Magnus Carlsen 的最高 ELO 分数高出 24%。然而，在过去两年，人工智能系统在新环境、更通用的强化学习任务上也提高了129%(Procgen) 。这一趋势预示着人工智能系统未来的发展可以学习更广泛地思考能力。
人工智能变得更实惠、性能更高：自 2018 年以来，训练图像分类系统的成本降低了 63.6%，而训练次数提高了 94.4%。其他任务也出现训练成本降低、但训练时间加快的趋势：推荐系统，物体检测和语言处理，并有利于更广泛的人工智能商业应用。
机械臂正在变得更便宜：一项人工智能指数调查显示，机械臂的中位数价格在过去六年中下降了 4 倍——从2016 年每只手臂 50,000 美元下降到 2021 年的 12,845 美元。关于机器人的研究变得更容易获得，且负担得起。

2.1 机器视觉——图像

Holi的导览指南：

第二章. 人工智能模型性能

概要：

2.1 机器视觉——图像

图像分类任务 IMAGE CLASSIFICATION

ImageNet

ImageNet: Top-1 Accuracy

ImageNet: Top-5 Accuracy

图像生成任务 IMAGE GENERATION

STL-10: Fréchet Inception Distance (FID) Score

CIFAR-10: Fréchet Inception Distance (FID) Score

深度伪造检测 DEEPFAKE DETECTION

FaceForensics++

Celab-DF

人体姿态估计 HUMAN POSE ESTIMATION

Leeds Sports Poses: Percentage of Correct Keypoints (PCK)

Human3.6M: Average Mean Per Joint Position Error (MPJPE)

语义分割任务 SEMANTIC SEGMENTATION

Cityscapes

医学图像分割任务 MEDICAL IMAGE SEGMENTATION

CVC-ClinicDB and Kvasir-SEG

人脸检测和识别 FACE DETECTION AND RECOGNITION

National Institute of Standards and Technology (NIST) Face Recognition Vendor Test (FRVT)

人脸检测：戴口罩的影响 FACE DETECTION: EFFECTS OF MASK-WEARING

Face Recognition Vendor Test (FRVT): Face-Mask Effects

Masked Labeled Faces in the Wild (MLFW)

视觉推理 VISUAL REASONING

Visual Question Answering(VQA) Challenge

图像分类任务 IMAGE CLASSIFICATION

图像分类是指机器对他们在图像中看到的内容进行分类的能力。实际上，图像识别系统可以帮助汽车识别周围的物体，帮助医生检测肿瘤，帮助工厂经理发现生产缺陷。在过去的十年中，我们看到了图像识别模型的技术能力巨大的进步。尤其是随着研究人员学习了更多的机器学习技巧。此外，算法、硬件和数据技术的进步意味着图像识别变得更实惠，更广泛适用，并且比以往任何时候都可访问。

ImageNet

ImageNet是一个数据库，其中包括，研究人员可公开使用的超过1400万张图像处理20,000个类别的图像分类问题。创建于2009年，ImageNet现在是科学家对图像分类的基准算法改进最常见的方式之一。

ImageNet: Top-1 Accuracy

ImageNet 上的基准测试是通过准确率指标来衡量的，它量化了 AI 模型分配给定图像正确标签的频率。Top-1 准确率衡量给定图像的分类模型最高预测率与实际目标标签的相似度。近年来，人们越来越普遍地通过额外的预训练其他图像数据集的数据提高ImageNet 的系统性能。

下图中显示2021 年底比 2012 年底，顶级图像分类模型使每 10 次分类尝试的 Top-1 准确率从平均出现 4 个错误提升到平均 1 个错误。 2021 年，最好的预训练系统是 Google Brain 团队的 CoAtNets模型。

ImageNet: Top-5 Accuracy

如图所示，Top-5 准确率考虑了模型与图像标签对齐的前 5 个最高概率答案，人工智能系统目前实现了近乎完美的 Top-5 估计。目前，预训练 Top-5 准确率的最先进性能是 99.0% ，于 2021 年 11 月由微软云和微软 AI 的 Florence-CoSwim-H 模型达成。

ImageNet 上 Top-5 准确率的改进似乎是停滞不前的，这也许不足为奇。如果你的系统在 100 次分类中正确分类 98 或 99 次，也只能有这样的准确率了。

图像生成任务 IMAGE GENERATION

图像生成是与真实图像无异的生成图像任务。图像生成可以在视觉内容必须虚拟创建的领域中广泛使用，例如娱乐业（像 NVIDIA 这样的公司已经使用图像生成器来创建用于游戏的虚拟世界）、时尚业（设计师可以让 AI 系统生成不同的设计模式）和医疗保健（图像生成器可以综合创造新药
化合物）。下图说明了去年由人工智能系统综合生成的图像生成任务进展中呈现一些人脸。

STL-10: Fréchet Inception Distance (FID) Score

Fréchet Inception Distance 算法分数跟踪人工生成的一组图像和生成它的真实图像的相似度。低分意味着生成的图像更类似于真品，零分表示虚假图像与真实图像完全相同。

下图记录了在 STL-10 数据集上使用 FID 制作生成模型的增益，这是在计算机视觉中最广泛使用的数据集之一。在 STL-10 数据集上最先进的模型是由韩国高级科学技术研究所研究人员和首尔大学联合开发的， FID 分数为 7.7，比 2020 年最先进的结果更显著。

CIFAR-10: Fréchet Inception Distance (FID) Score

图像生成的进展也可以在 CIFAR-10 数据集上作为基准，一个包含 60,000 个彩色图像的10类不同的对象数据集。2021 年发布在 CIFAR-10 数据集上的最先进结果是由来自英伟达的研究人员实现的。

顶级图像生成模型在 CIFAR-10 数据集上所获得的 FID 分数比 STL-10 数据集上低得多。这种差异可能是由于在 CIFAR-10 （32 x 32 像素）数据集上包含比 STL-10（96 x 96 像素）数据集上分辨率低得多的图像。

深度伪造检测 DEEPFAKE DETECTION

许多人工智能系统现在可以生成与真人无异的虚假图像。相关技术涉及将一个人的脸叠加到另一个人的脸上，创建所谓的“深度伪造”。将 Deepfake 用于广告或生成厌恶女性的色情和虚假信息的各种目的（例如，2018 年奥巴马对特朗普亵渎讲话的 deepfake 视频在网上流传超过 200 万次）。在过去的几年里，人工智能研究人员已经试图通过制作更强大的深度伪造检测算法跟上改进 deepfake 技术的步伐。

FaceForensics++

FaceForensics++ 是一个 deepfake 检测基准测试数据集，包含来自 YouTube 视频大约 1,000 个原始视频序列。FaceForensics++ 的模型进展以准确性为衡量标准：算法可以正确地识别改变的图像百分比。

尽管 FaceForensics ++ 是在 2019 年推出的，研究人员已经测试了现存的 deepfake 检测方法以跟踪随着时间的推移在 deepfake 检测算法的模型进展，如下图。在过去的十年中，AI系统在检测 deepfake 深度伪造的图像方面变得越来越好。2012 年，表现最佳的模型系统在所有四个 Faceforenics ++ 数据集中可以正确识别 69.9％的深度伪造图像。在 2021 年，该数量增加到 97.7％。

Celab-DF

Celeb-DF deepfake 检测数据集由 590 个原创名人 YouTube 视频被操纵成 5,639 个深度伪造图像。Celeb-DF 于 2019 年被推出。2021年，Celeb-DF 的最高分是 76.9 ，来自中国科技大学和阿里巴巴集团的研究人员。

在 Celeb-DF 数据集上比 FaceForensics++ 数据集上，顶级检测模型的表现明显更差（20%），表明 Celeb-DF 是一个更具挑战性的数据集测试技术。随着 deepfake 技术在未来几年的不断发展，这将很重要地继续监测在 Celeb-DF 数据集上和其他同样具有挑战性的 deepfake 检测数据集方面的进展。

人体姿态估计 HUMAN POSE ESTIMATION

人体姿态估计是从单个图像估计不同人体关节位置（手臂、头部、躯干等）的任务，然后整合
正确标记人类所采取姿势的估计。

人体姿态估计可用于促进体育分析、人群监控、CGI 开发、虚拟环境设计、和交通运输等目的的活动识别（例如，识别机场跑道管制员的身体语言标志）。

Leeds Sports Poses: Percentage of Correct Keypoints (PCK)

Leeds Sports Poses 利兹运动姿势数据集包含了收集到的 Flickr 参加一项运动的 2,000 张运动员图像。每个图像包含 14 个不同身体关节点信息。利兹运动姿势的表现基准是通过正确估计关键点的百分比来评估的。
2021 年，表现最好的人体姿态估计模型正确识别了利兹运动姿势数据集上 99.5% 的运动姿势关键点，如图。鉴于利兹运动姿势数据集上的准确率上限是 100.0%，人体姿态估计更具挑战性的基准必须被开发，因为我们非常接近了饱和基准。

Human3.6M: Average Mean Per Joint Position Error (MPJPE)

3D 人体姿态估计是一种更具挑战性的姿态估计任务类型，要求人工智能系统在三维而不是二维空间中进行姿态估计。在 Human3.6M 数据集上跟踪 3D 人体姿态估计的进展。 Human3.6M 数据集是超过 360 万个集合 17 种不同类型的人体姿势的图像（聊电话、讨论和吸烟等）。在Human3.6M 上的表现会测量每个关节的算术平均值，产生以毫米为单位的位置误差，这是在 AI 模型的位置估计和实际位置之间位置平均差异。
2014 年，表现最好的模型平均每关节误差 16 厘米，是标准学术尺寸的一半。 2021年，这个数字下降到1.9厘米，小于一般回形针的大小。

语义分割任务 SEMANTIC SEGMENTATION

语义分割是分配单个图像像素一个类别（例如人，自行车或背景）的任务。太多现实世界的领域需要像素级图像细分，例如自动驾驶（识别汽车看到的图像的哪些部分是行人和哪些部分是道路），图像分析（区分照片中的前景和背景），以及医学诊断（在肺中分割肿瘤）。

Cityscapes

Cityscapes 数据集包含来自 50 个城市环境的街道图像，在不同季节的白天来评估广泛的语义分割任务（实例级，全景模拟和 3D 车辆）。
大多数研究人员提交的任务是像素级的语义标签，人工智能系统必须面临的挑战是在每个像素级别上对图像进行语义标记。挑战者在并集交集 (IoU) 上进行评估度量，IoU 得分越高，对应越好的分割精度。实际上，分数更高意味着模型预测的更大比例图像部分与真实图像有重叠。
2021 年，在 Cityscapes 数据集上表现最好的 AI 系统报告分数比 2015 年的高出了 14.6 个百分点。与其他计算机视觉任务一样，在 Cityscapes 数据集上的模型已经在过去几年经过了其他训练数据的预训练了。

医学图像分割任务 MEDICAL IMAGE SEGMENTATION

医学图像分割任务指的是AI系统分割特定对象的能力，例如器官，医学图像中的病变或肿瘤，如图。这项任务的技术进步对于精简医学诊断的过程来说至关重要。医学影像分割任务的进展意味着医生可以用更少的时间诊断，并争分夺秒地去治疗患者。

CVC-ClinicDB and Kvasir-SEG

CVC-ClinicDB 是一个数据集，包括来自 31 个结肠镜检查的 600 多张高分辨率图像。 Kvasir-SEG 是一个 1,000 个由医生手动分割并由专业胃肠病学家交叉验证过的（具有专家高度准确性发）高分辨率胃肠息肉图片组成的公共数据集。这两个数据集用于跟踪医学图像分割任务的模型发展进度。模型性能以平均 DICE 指标衡量，代表着由AI系统和手动分割产生的图片平均重叠率。
人工智能系统现在能够在 CVC-ClinicDB 数据集上正确分割结肠镜息肉发生率的准确率为 94.2%，且自 2015 年以来提高了 11.9 个百分点，自2020 年以来提高了 1.8 个百分点。在 Kvasir-SEG 数据集上也取得了类似的进展，目前表现最好的人工智能模型能以 92.2% 的准确率正确分割胃肠息肉。专为医学图像分割而设计的最早的卷积神经网络之一 MSRF-Net 在 CVC-ClinicDB 和 Kvasir-SEG 数据集上的基准测试保持着最好的表现。

在 Kvasir-SEG 数据集上的基准测试也指向了医学图像分割任务的病毒式传播。早在 2020 年之前，该数据集仅在三篇学术论文中被引用。到2020 年，这个数字上升到 6 个，到 2021 年飙升到 25 个。去年还举办了 KiTS21（肾脏和肾肿瘤分割挑战赛），来自学术界和工业界的医学研究人员创建对肾肿瘤和肾脏周围的解剖结构自动分割的最佳系统。

人脸检测和识别 FACE DETECTION AND RECOGNITION

在人脸面部检测中，人工智能系统的任务是识别图像或视频中的人。虽然人脸识别技术已经存在了几十年，该项技术也在过去几年取得了重大进展。一些当今性能最佳的面部识别算法在具有挑战性的数据集上的成功率接近 100%。
人脸识别可便于跨境旅行，在防欺诈中保护敏感信息文件，并在在线的监考中识别考试作弊行为。然而，面部识别最大的应用是在于它助力安防的潜力，这使得这项技术对世界各地的军队和政府（例如，18/24 个美国政府机构已经在使用一些面部识别技术）。

National Institute of Standards and Technology (NIST) Face Recognition Vendor Test (FRVT)

美国国家标准与技术研究院（NIST）的人脸识别供应商测试标准（FRVT）在各类国土安全和执法任务中负责衡量面部识别算法的好坏，例如不同新闻摄影图像的面部识别，拐卖儿童受害者面部识别，护照重复数据的删除，和签证图像的交叉验证。面部识别算法的进步是根据虚假不匹配率（false non-match rate, FNMR）或错误率（模型无法将图像与人匹配的概率）。
2017年，一些表现最好的面部识别算法在某些 FRVT测试上的错误率超过 50.0%。 2021 年，没有人发布的模型错误率高于3.0%。2021 年所有数据集中表现最佳的模型（签证照片）的错误率为 0.1%，这意味着对于每 1,000 个人脸，模型能正确识别了 999 个人脸。

人脸检测：戴口罩的影响 FACE DETECTION: EFFECTS OF MASK-WEARING

Face Recognition Vendor Test (FRVT): Face-Mask Effects

随着 COVID-19 大流行的爆发和附带的戴口罩人脸识别任务，人脸识别变得更具挑战性。戴口罩的人脸识别任务要求 AI 模型测试识别两个签证数据集上的人脸照片，包括蒙面的脸和无遮挡的脸。
从 FRVT 测试中收集到三个重要的趋势：（1）面部识别系统仍然可以在戴口罩的人脸上相对较好地执行； (2) 戴口罩的人脸识别模型表现比无遮挡的人脸要差； (3）自 2019 年以来，模型效果差距已经在逐步缩小。

Although facial recognition technology has existed for several decades, the technical progress in the last few years has been significant. Some of today’s top-performing facial recognition algorithms have a near 100% success rate on challenging datasets.
虽然人脸识别技术已经存在了几十年，过去几年的技术进步一直非常重要。今天的最好表现的人脸识别算法在具有挑战性的数据集上有接近 100% 的成功率。

Masked Labeled Faces in the Wild (MLFW)

2021 年，来自北京邮电大学和中国电信的研究人员发布了6000张戴口罩的人脸识别数据集以应对大规模戴口罩带来的新的识别挑战。

EXAMPLES OF MASKED FACES IN THE MASKED LABELED FACES IN THE WILD (MLFW) DATABASE

Source: Wang et al., 2021

作为数据集发布的一部分，研究人员运行了一系列现有最先进的面部识别算法，包括他们的，以确定戴口罩的人脸图片对算法检测的性能下降程度有什么影响。他们的估计表明，最顶尖的模型在识别戴口罩的人脸时比不戴口罩的人脸识别要差 5 至 16 个百分点。这些发现在一定程度上确认了来自 FRVT 戴口罩的人脸识别测试的见解：戴口罩时识别性能会下降，但不是太显着。

视觉推理 VISUAL REASONING

视觉推理任务评估人工智能系统如何通过一个视觉与文字结合的数据来进行推理的效果。视觉推理能力可以使开发的AI系统做更广泛的推理。现有的人工智能已经可以在某些窄边界的视觉任务中做的比人类更好，例如图像分类、人脸检测和分割对象。但是很多AI系统在面临挑战时会挣扎着更抽象地推理——例如，产生对图像中动作执行人具体行为或动机的有效推论。

Visual Question Answering(VQA) Challenge

在视觉问答挑战中，人工智能系统的任务是回答关于图像的开放式问题。为了巧妙回答高水平的问题，人工智能系统必须有一个对语言、视觉的组合理解和常识推理。

自 VQA 挑战赛开始以来的六年里，最先进的模型性能提高了 24.4 个绝对百分点。 2015年，表现最好的系统只能正确回答 55.4% 的问题。截至 2021 年，最高表现性能为 79.8% —— 接近了 80.8% 的人类问答基线。

Xtuner：大模型微调快速上手潘达斯奈基~ AIGC AIGC
一、XTuner是什么？简单来说，XTuner是一个轻量级、易于使用的、为大语言模型（LLM）设计的微调工具库。它由上海人工智能实验室（OpenMMLab）开发，是其强大AI工具生态（MMCV,MMEngine等）的一部分。它的核心设计理念是“用一个配置文件搞定一切”，让开发者和研究人员可以极大地简化微调流程。二、为什么选择XTuner？（核心优势）轻量且用户友好：命令行驱动：你不需要编写复杂的训
ISP（图像信号处理）算法概述、工作原理、架构、处理流程全栈_xap 接口隔离原则信号处理算法
而DSP功能就比较多了，它可以做些拍照以及回显（JPEG的编解码）、录像以及回放（Video的编解码）、H.264的编解码、还有很多其他方面的处理，总之是处理数字信号了。ISP是一类特殊的处理图像信号的DSP。ISP架构方案：分为独立****（外置）与集成********（内置）****两种形式。CPU处理器包括：AP、BP、CP。其中BP****：基带处理器、AP：应用处理器、CP：****多媒
AI时代的人类增强：道德考虑与身体增强的未来发展机遇分析机遇挑战 AI天才研究院 AI人工智能与大数据 AI大模型企业级应用开发实战 Agentic AI 实战大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
AI时代的人类增强：道德考虑与身体增强的未来发展机遇分析机遇挑战关键词：人工智能、身体增强、道德考虑、未来发展、机遇挑战摘要：本文将探讨AI时代人类增强的各个方面，包括道德考虑和身体增强技术的未来发展机遇与挑战。通过详细分析AI技术基础、身体增强技术、道德哲学及社会影响，本文旨在为读者提供对这一前沿领域的深入理解和前瞻性思考。目录大纲AI时代的人类增强：道德考虑与身体增强的未来发展机遇分析机遇挑战
前端如何借助 Postman 进行接口性能调优前端视界前端艺匠馆前端 postman lua ai
前端如何借助Postman进行接口性能调优关键词：前端开发、Postman、接口性能调优、API测试、性能分析摘要：本文围绕前端开发中借助Postman进行接口性能调优展开。首先介绍了相关背景知识，包括目的、预期读者、文档结构和术语表。接着阐述了核心概念，如接口性能的相关概念及其联系，并给出了对应的文本示意图和Mermaid流程图。详细讲解了核心算法原理和具体操作步骤，结合Python代码示例进行
目标检测：从基础原理到前沿技术全面解析随机森林404 计算机视觉目标检测人工智能计算机视觉
引言在计算机视觉领域，目标检测是一项核心且极具挑战性的任务，它不仅要识别图像中有什么物体，还要确定这些物体在图像中的具体位置。随着人工智能技术的快速发展，目标检测已成为智能监控、自动驾驶、医疗影像分析等众多应用的基础技术。本文将全面介绍目标检测的基础概念、发展历程、关键技术、实践应用以及未来趋势，为读者提供系统性的知识框架。第一章目标检测概述1.1目标检测的定义与重要性目标检测（ObjectDet
喜讯 | Navicat 蝉联 2025 年 DBTA 100 强名单 Navicat中国 Navicat 17 焕新上市 navicat 数据库
Navicat在“DBTA1002025-数据领域最重要的公司”榜单中获得表彰。该奖项旨在表彰在数据管理与分析领域的领先创新者。数据库趋势与应用集团出版人TomHogan表示：“企业正寻求扩大人工智能的应用范围，采用新的技术与应用，增加数据分析/商业智能的使用，并对现有应用进行现代化改造”，“每年，《数据库趋势与应用》杂志都会推出DBTA100榜单，旨在表彰具有创新精神、能够为客户带来新产品新体验
Github 2025-07-04 Java开源项目日报 Top10 老孙正经胡说 github java 开源 Github趋势分析开源项目 Python Golang
根据GithubTrendings的统计，今日(2025-07-04统计)共有10个项目上榜。根据开发语言中项目的数量，汇总情况如下：开发语言项目数量Java项目10Java实现的算法集合：使用Gitpod.io进行编辑和贡献创建周期：2883天开发语言：Java协议类型：MITLicenseStar数量：57266个Fork数量：18692次关注人数：57266人贡献人数：431人OpenIss
水下目标检测：突破与创新加油吧zkf 目标跟踪人工智能计算机视觉
水下目标检测技术背景水下环境带来独特挑战：光线衰减导致对比度降低，散射引发图像模糊，色偏使颜色失真。动态水流造成目标形变，小目标（如10×10像素海胆）检测困难。声呐与光学数据融合可提升精度，但多模态对齐仍是技术难点。核心算法实现要点图像预处理直方图均衡化与Retinex算法结合改善对比度和色偏：defsingle_scale_retinex(img,sigma):retinex=np.log10
策略梯度在网络安全中的应用：AI如何防御网络攻击 AI智能探索者 web安全人工智能安全 ai
策略梯度在网络安全中的应用：AI如何防御网络攻击关键词：策略梯度、网络安全、AI防御、强化学习、网络攻击、入侵检测、自适应防御摘要：本文将探讨策略梯度这一强化学习算法在网络安全领域的创新应用。我们将从基础概念出发，逐步揭示AI如何通过学习网络攻击模式来构建自适应防御系统，分析其核心算法原理，并通过实际代码示例展示实现过程。文章还将讨论当前应用场景、工具资源以及未来发展趋势，为读者提供对这一前沿技术
Midjourney：AI人工智能图像生成的新方向 AI智能探索者人工智能 midjourney 计算机视觉 ai
Midjourney：AI人工智能图像生成的新方向关键词：Midjourney、AI图像生成、扩散模型、提示词工程、多模态学习、生成式AI、创意工具摘要：本文将带您走进AI图像生成的前沿领域，以Midjourney为核心，从技术原理到实际应用，用通俗易懂的语言解析其背后的“魔法”。我们将通过生活案例、技术拆解和实战演示，揭示Midjourney如何通过扩散模型、提示词工程和多模态学习，重新定义“用
Mac 磁盘检测和监控工具 DriveDx jia123yoou macos mac 磁盘监控
DriveDxMac一款不监视驱动器的内置S.M.A.R.T.状态的先进驱动器运行状况诊断和监测工具而且还分析了所有驱动器健康密切相关的指标，SSD或硬盘驱动器故障（像SSD磨损/耐久性，坏扇区重新分配，离线坏道，未定扇形区，I/O错误以及更多）和要是出了差错立即警报用户。我们的驱动器运行状况诊断算法是基于最近在这一领域的研究。原文地址：DriveDx英文Mac磁盘检测和监控工具
物联网零售领域AI算力网络与通信的应用探索 AI算力网络与通信物联网零售人工智能 ai
物联网零售领域AI算力网络与通信的应用探索关键词：物联网、零售领域、AI算力网络、通信、应用探索摘要：本文聚焦于物联网零售领域，深入探讨了AI算力网络与通信的应用。首先介绍了相关背景，包括目的、预期读者等。接着对核心概念进行解释，阐述它们之间的关系并给出原理架构示意图和流程图。然后详细讲解核心算法原理、数学模型与公式，通过项目实战展示代码案例及解读。还介绍了实际应用场景、推荐相关工具资源，分析未来
剖析AI人工智能领域Whisper的性能指标 AI大模型应用实战人工智能 whisper xcode ai
剖析AI人工智能领域Whisper的性能指标关键词：Whisper、语音识别、性能指标、ASR、AI模型评估、基准测试、语音转文本摘要：本文深入剖析OpenAI开发的Whisper语音识别系统的性能指标。我们将从技术原理、架构设计、性能基准测试等多个维度，全面分析Whisper在不同场景下的表现。文章将详细讲解Whisper的评估方法、关键性能指标解读、实际应用中的性能表现，以及与其他主流语音识别
探索AI人工智能领域多智能体系统的技术原理 AI大模型应用之禅人工智能网络 ai
探索AI人工智能领域多智能体系统的技术原理关键词：AI人工智能、多智能体系统、技术原理、智能体交互、分布式计算摘要：本文深入探索了AI人工智能领域多智能体系统的技术原理。首先介绍了多智能体系统的背景，包括其目的、预期读者、文档结构和相关术语。接着阐述了多智能体系统的核心概念与联系，通过文本示意图和Mermaid流程图进行清晰展示。详细讲解了核心算法原理，结合Python源代码进行说明，并给出了相关
【华为od刷题（C++）】HJ30 字符串合并处理 m0_64866459 华为od c++链表
我的代码：#include//用于输入输出流#include//用于字符串处理#include//用于动态数组的处理#include//包含排序等常见算法#include//用于字符串流的处理，可以将数据从字符串流中提取#include//提供字符处理函数，如isdigit、isalpha等#include//提供位集处理，能够将数字转换为二进制表示usingnamespacestd;charbi
Python pip与Conda环境的兼容性问题
Pythonpip与Conda环境的兼容性问题关键词：Python环境管理、pip与conda冲突、依赖解析、虚拟环境、包管理、兼容性解决方案、依赖冲突摘要：本文深入探讨Python生态中pip和conda两种主流包管理工具的兼容性问题。我们将从底层机制分析冲突根源，通过具体案例展示常见问题场景，并提供多种解决方案和最佳实践。文章包含详细的依赖解析算法分析、环境隔离技术比较，以及通过实际代码演示如
挑战华为社招：7年老Java一次坑爹的面试经历 m0_57286571 程序员 java 后端面试
前言今天刚好有空，跟大家聊聊如何学好算法进大厂。前两天一个读者和我说，他坚持刷算法题2个月，薪资翻番去了他梦寐以求的大厂，期间面字节跳动还遇到了原题…其实据我所知目前国内的大厂和一些独角兽，已经越来越效仿硅谷公司的做法，通过编程定题面试，来考察数据结构和算法的扎实程度。以我的经验来说，**对于新手来说，扎实的掌握一门语言是其一，其二就是要有基本的算法能力，这个非常重要。对于进阶的用户，更多技术栈的
结合创新idea：机器学习+运筹优化=CCF高端局 Ai多利机器学习人工智能
2024深度学习发论文&模型涨点之——机器学习+运筹优化机器学习是人工智能的一个分支，它使计算机系统能够从数据中学习并改进其性能，而无需进行明确的编程。运筹优化，也称为运筹学或运营管理，是应用数学的一个分支，它使用数学模型和算法来支持复杂决策过程的制定。机器学习与运筹优化的结合是一个前沿且活跃的研究领域，它们相互补充，为解决复杂问题提供了新的思路和方法。小编整理了一些机器学习+运筹优化【论文+代码
冒泡和快速排序的区别郭尘帅666 算法数据结构
冒泡算法快速排序时间复杂度O（n^2）最坏/平均O（nlogn）平均，O（n^2）最坏空间复杂度O（1）O（logn）最好/O(n)最坏稳定性很稳定(元素顺序不变)不稳定(元素顺序可能改变)适用场景小规模数据或接近有序的数据大规模数据核心思想重复遍历，每轮都会把最大的元素移至末尾选择基准值，比基准值小的元素放左边，大的放右边代码实现对比1.冒泡排序publicstaticvoidbubbleSor
《剑指迷宫：破解矩阵路径之谜》一只咸鱼大王故事版本数据结构与算法 C++数据结构算法递归回溯
故事标题：《剑与路之书——矩阵迷宫的路径密钥》引子：迷宫之城的秘密在遥远的算法大陆，有一座神秘的城市——“迷宫之城”。在这座城市的中心，矗立着一座名为“命运之塔”的古老建筑。传说中，这里藏着一本神秘的典籍——《剑指天书》，书中记载着无数关于矩阵、路径和逻辑推理的奥秘。在这片土地上，有一种被称为“矩阵迷宫”的古老魔法阵。它由一个个字符格子组成，每一步只能向上下左右移动一格。而最神奇的是，如果一条路径
常见手撕项目C++ 氏族归来 c++开发语言
常见手撕项目C++设计模式单例模式饿汉模式懒汉模式策略模式策略接口实现具体的策略（虚函数重写）定义上下文用户调用代码最短路径算法使用函数模板写冒泡排序写一个类模板stringreplace详解方法概览参数介绍代码示例多线程信号量解释设计模式单例模式单例模式是一种常用的软件设计模式，其目的是确保一个类只有一个实例，并提供一个全局访问点来获取该实例。优点：资源控制：单例模式能够确保一个类只有一个实例存
JuPyter(IPython) Notebooks中使用pip安装Python的模块 weixin_34218890 开发工具 python 人工智能
问题描述：没有带GPU的电脑，搞深度学习不是耍流氓嘛，我网上看到有个云平台，免费使用了一下，小姐姐很热情。使用过程如下：他们给的接口是Jupyter编辑平台，我就在上面跑了一个小例子。tensorflow和python环境是他们配置好的，不过我的例子中需要导入matplotlib.pylot模块。可是他们没有提供，怎么办呢？网上查了一下啊解决方法：采用如下方法：importpipdefMyPipi
【LangChain编程：从入门到实践】LangChain与其他框架的比较 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【LangChain编程：从入门到实践】LangChain与其他框架的比较1.背景介绍1.1人工智能发展现状在当今时代，人工智能(AI)已经成为科技领域中最热门和最具革命性的话题之一。随着计算能力的不断提升和算法的持续优化,AI系统正在不断扩展其应用范围,包括自然语言处理、计算机视觉、决策系统等各个领域。1.2LangChain概述在这种背景下,LangChain作为一个新兴的AI框架应运而生。L
重塑知识的圣殿：人工智能时代的教育革命与人文守护田园Coder 人工智能科普人工智能科普
教育，承载着文明火种传递的千年使命，其核心始终围绕两个永恒命题：如何让知识更有效地被获取？如何让个体潜能更充分地绽放？在信息爆炸、技能迭代加速的当代，传统教育模式——标准化课程、统一进度、有限师资、资源不均——正面临前所未有的压力。人工智能（AI）的崛起，如同一股强大的变革洪流，正以前所未有的深度和广度渗透教育生态的各个环节。从量身定制的学习路径到永不疲倦的智能导师，从虚拟现实的沉浸课堂到洞察学情
踏入真实：具身智能与物理世界的认知交响
当大型语言模型在文本的海洋中纵横捭阖，生成式AI在数字画布上挥洒创意时，人工智能仍有一个根本性的疆域尚未完全征服——真实的三维物理世界。理解一个苹果，不能仅靠词向量坐标；学会行走，无法通过阅读说明书达成；在拥挤的街道导航，远非处理符号逻辑那般简单。智能的进化，自生命诞生之初，便与具身性（Embodiment）和环境交互（Interaction）密不可分。我们的认知、学习、乃至意识的雏形，都源于身体
happy-llm 第一章 NLP 基础概念 weixin_38374194 自然语言处理人工智能学习
文章目录一、什么是NLP？二、NLP发展三大阶段三、NLP核心任务精要四、文本表示演进史1.传统方法：统计表征2.神经网络：语义向量化课程地址：happy-llmNLP基础概念一、什么是NLP？核心目标：让计算机理解、生成、处理人类语言，实现人机自然交互。现状与挑战：成就：深度学习推动文本分类、翻译等任务达到近人类水平。瓶颈：歧义性、隐喻理解、跨文化差异等。二、NLP发展三大阶段时期代表技术核心思
Python scikit-learn 【机器学习库】全面讲解
让AI成为我们的得力助手：《用Cursor玩转AI辅助编程——不写代码也能做软件开发》scikit-learn（简称sklearn）是Python最流行的机器学习库之一，提供简单高效的数据挖掘和数据分析工具。它基于NumPy、SciPy和Matplotlib构建，广泛应用于工业界和学术界。核心优势统一API设计：所有模型使用一致的接口（fit()、predict()、score()）丰富的算法：覆
Nystromformer：一种基于 Nyström 方法的自注意力近似算法 AI专题精讲 Paper阅读人工智能自然语言处理 AI
1.摘要Transformer已经成为广泛自然语言处理任务中的强大工具。推动Transformer展现出卓越性能的一个关键组件是self-attention机制，它对每个token编码了其他token的影响或依赖关系。虽然self-attention机制具有诸多优势，但其在输入序列长度上的二次复杂度限制了其在较长序列上的应用——这是当前社区积极研究的一个主题。为了解决这一限制，我们提出了Nystr
使用 C++/OpenCV 和 MFCC 构建双重认证智能门禁系统
使用C++/OpenCV和MFCC构建双重认证智能门禁系统引言随着物联网和人工智能技术的发展，智能门禁系统在安防领域的应用越来越广泛。相比于传统的钥匙、门禁卡或密码，生物识别技术（如人脸识别、指纹识别、虹膜识别等）提供了更高的安全性与便利性。然而，单一的生物识别方式在某些场景下可能存在安全隐患。例如，人脸识别可能被高清照片或视频欺骗（称为“欺骗攻击”），在光照、姿态变化剧烈时识别率也可能下降。为了
PHP接单涨薪系列（八）之AI内容工厂：用PHP批量生成SEO文章系统（2025接单秘籍）攻城狮凌霄 PHP PHP接单涨薪 AI 人工智能 php android
某SEO团队采用本方案后，内容产出效率提升10倍，网站流量3个月增长300%，单月通过内容外包获利超¥50,000。本文将揭秘如何用PHP+AI打造全自动SEO内容工厂，让你成为搜索引擎优化领域的抢手人才！一、SEO市场新机遇：AI内容生成的红利期1.12025年SEO行业巨变搜索引擎算法升级2025核心变革SGE体验优化EEAT权重提升多模态内容整合2025年SEO关键数据：指标20232025
eclipse maven IXHONG eclipse
eclipse中使用maven插件的时候，运行run as maven build的时候报错 -Dmaven.multiModuleProjectDirectory system propery is not set. Check $M2_HOME environment variable and mvn script match. 可以设一个环境变量M2_HOME指
timer cancel方法的一个小实例 alleni123 多线程 timer
package com.lj.timer; import java.util.Date; import java.util.Timer; import java.util.TimerTask; public class MyTimer extends TimerTask { private int a; private Timer timer; pub
MySQL数据库在Linux下的安装 ducklsl mysql
1.建好一个专门放置MySQL的目录 /mysql/db数据库目录 /mysql/data数据库数据文件目录 2.配置用户，添加专门的MySQL管理用户 >groupadd mysql ----添加用户组 >useradd -g mysql mysql ----在mysql用户组中添加一个mysql用户 3.配置，生成并安装MySQL >cmake -D
spring------>>cvc-elt.1: Cannot find the declaration of element Array_06 spring bean
将-------- <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3
maven发布第三方jar的一些问题 cugfy maven
maven中发布第三方jar到nexus仓库使用的是 deploy:deploy-file命令有许多参数，具体可查看 http://maven.apache.org/plugins/maven-deploy-plugin/deploy-file-mojo.html 以下是一个例子： mvn deploy:deploy-file -DgroupId=xpp3
MYSQL下载及安装 357029540 mysql
好久没有去安装过MYSQL，今天自己在安装完MYSQL过后用navicat for mysql去厕测试链接的时候出现了10061的问题，因为的的MYSQL是最新版本为5.6.24，所以下载的文件夹里没有my.ini文件，所以在网上找了很多方法还是没有找到怎么解决问题，最后看到了一篇百度经验里有这个的介绍，按照其步骤也完成了安装，在这里给大家分享下这个链接的地址
ios TableView cell的布局张亚雄 tableview
cell.imageView.image = [UIImage imageNamed:[imageArray objectAtIndex:[indexPath row]]]; CGSize itemSize = CGSizeMake(60, 50); &nbs
Java编码转义 adminjun java 编码转义
import java.io.UnsupportedEncodingException; /** * 转换字符串的编码 */ public class ChangeCharset { /** 7位ASCII字符，也叫作ISO646-US、Unicode字符集的基本拉丁块 */ public static final Strin
Tomcat 配置和spring aijuans spring
简介 Tomcat启动时，先找系统变量CATALINA_BASE，如果没有，则找CATALINA_HOME。然后找这个变量所指的目录下的conf文件夹，从中读取配置文件。最重要的配置文件：server.xml 。要配置tomcat，基本上了解server.xml，context.xml和web.xml。 Server.xml -- tomcat主
Java打印当前目录下的所有子目录和文件 ayaoxinchao 递归 File
其实这个没啥技术含量，大湿们不要操笑哦，只是做一个简单的记录，简单用了一下递归算法。 import java.io.File; /** * @author Perlin * @date 2014-6-30 */ public class PrintDirectory { public static void printDirectory(File f
linux安装mysql出现libs报冲突解决 BigBird2012 linux
linux安装mysql出现libs报冲突解决安装mysql出现 file /usr/share/mysql/ukrainian/errmsg.sys from install of MySQL-server-5.5.33-1.linux2.6.i386 conflicts with file from package mysql-libs-5.1.61-4.el6.i686
jedis连接池使用实例 bijian1013 redis jedis连接池 jedis
实例代码： package com.bijian.study; import java.util.ArrayList; import java.util.List; import redis.clients.jedis.Jedis; import redis.clients.jedis.JedisPool; import redis.clients.jedis.JedisPoo
关于朋友 bingyingao 朋友兴趣爱好维持
成为朋友的必要条件：志相同，道不合，可以成为朋友。譬如马云、周星驰一个是商人，一个是影星，可谓道不同，但都很有梦想，都要在各自领域里做到最好，当他们遇到一起，互相欣赏，可以畅谈两个小时。志不同，道相合，也可以成为朋友。譬如有时候看到两个一个成绩很好每次考试争做第一，一个成绩很差的同学是好朋友。他们志向不相同，但他
【Spark七十九】Spark RDD API一 bit1129 spark
aggregate package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} //测试RDD的aggregate方法 object AggregateTest { def main(args: Array[String]) { val conf = new Spar
ktap 0.1 released bookjovi kernel tracing
Dear, I'm pleased to announce that ktap release v0.1, this is the first official release of ktap project, it is expected that this release is not fully functional or very stable and we welcome bu
能保存Properties文件注释的Properties工具类 BrokenDreams properties
今天遇到一个小需求：由于java.util.Properties读取属性文件时会忽略注释，当写回去的时候，注释都没了。恰好一个项目中的配置文件会在部署后被某个Java程序修改一下，但修改了之后注释全没了，可能会给以后的参数调整带来困难。所以要解决这个问题。 &nb
读《研磨设计模式》-代码笔记-外观模式-Facade bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 百度百科的定义： * Facade（外观）模式为子系统中的各类（或结构与方法）提供一个简明一致的界面， * 隐藏子系统的复杂性，使子系统更加容易使用。他是为子系统中的一组接口所提供的一个一致的界面 * * 可简单地
After Effects教程收集 cherishLC After Effects
1、中文入门 http://study.163.com/course/courseMain.htm?courseId=730009 2、videocopilot英文入门教程（中文字幕） http://www.youku.com/playlist_show/id_17893193.html 英文原址： http://www.videocopilot.net/basic/ 素
Linux Apache 安装过程 crabdave apache
Linux Apache 安装过程下载新版本： apr-1.4.2.tar.gz（下载网站：http://apr.apache.org/download.cgi） apr-util-1.3.9.tar.gz（下载网站：http://apr.apache.org/download.cgi） httpd-2.2.15.tar.gz（下载网站：http://httpd.apac
Shell学习之变量赋值和引用 daizj shell 变量引用赋值
本文转自：http://www.cnblogs.com/papam/articles/1548679.html Shell编程中，使用变量无需事先声明，同时变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）中间不能有空格，可以使用下划线（_）不能使用标点符号不能使用bash里的关键字（可用help命令查看保留关键字）需要给变量赋值时，可以这么写：
Java SE 第一讲（Java SE入门、JDK的下载与安装、第一个Java程序、Java程序的编译与执行） dcj3sjt126com java jdk
Java SE 第一讲： Java SE：Java Standard Edition Java ME: Java Mobile Edition Java EE：Java Enterprise Edition Java是由Sun公司推出的（今年初被Oracle公司收购）。收购价格：74亿美金 J2SE、J2ME、J2EE JDK：Java Development
YII给用户登录加上验证码 dcj3sjt126com yii
1、在SiteController中添加如下代码： /** * Declares class-based actions. */ public function actions() { return array( // captcha action renders the CAPTCHA image displ
Lucene使用说明 dyy_gusi Lucene search 分词器
Lucene使用说明 1、lucene简介 1.1、什么是lucene Lucene是一个全文搜索框架，而不是应用产品。因此它并不像baidu或者googleDesktop那种拿来就能用，它只是提供了一种工具让你能实现这些产品和功能。 1.2、lucene能做什么要回答这个问题，先要了解lucene的本质。实际
学习编程并不难,做到以下几点即可! gcq511120594 数据结构编程算法
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
Java面试十问之三：Java与C++内存回收机制的差别 HNUlanwei java C++finalize()堆栈内存回收
大家知道， Java 除了那 8 种基本类型以外，其他都是对象类型（又称为引用类型）的数据。 JVM 会把程序创建的对象存放在堆空间中，那什么又是堆空间呢？其实，堆（ Heap）是一个运行时的数据存储区，从它可以分配大小各异的空间。一般，运行时的数据存储区有堆（ Heap）和堆栈（ Stack），所以要先看它们里面可以分配哪些类型的对象实体，然后才知道如何均衡使用这两种存储区。一般来说，栈中存放的
第二章 Nginx+Lua开发入门 jinnianshilongnian nginx lua
Nginx入门本文目的是学习Nginx+Lua开发，对于Nginx基本知识可以参考如下文章： nginx启动、关闭、重启 http://www.cnblogs.com/derekchen/archive/2011/02/17/1957209.html agentzh 的 Nginx 教程 http://openresty.org/download/agentzh-nginx-tutor
MongoDB windows安装基本命令 liyonghui160com
windows安装安装目录： D:\MongoDB\ 新建目录 D:\MongoDB\data\db 4.启动进城： cd D:\MongoDB\bin mongod -dbpath D:\MongoDB\data\db &n
Linux下通过源码编译安装程序 pda158 linux
一、程序的组成部分　　Linux下程序大都是由以下几部分组成：　　二进制文件：也就是可以运行的程序文件　　库文件：就是通常我们见到的lib目录下的文件　　配置文件：这个不必多说，都知道　　帮助文档：通常是我们在linux下用man命令查看的命令的文档　　二、linux下程序的存放目录　　linux程序的存放目录大致有三个地方：　　/etc, /b
WEB开发编程的职业生涯４个阶段 shw3588 编程 Web 工作生活
觉得自己什么都会 2007年从学校毕业，凭借自己原创的ASP毕业设计，以为自己很厉害似的，信心满满去东莞找工作，找面试成功率确实很高，只是工资不高，但依旧无法磨灭那过分的自信，那时候什么考勤系统、什么OA系统、什么ERP，什么都觉得有信心，这样的生涯大概持续了约一年。根本不是自己想的那样 2008年开始接触很多工作相关的东西，发现太多东西自己根本不会，都需要去学，不管是asp还是js，
遭遇jsonp同域下变作post请求的坑 vb2005xu jsonp 同域post
今天迁移一个站点时遇到一个坑爹问题,同一个jsonp接口在跨域时都能调用成功,但是在同域下调用虽然成功,但是数据却有问题. 此处贴出我的后端代码片段 $mi_id = htmlspecialchars(trim($_GET['mi_id '])); $mi_cv = htmlspecialchars(trim($_GET['mi_cv '])); 贴出我前端代码片段: $.aj

2022年斯坦福AI指数报告中文全解读-第二章 2.1 机器视觉——图像

第二章. 人工智能模型性能

概要：

2.1 机器视觉——图像

图像分类任务 IMAGE CLASSIFICATION

ImageNet

ImageNet: Top-1 Accuracy

ImageNet: Top-5 Accuracy

图像生成任务 IMAGE GENERATION

STL-10: Fréchet Inception Distance (FID) Score

CIFAR-10: Fréchet Inception Distance (FID) Score

深度伪造检测 DEEPFAKE DETECTION

FaceForensics++

Celab-DF

人体姿态估计 HUMAN POSE ESTIMATION

Leeds Sports Poses: Percentage of Correct Keypoints (PCK)

Human3.6M: Average Mean Per Joint Position Error (MPJPE)

语义分割任务 SEMANTIC SEGMENTATION

Cityscapes

医学图像分割任务 MEDICAL IMAGE SEGMENTATION

CVC-ClinicDB and Kvasir-SEG

人脸检测和识别 FACE DETECTION AND RECOGNITION

National Institute of Standards and Technology (NIST) Face Recognition Vendor Test (FRVT)

人脸检测：戴口罩的影响 FACE DETECTION: EFFECTS OF MASK-WEARING

Face Recognition Vendor Test (FRVT): Face-Mask Effects

Masked Labeled Faces in the Wild (MLFW)

视觉推理 VISUAL REASONING

Visual Question Answering(VQA) Challenge

你可能感兴趣的:(读书笔记,原创,人工智能,计算机视觉,深度学习,算法)