智源社区

【深度】北大王奕森：对抗机器学习的鲁棒、隐私和架构

第九届国际学习表征大会（ICLR 2021）是深度学习领域的国际顶级会议。在正式会议召开之前，青源Seminar于2月19日-21日成功召开了ICLR 2021 中国预讲会。回放链接：hub.baai.ac.cn/activity/details/131

本文介绍北京大学智能科学系助理教授王奕森在预讲会上的报告：「Adversarial Machine Learning on Robustness, Privacy and Architecture」。报告中，王奕森介绍了其团队近年来从对抗性机器学习的视角出发，对模型的鲁棒性、隐私保护、模型架构等问题的研究工作。

整理：熊宇轩

审校：贾伟

近年来，机器学习技术得到了长足的发展，该技术已经被广泛应用于图像分类、语音识别、目标检测、医学诊断、无人驾驶等领域。

图 1：机器学习系统存在的问题——对抗样本

但是，在实际应用场景下，机器学习技术仍然存在一些不足。如图 1 所示，在正常情况下，神经网络模型能将包含「狗」的图像正确分类。然而，如果我们对红色亮点所在的像素点进行一些修改，尽管人还是可以对该图像进行正确分类，但是神经网络模型则可能将该图片错误分类为「鸵鸟」。

而在更加敏感的领域中，这种模型鲁棒性差的现象则会造成更严重的影响。例如，在自动驾驶领域中，道路中的阴影可能会使汽车错误判断路线，导致汽车「撞墙」；而在视频监控领域中，人衣服上的图案则有可能使模型无法检测到有人的出现，从而使监控画面中的人「隐身」。我们将上述使机器学习系统失效的数据称为「对抗样本」。

为了更加合理、安全地使用机器学习系统，我们需要重新思考机器学习系统工作的方式，可以将机器学习存在对抗样本的问题视为一种机器学习解决方案的「压力测试」。

图 2：对抗性样本示例

就数字空间的白盒对抗样本而言，模型的训练实际上是一个经验风险最小化（ERM）的过程，而对抗性攻击则要求我们反过来在某种限制条件下最大化损失函数。为了保证对抗性样本和正常样本无法轻易被人类区分开来，因此我们要求二者的 L-p 范数上界为某个较小的值。例如，在 CIFAR-10 数据集上，我们往往采取 8 个像素点上的扰动，即。针对上述对抗性攻击，我们通常有两种常用的优化方式：（1）Fast Gradient Sign Method（FGSM）：无穷范数情况下的最速下降（2）Projected Gradient Descent（PGD）：迭代化的 FGSM。

图 3：对抗训练

为了让模型更加鲁棒，一个直观的想法是：将对抗样本加入到训练过程中（即对抗训练）。如图 3 所示，对抗性训练是一种最小最大优化（minmax）过程，内层的最大化过程被用于生成对抗样本（注：这是一种带约束的优化问题），而外层的最小化过程则使用内层最大化部分生成的对抗样本进行 ERM 模型训练。

用于提升模型鲁棒性的对抗性学习

图 4：最大化过程的收敛评分

直观地说，我们认为内层最大化过程的优化结果对外层 ERM 训练的结果具有很大的影响。然而，目前仍然缺乏有效的度量指标衡量内层优化过程的效果。

为此，王奕森博士团队在 ICML 2019 发表了论文「On the Convergence and Robustness of Adversarial Training」，提出了名为「一阶稳定条件」（FOSC）的内层最大化过程的优化效果度量指标，它可以帮助 Danskin 定理更好地成立。

图 5：收敛理论

通过使用 FOSC，我们发现当内层最大化过程优化到一定精度后（），就可以保证外层的最小化过程能够找到鲁棒的解，对抗性训练可以收敛到某个一阶稳定性点，当足够小时，我们可以通过对抗训练找到一个鲁棒的模型，其参数为。

图 6：为什么我们需要 FOSC？

下面，我们将说明提出 FOSC 指标的必要性。

当我们最大化内层 Loss 函数时，其值会逐渐上升至「平台」期。那么，Loss 上升至「平台」期是否意味着我们找到了非常好的解呢？

如图 6(a) 和图 6(b) 所示，我们发现「Step Size」和「Step Number」的取值对模型鲁棒性有较大的影响，而损失函数的分布几乎一样。因此，我们无法直接根据「损失函数不变」这一现象判断是否找到了较好的对抗样本。

如图 6(c) 和图 6(d) 所示，对于 FOSC 而言，模型鲁棒性越高则 FOSC 的值越小。因此，FOSC 对于最终模型的鲁棒性而言是一种更加可靠的标志。

图 7：从 FOSC 看对抗训练

此外，我们还可以使用 FOSC 对整个对抗训练的过程进行度量。具体而言，我们分别考察训练 10、60、100 轮三个阶段（即训练的早期、中期、后期）的训练情况。实验结果表明，标准的对抗训练在训练的早期会出现过拟合现象，而在训练后期 FOSC 值会上升，即内层最大化求解的结果变差。

直观地说，为了解决训练早期出现的过拟合现象，我们考虑再训练早期使用较弱的对抗攻击方式（例如，FGSM），从而提升模型的鲁棒性能。如图 7(b) 所示，将早期的对抗攻击方式换为 FGSM 后，可以将鲁棒性有效地提升 1-2 个百分点，这种鲁棒性的提升也可以从如图 7(c) 所示的 FOSC 的分布中反应出来。实际上，这也正是「预热」（Warm-up）技术背后的原理，它是一种得到更好的内层最大化求解结果的方式。

那么，我们是否还可以通过其它的方式得到更好的内层最大化求解结果呢？

图 8：重新思考鲁棒泛化鸿沟

王奕森博士团队于 NeurIPS 2020 上发表的论文「Adversarial Weight Perturbation Helps Robust Generalization」中从鲁棒泛化的角度重新思考该问题。

首先，我们可以将上述最小最大优化的过程重写为

在标准的训练过程中，训练时得到的准确率和测试时得到的准确率之间的「泛化误差」（Generalization Gap）较小，而在对抗训练中则会得到较大的「鲁棒性误差」，即训练时的鲁棒性很高而测试时的鲁棒性很低。而我们则试图缩小这种「鲁棒性误差」。

图 9：从 Weight loss lands 的视角观察泛化误差

受标准训练过程的启发，我们知道当「Weight loss landscape」（loss 随 weight 的变化情况）越平缓时，标准的泛化误差则越小。因此，我们试图探究是否可以将这一性质迁移到对抗训练中来。

在这里，我们借鉴了 Hao Li 等人于 NeurIPS 2018 年上发表的论文中提出的可视化方法，从而绘制损失函数的变化情况。其中，我们会向训练好的模型中加入一定的扰动，并查看损失函数分布变化，从而得到「Weight loss landscape」。

通过直观的思考，我们很自然地联想到在对抗训练环境下将标准训练中的替换为提前生成好的对抗样本，然后通过类似于标准训练中的方式，绘制出「Weight loss landscape」。然而这种方法并不可行，我们无法得到「Weight loss landscape 越平缓则鲁棒性误差越小」这一结论。

通过分析，我们发现上述方法之所以不可行是由于绘制损失函数变化情况的方式不正确。由于我们对模型进行了扰动，而对抗样本的生成高度依赖于当前的模型，因此对抗样本的生成应该也随之变化（即在扰动过程中实时生成对抗样本）。

图 10：Weight loss landscape 与泛化误差变化情况

在绘制出正确的损失函数变化情况后，我们观察到：在对抗训练的早期，泛化误差较小，「Weight loss landscape」较为平缓；而在训练的后期，泛化误差较大，「Weight loss landscape」较为尖锐。

图 11：不同训练方式下损失函数与「Weight loss landscape」的关系

如图 11 所示，我们针对不同的对抗训练方式绘制出了其损失函数变化情况。实验结果表明，「Weight loss landscape」越平缓则泛化误差越小。

从 PAC-Bayesian 边界的角度来看，公式

中的第二项恰好代表了「Weight loss landscape」的平坦程度。因此，我们可以将这一项显式地加入到训练的目标函数中，即将求期望操作替换为最大化操作（期望恒小于最大值），新的目标函数可以写作：

此时，我们将原先的「min-max」问题替换为了「min-max-max」优化问题，从而为原先的「min-max」问题得到更好的解。直观地说，对于输入的扰动得到了每个样本的局部最差值，而对于模型权值的扰动则为多个样本得到了全局最差值。

图 12：对抗性权值扰动可以带来普遍的鲁棒性提升

通过引入上述对抗性权值扰动方法，可以使各种对抗训练的变种面对各种攻击方式有普遍的鲁棒性提升。此外，近年来预训练技术在人工智能的各个领域大行其道。然而，我们发现在不使用预训练技术的情况下，仅仅对目标函数进行一些本质的改进也可以获得与使用预训练技术相当的性能，而将对抗性权值扰动与预训练技术相结合还可以进一步提升模型性能。

图 13：如何考虑原本就分类错误的样本？

接下来，我们将分析外层最小化过程对于鲁棒性的影响。

首先，内层的最大化过程的作用是生成对抗样本，而对抗样本仅仅定义在分类正确的样本上（即通过扰动使模型原本可以正确分类的样本会被错误分类）。那么，我们如何考虑原本就无法分类正确的样本呢？

图 14：分类正确的样本 vs. 分类错误的样本

在王奕森博士团队于 ICLR 2020 上发表的论文「Improving Adversarial Robustness Requires Revisiting Misclassified Examples」中，他们探讨了分类正确/错误的样本对模型最终的鲁棒性的影响。在本文中，我们对其中一部分样本进行扰动，而不扰动另一部分样本。实验结果表明，原本分类错误的样本对于最终模型的鲁棒性有很大的影响。

图 15：进一步考虑最大化过程、最小化过程

此外，如上文所述，求解最大化过程的结果只需要满足较高的精度即可，不同的内层最大化技术对于模型的鲁棒性影响甚微；而不同的外层最小化技术（是否加入正则项）对于模型的鲁棒性有很大的影响。

图 16：Misclassification aware adversarial risk（MART）

至此，我们在对抗性风险（Adversarial risk）中分别考虑分类正确和分类错误的样本，从而得到了如图 16 所示的「感知误分类的对抗性风险」（Misclassification aware adversarial risk）。

图 17：MART

为了使训练过程可以正常工作，我们使用替代损失函数替换上文中的指示函数，最终得到 MART 的损失函数为一个增强交叉熵（BCE）损失和重新加权的 KL 散度损失函数之和。在重加权项中，若样本被分类错误，我们将赋予该样本更大的权重。直观地说，分类错误的样本通常位于决策边界附近，而决策边界的对抗样本应该对决策边界的调整作用较大，因此我们着重考虑误分类样本。在如图 17 所示的消融实验中，我们考虑了 MART 中不同构成元素对模型鲁棒性的影响，从而确定了如图 17 所示的 MART 损失函数的最终形式。

用于隐私保护的对抗性机器学习

图 18：如何使私有数据无法被机器学习模型利用

如今，我们每个人都是网络空间的参与者，我们上传到网络中的图像、文本等数据可能会被他人收集起来训练深度神经网络模型。然而，我们往往并没有授权给某些公司将这些数据用作商业用途，因而存在一定的隐私泄露隐患。

在王奕森博士团队于 ICLR 2021 上发表的论文「Unlearnable Examples：Making Personal Data Unexploitable」中，他们探究了如何在隐私数据被上传到网络空间中之前，对这些数据进行相应的「加密」操作，从而实现隐私保护的目的。在本文中，他们试图对人脸图像数据进行修改，使深度学习模型无法利用该样本进行训练，而人类仍然可以正确识别图像。

图 19：生成无法学习的样本

实际上，「不可学习样本」与「对抗样本」的生成方式是相反的。对抗样本是通过在测试阶段最大化加入扰动后的损失函数获得的，而我们反过来可以通过在训练阶段最小化加入噪声后的损失函数（使其趋近于 0）获得不可学习样本，从而使模型无法进行学习。

图 20：生成不可学习样本

具体而言，我们可以将生成不可学习样本的过程形式化定义为一个「min-min」的两层优化目标，从而找到能够最小化误差的噪声。首先，我们需要训练一个参数为的模型；接着，我们将基于当前的模型生成误差最小化噪声。其中，误差分为类层次上的噪声和样本层次上的噪声。

通过这种方式获得的噪声具有迁移能力，我们可以将在 CIFAR-10 上生成的噪声迁移到 CIFAR-100 数据集上。此外，人类视觉无法区分出这种噪声对样本的修改，而机器使用不可学习样本训练得到的损失函数则为 0。

图 21：实验结果

实验结果表明，针对测试时的准确率指标而言，无论是加入随机噪声还是误差最大化噪声（对抗噪声）都无法使模型丧失学习能力，而加入误差最小化噪声则可以使样本不可被学习（测试时得到的准确率非常低）。如图 21 下方的表格所示，在不同的数据集上，向各种模型中添加类层次和样本层次上的噪声均可以得到不可学习的样本，模型预测准确率极低，可以起到保护隐私的效果。

模型架构与鲁棒性的关系

图 22：跳跃链接的影响

为了探究模型架构与鲁棒性的关系，在王奕森博士团队于 ICLR 2020 上发表的论文「Skip Connections Matter: On the Transferability of Adversarial Examples Generated with ResNets」中探讨了跳跃链接结构的影响。

在反向传播梯度回传的过程中，我们可以跳过一部分卷积残差模块，只使用跳跃链接。我们发现当跳过的残差模块数量增长到一定程度后，模型的「黑盒」迁移能力会增强，即跳跃链接可以暴露出更多可迁移的信息。

图 23：跳跃梯度方法

基于上述观察结果，我们提出了跳跃梯度方法（SGM），它可以大幅度提升对抗样本的迁移性能（将模型 A 上的对抗样本以较高的攻击成功率应用到模型 B 上）。如图 23 所示，较粗的线条代表较大的梯度，我们在对抗样本梯度回传的过程中通过跳跃链接回传大量的梯度。我们将通过卷积层回传的梯度乘以一个取值范围为 [0,1] 的权重，即缩小通过卷积层回传的梯度（线条更细）。通过实验，我们可以让包括「集成对抗训练」在内的最佳黑盒防御方式在 ImageNet 数据集上的防御成功率会从 73% 降低至 22%。

图 24：激活问题

此外，在 ICLR 2021 上发表的论文「Improving Adversarial Robustness via Channel-wise Activation Suppressing」中，王奕森博士团队还观察了标准模型和对抗训练模型的激活函数的幅值和频率。实验结果表明，对于标准模型而言，对抗样本激活的幅值更高，其激活频率也十分均匀。在进行了对抗训练之后，对抗样本激活的幅值被有效减小，模型的鲁棒性得到了提升。然而，此时激活的频率仍然较为平均，即一些不必要的通道将会被激活，这种现象也说明模型鲁棒性仍然存在一些缺陷。

图 25：通道激活抑制

针对上述问题，我们设计了一种通道激活抑制模块（CAS）。以往，我们通常认为每个通道的激活值的重要性是相同的。在这里，我们将考虑通道之间的关系，为不同的通道赋予不同的权值，使不需要被激活的通道被抑制。如图 25 所示，之前各种不同的防御方式（kWTA、SAP、PCL）都没能解决各通道激活值均匀的问题，而本文提出的 CAS 方法则有效抑制了不需要的通道。

图 26：实验结果

通过实验，我们发现 CAS 方法的通用性很强，无论我们采用对抗训练还是普通训练范式，使用对抗样本还是普通样本，加入了 CAS 模块的模型都可以将各种类别的表征有效地分开。

结语

图 27：相关文献

本次演讲涉及的相关论文如图 27 所示，详情请参阅具体论文的叙述。在王奕森博士看来，构建可靠可信的机器学习系统是我们不懈追求的目标！

欢迎对机器学习相关的理论及算法研究，包括对抗学习、图神经网络、弱监督或自监督学习、联邦学习等感兴趣的同学，联系王奕森老师读博或实习！

感兴趣的研究者请入群深入交流！

青源研究组-对抗学习兴趣群

点击左下角“阅读原文”，了解更多！

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
计算机视觉中，Pooling的作用 Wils0nEdwards 计算机视觉人工智能
在计算机视觉中，Pooling（池化）是一种常见的操作，主要用于卷积神经网络（CNN）中。它通过对特征图进行下采样，减少数据的空间维度，同时保留重要的特征信息。Pooling的作用可以归纳为以下几个方面：1.降低计算复杂度与内存需求Pooling操作通过对特征图进行下采样，减少了特征图的空间分辨率（例如，高度和宽度）。这意味着网络需要处理的数据量会减少，从而降低了计算量和内存需求。这对大型神经网络
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
神经网络-损失函数红米煮粥神经网络人工智能深度学习
文章目录一、回归问题的损失函数1.均方误差（MeanSquaredError,MSE）2.平均绝对误差（MeanAbsoluteError,MAE）二、分类问题的损失函数1.0-1损失函数（Zero-OneLossFunction）2.交叉熵损失（Cross-EntropyLoss）3.合页损失（HingeLoss）三、总结在神经网络中，损失函数（LossFunction）扮演着至关重要的角色，它
OpenCV图像处理技术（Python）——入门森屿_ opencv
©FuXianjun.AllRightsReserved.OpenCV入门图像作为人类感知世界的视觉基础，是人类获取信息、表达信息的重要手段，OpenCV作为一个开源的计算机视觉库，它包括几百个易用的图像成像和视觉函数，既可以用于学术研究，也可用于工业邻域，它于1999年由因特尔的GaryBradski启动，OpenCV库主要由C和C++语言编写，它可以在多个操作系统上运行。1.1图像处理基本操作
web报表工具FineReport常见的数据集报错错误代码和解释老A不折腾 web报表 finereport 代码可视化工具
在使用finereport制作报表，若预览发生错误，很多朋友便手忙脚乱不知所措了，其实没什么，只要看懂报错代码和含义，可以很快的排除错误，这里我就分享一下finereport的数据集报错错误代码和解释，如果有说的不准确的地方，也请各位小伙伴纠正一下。 NS-war-remote=错误代码\:1117 压缩部署不支持远程设计 NS_LayerReport_MultiDs=错误代码
Java的WeakReference与WeakHashMap bylijinnan java 弱引用
首先看看 WeakReference wiki 上 Weak reference 的一个例子： public class ReferenceTest { public static void main(String[] args) throws InterruptedException { WeakReference r = new Wea
Linux——（hostname）主机名与ip的映射 eksliang linux hostname
一、什么是主机名无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。但IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。域名类型 linuxsir.org 这样的；主机名是用于什么的呢？答：在一个局域网中，每台机器都有一个主
oracle 常用技巧 18289753290
oracle常用技巧 ①复制表结构和数据 create table temp_clientloginUser as select distinct userid from tbusrtloginlog ②仅复制数据如果表结构一样 insert into mytable select * &nb
使用c3p0数据库连接池时出现com.mchange.v2.resourcepool.TimeoutException 酷的飞上天空 exception
有一个线上环境使用的是c3p0数据库，为外部提供接口服务。最近访问压力增大后台tomcat的日志里面频繁出现 com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.v2.resourcepool.BasicResou
IT系统分析师如何学习大数据蓝儿唯美大数据
我是一名从事大数据项目的IT系统分析师。在深入这个项目前需要了解些什么呢？学习大数据的最佳方法就是先从了解信息系统是如何工作着手，尤其是数据库和基础设施。同样在开始前还需要了解大数据工具，如Cloudera、Hadoop、Spark、Hive、Pig、Flume、Sqoop与Mesos。系统分析师需要明白如何组织、管理和保护数据。在市面上有几十款数据管理产品可以用于管理数据。你的大数据数据库可能
spring学习——简介 a-john spring
Spring是一个开源框架，是为了解决企业应用开发的复杂性而创建的。Spring使用基本的JavaBean来完成以前只能由EJB完成的事情。然而Spring的用途不仅限于服务器端的开发，从简单性，可测试性和松耦合的角度而言，任何Java应用都可以从Spring中受益。其主要特征是依赖注入、AOP、持久化、事务、SpringMVC以及Acegi Security 为了降低Java开发的复杂性，
自定义颜色的xml文件 aijuans xml
<?xml version="1.0" encoding="utf-8"?> <resources> <color name="white">#FFFFFF</color> <color name="black">#000000</color> &
运营到底是做什么的？ aoyouzi 运营到底是做什么的？
文章来源：夏叔叔（微信号：woshixiashushu），欢迎大家关注！很久没有动笔写点东西，近些日子，由于爱狗团产品上线，不断面试，经常会被问道一个问题。问：爱狗团的运营主要做什么？答：带着用户一起嗨。为什么是带着用户玩起来呢？究竟什么是运营？运营到底是做什么的？那么，我们先来回答一个更简单的问题——互联网公司对运营考核什么？以爱狗团为例，绝大部分的移动互联网公司，对运营部门的考核分为三块——用
js面向对象类和对象百合不是茶 js 面向对象函数创建类和对象
接触js已经有几个月了,但是对js的面向对象的一些概念根本就是模糊的,js是一种面向对象的语言但又不像java一样有class,js不是严格的面向对象语言 ,js在java web开发的地位和java不相上下 ,其中web的数据的反馈现在主流的使用json,json的语法和js的类和属性的创建相似下面介绍一些js的类和对象的创建的技术一:类和对
web.xml之资源管理对象配置 resource-env-ref bijian1013 java web.xml servlet
resource-env-ref元素来指定对管理对象的servlet引用的声明，该对象与servlet环境中的资源相关联 <resource-env-ref> <resource-env-ref-name>资源名</resource-env-ref-name> <resource-env-ref-type>查找资源时返回的资源类
Create a composite component with a custom namespace sunjing
https://weblogs.java.net/blog/mriem/archive/2013/11/22/jsf-tip-45-create-composite-component-custom-namespace When you developed a composite component the namespace you would be seeing would
【MongoDB学习笔记十二】Mongo副本集服务器角色之Arbiter bit1129 mongodb
一、复本集为什么要加入Arbiter这个角色回答这个问题，要从复本集的存活条件和Aribter服务器的特性两方面来说。什么是Artiber？ An arbiter does not have a copy of data set and cannot become a primary. Replica sets may have arbiters to add a
Javascript开发笔记白糖_ JavaScript
获取iframe内的元素通常我们使用window.frames["frameId"].document.getElementById("divId").innerHTML这样的形式来获取iframe内的元素，这种写法在IE、safari、chrome下都是通过的，唯独在fireforx下不通过。其实jquery的contents方法提供了对if
Web浏览器Chrome打开一段时间后，运行alert无效 bozch Web chorme alert 无效
今天在开发的时候，突然间发现alert在chrome浏览器就没法弹出了，很是怪异。试了试其他浏览器，发现都是没有问题的。开始想以为是chorme浏览器有啥机制导致的，就开始尝试各种代码让alert出来。尝试结果是仍然没有显示出来。这样开发的结果，如果客户在使用的时候没有提示，那会带来致命的体验。哎，没啥办法了就关闭浏览器重启。结果就好了，这也太怪异了。难道是cho
编程之美-高效地安排会议图着色问题贪心算法 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Collections; import java.util.List; import java.util.Random; public class GraphColoringProblem { /**编程之美高效地安排会议图着色问题贪心算法 * 假设要用很多个教室对一组
机器学习相关概念和开发工具 chenbowen00 算法 matlab 机器学习
基本概念：机器学习(Machine Learning, ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域，它主要使用归纳、综合而不是演绎。开发工具 M
[宇宙经济学]关于在太空建立永久定居点的可能性 comsci 经济
大家都知道,地球上的房地产都比较昂贵,而且土地证经常会因为新的政府的意志而变幻文本格式........ 所以,在地球议会尚不具有在太空行使法律和权力的力量之前,我们外太阳系统的友好联盟可以考虑在地月系的某些引力平衡点上面,修建规模较大的定居点
oracle 11g database control 证书错误 daizj oracle 证书错误 oracle 11G 安装
oracle 11g database control 证书错误 win7 安装完oracle11后打开 Database control 后，会打开em管理页面，提示证书错误，点“继续浏览此网站”，还是会继续停留在证书错误页面解决办法：是 KB2661254 这个更新补丁引起的，它限制了 RSA 密钥位长度少于 1024 位的证书的使用。具体可以看微软官方公告：
Java I/O之用FilenameFilter实现根据文件扩展名删除文件游其是你 FilenameFilter
在Java中，你可以通过实现FilenameFilter类并重写accept(File dir, String name) 方法实现文件过滤功能。在这个例子中，我们向你展示在“c:\\folder”路径下列出所有“.txt”格式的文件并删除。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
C语言数组的简单以及一维数组的简单排序算法示例，二维数组简单示例 dcj3sjt126com c array
# include <stdio.h> int main(void) { int a[5] = {1, 2, 3, 4, 5}; //a 是数组的名字 5是表示数组元素的个数，并且这五个元素分别用a[0], a[1]...a[4] int i; for (i=0; i<5; ++i) printf("%d\n",
PRIMARY, INDEX, UNIQUE 这3种是一类 PRIMARY 主键。就是唯一且不能为空。 INDEX 索引，普通的 UNIQUE 唯一索引 dcj3sjt126com primary
PRIMARY, INDEX, UNIQUE 这3种是一类PRIMARY 主键。就是唯一且不能为空。INDEX 索引，普通的UNIQUE 唯一索引。不允许有重复。FULLTEXT 是全文索引，用于在一篇文章中，检索文本信息的。举个例子来说，比如你在为某商场做一个会员卡的系统。这个系统有一个会员表有下列字段：会员编号 INT会员姓名
java集合辅助类 Collections、Arrays shuizhaosi888 Collections Arrays HashCode
Arrays、Collections 1 ）数组集合之间转换 public static <T> List<T> asList(T... a) { return new ArrayList<>(a); } a）Arrays.asL
Spring Security（10）——退出登录logout 234390216 logout Spring Security 退出登录 logout-url LogoutFilter
要实现退出登录的功能我们需要在http元素下定义logout元素，这样Spring Security将自动为我们添加用于处理退出登录的过滤器LogoutFilter到FilterChain。当我们指定了http元素的auto-config属性为true时logout定义是会自动配置的，此时我们默认退出登录的URL为“/j_spring_secu
透过源码学前端之 Backbone 三 Model 逐行分析JS源代码 backbone 源码分析 js学习
Backbone 分析第三部分 Model 概述： Model 提供了数据存储，将数据以JSON的形式保存在 Model的 attributes里，但重点功能在于其提供了一套功能强大，使用简单的存、取、删、改数据方法，并在不同的操作里加了相应的监听事件，如每次修改添加里都会触发 change，这在据模型变动来修改视图时很常用，并且与collection建立了关联。
SpringMVC源码总结（七）mvc:annotation-driven中的HttpMessageConverter 乒乓狂魔 springMVC
这一篇文章主要介绍下HttpMessageConverter整个注册过程包含自定义的HttpMessageConverter，然后对一些HttpMessageConverter进行具体介绍。 HttpMessageConverter接口介绍： public interface HttpMessageConverter<T> { /** * Indicate
分布式基础知识和算法理论 bluky999 算法 zookeeper 分布式一致性哈希 paxos
分布式基础知识和算法理论 BY [email protected] 本文永久链接：http://nodex.iteye.com/blog/2103218 在大数据的背景下，不管是做存储，做搜索，做数据分析，或者做产品或服务本身，面向互联网和移动互联网用户，已经不可避免地要面对分布式环境。笔者在此收录一些分布式相关的基础知识和算法理论介绍，在完善自我知识体系的同
Android Studio的.gitignore以及gitignore无效的解决 bell0901 android gitignore
　　github上.gitignore模板合集，里面有各种.gitignore ： https://github.com/github/gitignore 　　自己用的Android Studio下项目的.gitignore文件，对github上的android.gitignore添加了　　　　　　# OSX files　　　　　　//mac os下　　　　　　.DS_Store
成为高级程序员的10个步骤 tomcat_oracle 编程
What 软件工程师的职业生涯要历经以下几个阶段：初级、中级，最后才是高级。这篇文章主要是讲如何通过 10 个步骤助你成为一名高级软件工程师。 Why 得到更多的报酬！因为你的薪水会随着你水平的提高而增加提升你的职业生涯。成为了高级软件工程师之后，就可以朝着架构师、团队负责人、CTO 等职位前进历经更大的挑战。随着你的成长，各种影响力也会提高。
mongdb在linux下的安装 xtuhcy mongodb linux
一、查询linux版本号： lsb_release -a LSB Version: :base-4.0-amd64:base-4.0-noarch:core-4.0-amd64:core-4.0-noarch:graphics-4.0-amd64:graphics-4.0-noarch:printing-4.0-amd64:printing-4.0-noa

【深度】北大王奕森：对抗机器学习的鲁棒、隐私和架构

你可能感兴趣的:(计算机视觉,神经网络,机器学习,人工智能,深度学习)