Amusi（CVer）

深度学习中的3个秘密：集成，知识蒸馏和自蒸馏

点击上方“CVer”，选择加"星标"置顶

重磅干货，第一时间送达

本文转载自：AI公园

作者：Zeyuan Allen-Zhu | 编译：ronghuaiyang

导读

训练好的模型，用自己蒸馏一下，就能提高性能，是不是很神奇，这里面的原理到底是什么呢，这要从模型集成开始说起。

在现在的标准技术下，例如过参数化、batch-normalization和添加残差连接，“现代”神经网络训练 —— 至少对于图像分类任务和许多其他任务来说 —— 通常是相当稳定的。使用标准的神经网络结构和训练算法(通常是带动量的SGD)，学习模型的表现一贯良好，不仅在训练精度方面，甚至在测试精度方面，无论在训练过程中使用的是哪种随机初始化或随机数据顺序。例如，用不同的随机种子在CIFAR-100数据集上训练相同的WideResNet-28-10架构10次，平均测试精度为81.51%，而标准偏差仅为0.16%。

在一篇新论文“Towards Understanding Ensemble, Knowledge Distillation, and Self-Distillation in Deep Learning“中，我们专注于研究神经网络在训练过程中纯粹由于随机化产生的差异。我们提出了以下问题：除了测试准确性上的微小偏差外，从不同随机初始化中训练出来的神经网络是否学习了非常不同的函数？如果是这样，差异从何而来？我们如何减少这种差异，使神经网络更稳定，甚至更好？这些问题并非微不足道，它们与深度学习中广泛使用的三种技术有关。

深度学习中的三个神秘之处

神秘之处1：集成 使用不同随机种子的学习网络F1，…F10 —— 尽管具有非常相似的测试性能 —— 被观察到与非常不同的函数相关联。实际上，使用一种著名的技术叫做集成(ensemble)，只需对这些独立训练的网络的输出进行无加权的平均，就可以在许多深度学习应用中获得测试时性能的巨大提升。(参见下面的图1。)这意味着单个函数F1，…F10必须是不同的。然而，为什么集成的效果会突然提高呢？另外，如果一个人直接训练(F1+⋯+F10)/10，为什么性能提升会消失？

图1：在深度学习应用中，集成可以提高测试精度的性能，但这种精度的提高无法通过直接训练模型的平均值来实现。

神秘之处2：知识蒸馏 尽管集成在提高测试时性能方面非常出色，但在推理时间(即测试时间)上，它的速度会慢10倍：我们需要计算10个神经网络的输出，而不是一个。当我们在低能耗、移动环境中部署这样的模型时，这是一个问题。为了解决这个问题，提出了一种叫做知识蒸馏的开创性技术。也就是说，知识蒸馏只需要训练另一个单独的模型就可以匹配集成的输出。在这里，对猫图像的集成输出(也称为“dark knowledge”)可能是类似“80% cat + 10% dog + 10% car”，而真正的训练标签是“100% cat”。(参见下面的图2。)

事实证明，经过训练的单个模型，在很大程度上，可以匹配10倍大的集成测试时的表现。然而，这导致了更多的问题。为什么与真实的标签相比，匹配集成的输出能给我们更好的测试精度？此外，我们是否可以对知识蒸馏后的模型进行集成学习以进一步提高测试精度？

图2：知识蒸馏和自蒸馏也提高了深度学习的性能。

神秘之处3：自蒸馏 注意，知识蒸馏至少直观上是有意义的：教师集成模型的测试准确率为84.8%，所以单个学生模型的测试准确率可以达到83.8%。下面的现象，被称为自蒸馏(或“Be Your Own Teacher”)，是完全令人惊讶的 ——通过对同一架构的单个模型执行知识蒸馏，测试的准确性也可以得到提高。(请参见上面的图2。) 考虑一下这个问题：如果训练一个单独的模型只能得到81.5%的测试准确率，那么为什么“再次训练同一个模型把自己当作老师”突然可以把测试准确率提高到83.5%呢？

神经网络集成 vs 特征图集成

大多数现有的集成理论只适用于个体模型本质上不同的情况(例如，使用不同变量子集的决策树)或在不同的数据集上训练(如bootstrapping)。在深度学习世界中，单独训练的神经网络具有相同的架构，使用相同的训练数据 —— 它们唯一的区别在于训练过程中的随机性。

也许现有的深度学习中最接近去匹配集成定理的是随机特征映射的集成。一方面，将多个随机(特定的)特征的线性模型结合在一起可以提高测试时的性能，因为它增加了特征的数量。另一方面，在某些参数上，神经网络权重可以保持非常接近他们的初始化(称为neural tangent kernel、NTK，regime)，以及由此产生的网络仅仅是学习一个由完全随机初始化决定的特定的特征映射的线性函数。当将两者结合起来时，我们可以推测深度学习中的集成与随机特征映射中的集成原理相同。这就引出了下面的问题：

与随机特征映射(即NTK特征映射)相比，集成/知识蒸馏在深度学习中的工作方式是否相同？

**回答：并非如此，下面图3的实验证明了这一点。**此图比较了深度学习中的集成和知识蒸馏与随机特征映射的线性模型的集成和知识蒸馏。集成在两种情况下都有效。然而，图3中的准确性清楚地表明，它们的工作原因完全不同。具体地说：

与深度学习的情况不同，随机特征设置下集成的优越性能不能被蒸馏为单个模型。例如，在图3中，neural tangent kernel(NTK)模型在CIFAR-10数据集上的集成精度达到了70.54%，但经过知识精馏后，集成精度下降到66.01%，甚至低于个体模型的测试精度66.68%。
在深度学习中，直接训练模型的平均值(F1+⋯+F10)/10与训练单个模型Fi相比没有任何好处，而在随机特征设置中，训练平均值的效果优于单个模型和它们的集成。例如，在图3中，NTK模型的集成达到了70.54%的精度，但这甚至比直接训练10个模型的平均的精度72.86%还要差。

图3：集成在随机特征映射中起作用(但原因与深度学习完全不同)，而知识蒸馏在随机特征映射中不起作用。

神经网络的原因是执行(层次特性学习) —— 单个Fi模型，尽管使用不同的随机初始化，仍有能力学习相同的特性集。因此，与单个网络相比，它们的平均几乎无法提供额外的能力。然而，在线性设置中，每个Fi使用一组不同的特定的特征。因此，尽管结合这些特征(使用集合或直接训练平均值)确实有优势，但由于特征的稀缺性，它们不能被提炼成单个模型。

集成 vs 减少单个模型的误差

除了随机特征的集合外，人们还可以推测，由于神经网络的高度复杂性，每个单独的模型Fi可能学习一个函数Fi (x)=y+ξi，其中ξi是一些依赖于训练过程中使用的随机性的噪声。经典统计表明，如果所有的ξi都是大致独立的，那么对它们平均可以大大减少噪声。因此，

“集成减少误差”是集成可以让性能提升的原因吗？

答案：我们的证据表明，这种减少误差的假设在深度学习的背景下是非常值得怀疑的：

集成不会永远提高测试精度：当集成超过100个单独的模型时，与集成超过10个单独的模型相比，通常没有区别。因此，100ξi的均值与10ξi的相比不再减少方差 —— 这表明ξi的(1)可能不是独立的，(2)可能是有偏的，因此其均值不为零。在(1)的情况下，很难讨论通过对这些算子的平均可以减少多少误差。
即使人们希望接受理想主义的信念即(1)不会发生，所有的ξi都是有偏的，用符号表示的话，Fi(x)=y+ξ+ξi‘，其中ξ是一般性偏差，ξi '是独立偏差。那么为什么知识蒸馏能工作呢？在集成之后，我们期望输出可以接近y+ξ ，也就是具有一般性的偏差ξ。那么，为什么使用具有误差ξ的输出(也称为 dark knowledge)比原来训练的真实标记更好呢？
在图4中，我们看到神经网络的集成学习并不总是提高测试精度——至少在输入是类似高斯的情况下是这样。换句话说，在这些网络中，“平均这些数据”并不会导致任何精度的提高。因此，我们需要更仔细地理解深度学习中的集成，而不是像“减少误差”这样的一般性说法。

图4：当输入为类高斯时，实验表明集成并没有提高测试精度。

多视图数据：新方法去证明深度学习中的集成

由于集成不太可能在非结构化的随机输入下工作(见图4)，我们必须查看数据中的特殊结构以正确理解它。

在我们的新工作中，我们建议研究一种可以在许多深度学习擅长的数据集中找到的共同结构。特别是在视觉数据集中，对象通常可以使用多个视图进行分类。例如，一辆汽车的图像可以根据前灯、车轮或窗户分类为一辆汽车。对于汽车在图像中的典型视图，我们可以观察到所有这些特征，使用其中一个特征将其分类为汽车就足够了。然而，也有一些从特定角度拍摄的汽车图像，其中一个或多个特征是缺失的。例如，一辆汽车正面朝前的图像可能没有车轮的特征。我们在图5中给出了实际的例子。

图5:CIFAR-10训练后的ResNet-34第23层部分通道的可视化

我们将这种结构称为“多视图”，其中每个数据类都有多个视图特征。在大多数数据中，几乎所有的视角特征都会显示出来，但在一些数据中，一些视图特征可能会丢失。(更广义地说，“多视图”结构不仅表现在输入像素空间中，也表现在中间层中)

我们发展出一个定理，表明在多视图数据下的神经网络训练过程中，网络会：

根据学习过程中使用的随机性，快速学习这些视图特征的子集。
记住少数剩余的不能使用这些视图特性正确分类的数据。

第一点意味着，不同网络的集成将收集所有这些可学习的视图特征，从而实现更高的测试精度。第二点意味着单个模型不能学习所有的视图特性，不是因为它们没有足够的容量，而是因为没有足够多的训练数据来学习这些视图。大多数数据已经用现有的视图特征进行了正确的分类，所以在这个训练阶段它们基本上不提供梯度。

知识蒸馏：让单个模型去学习多个视图

在这项新工作中，我们继续展示知识蒸馏的工作原理。在现实生活中，一些汽车图像可能比其他图像看起来“更像猫”：例如，一些汽车图像的前灯看起来像猫的眼睛。当这种情况发生时，集成模型可以提供有意义的dark knowledge：例如，“汽车图像X有10%像一只猫。”

现在来看看关键的观察结果。当训练一个单独的神经网络模型时，如果“前照灯”视图没有被学习，那么即使剩余的视图仍然可以正确地将图像X标记为一辆车，它们也不能用来匹配“dark knowledge”图像X是10%像一只猫。换句话说，在知识蒸馏过程中，个体模型被迫学习每一个可能的视图特征，以匹配集成的性能。请注意，深度学习中知识提炼的关键是，作为神经网络的单个模型正在进行特征学习，因此能够学习集成的所有特征。这与我们在实践中观察到的情况是一致的。(参见图6)。

图6:知识蒸馏已经从集成中学习了大多数视图特征，因此在知识蒸馏后对模型进行集成学习不会提供更多的性能提升。

自蒸馏：隐式地结合集成和知识蒸馏

在这项新工作中，我们还为知识自蒸馏提供了理论支持(参见图3)。训练一个单个模型以匹配另一个相同单个模型的输出(但使用不同的随机种子)，以某种方式提高了性能。

在较高的层次上，我们把自蒸馏看作是集成蒸馏和知识蒸馏更紧密的结合。当从随机初始化学习单个模型F2以匹配单独训练的单个模型F1的输出时，可以期望F2根据它自己的随机初始化学习特征的子集。除此之外，F2也有动机去学习F1已经学习过的特征子集。换句话说，人们可以把这个过程看作是“集成学习两个单独的模型F1和F2，并将其蒸馏为F2。最终的学习模型F2可能不一定涵盖数据集中所有的可学习视图，但它至少有潜力学习所有可以通过集成学习覆盖两个单独模型的视图。这就是测试时性能提升的来源。

总结

在这项工作中，我们尽我们所知，展示了第一个理论证明，有助于理解集成在深度学习中的工作原理。我们也提供了实证证据来支持我们的理论和我们的“多视角”数据假设。我们认为，我们的框架可以适用于其他情况。例如，使用随机裁剪的数据增强可以被视为增强网络学习“多视图”的另一种方式。我们希望，在实践中，我们关于神经网络如何在训练过程中提取特征的新理论观点，也可以帮助设计新的原则和方法，以提高神经网络的测试精度，并有可能与模型集成的测试精度相匹配。

英文原文：https://www.microsoft.com/en-us/research/blog/three-mysteries-in-deep-learning-ensemble-knowledge-distillation-and-self-distillation/

CV资源下载

后台回复：CVPR2020，即可下载代码开源的论文合集

后台回复：ECCV2020，即可下载代码开源的论文合集

后台回复：YOLO，即可下载YOLOv4论文和代码

后台回复：Transformer综述，即可下载两个最新的视觉Transformer综述PDF，肝起来！

重磅！CVer-细分垂直交流群成立

扫码添加CVer助手，可申请加入CVer-细分垂直方向 微信交流群，也可申请加入CVer大群，细分方向已涵盖：目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、Transformer、PyTorch和TensorFlow等群。

一定要备注：研究方向+地点+学校/公司+昵称（如目标检测+上海+上交+卡卡），根据格式备注，才能通过且邀请进群

▲长按加微信群

▲长按关注CVer公众号

整理不易，请给CVer点赞和在看！

SVC函数介绍浊酒南街 #机器学习算法人工智能
目录前言函数介绍示例前言SVC（SupportVectorClassification）是支持向量机（SVM）的一种实现，主要用于分类问题。支持向量机是一种监督学习算法，其基本原理是找到一个最优的超平面来将不同类别的数据分开。SVC在小样本和高维空间中表现良好，且能够处理非线性分类问题。函数介绍SVC(C=1.0,kernel=‘rbf’,degree=3,gamma=‘auto’,coef0=0
4. 马科维茨资产组合模型+Fama-French五因子优化方案（理论+Python实战）金融OG 金融资产组合模型进化论 python java 前端金融数据库机器学习大数据
目录0.承前1.Fama-French五因子优化的现代投资组合理论1.1WhatisFama-French五因子优化的现代投资组合理论1.2WhyisFama-French五因子优化的现代投资组合理论1.3HowtoFama-French五因子优化的现代投资组合理论2.数据要素&计算流程2.1参数集设置2.2数据获取&预处理2.3收益率计算2.4因子构建与预期收益率计算2.5协方差矩阵计算2.6投
2. 马科维茨资产组合模型+CAMP优化方案（理论+Python实战）金融OG 金融资产组合模型进化论人工智能大数据金融 python 数据库机器学习
目录0.承前1.资本资产定价模型(CAPM)优化的现代投资组合理论1.1WhatisCAPM优化的现代投资组合理论1.2WhyisCAPM优化的现代投资组合理论1.3HowtoCAPM优化的现代投资组合理论2.数据要素&计算流程2.1参数集设置2.2数据获取&预处理2.3收益率计算2.4CAPM预期收益率计算2.5协方差矩阵计算2.6投资组合表现计算2.7夏普比率优化2.8持仓筛选3.汇总代码4.
【AI量金术师：简易代码领悟高深金融术语】02.马科维茨资产组合模型Python实战金融OG 高深金融术语私厨人工智能金融 python
目录1.马科维茨资产组合模型简介1.1模型的起源与发展1.2核心概念2.模型的基本假设2.1投资者行为假设2.2市场环境假设3.模型的应用与局限性3.1实际应用3.2局限性探讨4.Python代码案例：实现马科维茨资产组合模型4.1环境准备与数据获取4.2数据收集4.3计算收益率与协方差矩阵4.4随机生成投资组合4.5绘制有效前沿4.6优化求解最优投资组合5.结论与展望1.马科维茨资产组合模型简介
svm python 模型绘图_1SVM处理数据并绘图张炜大师傅 svm python 模型绘图
爬虫Python基础、数据分析扩展包Numpy、pandas、matplotlib，Python读取MySQL数据，Python爬虫及Scrapy框架，无监督机器学习算法聚类分析等，以及案例：互联网金融行业客户价值分析等。机器学习机器学习是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有
服务器ibmc无法加载js文件,华为服务器IBMC批量巡检代码 1ce0ear 服务器ibmc无法加载js文件
selenium需要下载Chrome驱动webdriver，具体下载的版本根据自己的谷歌浏览器版本进行下载，然后将下载好的驱动webdriver放到自己python解释器同级目录中即可，下载地址http://npm.taobao.org/mirrors/chromedriver/此代码可用于华为服务器批量巡检，前提要在脚本存放的同级目录下建立一个ipList.txt文件存储服务器管理IP地址格式为
深入MapReduce——引入黄雪超大数据基础 #深入MapReduce mapreduce 大数据 hadoop
引入前面我们已经深入了HDFS的设计与实现，对于分布式系统也有了不错的理解。但HDFS仅仅解决了海量数据存储和读写的问题。但要想让数据产生价值，一定是需要从数据中挖掘出价值才行，这就需要我们拥有海量数据的计算处理能力。下面我们还是老样子，来数据一下要实现海量计算处理能力，有些什么核心痛点大数据计算核心痛点量级大在稍微大一点的互联网企业，需要计算处理的数据量都开始以PB计了。而传统的计算处理模型中，
clang和gcc对比三雷科技深入C++编程入门开发语言 c++c clang llvm gcc
clang和gcc对比一、基本概述二、背景与历史三、架构与模块化四、错误提示与静态分析五、性能与编译速度六、兼容性与多平台支持七、调试支持Clang和GCC都是广泛使用的C、C++编译器，它们各自具有独特的优势和特点，适用于不同的使用场景。以下是对两者的详细对比：一、基本概述ClangGCC定义一个C/C++、Objective-C/Objective-C++编程语言的编译器前端，采用底层虚拟机（
Kafka 迁移 AutoMQ 时 Flink 位点管理的挑战与解决方案 AutoMQ 云计算云原生 Kafka 消息计算大数据 AWS AutoMQ 阿里云腾讯云 GCP
编辑导读：AutoMQ是一款与ApacheKafka100%完全兼容的新一代Kafka，可以做到至多10倍的成本降低和极速的弹性。凭借其与Kafka的完全兼容性可以与用户已有的Flink等大数据基础设施进行轻松整合。Flink是重要的流处理引擎，与Kafka有着密切的关系。本文重点介绍了当用户需要将生产Kafka集群迁移到AutoMQ时，如何处理好Flink的位点来确保整体迁移的平滑过渡。引言在云
AI产品经理还不会数据挖掘❓看完这篇就够了脱泥不tony 人工智能产品经理数据挖掘 python tensorflow 开发语言 llama
前言在数字化时代的浪潮中，AI产品经理正成为推动科技与商业融合的重要力量。然而，面对海量的数据，如何从中挖掘出有价值的信息，为AI产品的开发提供有力支持？这已成为AI产品经理必须面对的挑战。今天，我们就来探讨一下数据挖掘在AI产品经理工作中的重要性，以及如何通过掌握数据挖掘方法论，打造卓越的AI产品。一、数据挖掘：AI产品经理的必备技能在AI产品的世界中，大数据是构建一切的基础。无论是算法组件、知
python数据分析与可视化盆蒂 python 开发语言
一、Python数据分析概述Python是一种解释型、交互式的编程语言，其设计理念强调代码的可读性和简洁性。Python的语法结构简单，支持面向对象、过程式和函数式三种编程范式，使得Python成为一种强大而灵活的编程语言。Python数据分析主要包括数据清洗、数据探索和数据可视化三个部分。数据清洗是数据分析的重要环节，主要是对数据进行预处理，包括缺失值处理、异常值处理、数据类型转换等。数据探索则
HTTPS keytool工具使用(高频) 笑锝没心没肺 Linux #网络安全 https 网络协议 http
keytool是Java平台的一个密钥和证书管理工具，它用于管理JavaKeystore(JKS)文件，这些文件用于存储密钥和证书。以下是keytool命令的一些常用选项及其详解：基本语法keytool[options]选项列表生成密钥库-genkeypair:生成密钥对。-alias:密钥库条目的别名。-keyalg:密钥算法，例如RSA或EC。-keysize:密钥大小（位数）。-validi
顺序表、链式表、顺序栈、链式栈以及顺序队列、链式队列 ¿134 数据结构算法 c语言
一、什么是数据结构1、数据结构的起源1968，美国高德纳教授，《计算机程序设计艺术》第一卷《基本算法》，开创了数据结构和算法的先河数据结构是研究数据之间关系和操作的学科，而非计算方法数据结构+算法=程序美国沃斯提出这句话揭示了程序的本质2、数据结构相关概念结构：所以能够输入到计算机中，能够被程序处理的描述客观事物的符号数据项：有独立含义的数据的最小单位，也称为域数据元素：组成数据的有一定含义的基本
Python操作MongoDB看这一篇就够了 Python3.7 Python进阶 python
MongoDB是由C++语言编写的非关系型数据库，是一个基于分布式文件存储的开源数据库系统，其内容存储形式类似JSON对象，它的字段值可以包含其他文档、数组及文档数组，非常灵活。在这一节中，我们就来看看Python3下MongoDB的存储操作。1.准备工作在开始之前，请确保已经安装好了MongoDB并启动了其服务，并且安装好了Python的PyMongo库。2.连接MongoDB连接MongoDB
C#编程语言实践：基础知识与项目开发靠谱电竞
本文还有配套的精品资源，点击获取简介：C#是微软公司设计的面向对象编程语言，广泛应用于Windows桌面、游戏及Web应用开发。本课程深入探讨C#的基础知识、语法特性、面向对象编程、异常处理等概念，并涉及LINQ查询、异步编程、泛型、委托、事件、接口、匿名方法、Lambda表达式、.NET框架及C#最新版本的特性。此外，课程将介绍调试与性能优化技能，以及代码重构的重要性，以帮助学生建立扎实的C#编
python加密解密算法_Python-AES加密算法接口测试 weixin_39602737 python加密解密算法
前言先前已经学过了Python-SHA256加密算法接口测试，今天我跟大家讲解一下AES加密算法的接口如何写python脚本进行测试。一：安装pycryptodome模块pipinstallpycryptodome二：定义AES加密的方法，本次使用ECB模式加密importbase64fromCrypto.CipherimportAESfromCrypto.Util.Paddingimportpa
从自然语言到提示词：编程范式的革命 AI天才研究院计算机软件编程原理与应用实践大数据AI人工智能 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
从自然语言到提示词：编程范式的革命关键词：编程范式、自然语言处理、提示词编程、人工智能、算法原理摘要：随着人工智能技术的不断发展，编程范式正经历着从自然语言处理向基于提示词的人工智能编程模式的转变。本文旨在探讨这一转变的背景、动机、原理及其在软件开发实践和工程方法论中的影响。文章将逐步分析自然语言处理和提示词编程的核心概念，讲解算法原理和数学模型，并通过实际案例展示编程范式转变的应用效果。第一部分
深入理解AES加密算法：原理与Python实现闲人编程密码学与信息安全 python 开发语言 AES 加密解密密码学
目录深入理解AES加密算法：原理与Python实现1.AES算法简介2.AES加密解密流程3.Python实现AES加密解密4.结论深入理解AES加密算法：原理与Python实现AES(AdvancedEncryptionStandard)是目前最广泛使用的对称加密算法之一。它具有高效、安全和灵活的特点，被广泛应用于数据加密、通信加密以及各种安全协议中。本文将详细介绍AES算法的加密和解密流程，并
分布式因果推断在美团履约平台的探索与实践思维导图-java架构用心去追梦 java 架构开发语言
为了创建一个关于“分布式因果推断在美团履约平台的探索与实践”的思维导图，并且专注于Java架构下的实现，我们可以将这个主题分解为几个关键领域。这包括：项目背景、因果推断的基本概念、数据收集与预处理、分布式系统设计、算法选择与实现、性能优化策略、以及效果评估与迭代。以下是这个主题的思维导图结构建议：思维导图结构1.项目背景美团履约平台简介平台业务流程（如外卖配送、闪购等）履约效率的重要性分布式因果推
gradio库的基本使用 Echo..... python python
Gradio（通过pipinstallgradio安装）是一个用于创建交互式界面的Python库。它允许你基于预训练模型、函数或任意代码块创建实时演示和部署模型的图形用户界面（GUI）。使用Gradio库，你可以轻松创建Web界面，用于输入数据、调用模型、显示结果，并为用户提供与模型交互的功能。它支持多种输入类型（如文本框、图片上传、滑块等）和输出展示方式（如图像展示、文本展示等）。你可以根据需要
leetcode215.数组中的第K个最大元素努力d小白 #其他算法排序算法数据结构
标签：计数排序给定整数数组nums和整数k，请返回数组中第k个最大的元素。请注意，你需要找的是数组排序后的第k个最大的元素，而不是第k个不同的元素。你必须设计并实现时间复杂度为O(n)的算法解决此问题。示例1:输入:[3,2,1,5,6,4],k=2输出:5示例2:输入:[3,2,3,1,2,4,5,5,6],k=4输出:4提示：-0){if(temp[a]==0)a--;else{temp[a]
利用Python的jieba和wordcloud第三方库制作精美词云博客冲浪 Python python
一：《红楼梦》高频中文词语统计importjiebaf=open('红楼梦.txt','r')txt=f.read()f.close()words=jieba.icut(txt)counts={}forwordinwords:iflen(word)==1:continueelse:counts[word]=counts.get(word,0)+1items=list(counts.items())
动态规划（Dynamic Programming，简称 DP）佛渡红尘计算机应用与算法动态规划代理模式算法
动态规划（DynamicProgramming，简称DP）是一种在数学、计算机科学和经济学中使用的，通过把原问题分解为相对简单的子问题的方式来求解复杂问题的方法。动态规划常常适用于有重叠子问题和最优子结构性质的问题。通过保存和重用已经解决的子问题的解，来避免重复计算，从而大大提高了算法的效率。动态规划的基本思想是将一个复杂的问题分解为若干个相对简单的子问题，通过求解子问题，并将这些子问题的解保存起
【AI中数学-概率论-综合实例-包括python实现】预测的守望者：动态贝叶斯网络在风险预警中的应用云博士的AI课堂 AI中的数学人工智能概率论 python 贝叶斯网络机器学习 AI数学
第四章：概率论-综合实例第2节预测的守望者：动态贝叶斯网络在风险预警中的应用在许多现实世界的应用中，预测和风险评估通常不仅依赖于静态的输入数据，而是需要考虑时间维度和动态变化。动态贝叶斯网络（DBN,DynamicBayesianNetwork）作为一种扩展了传统贝叶斯网络的工具，可以有效地处理时间序列数据，并进行时序预测。与静态贝叶斯网络不同，DBN能够通过建模系统状态随时间的变化，揭示出更为复
jave五子棋人机对战 aqfcca c++算法笔记 java 开发语言
这是pythonpythonAI五子棋对战-CSDN博客这是c++c++五子棋代码-CSDN博客这又是javeimportjavax.imageio.ImageIO;importjavax.swing.*;importjava.awt.*;importjava.awt.event.MouseEvent;importjava.awt.event.MouseListener;importjava.aw
基于OpenCV的道路损伤识别 Srlua小谢传知代码论文复现 python 图形图像
✨✨欢迎大家来访Srlua的博文（づ￣3￣）づ╭❤～✨✨欢迎各位亲爱的读者，感谢你们抽出宝贵的时间来阅读我的文章。我是Srlua小谢，在这里我会分享我的知识和经验。希望在这里，我们能一起探索IT世界的奥妙，提升我们的技能。记得先点赞后阅读哦~所属专栏：传知代码论文复现欢迎访问我的主页：Srlua小谢获取更多信息和资源。✨✨目录一、背景介绍二、算法原理（一）中值滤波（二）直方图均衡化（三）调节阈值（
python高级加密算法AES对信息进行加密和解密 Python数据分析与机器学习 python 开发语言
AES（高级加密标准）是一种广泛使用的对称加密算法，它以字节为单位处理数据，将明文分组加密成密文。AES算法的核心在于一个轮函数，该函数会对数据执行多次变换，包括字节代换、行移位、列混合和轮密钥加。这些操作确保了数据的安全性，使得原始数据经过AES加密后变得无法识别。AES加密过程AES加密过程涉及以下几个关键步骤：字节代换：这一步使用一个预定义的S盒（替换表）来替换状态矩阵中的每个字节。这是一个
R语言的编程范式编程小筑包罗万象 golang 开发语言后端
R语言的编程范式探讨引言R语言作为一种专门用于统计分析和数据可视化的编程语言，近年来得到了广泛的应用。无论是在学术研究、企业分析，还是在数据科学的各个领域，R语言凭借其强大的数据处理能力和丰富的图形化工具，吸引了大批用户。在这一背景下，理解R语言的编程范式对于提升我们的编程能力、优化数据分析过程具有重要意义。本文将探讨R语言的编程范式，包括其命令式编程、函数式编程、面向对象编程等特性，并通过实例分
c#视觉应用开发中如何在C#中进行图像颜色空间转换？ openwin_top C#视觉应用开发问题系列 c#开发语言计算机视觉视觉检测 .net
microPythonPython最小内核源码解析NI-motion运动控制c语言示例代码解析python编程示例系列python编程示例系列二python的Web神器Streamlit如何应聘高薪职位在C#中进行图像颜色空间转换，通常涉及将图像从一种颜色空间转换到另一种颜色空间，例如从RGB转换到灰度、HSV或YUV等。为了实现这些转换，您可以使用多种库和技术，包括.NET自带的System.D
【在 PyTorch 中使用 tqdm 显示训练进度条，并解决常见错误TypeError: ‘module‘ object is not callable】 weixin_48705841 人工智能
在PyTorch中使用tqdm显示训练进度条，并解决常见错误TypeError:'module'objectisnotcallable在进行深度学习模型训练时，尤其是在处理大规模数据时，实时了解训练过程中的进展是非常重要的。为了实现这一点，我们可以使用tqdm库，它可以非常方便地为你提供进度条显示。1.什么是tqdm？TQDM是一个快速、可扩展的Python进度条库。它可以用来显示迭代的进度，帮助
jQuery 跨域访问的三种方式 No 'Access-Control-Allow-Origin' header is present on the reque qiaolevip 每天进步一点点学习永无止境跨域众观千象
XMLHttpRequest cannot load http://v.xxx.com. No 'Access-Control-Allow-Origin' header is present on the requested resource. Origin 'http://localhost:63342' is therefore not allowed access. test.html:1
mysql 分区查询优化 annan211 java 分区优化 mysql
分区查询优化引入分区可以给查询带来一定的优势，但同时也会引入一些bug. 分区最大的优点就是优化器可以根据分区函数来过滤掉一些分区，通过分区过滤可以让查询扫描更少的数据。所以，对于访问分区表来说，很重要的一点是要在where 条件中带入分区，让优化器过滤掉无需访问的分区。可以通过查看explain执行计划，是否携带 partitions
MYSQL存储过程中使用游标 chicony Mysql存储过程
DELIMITER $$ DROP PROCEDURE IF EXISTS getUserInfo $$ CREATE PROCEDURE getUserInfo(in date_day datetime)-- -- 实例-- 存储过程名为：getUserInfo-- 参数为：date_day日期格式:2008-03-08-- BEGINdecla
mysql 和 sqlite 区别 Array_06 sqlite
转载： http://www.cnblogs.com/ygm900/p/3460663.html mysql 和 sqlite 区别 SQLITE是单机数据库。功能简约，小型化，追求最大磁盘效率 MYSQL是完善的服务器数据库。功能全面，综合化，追求最大并发效率 MYSQL、Sybase、Oracle等这些都是试用于服务器数据量大功能多需要安装，例如网站访问量比较大的。而sq
pinyin4j使用 oloz pinyin4j
首先需要pinyin4j的jar包支持；jar包已上传至附件内方法一:把汉字转换为拼音；例如：编程转换后则为biancheng /** * 将汉字转换为全拼 * @param src 你的需要转换的汉字 * @param isUPPERCASE 是否转换为大写的拼音； true:转换为大写；fal
微博发送私信随意而生微博
在前面文章中说了如和获取登陆时候所需要的cookie，现在只要拿到最后登陆所需要的cookie，然后抓包分析一下微博私信发送界面 http://weibo.com/message/history?uid=****&name=**** 可以发现其发送提交的Post请求和其中的数据，让后用程序模拟发送POST请求中的数据，带着cookie发送到私信的接入口，就可以实现发私信的功能了。
jsp 香水浓 jsp
JSP初始化容器载入JSP文件后，它会在为请求提供任何服务前调用jspInit()方法。如果您需要执行自定义的JSP初始化任务，复写jspInit()方法就行了 JSP执行这一阶段描述了JSP生命周期中一切与请求相关的交互行为，直到被销毁。当JSP网页完成初始化后
在 Windows 上安装 SVN Subversion 服务端 AdyZhang SVN
在 Windows 上安装 SVN Subversion 服务端2009-09-16高宏伟哈尔滨市道里区通达街291号最佳阅读效果请访问原地址：http://blog.donews.com/dukejoe/archive/2009/09/16/1560917.aspx 现在的Subversion已经足够稳定，而且已经进入了它的黄金时段。我们看到大量的项目都在使
android开发中如何使用 alertDialog从listView中删除数据？ aijuans android
我现在使用listView展示了很多的配置信息，我现在想在点击其中一条的时候填出 alertDialog,点击确认后就删除该条数据，（ ArrayAdapter ，ArrayList，listView 全部删除），我知道在下面的onItemLongClick 方法中参数 arg2 是选中的序号，但是我不知道如何继续处理下去 1 2 3
jdk-6u26-linux-x64.bin 安装 baalwolf linux
1.上传安装文件(jdk-6u26-linux-x64.bin) 2.修改权限 [root@localhost ~]# ls -l /usr/local/jdk-6u26-linux-x64.bin 3.执行安装文件 [root@localhost ~]# cd /usr/local [root@localhost local]# ./jdk-6u26-linux-x64.bin&nbs
MongoDB经典面试题集锦 BigBird2012 mongodb
1.什么是NoSQL数据库？NoSQL和RDBMS有什么区别？在哪些情况下使用和不使用NoSQL数据库？ NoSQL是非关系型数据库，NoSQL = Not Only SQL。关系型数据库采用的结构化的数据，NoSQL采用的是键值对的方式存储数据。在处理非结构化/半结构化的大数据时；在水平方向上进行扩展时；随时应对动态增加的数据项时可以优先考虑使用NoSQL数据库。在考虑数据库的成熟
JavaScript异步编程Promise模式的6个特性 bijian1013 JavaScript Promise
Promise是一个非常有价值的构造器，能够帮助你避免使用镶套匿名方法，而使用更具有可读性的方式组装异步代码。这里我们将介绍6个最简单的特性。在我们开始正式介绍之前，我们想看看Javascript Promise的样子： var p = new Promise(function(r
[Zookeeper学习笔记之八]Zookeeper源代码分析之Zookeeper.ZKWatchManager bit1129 zookeeper
ClientWatchManager接口 //接口的唯一方法materialize用于确定那些Watcher需要被通知 //确定Watcher需要三方面的因素1.事件状态 2.事件类型 3.znode的path public interface ClientWatchManager { /** * Return a set of watchers that should
【Scala十五】Scala核心九：隐式转换之二 bit1129 scala
隐式转换存在的必要性，在Java Swing中，按钮点击事件的处理，转换为Scala的的写法如下： val button = new JButton button.addActionListener( new ActionListener { def actionPerformed(event: ActionEvent) {
Android JSON数据的解析与封装小Demo ronin47
转自：http://www.open-open.com/lib/view/open1420529336406.html package com.example.jsondemo; import org.json.JSONArray; import org.json.JSONException; import org.json.JSONObject; impor
[设计]字体创意设计方法谈 brotherlamp UI ui自学 ui视频 ui教程 ui资料
从古至今，文字在我们的生活中是必不可少的事物，我们不能想象没有文字的世界将会是怎样。在平面设计中，UI设计师在文字上所花的心思和功夫最多，因为文字能直观地表达UI设计师所的意念。在文字上的创造设计，直接反映出平面作品的主题。如设计一幅戴尔笔记本电脑的广告海报，假设海报上没有出现“戴尔”两个文字，即使放上所有戴尔笔记本电脑的图片都不能让人们得知这些电脑是什么品牌。只要写上“戴尔笔
单调队列-用一个长度为k的窗在整数数列上移动，求窗里面所包含的数的最大值 bylijinnan java 算法面试题
import java.util.LinkedList; /* 单调队列滑动窗口单调队列是这样的一个队列：队列里面的元素是有序的，是递增或者递减题目：给定一个长度为N的整数数列a(i),i=0,1,...,N-1和窗长度k. 要求：f(i) = max{a(i-k+1),a(i-k+2),..., a(i)},i = 0,1,...,N-1 问题的另一种描述就
struts2处理一个form多个submit chiangfai struts2
web应用中，为完成不同工作，一个jsp的form标签可能有多个submit。如下代码： <s:form action="submit" method="post" namespace="/my"> <s:textfield name="msg" label="叙述：">
shell查找上个月，陷阱及野路子 chenchao051 shell
date -d "-1 month" +%F 以上这段代码，假如在2012/10/31执行，结果并不会出现你预计的9月份，而是会出现八月份，原因是10月份有31天，9月份30天，所以-1 month在10月份看来要减去31天，所以直接到了8月31日这天，这不靠谱。野路子解决：假设当天日期大于15号
mysql导出数据中文乱码问题 daizj mysql 中文乱码导数据
解决mysql导入导出数据乱码问题方法：１、进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+----------------------------------------+ | Variable_name&nbs
SAE部署Smarty出现：Uncaught exception 'SmartyException' with message 'unable to write dcj3sjt126com PHP smarty sae
对于SAE出现的问题：Uncaught exception 'SmartyException' with message 'unable to write file...。官方给出了详细的FAQ：http://sae.sina.com.cn/?m=faqs&catId=11#show_213 解决方案为： 01 $path
《教父》系列台词 dcj3sjt126com
Your love is also your weak point. 你的所爱同时也是你的弱点。 If anything in this life is certain, if history has taught us anything, it is that you can kill anyone. 不顾家的人永远不可能成为一个真正的男人。 &
mongodb安装与使用 dyy_gusi mongo
一.MongoDB安装和启动,widndows和linux基本相同 1.下载数据库, linux:mongodb-linux-x86_64-ubuntu1404-3.0.3.tgz 2.解压文件,并且放置到合适的位置 tar -vxf mongodb-linux-x86_64-ubun
Git排除目录 geeksun git
在Git的版本控制中，可能有些文件是不需要加入控制的，那我们在提交代码时就需要忽略这些文件，下面讲讲应该怎么给Git配置一些忽略规则。有三种方法可以忽略掉这些文件，这三种方法都能达到目的，只不过适用情景不一样。 1. 针对单一工程排除文件这种方式会让这个工程的所有修改者在克隆代码的同时，也能克隆到过滤规则，而不用自己再写一份，这就能保证所有修改者应用的都是同一
Ubuntu 创建开机自启动脚本的方法 hongtoushizi ubuntu
转载自： http://rongjih.blog.163.com/blog/static/33574461201111504843245/ Ubuntu 创建开机自启动脚本的步骤如下： 1) 将你的启动脚本复制到 /etc/init.d目录下以下假设你的脚本文件名为 test。 2) 设置脚本文件的权限 $ sudo chmod 755
第八章流量复制/AB测试/协程 jinnianshilongnian nginx lua coroutine
流量复制在实际开发中经常涉及到项目的升级，而该升级不能简单的上线就完事了，需要验证该升级是否兼容老的上线，因此可能需要并行运行两个项目一段时间进行数据比对和校验，待没问题后再进行上线。这其实就需要进行流量复制，把流量复制到其他服务器上，一种方式是使用如tcpcopy引流；另外我们还可以使用nginx的HttpLuaModule模块中的ngx.location.capture_multi进行并发
电商系统商品表设计 lkl
DROP TABLE IF EXISTS `category`; -- 类目表 /*!40101 SET @saved_cs_client = @@character_set_client */; /*!40101 SET character_set_client = utf8 */; CREATE TABLE `category` ( `id` int(11) NOT NUL
修改phpMyAdmin导入SQL文件的大小限制 pda158 sql mysql
　用phpMyAdmin导入mysql数据库时，我的10M的数据库不能导入，提示mysql数据库最大只能导入2M。　　 phpMyAdmin数据库导入出错：　　You probably tried to upload too large file. Please refer to documentation for ways to workaround this limit.
Tomcat性能调优方案 Sobfist apache jvm tomcat 应用服务器
一、操作系统调优对于操作系统优化来说，是尽可能的增大可使用的内存容量、提高CPU的频率，保证文件系统的读写速率等。经过压力测试验证，在并发连接很多的情况下，CPU的处理能力越强，系统运行速度越快。。【适用场景】任何项目。二、Java虚拟机调优应该选择SUN的JVM，在满足项目需要的前提下，尽量选用版本较高的JVM，一般来说高版本产品在速度和效率上比低版本会有改进。 J
SQLServer学习笔记 vipbooks 数据结构 xml
1、create database school 创建数据库school 2、drop database school 删除数据库school 3、use school 连接到school数据库，使其成为当前数据库 4、create table class(classID int primary key identity not null) 创建一个名为class的表，其有一