蒸馏）第27页

加速100倍，性能媲美SOTA，浙大提出无数据知识蒸馏新方法FastDFKD

在无法获取到原始训练数据的情况下，你可以尝试一下这种新型蒸馏算法FastDFKD，数据合成与现有的生成方法相比，可以实现10倍的加速，与非生成方法相比，甚至可以达到100倍以上的加速。

机器学习社区·2022-09-25 01:08

无数据蒸馏方向文献_1

初认无数据知识蒸馏Large-ScaleGenerativeData-FreeDistillationIntroduction&RelatedWork具体实现知识蒸馏图像生成模型InceptionismlossMomentmatchingloss

ExcitingYi·2022-09-25 00:12

论文阅读_知识蒸馏_Meta-KD

AMetaKnowledgeDistillationFrameworkforLanguageModelCompressionacrossDomains中文题目：Meta-KD:跨领域语言模型压缩的元知识蒸馏框架论文地址

xieyan0811·2022-09-25 00:09

论文阅读_知识蒸馏_Distilling_BERT

英文题目：DistillingTask-SpecificKnowledgefromBERTintoSimpleNeuralNetworks中文题目：从BERT中蒸馏指定任务知识到简单网络论文地址：https

xieyan0811·2022-09-18 00:53

论文阅读_知识蒸馏_TinyBERT

DISTILLINGBERTFORNATURALLAN-GUAGEUNDERSTANDING中文题目：TinyBERT:提炼BERT的自然语言理解能力论文地址：https://arxiv.org/pdf/1909.10351.pdf领域：NLP，知识蒸馏发表时间

xieyan0811·2022-09-18 00:23

《GhostNet: More Features from Cheap Operations》论文解读

常见的方法有模型剪枝(pruning)，量化(quantization)和蒸馏(distillation)。常规的CNN网络提取到的特征图有很多冗余信息，如下图，扳手连接的两个位置的特征图类似。

zhuikefeng·2022-09-15 14:32

Residual Feature Distillation Network for Lightweight Image Super-Resolution（AIM2020）轻质超分辨率的残差特征蒸馏

AIM2020-ESR冠军轻质图像超分辨率的残差特征蒸馏网代码：https://github.com/njulj/RFDN图像超分取得了极大的进展，尽管基于CNN的方法取得了极好的性能与视觉效果，但是这些模型难以部署到端侧设备

msy0330·2022-09-15 07:26

基于知识蒸馏Knowledge Distillation模型压缩pytorch实现

在弄懂原理基础上，从本篇博客开始，逐步介绍基于知识蒸馏的增量学习、模型压缩的代码实现。毕竟“纸上得来终觉浅，绝知此事要躬行。”。先从最经典的Hilton论文开始，先实现基于知识蒸馏的模型压缩。

azy1988·2022-09-14 07:20

模型压缩之知识蒸馏

1.介绍1.2背景虽然在一般情况下，我们不会去区分训练和部署使用的模型，但是训练和部署之间存在着一定的不一致性:在训练过程中，我们需要使用复杂的模型，大量的计算资源，以便从非常大、高度冗余的数据集中提取出信息。在实验中，效果最好的模型往往规模很大，甚至由多个模型集成得到。而大模型不方便部署到服务中去，常见的瓶颈如下:推断速度慢对部署资源要求高(内存，显存等)在部署时，我们对延迟以及计算资源都有着严

AI算法-图哥·2022-09-14 07:46

深度学习之知识蒸馏(Knowledge Distillation)

本文参考以下链接，如有侵权，联系删除论文参考引言知识蒸馏是一种模型压缩方法，是一种基于“教师-学生网络思想”的训练方法，由于其简单，有效，在工业界被广泛应用。

专注于计算机视觉的AndyJiang·2022-09-14 07:31

模型压缩中知识蒸馏技术原理及其发展现状和展望

知识蒸馏是非常经典的基于迁移学习的模型压缩技术，在学术界的研究非常活跃，工业界也有许多的应用和较大的潜力，本文给大家梳理知识蒸馏的核心技术，发展现状，未来展望以及学习资源推荐。

文文学霸·2022-09-14 07:00

初识知识蒸馏

这里写自定义目录标题知识蒸馏1知识蒸馏的作用2怎么做到？3到底怎么实现？注：知识蒸馏1知识蒸馏的作用知识蒸馏的概念来源于大牛Hinton在2015年的一篇文章，在文中首次提出了知识蒸馏的概念。

Moringstarluc·2022-09-14 07:29

深度学习中的知识蒸馏技术！

本文概览:1.知识蒸馏介绍1.1什么是知识蒸馏？在化学中，蒸馏是一种有效的分离不同沸点组分的方法，大致步骤是先升温使低沸点的组分汽化，然后降温冷凝，达到分离出目标物质的目的。

Datawhale·2022-09-14 07:58

知识蒸馏基本原理

1.概述蒸馏是一个化学上的词汇，百科上对于蒸馏的解释为：“蒸馏是一种热力学的分离工艺，它利用混合液体或液-固体系中各组分沸点不同，使低沸点组分蒸发，再冷凝以分离整个组分的单元操作过程，是蒸发和冷凝两种单元操作的联合

zhiyong_will·2022-09-14 07:25

深度学习——卷积神经网络压缩方法总结（等待补充）

卷积网络压缩方法总结卷积网络的压缩方法一，低秩近似二，剪枝与稀疏约束三，参数量化四，二值化网络五，知识蒸馏六，浅层网络我们知道，在一定程度上，网络越深，参数越多，模型越复杂，其最终效果越好。

小陈phd·2022-09-10 07:40

论文阅读：CVPR2022 Wavelet Knowledge Distillation: Towards Efficient Image-to-Image Translation

为了解决这个问题，提出了一种新的知识蒸馏方法，称为小波知识蒸馏。小波知识蒸馏不是直接提取生成的教师图像，而是首先通过离散小波变换将

_击空明兮溯流光_·2022-09-04 07:58

模型压缩|深度学习（李宏毅）（十三）

本文主要介绍五种模型压缩的方法：①网络剪枝（NetworkPruning）②知识蒸馏（KnowledgeDistillation）③参数量化（ParameterQuantization）④结构设计（ArchitectureDesign

酷酷的群·2022-09-03 15:59

万字综述 | 一文读懂知识蒸馏

知识蒸馏综述摘要知识蒸馏简介知识Response-BasedKnowledgeFeature-BasedKnowledgeRelation-BasedKnowledge蒸馏离线蒸馏（OfflineDistillation

AI异构·2022-09-03 15:29

深度学习之模型压缩

本文参考以下链接，如有侵权，联系删除参考概述目的：最大程度的减小模型复杂度，减少模型存储需要的空间，也致力于加速模型的训练和推理主要方法前端压缩(可逆)：知识蒸馏：通过采用预先训练好的复杂模型（teachermodel

专注于计算机视觉的AndyJiang·2022-09-03 15:23

【深度学习之模型优化】模型剪枝、模型量化、知识蒸馏概述

【深度学习之模型优化】模型剪枝、模型量化、知识蒸馏概述模型剪枝技术概述1.什

大气层煮月亮·2022-09-03 15:21

数学、机器学习、深度学习目录

对象检测1.数学基础矩阵求导术用狄拉克函数来构造非光滑函数的光滑近似2.深度学习深度学习入门（一）感知机与激活函数损失函数–交叉熵与极大似然估计softmax求导/label_smoothing求导/知识蒸馏求导梯度推导深度学习入门

得克特·2022-09-01 07:19

超越所有MIM模型的BEiT v2来了！微软使用矢量量化视觉Tokenizers的掩码图像建模！

具体来说，作者引入向量量化知识蒸馏来训练tokenizer，它将连续的语义空间离散化为紧凑

·2022-08-29 10:55

CVPR 2022详解｜重新挖掘logit蒸馏的潜力，旷视等开源解耦知识蒸馏DKD

作者丨科技猛兽编辑丨3D视觉开发者社区导读本文提出了一种十分新颖的观点，即：输出知识蒸馏的潜力其实还没有得到完全开发。

奥比中光3D视觉开发者社区·2022-08-27 07:55

CVPR2022 | 中科大&华为提出用于非对称图像检索的上下文相似性蒸馏

为此，作者提出了一个灵活的上下文相似性蒸馏框架来增强小型查询模型并保持其输出特征与大型图库模型的输出特征兼容，这对于非对称检索至关重要。在本文的方法中，作者学习了具有新的

·2022-08-26 10:42

知识蒸馏：好老师是耐心且一致的

Knowledgedistillation:Agoodteacherispatientandconsistent9Jun2021CVPR2022Oral作者：LucasBeyer,XiaohuaZhai,AmélieRoyer,LarisaMarkeeva,RohanAnil,AlexanderKolesnikov单位：GoogleResearch,BrainTeam原文：https://arxi

Valar_Morghulis·2022-08-19 16:33

预约直播 | 基于预训练模型的自然语言处理及EasyNLP算法框架

算法框架二、直播时间：2022年08月24日（周三）18：00-18：30三、议题介绍：此次分享将深入介绍预训练语言模型的研究进展以及各种下游自然语言理解的应用；为了解决大模型落地难问题，重点展示多种知识蒸馏

·2022-08-18 10:49

深度学习模型——知识蒸馏

什么是知识蒸馏？近年来，神经模型在几乎所有领域都取得了成功，包括极端复杂的问题。然而，这些模型体积巨大，有数百万(甚至数十亿)个参数，因此不能部署在边缘设备上。

wuguangbin1230·2022-08-13 07:09

深度学习机器学习面试题汇——模型优化，轻量化，模型压缩

为什么用知识蒸馏？知道模型蒸馏吗？谈下原理做过模型优化吗？模型蒸馏和模型裁剪？squeezeNet的FireModule有什么特点？

冰露可乐·2022-08-13 07:07

【模型压缩】（四）——知识蒸馏

一、概述一句话概括：将一个复杂模型的预测能力转移到一个较小的网络上；（复杂模型称为教师模型，较小模型称为学生模型）TeacherandStudent的概念：对大网络学习的知识进行"蒸馏"，并将其转移到小网络上

一个热爱学习的深度渣渣·2022-08-13 07:35

深度学习模型压缩之知识蒸馏

知识蒸馏知识蒸馏蒸馏方式离线蒸馏在线蒸馏自我蒸馏蒸馏算法对抗蒸馏多教师蒸馏跨模态蒸馏图蒸馏无数据蒸馏量化蒸馏深度交互学习（DeepMutalLearning）Demo环境导入相关的包加载mnist数据定义教师模型训练教师模型修改教师模型生成

RyanC3·2022-08-13 07:33

深度学习模型压缩#1-剪枝

模型压缩有剪枝、量化、知识蒸馏等方法。剪枝网络剪枝是模型压缩使用较为普遍的一种方法。主要通过减少网络参数、降低结构复杂度来增强网络泛化性能和避免过拟合，以此得到更轻量、高效的应用模型。

Qinghuan1958·2022-08-13 07:29

李宏毅《机器学习》模型压缩-知识蒸馏

本文主要介绍五种模型压缩的方法：①网络剪枝（NetworkPruning）②知识蒸馏（KnowledgeDistillation）③参数量化（ParameterQuantization）④结构设计（ArchitectureDesign

Good@dz·2022-08-13 07:57

深度学习中模型压缩（Network Compression）的几种方法（李宏毅视频课总结）

文章目录0前言1NetworkPruning（网络剪枝）1.1Basemethod1.2WeightPruning1.3NeuronPruning2KnowledgeDistillation（知识蒸馏）

Y_蒋林志·2022-08-13 07:25

深度学习模型压缩与加速技术（六）：知识蒸馏

目录总结知识蒸馏定义特点1.学生模型的网络架构2.教师模型的学习信息训练技巧其他场景参考文献深度学习模型的压缩和加速是指利用神经网络参数的冗余性和网络结构的冗余性精简模型，在不影响任务完成度的情况下，得到参数量更少

小风_·2022-08-13 07:54

模型压缩 —— 知识蒸馏（Knowledge Distillation）

https://zhuanlan.zhihu.com/p/81467832在深度学习的背景下，为了达到更好的预测，常常会有两种方案：1.使用过参数化的深度神经网络，这类网络学习能力非常强，因此往往加上一定的正则化策略(如dropout)；2.集成模型(ensemble)，将许多弱的模型集成起来，往往可以实现较好的预测。这两种方案需要的计算量和计算资源很大，对部署非常不利。这也就是模型压缩的动机：我

rainbow_lucky0106·2022-08-13 07:53

模型压缩（4）——知识蒸馏

对于大的数据集，小模型往往很难获得较高的精度；知识蒸馏则是使用大模型指导小模型，使小模型学到大模型包含的知识，从而得到更高的精度。

不变强不改名·2022-08-13 07:20

深度学习-知识蒸馏

第一章综述知识蒸馏的目的是将大模型变成小模型，将小模型部署到移动终端设备上。

jackson_j·2022-08-13 07:48

模型压缩 | TIP 2022 - 蒸馏位置自适应：Spot-adaptive Knowledge Distillation

TIP2022-蒸馏位置自适应：Spot-adaptiveKnowledgeDistillation本文已授权极市平台,并首发于极市平台公众号.未经允许不得二次转载.原始语雀文档：https://www.yuque.com

有为少年·2022-08-13 07:43

深度学习之压缩模型大小且不掉点的方法---知识蒸馏

目录原理知识蒸馏代码演示（手写数字集）1.导入相关包2.准备训练集3.搭建教师网络并训练4.搭建学生网络并训练5.对学生网络进行知识蒸馏训练测试结果总结知识蒸馏的功能原理知识蒸馏的算法理论，就是将庞大的教师模型的重要的东西让学生模型来逼近和训练

L888666Q·2022-08-13 07:37

美团搜索粗排优化的探索与实践

本文介绍了美团搜索粗排的迭代路线、基于知识蒸馏和自动神经网络选择的粗排优化工作，希望为从事相关工作的同学带来一些启发或者帮助。

美团技术团队·2022-08-12 19:27

美团搜索粗排优化的探索与实践

本文介绍了美团搜索粗排的迭代路线、基于知识蒸馏和自动神经网络选择的粗排优化工作，希望为从事相关工作的同学带来一些启发或者帮助。

·2022-08-12 17:26

用20篇论文走完知识蒸馏在 2014-2020 年的技术进展

点击上方“视学算法”，选择加"星标"或“置顶”重磅干货，第一时间送达作者丨傅斯年Walton@知乎（已授权）来源丨https://zhuanlan.zhihu.com/p/160206075编辑丨极市平台前言最近给公司里面的同学做了一个KD的survey，趁热把我回顾研究的一些东西记录下来，算是回馈知乎社区，一直以来，从里面汲取了很多营养，但没有怎么输出优质内容。概要Intro&RoadmapKD

视学算法·2022-08-08 07:00

工行里的数字员工是怎么来的？

《新程序员005：开源深度指南&新金融背后的技术力量》特邀中国工商银行软件开发中心来分享他们在数字化员工建设方面的实践与总结，通过对意图识别、对话抽取、模型蒸馏、回流学习等技术的介绍，对用户理解进行了深入探索

《新程序员》编辑部·2022-08-05 13:54

实际工作中的高级技术（训练加速、推理加速、深度学习自适应、对抗神经网络）

基于数据的并行①ModelAverage（模型平均）②SSGD（同步随机梯度下降）③ASGD*（异步随机梯度下降）2.基于模型的并行二、推理加速1.SVD分解*2.HiddenNodeprune3.知识蒸馏

Billie使劲学·2022-08-05 07:41

ECCV22｜只能11%的参数就能优于Swin，微软提出快速预训练蒸馏方法TinyViT

为了缓解这一问题，作者提出了TinyViT，这是一种新的微小而高效的小视觉Transformer家族，使用本文提出的快速蒸馏框架在大规模数据集上进行预训练。

·2022-08-01 10:53

Towhee 每周模型

·2022-07-29 19:17

DeiT：注意力也能蒸馏

其核心是提出了针对ViT的教师-学生蒸馏训练策略，并提出了token-baseddistillation方法，使得Transformer在视觉领域训练得又快又好。

ZOMI酱酱·2022-07-20 00:00

公众号内容拓展学习笔记（2021.3.27）

用20篇论文走完知识蒸馏在2014-2020年的技术进展⭐️⭐️主要内容：有关知识蒸馏技术发展的综述核心要点：三种主流方法：模型压缩算法，模

CV_七少·2022-07-19 07:59

LIVE 预告 | CVPR 2021 预讲 · 旷视专场，覆盖目标检测、蒸馏、图像降噪、人体姿态估计等...

CVPR2021大会将于6月19日至25日线上举行。为促进同行之间的交流与合作，智源社区近期举办了系列CVPR2021预讲报告，其中实验室系列将汇聚国内顶尖高校和企业实验室的研究人员为大家分享其最新研究成果。在本届CVPR会议中，旷视研究院共有22篇文章入选，研究领域涵盖激活函数、神经网络、神经网络架构搜索、光流估计、无监督学习、人体姿态估计、目标检测等。智源社区特此邀请旷视研究院分享当中6篇工作

智源社区·2022-07-10 22:37

手把手教你在query-doc匹配模型上实现蒸馏优化！

导语|本文主要介绍我们在视频的query-doc匹配模型上进行的模型蒸馏技术优化，第一章介绍知识蒸馏概念、业务模型难点以及现有方案不足；第二章介绍匹配模型细节以及模型蒸馏整体框架；第三章介绍我们在蒸馏方案上的优化点

腾讯云开发者·2022-07-06 07:32

推荐频道

蒸馏）

加速100倍，性能媲美SOTA，浙大提出无数据知识蒸馏新方法FastDFKD

无数据蒸馏方向文献_1

论文阅读_知识蒸馏_Meta-KD

论文阅读_知识蒸馏_Distilling_BERT

论文阅读_知识蒸馏_TinyBERT

《GhostNet: More Features from Cheap Operations》论文解读

Residual Feature Distillation Network for Lightweight Image Super-Resolution（AIM2020）轻质超分辨率的残差特征蒸馏

基于知识蒸馏Knowledge Distillation模型压缩pytorch实现

模型压缩之知识蒸馏

深度学习之知识蒸馏(Knowledge Distillation)

模型压缩中知识蒸馏技术原理及其发展现状和展望

初识知识蒸馏

深度学习中的知识蒸馏技术！

知识蒸馏基本原理

深度学习——卷积神经网络压缩方法总结（等待补充）

论文阅读：CVPR2022 Wavelet Knowledge Distillation: Towards Efficient Image-to-Image Translation

模型压缩|深度学习（李宏毅）（十三）

万字综述 | 一文读懂知识蒸馏

深度学习之模型压缩

【深度学习之模型优化】模型剪枝、模型量化、知识蒸馏概述

数学、机器学习、深度学习目录

超越所有MIM模型的BEiT v2来了！微软使用矢量量化视觉Tokenizers的掩码图像建模！

CVPR 2022详解｜重新挖掘logit蒸馏的潜力，旷视等开源解耦知识蒸馏DKD

CVPR2022 | 中科大&华为提出用于非对称图像检索的上下文相似性蒸馏

知识蒸馏：好老师是耐心且一致的

预约直播 | 基于预训练模型的自然语言处理及EasyNLP算法框架

深度学习模型——知识蒸馏

深度学习机器学习面试题汇——模型优化，轻量化，模型压缩

【模型压缩】（四）——知识蒸馏

深度学习 模型压缩之知识蒸馏

深度学习模型压缩#1-剪枝

李宏毅《机器学习》模型压缩-知识蒸馏

深度学习中模型压缩（Network Compression）的几种方法（李宏毅视频课总结）

深度学习模型压缩与加速技术（六）：知识蒸馏

模型压缩 —— 知识蒸馏（Knowledge Distillation）

模型压缩（4）——知识蒸馏

深度学习-知识蒸馏

模型压缩 | TIP 2022 - 蒸馏位置自适应：Spot-adaptive Knowledge Distillation

深度学习之压缩模型大小且不掉点的方法---知识蒸馏

美团搜索粗排优化的探索与实践

美团搜索粗排优化的探索与实践

用20篇论文走完知识蒸馏在 2014-2020 年的技术进展

工行里的数字员工是怎么来的？

实际工作中的高级技术（训练加速、推理加速、深度学习自适应、对抗神经网络）

ECCV22｜只能11%的参数就能优于Swin，微软提出快速预训练蒸馏方法TinyViT

Towhee 每周模型

DeiT：注意力也能蒸馏

公众号内容拓展学习笔记（2021.3.27）

LIVE 预告 | CVPR 2021 预讲 · 旷视专场，覆盖目标检测、蒸馏、图像降噪、人体姿态估计等...

手把手教你在query-doc匹配模型上实现蒸馏优化！

深度学习模型压缩之知识蒸馏