zenRRan

Fast and Effective！一文速览轻量化Transformer各领域研究进展

每天给你送来NLP技术干货！

机构｜中国人民大学高瓴人工智能学院

研究方向 | 多模态学习

来自 | RUC AI Box

本文梳理了一些Transformer常用的轻量化方法，并分领域的介绍了一些主流的轻量化Transformer。

引言：近年来，Transformer模型在人工智能的各个领域得到了广泛应用，成为了包括计算机视觉，自然语言处理以及多模态领域内的主流方法。尽管Transformer在大部分任务上拥有极佳的性能，其过大的参数量限制了在现实场景下的应用，也给相关研究带来了困难，由此带来了Transformer轻量化领域的发展。笔者首先梳理了一些Transformer常用的轻量化方法，并分领域的介绍了一些主流的轻量化Transformer。欢迎大家批评指正，相互交流。

预训练模型参数量增长趋势

1.Transformer中常用的模型压缩方法

量化：量化的基本思想即利用低比特的数据类型来替代原本的高比特数据类型，同时对数据的存储空间与计算的复杂度进行轻量化。简单的训练后量化，即直接对训练好的模型参数进行量化会带来很大的误差，目前主要会采用量化感知训练（Quantized-Aware Training, QAT）的方式，在训练时全精度优化，仅模拟低精度的推理过程，很好的降低了量化过程的性能损失。
剪枝：剪枝方法基于lottery ticket假设，即模型中只有小部分参数起了核心作用，其他的大部分参数是无效参数，可以去除掉。剪枝可以分为非结构化剪枝与结构化剪枝。非结构化剪枝即定位参数矩阵中接近于0或者有接近0趋势的参数，并将这些参数归零，使参数矩阵稀疏化。结构化剪枝即消减模型中结构化的部分，如多头注意力中不需要的注意力头，多层Transformer中不需要的若干层等等。

非结构化剪枝

知识蒸馏：知识蒸馏通常在一个大的老师模型与一个小的学生模型之间进行。通过老师模型在监督数据上输出的“软标签分布”来训练学生模型。这种“软标签”的学习能够很好的克服监督数据中标签偏差的问题，带来了很好的知识迁移的能力。

参数共享：在模型同质的部分间共享参数。

2.预训练语言模型中的轻量化Transformer

Transformer最早在自然语言领域中得到广泛的应用，其强大的能力带来了预训练领域的快速发展，并在相关领域带来了革新。但是随着预训练模型规模的不断增大，训练与部署一个预训练模型的代价也不断提升，预训练语言模型轻量化的研究方向应运而生。由于以Bert为代表的预训练语言模型的主流架构仍是Transformer，因此Transformer的轻量化也成为了当前NLP领域的一个重要课题。以下是笔者整理的几篇经典的预训练语言模型中的轻量化工作，供读者参考。

Q8BERT: Quantized 8Bit BERT

https://arxiv.org/pdf/1910.06188.pdf

Q8BERT是量化方法在Bert上的朴素运用。除了采用了基本的量化感知训练方式外，Q8BERT还采用了指数滑动平均的方式平滑QAT的训练过程。最终，在压缩了近4倍参数量，取得4倍推理加速的前提下，Q8BERT在GLUE与SQUAD数据集上取得了接近Bert的效果，证明了量化方法在Bert上的有效性。

Q8BERT在下游任务上的表现

DistilBERT, a distilled version of BERT: smaller, faster, cheaper and lighter

https://arxiv.org/pdf/1910.01108.pdf

DistillBERT是huggingface发布的一个小版本的Bert模型，它只在输出层面采用了软标签的蒸馏，将Bert的层数压缩到了原本的1/2，并在各个下游任务上取得了不错的结果。

在GLUE上，DisitlBERT只用了60%的参数，保留了97%的性能

TinyBERT: Distilling BERT for Natural Language Understanding

https://arxiv.org/pdf/1909.10351.pdf

与DistilBERT相同，TinyBERT同样是知识蒸馏在Bert压缩上的应用。不同于DistillBERT只在预训练阶段采用知识蒸馏，TinyBERT同时在预训练和微调阶段采用了两阶段的知识蒸馏，使得小模型能够学到通用与任务相关的语义知识。

TinyBERT蒸馏策略

同时，TinyBERT采用了更加细粒度的知识蒸馏方式，对embedding层的输出，Transformer每一层中隐藏层与注意力计算的输出以及整个模型的软标签进行了知识蒸馏，得到了更加精准的知识迁移效果。

更加细粒度的蒸馏方式

最终，TinyBERT将BERT模型蒸馏成了一个4层且隐藏层维度更小的模型，并取得了不亚于更高参数量的DistilBERT的效果。

ALBERT: A LITE BERT FOR SELF-SUPERVISED LEARNING OF LANGUAGE REPRESENTATIONS

https://arxiv.org/pdf/1909.11942.pdf

ALBERT是Google在ICLR2020上的一篇工作。它首先采用了词表矩阵分解的方法，由于Bert采用了一个很大的词表，因此词表的embedding层包含了很大的参数量，ALBERT采用了参数分解（Factorized embedding parameterization）的方式减少这部分的参数量。具体而言，对于一个包含V 个单词的词表，假如词表的隐藏层大小E 与模型的隐藏层大小H 相等，则embedding层包含的参数量为V × E 。考虑到V 通常较大，embedding的总参数量也会较大。为了减少参数量，与直接对one-hot的词向量映射到 H 维空间不同，ALBERT首先将词向量映射到较小的E 维空间，再映射到H 维空间。将参数量从O(V × H)降低到了O(V × E + E × H) ，实现了embedding层的压缩。

除此之外，ALBERT还进行了Transformer内跨层的参数压缩，通过跨Tranformer层的完全参数共享，ALBERT对参数量进行了充分的压缩，在低参数量的条件下取得了与Bert-base相似的效果，同时在相近的参数量下可以保证模型更深，隐藏层维度更大，在下游任务下的表现更好。

ALBERT的参数量及下游任务表现

3.计算机视觉中的轻量化Transformer

尽管Transformer在计算机视觉领域的应用相较于NLP领域稍慢一步，但Vision Transformer的横空出世使得Transformer也占据了视觉模型的主流。后期基于MAE与BEiT的预训练方法更加巩固了Transformer在计算机视觉领域的地位。与自然语言理解领域相同，计算机视觉中的Transformer同样面临着参数量过多，部署困难的问题，因此也需要轻量化的Transformer来高效的完成下游任务。以下是笔者整理的几篇近年来计算机视觉领域中的轻量化工作，供读者参考。

Training data-efficient image transformers & distillation through attention

http://proceedings.mlr.press/v139/touvron21a/touvron21a.pdf

DeiT是Facebook在2021年的一篇工作，模型的核心方法是通过知识蒸馏对视觉Transformer进行压缩。DeiT采用了两种蒸馏方法实现了老师模型到学生模型的知识迁移：

Soft Distillation：通过老师模型输出的软标签进行知识蒸馏。
Hard-label Distillation：通过老师模型预测出的实际标签进行知识蒸馏，意义在于纠正可能存在的有监督数据的标签偏差。

DeiT在蒸馏过程中引入了Distillation token的概念，其作用与Class token类似，但Class token用于在原数据上利用交叉熵进行训练，Distillation token用于模拟老师模型的软分布输出或利用老师模型预测的hard-label进行训练。

Disillation token

通过在老师模型上的蒸馏过程，DeiT拥有更小的参数规模和更快的推理速度的条件下，取得了比ViT更好的效果。

TinyViT: Fast Pretraining Distillation for Small Vision Transformers

https://www.ecva.net/papers/eccv_2022/papers_ECCV/papers/136810068.pdf

TinyViT是微软在2022年的一篇工作，这篇工作的核心依然是知识蒸馏，但是在工程实现上进行了一些优化，使得小模型能够在更大的数据规模下通过知识蒸馏获取到大模型的知识。DeiT采用的知识蒸馏方法是相当昂贵的，因为在蒸馏过程中，教师模型与老师模型会同时占用GPU的内存，限制了batch_size的增加与学生模型的训练速度。且软标签在老师模型输出端到学生模型输出端的迁移也会带来一定的计算资源损耗。

为了解决这个问题，TinyViT提出了一种软标签预生成的方法，即解耦软标签的生成与学生模型的训练过程。先进行软标签的生成与预存储，再利用预存储的软标签对学生模型进行训练。由于预存储软标签向量会带来极大的存储损耗，考虑到这些向量大部分是稀疏的（因为对于一个训练好的老师模型，给定一张图片，只有极小部分类别会存在成为正确标签的概率），作者采用了存储稀疏标签的策略，即只存储top-k概率的标签以及其对应的概率。在训练学生模型时将这样的稀疏标签还原成完整的概率分布，并进行知识蒸馏。整个pipeline如下图所示：

TinyViT的蒸馏流程

在相同的模型规模下，TinyViT提高了知识蒸馏的速度与数据量，并取得了分类任务上的提升。

MiniViT: Compressing Vision Transformers with Weight Multiplexing

https://openaccess.thecvf.com/content/CVPR2022/papers/Zhang_MiniViT_Compressing_Vision_Transformers_With_Weight_Multiplexing_CVPR_2022_paper.pdf

MiniViT是微软在CVPR2022的一篇工作，采用了权重复用的方法来压缩模型的参数。与ALBERT不同的是，作者发现单纯的权重复用会导致每层梯度l2范数的同质化以及最后几层输出特征相关性的降低。为了解决这个问题，MiniViT采用了Weight Transformation与Weight Distillation的方法来解决这个问题。Weight Transformation，即在每一层之间插入小型的类似Adapter的结构，以保证每层的输出不会因为参数量相同而同质化。Weight Distillation，即采用一个老师模型来引导MiniViT的输出以增强模型性能。整体的pipeline如下所示：

作为一个通用的压缩方法，作者在DeiT与Swin-Transformer上进行了测试。在更小的参数量下，在ImageNet数据集上，Mini版本的模型均取得了不亚于甚至更好的效果。

DynamicViT: Efficient Vision Transformers with Dynamic Token Sparsification

https://proceedings.neurips.cc/paper/2021/file/747d3443e319a22747fbb873e8b2f9f2-Paper.pdf

本文是清华大学在Nips2021上的一篇工作，其借鉴了模型压缩中剪枝的思想，但是是对Transformer每一层的输入token进行了稀疏化。Token稀疏化的基本假设在于：对于一张图片，一定会存在一些冗余部分对模型的预测结果影响很小，对这些部分的削减可以很大程度的增加模型的推理速度。

DynamicViT的具体做法是：通过在每一层间增加一个轻量化的预测模块，预测哪一些部分的token是可以被丢弃掉的。在预测完后通过一个二进制的决策掩码来完成对token的丢弃。同时，作者修改了训练的目标函数，保证了每一层丢弃的token数量是有限的。

DynamicViT的稀疏化模块

最终，在上述的稀疏化策略下，DynamicViT在原始的ViT基础上取得了很好的加速，并在模型性能与推理速度之间达到了一个很好的平衡。

4.多模态中的轻量化Transformer

多模态模型往往同时参考了视觉模型与语言模型的设计，因此也会以Transformer作为其主流架构。但多模态中的轻量化工作较少，笔者整理了比较有代表性的几篇多模态轻量化工作供读者参考。

MiniVLM: A Smaller and Faster Vision-Language Model

https://arxiv.org/pdf/2012.06946.pdf

MiniVLM是微软在Oscar模型上的轻量化工作。MiniVLM的轻量化基于一个观察假设：即在大多数多模态任务中，多模态模型的视觉端不需要特别强的目标检测信息，而目标检测器往往是模型的瓶颈部分。因此，用一个不那么精确的目标检测器可以有效的压缩模型的参数量与加快推理速度，同时尽可能的减少性能损失。

为了达到上述效果，MiniVLM采用了一个基于EfficientNet与Bi-FPN的轻量化目标检测器。同时，为了进行进一步压缩，MiniVLM对多模态Tranformer端也进行了压缩，将原本的Bert结构更换到了更加轻量化的MiniLM，其结构如下所示：

轻量化目标检测器

最终，在可接受的精度损失范围内，相较于原本的OSCAR模型，MiniVLM对推理速度进行了极大的提升：

MiniVLM的加速效果与下游任务性能

Compressing Visual-linguistic Model via Knowledge Distillation

https://arxiv.org/pdf/2104.02096

DistilVLM是MiniVLM工作的延续。不同的是，在更换目标检测器与Transformer架构的同时，DistilVLM同时采用了知识蒸馏来保持模型的性能。DistilVLM的蒸馏策略与TinyBERT相同，同样是进行预训练阶段和微调阶段的两阶段蒸馏：

DistilVLM的蒸馏策略

由于采用了不同的目标检测器，在检测得到的目标区域不同的前提下，后续的知识蒸馏均是无效的。为了解决这个问题，DistilVLM采用了视觉token对齐的方式，老师模型和学生模型均采用相同的目标检测器，使得两个模型的检测区域对齐，保证了后续知识蒸馏的有效性。

视觉对齐

最终，在与MiniVLM相同参数和推理速度的前提下，DistilVLM取得了不错的性能提升。

参考文献

[1] Q8BERT: Quantized 8Bit BERT [2] DistilBERT, a distilled version of BERT: smaller, faster, cheaper and lighter [3] TinyBERT: Distilling BERT for Natural Language Understanding [4] ALBERT: A LITE BERT FOR SELF-SUPERVISED LEARNING OF LANGUAGE REPRESENTATIONS [5] Training data-efficient image transformers & distillation through attention [6] TinyViT: Fast Pretraining Distillation for Small Vision Transformers [7] MiniViT: Compressing Vision Transformers with Weight Multiplexing [8] DynamicViT: Efficient Vision Transformers with Dynamic Token Sparsification [9] MiniVLM: A Smaller and Faster Vision-Language Model [10] Compressing Visual-linguistic Model via Knowledge Distillation

论文解读投稿，让你的文章被更多不同背景、不同方向的人看到，不被石沉大海，或许还能增加不少引用的呦~ 投稿加下面微信备注“投稿”即可。

最近文章

COLING'22 | SelfMix：针对带噪数据集的半监督学习方法

ACMMM 2022 | 首个针对跨语言跨模态检索的噪声鲁棒研究工作

ACM MM 2022 Oral | PRVR: 新的文本到视频跨模态检索子任务

投稿或交流学习，备注：昵称-学校（公司）-方向，进入DL&NLP交流群。

方向有很多：机器学习、深度学习，python，情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。

记得备注~

python第六次课----异常处理心之所向，随风依旧 python
1.异常简介异常即非正常状态，在Python中使用异常对象来表示异常。若程序在编译或运行过程中发生错误，程序的执行过程就会发生改变，抛出异常对象，程序流进入异常处理。如果异常对象没有被处理或捕捉，程序就会执行回溯(Traceback)来终止程序。异常信息：异常类型：异常类型异常消息NameError: name'num'isnotdefined.Didyoumean:'sum'?FileN
【数据结构与算法】力扣 5. 最长回文子串秀秀_heo 数据结构与算法 leetcode 算法职场和发展
题目描述5.最长回文子串给你一个字符串s，找到s中最长的回文子串。示例1：输入：s="babad"输出："bab"解释："aba"同样是符合题意的答案。示例2：输入：s="cbbd"输出："bb"提示：1=0&&rightmaxLen){start=oddStart;maxLen=oddLen;}//处理偶数长度回文let[evenStart,evenLen]=expandAroundCenter
探索Web3世界：算法与挖矿详解 Java先进事迹 web3 算法
哈希算法：区块链的“数字指纹”区块链的结构类似于链表，数据块一个连着一个，链接在一条或多条链上。每个数据块都至少记录着数据、自己的地址和前一个数据块的地址。每个数据块的“地址”的编码都是独一无二的，通过一种称为哈希算法的技术生成。哈希算法能够将任意长度的数据映射为一个固定长度的唯一编码（哈希值）。即使输入数据发生微小变化，生成的哈希值也会截然不同。我们可以将哈希算法比作一台神奇的调色机。无论你放入
python 抽象类学python的土豆 python 开发语言
1.基本概念抽象类，顾名思义，是包含抽象方法（即没有具体实现的方法）的类。这些抽象方法必须在子类中得以具体实现。Python通过abc（AbstractBaseClasses）模块提供了对抽象类的支持。在Python3中，我们通常会从abc.ABC类继承来创建一个抽象类，并使用@abc.abstractmethod装饰器来标记抽象方法。2.定义抽象类fromabcimportABC,abstrac
python中的时间模块--datetime模块、time模块学python的土豆 python 开发语言
python中的时间模块一.datetime模块二.time模块一.datetime模块引入时间模块fromdatetimeimportdatetime获取当前时间print(datetime.today())#前的日期和时间print(datetime.now())#当前的日期和时间print(datetime.now().year)#当前的年份print(datetime.now().mont
python 函数基础学python的土豆 python 开发语言
python函数基础1.函数的目的2.函数的定义3.函数的声明与调用4.函数的形参与实参5.函数的返回值6.函数的参数类型6.1位置参数：6.2关键字参数：6.3默认参数：6.4可变参数：7.匿名函数8.函数的进阶应用在编程的世界里，函数是构建程序大厦的基石。Python作为一种高级编程语言，提供了强大且灵活的函数定义和调用机制。本文将对python函数基础的相关知识进行讲解。1.函数的目的函
python 函数进阶（迭代器和生成器）学python的土豆 python 开发语言
python函数进阶（迭代器和生成器）1.迭代器1.1迭代器的定义1.2迭代器的使用2.生成器2.1生成器的定义2.2生成器的优势2.3生成器的应用总结在Python的编程世界里，迭代器与生成器是两个很重要的概念，它们不仅简化了数据遍历与处理的过程，还极大地提升了代码的可读性与执行效率。这篇文章就来深入了解一下Python中的迭代器与生成器1.迭代器迭代器是Python中处理序列数据的一种重要方式
python的异常处理--异常引入，异常处理，常见异常，断言，自定义异常学python的土豆 python
python的异常处理一.异常引入二.异常处理三.常见异常四.断言五.自定义异常一.异常引入异常概念:程序在运行过程中发生不可预知的错误，程序员很难堵住所有的漏洞，就需要异常处理二.异常处理异常处理:捕获异常:try-except-else-finally将可能发生异常的代码，放入try-except中else：当代码没有异常就会执行else,如果代码块中有return，else将不执行final
初识C语言02 HIS~story @ 哲 c语言 c++开发语言
今天博主来继续更新。我们知道在任何一门编程语言中都会涉及到常量和定义变量的问题。顾名思义，常量，也就是不变的值，变化的值用变量来表示。变量：局部变量和全局变量。我们现在看一段代码：#includeintb=20;intmain(){shorta=20;return0;}在C语言中，局部变量是在函数内部或代码块（用{}括起来的区域）中定义的变量。在函数内部定义的变量，其作用域仅限于该函数。全局变量的
Python+Selenium环境搭建程序媛_ Selenium Python python selenium pycharm
文章目录1安装Python1.1下载1.2安装注意事项1.3验证环境2安装PyCharm2.1下载PyCharm社区版2.2安装注意事项3安装浏览器及驱动3.1下载Chrome浏览器3.2下载Chromedriver3.3关闭浏览器自动更新关闭3.4配置Chromdriver4安装Selenium5调试6异常解决7自动化Edge浏览器1安装Python1.1下载下载网址:https://www.p
【unstructured】针对unstructured的pdf提取的hi_res策略不能够连接huggingface.co下载模型的问题而选择本地化模型推理部署的方法 phillihp llm python 深度学习 pdf llama langchain
目录unstructuredpdfhi_res策略本地推理部署说明python3.9虚拟环境准备安装miniconda创建一个conda-env环境安装unstructured背景知识安装步骤安装detectron2背景知识安装detectron2及其依赖torch，torchvision和torchaudio部署模型背景知识hi_res策略三种模型本地推理部署layoutmodel(detect
Python-处理非结构化数据 cunzai1985 python 大数据 linux 人工智能 java
Python-处理非结构化数据(Python-ProcessingUnstructuredData)Thedatathatisalreadypresentinarowandcolumnformatorwhichcanbeeasilyconvertedtorowsandcolumnssothatlateritcanfitnicelyintoadatabaseisknownasstructuredda
组合导航中Kalman滤波算法相关知识简述十八与她捷联惯导算法与组合导航原理算法机器学习人工智能组合导航惯导
组合导航中Kalman滤波算法相关知识简述温馨提示：阅读本篇博文内容，需要读者具备一定的Kalman滤波基础知识上图即为Kalman滤波算法的框架，分为预测（时间更新）和更新（量测更新）两部分，其参数估计的过程就是两者循环迭代的过程。预报，就是根据系统状态方程，从前一时刻状态预测当前时刻的状态的过程，可理解成对系统的先验知识的一种推算。预报中，状态估计和它的方差协方差阵也要给出，从方差协方差阵P的
[利用Python加载和处理网址内容：从Unstructured到Selenium和Playwright] bhawfgrcbtwny python selenium 开发语言
引言在现代网页数据分析中，加载和处理来自多种网址的内容是一个常见需求。无论是数据挖掘还是网页内容分析，我们常常需要从多个网页中提取HTML文档。本篇文章将介绍如何利用Python中的Unstructured、Selenium和Playwright库来加载这些网页内容，并将其转换为适合后续处理的文档格式。主要内容UnstructuredURLLoaderUnstructuredURLLoader可以
基于DQ轴谐波提取器的PMSM谐波抑制算法仿真研究：主动注入谐波电压与SVPWM调制策略的效果分析 BIdOeVNkOZSO 算法单片机嵌入式硬件
PMSM谐波抑制算法基于DQ轴谐波提取器的永磁同步电机仿真1.通过谐波提取器，直接提取DQ轴的谐波分量进行抑制，对五七次谐波电流抑制效果效果很好。2.为了放大效果，采用主动注入谐波电压的方法，增大了电机中的谐波分量。3.调制算法采用SVPWM，电流环处搭建了解耦补偿模块，控制效果更好。YID:799786174661444甜水井朴素的梭子蟹永磁同步电机仿真：PMSM谐波抑制算法的探索与实现在电力电
大数据相关职位介绍之二（数据治理，数据库管理员，数据资产管理师，数据质量专员）小Tomkk 大数据大数据数据治理数据库管理员数据资产管理师数据质量专员
大数据相关职位介绍之二（数据治理，数据库管理员，数据资产管理师，数据质量专员）文章目录大数据相关职位介绍之二（数据治理，数据库管理员，数据资产管理师，数据质量专员）数据治理工程师/专家（DataGovernanceEngineer/Expert）1.元数据管理师（MetadataManager）2.主数据管理师（MasterDataManager）数据库管理员（DBA-DatabaseAdmini
Python unstructured库详解：partition_pdf函数完整参数深度解析 engchina LINUX python pdf 1024程序员节 Unstructured partition_pdf
Pythonunstructured库详解：partition_pdf函数完整参数深度解析1.简介2.基础文件处理参数2.1文件输入参数2.2页面处理参数3.文档解析策略3.1strategy参数详解3.2策略选择建议4.表格处理参数4.1表格结构推断5.语言处理参数5.1语言设置6.图像处理参数6.1图像提取配置6.2图像提取优化7.表单处理参数7.1表单提取配置7.2表单处理场景8.元数据参数
tensorflow和python不兼容_tensorflow与numpy的版本兼容性问题的解决 li旭旭
tensorflow与numpy的版本兼容性问题的解决,版本,站长站,错误,文章,较高tensorflow与numpy的版本兼容性问题的解决易采站长站，站长之家为您整理了tensorflow与numpy的版本兼容性问题的解决的相关内容。在Python交互式窗口导入tensorflow出现了下面的错误：root@ubuntu:~#python3Python3.6.8(default,Oct72019
自然语言编程：用 Cursor 将需求转化为代码 drebander AI 编程 Cursor
引言在传统编程中，开发者需要精确掌握语法规则、API接口和框架特性才能实现功能需求。然而，随着人工智能技术的发展，以自然语言交互为核心的编程方式正在颠覆这一流程。Cursor作为一款智能编程助手，通过其自然语言编程功能，允许开发者直接通过文本描述生成代码，将模糊的需求快速转化为可执行的程序。本文将深入探讨Cursor的自然语言交互能力，并通过实际案例（如生成React组件、Python脚本等），展
(04)python-opencv图像处理——图像阈值、平滑图像、形态转换、图像梯度欲游山河十万里 #opencv-python #深度学习 #人工智能 python opencv 图像处理
目录前言一、图像阈值1.1简单的阈值法1.2自适应阈值二、平滑图像2.1二维卷积(图像滤波)2.2图像模糊2.2.1均值模糊2.2.2高斯模糊2.2.3中值滤波2.2.4双边滤波三、形态转换1、腐蚀2、膨胀3、开运算4、闭运算四、图像梯度Sobel和Scharr微分参考文前言在本博文中，进行图像阈值、平滑图像、形态转换、图像梯度的学习以及介绍。一、图像阈值在本部分中，你会学到简单阈值法，自适应阈值
GEE python——gee_pyccd基于连续监测变化检测（Continuous Change Detection and Classification, CCDC）此星光明 GEE-PYTHON python 开发语言 gee ccdc 变化检测 py 连续性
目录简介gee_pyccdPyCCDCCDC算法代码1代码2结果简介gee_pyccd协调在GoogleEarthEngine数据上使用PyCCD的脚本。此存储库与Google或USGS没有正式关联。gee_pyccd是一个基于GoogleEarthEngine平台的Python库，用于对遥感时间序列数据进行变化检测和趋势分析。它实现了基于连续监测变化检测（ContinuousChangeDete
如何在Java中调用Python 梦想画家 #python java8~9核心功能 java python jython
Python语言有丰富的系统管理、数据处理、统计类软件包，因此从java应用中调用Python代码的需求很常见、实用。DataX是阿里开源的一个异构数据源离线同步工具，致力于实现包括关系型数据库(MySQL、Oracle等)、HDFS、Hive、ODPS、HBase、FTP等各种异构数据源之间稳定高效的数据同步功能。Datax也是通过Java调用Python脚本。本文介绍几种方法从java调用Py
模式识别与机器学习（Python实现）：基于sklearn朴素贝叶斯模型实现男女分类 CV视界模式识别机器学习与图像处理机器学习 python 人工智能
模式识别与机器学习（Python实现）：基于sklearn朴素贝叶斯模型和pazen窗方法实现男女分类欢迎大家来到安静到无声的《模式识别与人工智能（程序与算法）》，如果对所写内容感兴趣请看模式识别与人工智能（程序与算法）系列讲解-总目录，同时这也可以作为大家学习的参考。欢迎订阅，优惠价只需9.9元，请多多支持！目录标题模式识别与机器学习（Python实现）：基于sklearn朴素贝叶斯模型和paz
单词搜索--回溯算法 jump_into_zehe 回溯算法字符串
LeetCode单词搜索给定一个二维网格board和一个字典中的单词列表words，找出所有同时在二维网格和字典中出现的单词。单词必须按照字母顺序，通过相邻的单元格内的字母构成，其中“相邻”单元格是那些水平相邻或垂直相邻的单元格。同一个单元格内的字母在一个单词中不允许被重复使用。示例：输入:words=["oath","pea","eat","rain"]andboard=[['o','a','a
Python基本数据类型之字符串 stiinput Python知识集 python 开发语言
文章目录变量类型之字符串一、字符串的性质二、字符串的分类1.字符串又分为转义字符、原始字符串和一般字符串三种。三、字符串的基本操作1.字符串能实现拼接、重复、成员运算、比较大小等基本操作，其中比较大小还涉及到进制转换。2.字符串也能实现跟列表一样的通过下标找元素，切片等操作。3.字符串的遍历也有两种四、字符串的方法1.字符串的方法有：2.字符串的各种方法的应用3.字符串方法的补充五、字符串推导式变
Python爬虫获取item_fee-获得淘宝商品快递费用接口 Jelena15779585792 API 示例代码 python 爬虫开发语言
一、引言在电商运营中，了解商品的快递费用是至关重要的。这不仅有助于商家更好地制定价格策略，还能提升用户体验，避免因快递费用不明确而导致的纠纷。淘宝提供了item_fee接口，通过该接口可以查询指定商品的快递费用信息。本文将详细介绍如何使用Python编写爬虫程序，调用淘宝的item_fee接口获取商品快递费用。二、准备工作注册淘宝开放平台账号首先，需要在淘宝开放平台注册一个开发者账号，并创建应用以
LeetCode：53.最大子序和 xiaoshiguang3 代码随想录-跟着Carl学算法 leetcode 算法 java 动态规划
跟着carl学算法，本系列博客仅做个人记录，建议大家都去看carl本人的博客，写的真的很好的！代码随想录LeetCode：53.最大子序和给你一个整数数组nums，请你找出一个具有最大和的连续子数组（子数组最少包含一个元素），返回其最大和。子数组是数组中的一个连续部分。示例1：输入：nums=[-2,1,-3,4,-1,2,1,-5,4]输出：6解释：连续子数组[4,-1,2,1]的和最大，为6。
python矩阵教程_numpy教程：矩阵matrix及其运算 weixin_39658474 python矩阵教程
numpy矩阵简介NumPy函数库中存在两种不同的数据类型(矩阵matrix和数组array)，都可以用于处理行列表示的数字元素。虽然它们看起来很相似，但是在这两个数据类型上执行相同的数学运算可能得到不同的结果，其中NumPy函数库中的matrix与MATLAB中matrices等价。numpy模块中的矩阵对象为numpy.matrix，包括矩阵数据的处理，矩阵的计算，以及基本的统计功能，转置，可
python dashboard django_Django + MySQL Dashboard 网页端数据库可视化 weixin_39639600 python dashboard django
1.OverviewPython+MySQL+Django,有些数据托管在MySQL的数据库，然后我们希望进行可视化，通过web的方式对数据库的信息去进行展示/检索/维护/..这个项目中，我们的数据托管在MySQL的数据库中，然后在Django中配置数据库信息，连接到数据库，在前端用Django-table2进行渲染;最终我们可以在web端看到如下所示效果，可以进行展示所有的数据，然后进行检索和过
智能优化算法应用：天鹰算法优化脉冲耦合神经网络的图像自动分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法神经网络人工智能
智能优化算法应用：天鹰算法优化脉冲耦合神经网络的图像自动分割文章目录智能优化算法应用：天鹰算法优化脉冲耦合神经网络的图像自动分割1.天鹰算法2.PCNN网络3.实验结果4.参考文献5.Matlab代码摘要：本文利用天鹰算法对脉冲耦合神经网络的参数进行优化，以信息熵作为适应度函数，提高其图像分割的性能。1.天鹰算法天鹰算法原理请参考：https://blog.csdn.net/u011835903/
Java实现的简单双向Map，支持重复Value superlxw1234 java 双向map
关键字：Java双向Map、DualHashBidiMap 有个需求，需要根据即时修改Map结构中的Value值，比如，将Map中所有value=V1的记录改成value=V2，key保持不变。数据量比较大，遍历Map性能太差，这就需要根据Value先找到Key，然后去修改。即：既要根据Key找Value，又要根据Value
PL/SQL触发器基础及例子百合不是茶 oracle数据库触发器 PL/SQL编程
触发器的简介; 触发器的定义就是说某个条件成立的时候，触发器里面所定义的语句就会被自动的执行。因此触发器不需要人为的去调用，也不能调用。触发器和过程函数类似过程函数必须要调用, 一个表中最多只能有12个触发器类型的,触发器和过程函数相似触发器不需要调用直接执行, 触发时间：指明触发器何时执行，该值可取： before：表示在数据库动作之前触发
[时空与探索]穿越时空的一些问题 comsci 问题
我们还没有进行过任何数学形式上的证明,仅仅是一个猜想..... 这个猜想就是; 任何有质量的物体(哪怕只有一微克)都不可能穿越时空,该物体强行穿越时空的时候,物体的质量会与时空粒子产生反应,物体会变成暗物质,也就是说,任何物体穿越时空会变成暗物质..(暗物质就我的理
easy ui datagrid上移下移一行商人shang js 上移下移 easyui datagrid
/** * 向上移动一行 * * @param dg * @param row */ function moveupRow(dg, row) { var datagrid = $(dg); var index = datagrid.datagrid("getRowIndex", row); if (isFirstRow(dg, row)) {
Java反射 oloz 反射
本人菜鸟，今天恰好有时间，写写博客，总结复习一下java反射方面的知识，欢迎大家探讨交流学习指教首先看看java中的Class package demo; public class ClassTest { /*先了解java中的Class*/ public static void main(String[] args) { //任何一个类都
springMVC 使用JSR-303 Validation验证杨白白 spring mvc
JSR-303是一个数据验证的规范，但是spring并没有对其进行实现，Hibernate Validator是实现了这一规范的，通过此这个实现来讲SpringMVC对JSR-303的支持。 JSR-303的校验是基于注解的，首先要把这些注解标记在需要验证的实体类的属性上或是其对应的get方法上。登录需要验证类 public class Login { @NotEmpty
log4j 香水浓 log4j
log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, HTML, DATABASE #log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, ROLLINGFILE, HTML #console log4j.appender.STDOUT=org.apache.log4j.ConsoleAppender log4
使用ajax和history.pushState无刷新改变页面URL agevs jquery 框架 Ajax html5 chrome
表现如果你使用chrome或者firefox等浏览器访问本博客、github.com、plus.google.com等网站时，细心的你会发现页面之间的点击是通过ajax异步请求的，同时页面的URL发生了了改变。并且能够很好的支持浏览器前进和后退。是什么有这么强大的功能呢？ HTML5里引用了新的API，history.pushState和history.replaceState，就是通过
centos中文乱码 AILIKES centos OS ssh
一、CentOS系统访问 g.cn ，发现中文乱码。于是用以前的方式：yum -y install fonts-chinese CentOS系统安装后，还是不能显示中文字体。我使用 gedit 编辑源码，其中文注释也为乱码。后来，终于找到以下方法可以解决，需要两个中文支持的包： fonts-chinese-3.02-12.
触发器 baalwolf 触发器
触发器(trigger)：监视某种情况，并触发某种操作。触发器创建语法四要素：1.监视地点(table) 2.监视事件(insert/update/delete) 3.触发时间(after/before) 4.触发事件(insert/update/delete) 语法： create trigger triggerName after/before
JS正则表达式的i m g bijian1013 JavaScript 正则表达式
g:表示全局（global)模式，即模式将被应用于所有字符串，而非在发现第一个匹配项时立即停止。 i:表示不区分大小写（case-insensitive）模式，即在确定匹配项时忽略模式与字符串的大小写。 m:表示
HTML5模式和Hashbang模式 bijian1013 JavaScript AngularJS Hashbang模式 HTML5模式
我们可以用$locationProvider来配置$location服务（可以采用注入的方式，就像AngularJS中其他所有东西一样）。这里provider的两个参数很有意思，介绍如下。 html5Mode 一个布尔值，标识$location服务是否运行在HTML5模式下。 ha
[Maven学习笔记六]Maven生命周期 bit1129 maven
从mvn test的输出开始说起当我们在user-core中执行mvn test时，执行的输出如下： /software/devsoftware/jdk1.7.0_55/bin/java -Dmaven.home=/software/devsoftware/apache-maven-3.2.1 -Dclassworlds.conf=/software/devs
【Hadoop七】基于Yarn的Hadoop Map Reduce容错 bit1129 hadoop
运行于Yarn的Map Reduce作业，可能发生失败的点包括 Task Failure Application Master Failure Node Manager Failure Resource Manager Failure 1. Task Failure 任务执行过程中产生的异常和JVM的意外终止会汇报给Application Master。僵死的任务也会被A
记一次数据推送的异常解决端口解决 ronin47 记一次数据推送的异常解决
　　需求：从db获取数据然后推送到B 程序开发完成，上jboss,刚开始报了很多错，逐一解决，可最后显示连接不到数据库。机房的同事说可以ping 通。　　自已画了个图，逐一排除，把linux 防火墙　和　setenforce　设置最低。　　　service iptables stop
巧用视错觉-UI更有趣 brotherlamp UI ui视频 ui教程 ui自学 ui资料
我们每个人在生活中都曾感受过视错觉（optical illusion）的魅力。视错觉现象是双眼跟我们开的一个玩笑，而我们往往还心甘情愿地接受我们看到的假象。其实不止如此，视觉错现象的背后还有一个重要的科学原理——格式塔原理。格式塔原理解释了人们如何以视觉方式感觉物体，以及图像的结构，视角，大小等要素是如何影响我们的视觉的。在下面这篇文章中，我们首先会简单介绍一下格式塔原理中的基本概念，
线段树-poj1177-N个矩形求边长（离散化+扫描线） bylijinnan 数据结构算法线段树
package com.ljn.base; import java.util.Arrays; import java.util.Comparator; import java.util.Set; import java.util.TreeSet; /** * POJ 1177 (线段树+离散化+扫描线)，题目链接为http://poj.org/problem?id=1177
HTTP协议详解 chicony http协议
引言
Scala设计模式 chenchao051 设计模式 scala
Scala设计模式我的话：在国外网站上看到一篇文章，里面详细描述了很多设计模式，并且用Java及Scala两种语言描述，清晰的让我们看到各种常规的设计模式，在Scala中是如何在语言特性层面直接支持的。基于文章很nice，我利用今天的空闲时间将其翻译，希望大家能一起学习，讨论。翻译
安装mysql daizj mysql 安装
安装mysql (1)删除linux上已经安装的mysql相关库信息。rpm -e xxxxxxx --nodeps (强制删除) 执行命令rpm -qa |grep mysql 检查是否删除干净 (2)执行命令 rpm -i MySQL-server-5.5.31-2.el
HTTP状态码大全 dcj3sjt126com http状态码
完整的 HTTP 1.1规范说明书来自于RFC 2616，你可以在http://www.talentdigger.cn/home/link.php?url=d3d3LnJmYy1lZGl0b3Iub3JnLw%3D%3D在线查阅。HTTP 1.1的状态码被标记为新特性，因为许多浏览器只支持 HTTP 1.0。你应只把状态码发送给支持 HTTP 1.1的客户端，支持协议版本可以通过调用request
asihttprequest上传图片 dcj3sjt126com ASIHTTPRequest
NSURL *url =@"yourURL"; ASIFormDataRequest*currentRequest =[ASIFormDataRequest requestWithURL:url]; [currentRequest setPostFormat:ASIMultipartFormDataPostFormat];[currentRequest se
C语言中，关键字static的作用 e200702084 C++c C#
在C语言中，关键字static有三个明显的作用： 1)在函数体，局部的static变量。生存期为程序的整个生命周期，（它存活多长时间）；作用域却在函数体内（它在什么地方能被访问（空间））。一个被声明为静态的变量在这一函数被调用过程中维持其值不变。因为它分配在静态存储区，函数调用结束后并不释放单元，但是在其它的作用域的无法访问。当再次调用这个函数时，这个局部的静态变量还存活，而且用在它的访
win7/8使用curl geeksun win7
1. WIN7/8下要使用curl，需要下载curl-7.20.0-win64-ssl-sspi.zip和Win64OpenSSL_Light-1_0_2d.exe。下载地址： http://curl.haxx.se/download.html 请选择不带SSL的版本，否则还需要安装SSL的支持包 2. 可以给Windows增加c
Creating a Shared Repository; Users Sharing The Repository hongtoushizi git
转载自： http://www.gitguys.com/topics/creating-a-shared-repository-users-sharing-the-repository/ Commands discussed in this section: git init –bare git clone git remote git pull git p
Java实现字符串反转的8种或9种方法 Josh_Persistence 异或反转递归反转二分交换反转 java字符串反转栈反转
注：对于第7种使用异或的方式来实现字符串的反转，如果不太看得明白的，可以参照另一篇博客： http://josh-persistence.iteye.com/blog/2205768 /** * */ package com.wsheng.aggregator.algorithm.string; import java.util.Stack; /**
代码实现任意容量倒水问题 home198979 PHP 算法倒水
形象化设计模式实战 HELLO!架构 redis命令源码解析倒水问题：有两个杯子，一个A升，一个B升，水有无限多，现要求利用这两杯子装C
Druid datasource zhb8015 druid
推荐大家使用数据库连接池 DruidDataSource. http://code.alibabatech.com/wiki/display/Druid/DruidDataSource DruidDataSource经过阿里巴巴数百个应用一年多生产环境运行验证，稳定可靠。它最重要的特点是：监控、扩展和性能。下载和Maven配置看这里： http
两种启动监听器ApplicationListener和ServletContextListener spjich java spring 框架
引言:有时候需要在项目初始化的时候进行一系列工作，比如初始化一个线程池，初始化配置文件，初始化缓存等等，这时候就需要用到启动监听器，下面分别介绍一下两种常用的项目启动监听器 ServletContextListener 特点: 依赖于sevlet容器，需要配置web.xml 使用方法: public class StartListener implements
JavaScript Rounding Methods of the Math object 何不笑 JavaScript Math
The next group of methods has to do with rounding decimal values into integers. Three methods — Math.ceil(), Math.floor(), and Math.round() — handle rounding in differen

Fast and Effective！一文速览轻量化Transformer各领域研究进展

你可能感兴趣的:(大数据,算法,编程语言,python,计算机视觉)