我爱计算机视觉

KD-VLP：知识蒸馏和预训练还能这么结合？上科大&Intel&MSRA提出基于知识蒸馏的端到端多模态预训练模型...

关注公众号，发现CV技术之美

本文分享论文『KD-VLP: Improving End-to-End Vision-and-Language Pretraining with Object Knowledge Distillation』，由上科大&Intel&MSRA联合提出基于知识蒸馏的端到端多模态预训练模型《KD-VLP》。

详细信息如下：

论文链接：https://arxiv.org/abs/2109.10504
项目链接：未开源

导言：

自监督视觉和语言预训练(VLP)旨在从大规模图文数据中学习可迁移的多模态表征，并在微调后在广泛的视觉语言任务中取得优异的表现。以往主流的VLP方法通常是依赖于两步的策略，即先通过外部目标检测器提取视觉特征，然后在多模态Transformer框架中对多模态信息进行编码，这种方法存在着目标概念空间受限、图像上下文受限和计算效率低下等问题。

本文提出了一种面向对象的端到端VLP框架，该框架直接将CNN的图像grid特征送入到Transformer，并联合学习多模态表示。此外，作者提出进行对象知识蒸馏，以便于学习不同语义层次上的跨模态对齐。为了达到这一目的，作者设计了两个新的预训练代理任务，以外部检测器的对象特征及其语义标签作为监督信息：

1）目标引导掩码视觉建模任务（Object-guided masked vision modeling task）的重点是在多模态Transformer中加强目标感知表征学习；2）短语-区域对齐任务（Phrase-region alignment task）旨在利用名词短语和对象标签在语言空间中的相似性来提高跨模态对齐。

在视觉语言任务上的广泛实验，证明了本文提出的框架的有效性，并且本文的方法获得了比现有的预训练策略更好的性能。

Motivation

随着Bert的成功在语言建模中，自监督视觉和语言预训练(VLP)引起了人工智能社区的极大兴趣，其目的是从大规模图文数据中学习可概括的多模态表示。与先训练后迁移的策略相结合，VLP在处理视觉和语言推理任务方面显示出巨大的潜力，如图像-文本检索、视觉问答(VQA)等。这种表示学习中的关键步骤是联合建模语言实体和视觉语义概念(例如，属性、对象和关系)以及它们的对齐。然而，这是具有挑战性的，因为视觉和语言表示(即，像素与文字)的巨大差异，以及在监督中缺乏实体级别的跨模态对应。

为了解决这些挑战，大多数现有的方法采用两步的预训练策略，首先使用现成的检测器将图像解析成一组对象token，然后构建多层Transformer来联合学习视觉和语言嵌入。为了便于多模态学习，这些网络通过一组精心设计的类似BERT的目标函数进行预训练。尽管两步策略有很好的性能，但它有几个局限性：

有限的视觉对象概念 ，因为外部检测器是在一组预定义的对象类别上训练的；
缺乏对象区域外的上下文线索 ，这对复杂的推理任务至关重要；
阶段性训练导致的次优性能 ；
附加检测模块导致计算效率低下 。

为了克服这些限制，最近的工作试图以端到端的方式学习联合的视觉-语言表征。这些方法直接从图像中提取密集的grid视觉特征作为多模态Transformer网络的输入，因此在预训练和微调阶段都不依赖于外部目标检测器。这种模型设计极大地简化了整个网络的结构，并允许视觉和语言功能之间的更深层次的集成。然而，使用grid特征使得捕获对象级视觉概念变得困难，这通常会导致多模态表示的表达能力较差，从而在下游任务中的性能较差。

在这项工作中，作者提出了一种面向对象的端到端VLP方法，该方法继承了上述两种预训练策略的优点。本文的核心思想为KD-VLP，是将视觉对象概念结合到端到端的多模态学习中，这是通过在预训练阶段执行从语义对象(来自现成的检测器)的知识提取来实现的。这使得网络能够更好地捕获对象表征，从而便于学习语言实体和视觉概念的对齐。

为了实现这一点，作者引入了两个新的预训练代理任务来执行对象知识提炼：即，获得对象感知特征嵌入的基于对象的掩码视觉建模任务（object-based masked vision modeling task），和建立对象区域和语言实例之间关系的短语-区域对齐任务（Phrase-region alignment task）。

具体地说，作者采用典型的CNN主干+多模态Transformer模型进行预训练。在给定图文对的情况下，视觉CNN主干网络首先在图像上计算一组视觉特征。然后，多层Transformer将视觉特征和相应的文本token作为输入，生成它们的多模态嵌入。基于这些嵌入特征，一组特定于任务的head计算相应的目标函数，以端到端的方式训练整个网络。

在这里，除了常用的图文匹配（image-text matching）和掩码语言建模（masked language modeling）任务外，作者还提出了基于对象的掩码视觉建模任务（object-based masked vision modeling task）和短语-区域对齐任务（Phrase-region alignment task）。

基于对象的掩码视觉建模任务（OMVM），其目的是利用周围的视觉上下文和文本描述重建每个对象(来自外部检测器)的RoI特征和语义标签。为了便于跨模态对齐，作者还开发了一种知识引导的掩码策略，该策略根据对应文本中的名词短语与其语义标签之间的相似度得分，对候选对象进行采样以进行重建。（这一步类似MVM，不同的是这里用到目标检测模型，所以mask的区域都是包含对象的区域，使得预测的效率更高；此外，除了预测区域之外，这里还需要预测出对应的语义标签）

短语-区域对齐任务（PRA）的目的是将短语-标签相似度得分与名词短语嵌入和对象区域嵌入之间的跨模态相似度得分进行匹配，以进一步提高跨模态对齐。经过预训练后，所学到的多模态表征可以转移到不同的下游视觉语言任务上。

方法

本文方法的模型结构如上图所示。

2.1 Problem Definition and Overview

自监督视觉语言处理的目标是从大量的图文数据中学习一种通用的、可迁移的视觉语言表征，从而在下游视觉语言任务中获得较强的泛化性能。设输入图文对表示为，其中代表图片，代表相应的文本。通常，预训练网络由表示网络模块θ 和一组特定于任务的网络head θ组成，其中s表示预训练代理任务的下标。预训练目标函数如下：

其中和分别是特定于任务的ground truth标签和损失函数。在预训练之后，去除了所有预训练任务的head，并将具有学习到参数θ的表示网络θ应用于下游任务，然后进行特定任务的微调。

2.2 Model Architecture

对于给定的图文对，本文的模型首先分别计算图像嵌入和语言嵌入，然后将它们连接成一个token序列，并将两个额外的token [SEP]和[CLS]作为Transformer的输入，以生成多模态上下文嵌入。

Visual Embedding

对于每幅图像I，作者采用一个cnn主干网络来提取图像特征，其中L是特征的大小，是具有维的特征向量。此外，作者也加入了二维位置编码来获取位置信息。

Linguistic Embedding

对于语言描述D，首先使用WordPiess将它们编码成单词token ，其中是特征向量。类似地，位置编码也加入到每个单词嵌入中以捕获位置信息。

Multi-modal Transformer

在获得图像和语言嵌入后，作者将它们组装成一个token序列，，，，并采用多层Transformer来计算它们，最后一层状态编码表示为，，，，其中和分别代表视觉和语言的特征。最后，将这些特征表示送到每个预训练代理任务的head中。

2.3 Pretext Tasks

对于每个图像，首先基于现成的检测器生成一组对象proposal，表示为，，，其中代表检测框的位置，代表对象的类别，是对象的RoI特征。对于每一个对象，作者引入了一个二进制掩码，这个二进制掩码flatten之后可以表示为。对于相应的文本，作者采用训练好的语言模型来提取名词短语。并计算每个名词短语和对象类别之间的关系，如下所示：

其中代表余弦距离，代表语言嵌入模型（比如BERT）。

Object-guided Masked Vision Modeling (OMVM)

第一个任务的目的是在端到端的预训练中学习更明确的对象概念。具体地说，每次采样一个对象，在Transformer输入中取出其特征并进行avgpool，并强制网络生成对象RoI特征和语义标签。为了便于跨模态对齐，作者提出了一种知识引导的掩码策略，该策略基于归一化的相似度得分α，对与名词短语相关的对象区域进行采样以进行mask。所选对象区域的二进制掩码、分类和RoI特征表示为，，。

作者设计了两个学习目标函数，掩码区域分类(MRC)和掩码区域特征回归(MRFR) ：

为了计算LMRC和LMRFR的损失，首先计算最后一层mask区域的对象表示，这是由mask之后的特征平均池化得到的。

对于MRC，多层FC网络采用最大似然来预测对象类别，即：

对于MRFR，多层FC网络通过最小化L2距离来学习特征空间中的表示，即：

Phrase Region Alignment (PRA)

第二个任务PRA主要是学习对象层面的跨模态对齐，目的是拉近正短语-区域对，推开负对。在这里，作者利用语言空间中名词短语和对象类别之间的相似度α，作为跨模态学习的指导。

具体地说，作者首先计算每个proposal的对象表示和短语表示。对象表示由mask之后的视觉特征进行全局平均池化之后得到，而短语表示的计算如下：

然后，将跨模态相似度定义为：

PRA任务的目标就是最小化短语-标签的相似度和跨模态相似度的KL散度。

将mask集合表示为，PRA损失函数表示如下：

Masked Language Modeling (MLM)

作者采用与Bert相同的掩码策略，即随机mask输入单词token。在这里，MLM的目标是根据整个图像及其周围的语言上下文，通过Transformer来预测每个mask token的原始词索引。因此，采用如下的交叉熵损失：

Image-Text Matching (ITM)

在ITM中，训练多层Transformer，并基于最终层[CLS] token表示来区分输入图文对是否在语义上匹配。为了构造训练样本，以0.5的概率将每个图像-文本对的文本随机替换为数据集中的另一个文本。因此，输出标签可以定义为，，1代表匹配，0代表不匹配。ITM任务的训练目标是将二元交叉熵损失降至最低：

实验

3.1. Downstream Tasks

Image-Text Retrieval

从上表可以看出，在一阶段的方法中，基于图文检索任务，本文的方法达到了SOTA的性能，甚至超过了一些二阶段的方法。

Visual Entailment (VE)

如上表所示，基于VE任务，本文的模型在验证集上达到了78.21%的正确率，在测试集合上达到了77.87%的正确率。

Natural Language Visual Reasoning

如上表所示，在Natural Language Visual Reasoning任务上，本文方法的表现明显优于SOHO、Pixel-Bert、Vilt和E2E-VLP。

Visual Question Answering (VQA)

在VQA任务上，与E2E预训练方法相比，本文的方法显示出了明显的性能改善，甚至其表现略高于二阶段预训练方法。

Visual Commonsense Reasoning (VCR)

如上表所示，本文的方法在VCR验证集中取得了较高的准确率，在Q→A设置中达到了76.70%，在QA→R中达到了78.63%，在Q→AR中达到了60.54%。

3.2. Ablation Study & Visualization Analysis

上表展示了不用预训练任务的性能对比，可以看出本文提出OMVM和PRA预训练任务对于模型性能的提升都是重要的。

从上图a中可以看出，本文的知识引导掩码策略总是mask与短语相关的图像区域，这可以促进多模态学习。从b中可以看出，本文模型在进行图文匹配时，attention的定位更加准确。

从上表可以看出，无论模型大小如何，本文的方法都是有效的，且较大的模型甚至比轻量级模型有更明显的性能改进。

总结

在本文中，作者提出了一种新的自监督VLP方法，该方法在端到端的框架中促进学习对象感知的多模态表示。本文的核心思想是在预训练阶段从外部检测器的语义空间和特征空间中进行目标知识的提取。

因此，作者开发了一个对象引导的掩码视觉建模任务来提取外部对象知识，以及一个短语-区域对齐任务来更好地学习语言实体和视觉概念之间的对齐。与以往的工作相比，本文的模型在下游任务测试中不需要依赖复杂的对象检测器，就可以实现更高的性能。

▊ 作者简介

研究领域：FightingCV公众号运营者，研究方向为多模态内容理解，专注于解决视觉模态和语言模态相结合的任务，促进Vision-Language模型的实地应用。

知乎/公众号：FightingCV

END

欢迎加入「视觉语言」交流群备注：VL

python 捕获异常 weixin_30730151 python 数据库
异常：由于代码的逻辑或者语法错误导致的程序中断。在学习Python的过程当中，大家一定要区分清楚异常和布尔值False布尔值的False只是一个值，通常代表的是一个条件的不成立，常用于逻辑判断比如：1num=22print(num>3)3ifnum>3:4print("num>3")异常指的是由于代码的逻辑或者语法错误导致的程序中断比如：1num=222+"2"了解了上面的逻辑之后，我们来看看大家
python爬虫Redis数据库 Æther_9 Python爬虫零基础入门数据库 python 爬虫
Redis数据库Redis简介Redis是完全开源免费的，遵守BSD协议，是一个高性能的key-value数据库。Redis与其他key-value缓存产品有以下三个特点：Redis支持数据的持久化，可以将内存中的数据保存在磁盘中，重启的时候可以再次加载进行使用。Redis不仅仅支持简单的key-value类型的数据，同时还提供list，set，zset，hash等数据结构的存储。redis：半持
Java：从入门到创新 java
Java：从入门到创新一、Java简介Java是一种广泛使用的高级编程语言，自1995年首次发布以来，一直深受开发者的喜爱。它由SunMicrosystems公司开发，后来被Oracle公司收购。Java的设计目标是简单、健壮、安全且跨平台，这些特性使其在企业级应用开发中占据重要地位。二、Java的主要特点（一）简单易学Java的语法与C语言和C++语言很接近，但丢弃了C++中一些复杂且容易出错的
python sympy的安装与使用范哥来了 python 开发语言
为了安装和使用sympy，您可以按照以下步骤进行操作：安装SymPy首先，您需要确保已经安装了Python。接着，可以通过pip来安装sympy。打开命令行工具（如终端或命令提示符），然后输入以下命令来安装sympy：pipinstallsympy如果您使用的是特定的Python环境，请确保激活该环境后再执行上述安装命令。使用SymPy安装完成后，您就可以在Python项目中导入并使用sympy了
重要重要！！fisher矩阵是怎么计算和更新的，以及计算过程中参数的物理含义 ZhangJiQun&MXP 教学 2021 论文 2024大模型以及算力矩阵概率论线性代数 windows 微信机器学习
fisher矩阵是怎么计算和更新的，以及计算过程中参数的物理含义Fisher信息矩阵（FisherInformationMatrix,FIM）用于衡量模型参数估计的不确定性，其计算和更新在统计学、机器学习和优化中具有重要作用。以下是其计算和更新的关键步骤：一、Fisher矩阵的计算定义Fisher矩阵的元素表示对数似然函数关于参数的二阶导数的期望值的负数，即：Fi,j=−
facefusion AI换脸软件的本地部署过程记录 kfrealme 人工智能
tags:AI驾驭facefusion我的环境Win10+N卡安装步骤安装Python3.10方案手动安装Python官网下载安装包安装PythonReleasesforWindows|Python.org我的蓝奏云分享https://www.lanzoub.com/i9La81s1o5gb密码:h17b命令行安装1以管理员身份打开「命令提示符」2删除Microsoft官方源wingetsourc
Python中手动实现进制转换棉猴 Python 进制转换十进制二进制十六进制八进制
在《Python中进制转换》中提到可以使用bin()、oct()、int()和hex()等函数编程实现数字间的进制转换。除了编程实现进制转换外，还可以通过手动实现。1手动实现二进制数转换为十进制可以通过“填空法”手动将二进制数转换为十进制数，例如将二进制数“0b1101”转换为十进制数的方法如图1所示。“填空法”可以归纳为四个步骤：首先“画空格”，接下来“写次方”，然后“填数字”，最后“列算式”。
Python中的进制转换棉猴 #Python数据类型 Python 进制转化二进制八进制十六进制 bin oct
常用的进制有二进制、八进制、十进制和十六进制。1四种进制简介最常用的十进制基本原理是“逢十进一”，因此十进制包括的数字是“0-9”;同理，二进制的基本原理是“逢二进一”，包含的数字是“0-1”;八进制是“逢八进一”，包含的数字是“0-7”；十六进制是“逢十六进一”，包含的数字是“0-15”，其中用“A、B、C、D、E、F”分别表示“10-15”这五个数。2四种进制数的表示对于一个数字“11”,可能
从指令集鸿沟到硬件抽象：AI 如何重塑手机与电脑编程语言差异——PanLang 原型全栈设计方案与实验性探索1 灏瀚星空 PanLang 原型全栈设计方案与实验性探索人工智能智能手机开发语言架构机器学习语言模型模板方法模式
AI如何跨越指令集鸿沟？手机与电脑编程语言差异溯源与统一路径——PanLang原型全栈设计方案与实验性探索1文章目录AI如何跨越指令集鸿沟？手机与电脑编程语言差异溯源与统一路径——PanLang原型全栈设计方案与实验性探索1前言一、手机与电脑编程语言的核心差异二、实现语言统一的技术路径1.硬件抽象层设计（HAL2.0）2.自适应运行时系统3.跨平台UI引擎三、新型统一语言设计要素1.核心特性2.编
小菜鸟的Python笔记001：将Word文档中数据汇总到Excel表格蜉蝣2805 小菜鸟的Python笔记 python 数据分析
将Word文档中数据汇总到Excel表格前言一、应用场景二、程序思路及准备工作思路如下：准备工作：三、程序代码1、主程序2、获取Word文档列表3、提取文档内数据4、导入到Excel表格四、遇到的问题1、错误AttributeError:word.Application.Quit2、word文档中复选框的识别总结前言我并非一个专业的程序员，只是一个普通的编程爱好者、一只小菜鸟。得益于网络上各路大神
31天Python入门——第9天:再学函数安然无虞 Python手把手教程 python 开发语言后端 pyqt
你好，我是安然无虞。文章目录再学函数1.变量在函数中的作用域2.函数的参数传递.补充学习:不定长参数*args和**kwargs3.值传递和引用传递补充学习:把函数作为参数传递4.匿名函数5.python中内置的常用函数zip()map()filter()all()any()6.函数练习再学函数1.变量在函数中的作用域变量的作用域是指变量的作用范围.局部变量:在函数体或局部范围内声明的变量称为局部
Scrapy 入门教程 zru_9602 爬虫 scrapy
Scrapy入门教程Scrapy是一个用于爬取网站数据的Python框架，功能强大且易于扩展。本文将介绍Scrapy的基本概念、安装方法、使用示例，并展示如何编写一个基本的爬虫。1.什么是Scrapy？Scrapy是一个开源的、用于爬取网站数据的框架，主要特点包括：高效、异步的爬取机制强大的XPath和CSS选择器解析能力内置中间件，支持代理、去重等功能易于扩展，适用于各种爬虫需求2.安装Scra
python批量替换word内容_python win32com 库批量替换word文件内容 weixin_39657300
前言win32com模块主要为Python提供调用windows底层组件对word、Excel、PPT等进行操作的功能，只能在Windows环境下使用，并且需要安装office相关软件才行(WPS也行)。实例代码下方代码实现批量替换当前路径下word文档的指定文本内容。importwin32com.clientimportosimporttimedefupdate_replace(file):wo
python strip() 编号1993 python python
参考：http://www.jb51.net/article/37287.htm###############################s.strip(del)：在字符串s的开头结尾处，删除del中存在的字符s.lstrip(del)：在字符串s的开头处，删除del中存在的字符s.rstrip(del)：在字符串s的结尾处，删除del中存在的字符s='asdf'#前后均有空格s.strip(
Python调用WPS进行文档转换PDF及PDF转图片 IT孔乙己 python 开发语言后端
这里是利用WPS进行转换，要先安装WPS。安装依赖pipinstallpypiwin32代码#!/usr/bin/python#-*-coding:UTF-8-*-importosimportwin32com.clientdefConvertByWps(sourceFile,targetFile):ifnotos.path.exists(sourceFile):print(sourceFile+"
Apache大数据旭哥优选大数据选题 Apache大数据旭大数据定制选题 java hadoop spark 开发语言 idea hive 数据库架构
定制旭哥服务，一对一，无中介包安装+答疑+售后态度和技术都很重要定制按需求做要求不高就实惠一点定制需提前沟通好怎么做，这样才能避免不必要的麻烦python、flask、Django、mapreduce、mysqljava、springboot、vue、echarts、hadoop、spark、hive、hbase、flink、SparkStreaming、kafka、flume、sqoop分析+推
Python strip() 方法详解：用途、应用场景及示例解析（中英双语）阿正的梦工坊 Python python 开发语言
Pythonstrip()方法详解：用途、应用场景及示例解析在Python处理字符串时，经常会遇到字符串前后存在多余的空格或特殊字符的问题。strip()方法就是Python提供的一个强大工具，专门用于去除字符串两端的指定字符。本文将详细介绍strip()的用法、适用场景，并通过多个示例解析其应用。1.strip()方法简介strip()方法用于去除字符串两端的指定字符（默认为空格和换行符）。它的
使用Python连接SqlServer 带带琪宝工作日记 python sqlserver 开发语言
目录cursor()execute('sqlstr')fetchall()、fetchone()cursor.description属性close()转化为dataframe进行分析使用的是pymssql库，这个库的详细用法参照博客（博客里也有官方文档，英语好的可以直接看）：pythonpymssql—pymssql模块使用指南_夏日白云的博客-CSDN博客我目前的需求只是使用Python连接数据
Python连接SQL SEVER数据库全流程 m0_74823131 数据库 python sql
背景介绍在数据分析领域，经常需要从数据库中获取数据进行分析和处理。而SQLServer是一种常用的关系型数据库管理系统，因此学习如何使用Python连接SQLServer数据库并获取数据是非常有用的。以下是Python使用pymssql连接SQLServer数据库的全流程：安装pymssql库本地账号设置脚本连接数据导入函数实现一、安装pymssqlpymssql是Python连接SQLServe
AI大模型训练教程 Small踢倒coffee_氕氘氚 python自学经验分享笔记
1.引言随着人工智能技术的快速发展，大模型（如GPT-3、BERT等）在自然语言处理、计算机视觉等领域取得了显著的成果。训练一个大模型需要大量的计算资源、数据和专业知识。本教程将带你了解如何从零开始训练一个AI大模型。2.准备工作2.1硬件要求GPU：推荐使用NVIDIA的高性能GPU，如A100、V100等。内存：至少64GBRAM。存储：SSD存储，至少1TB。#2.2软件环境操作系统：Lin
Java后端开发技术详解小二爱编程· java 开发语言
Java作为一门成熟的编程语言，已广泛应用于后端开发领域。其强大的生态系统和广泛的支持库使得Java成为许多企业和开发者的首选后端开发语言。随着云计算、微服务架构和大数据技术的兴起，Java后端开发的技术栈也不断演进。本文将详细介绍Java后端开发的核心技术，包括Java基础、常见框架、数据库操作、缓存技术、异步编程等。1.Java基础：理解面向对象的编程Java是一种面向对象的编程语言，面向对象
力扣 160 - Intersection of Two Linked Lists. (相交链表) Python双指针小杨快没头发了 Leetcode 刷题
力扣160-IntersectionofTwoLinkedLists.(相交链表)Python双指针原题地址：https://leetcode.com/problems/intersection-of-two-linked-lists/Giventheheadsoftwosinglylinked-listsheadAandheadB,returnthenodeatwhichthetwolistsi
Opencv之计算机视觉一闭月之泪舞计算机视觉计算机视觉 opencv python
一、环境准备使用opencv库来实现简单的计算机视觉。需要安装两个库：opencv-python和opencv-contrib-python，版本可以自行选择，注意不同版本的opencv中的某些函数名和用法可能不同pipinstallopencv-python==3.4.18.65-ihttps://pypi.tuna.tsinghua.edu.cn/simplepipinstallopencv-
计算机视觉总结 Trank-Lw 计算机视觉深度学习人工智能
以下是针对上述问题的详细解答，并结合代码示例进行说明：1.改进YOLOv5人脸检测模块，复杂光照场景准确率从98.2%提升至99.5%优化具体过程：光照补偿：在数据预处理阶段，采用自适应光照补偿算法，对图像进行实时增强，以减少光照变化对人脸检测的影响。数据增强：在训练数据中增加复杂光照场景下的样本，如强光、弱光、背光等，通过数据增强提高模型对不同光照条件的适应性。模型调整：对YOLOv5模型的网络
VSCode python 遇到的问题：vscode can't open file '': [Errno 2] No such file or dire... weixin_33984032 python 开发工具 json
代码很简单，就两行：importpandasaspdimportnetCDF4asncdataset=nc.Dataset('20150101.nc')环境：在VSCode中左下角把原环境的Python3.6.532-bit切换为Anaconda中的Python3.6.564-bit('base':conda)过程中有两种错误：（忘记截图了，都是历史记录中的google网页搜索栏找到的搜索记录）1
【测试工程师必备！】VS Code好用插件FastPytestRunner 花小田 pytest vscode
你是否还在为PythonTestExplorerforVisualStudioCode以下痛点焦头烂额？•测试扫描慢到怀疑人生，每次启动都要等待5分钟•调试时总是找不到断点入口，配置项复杂到崩溃•传统测试工具无法满足大规模测试需求•每次切换项目都要重新配置测试环境FastPytestRunner——专为测试工程师量身打造的极速测试利器来了！️实战进阶技巧：✅配置黄金法则：{"pytestRunne
如何用 Python 实现树结构不辉放弃 python 开发语言
一、树结构基础认知1.1树的四大特征层级关系：父子节点的从属关系唯一根节点：访问起点无循环：从根到叶的路径不形成环N叉分支：每个节点可有多个子节点1.2核心组件解析classTreeNode:def__init__(self,data):self.data=data#节点存储的数据self.children=[]#子节点容器（多叉树特性）defadd_child(self,node):self.c
景联文科技提供高质量文本标注服务，驱动AI技术发展景联文科技科技人工智能
文本标注是指在原始文本数据上添加标签的过程，这些标签可以用来指示特定的实体、关系、事件等信息，以帮助计算机理解和处理这些数据。文本标注是自然语言处理（NLP）领域的一个重要环节，它通过为文本的不同部分提供具体的含义和上下文信息，增强机器学习和深度学习模型对文本内容的理解能力。标注类型情感分析情感极性：确定文本表达的情感倾向，如正面、负面或中立。强度评估：衡量情感的强烈程度，从轻微到极端不等。命名实
Python 用户账户(让用户拥有自己的数据) 钢铁男儿 Python 从入门到精通 python 数据库 sqlite
Web应用程序的核心是让任何用户都能够注册账户并能够使用它，不管用户身处何方。在本章中，你将创建一些表单，让用户能够添加主题和条目，以及编辑既有的条目。你还将学习Django如何防范对基于表单的网页发起的常见攻击，这让你无需花太多时间考虑确保应用程序安全的问题。然后，我们将实现一个用户身份验证系统。你将创建一个注册页面，供用户创建账户，并让有些页面只能供已登录的用户访问。接下来，我们将修改一些视图
Python 用户账户(让用户能够输入数据) 钢铁男儿 Python 从入门到精通 python 数据库 sqlite
Web应用程序的核心是让任何用户都能够注册账户并能够使用它，不管用户身处何方。在本章中，你将创建一些表单，让用户能够添加主题和条目，以及编辑既有的条目。你还将学习Django如何防范对基于表单的网页发起的常见攻击，这让你无需花太多时间考虑确保应用程序安全的问题。然后，我们将实现一个用户身份验证系统。你将创建一个注册页面，供用户创建账户，并让有些页面只能供已登录的用户访问。接下来，我们将修改一些视图
ASM系列四利用Method 组件动态注入方法逻辑 lijingyao8206 字节码技术 jvm AOP 动态代理 ASM
这篇继续结合例子来深入了解下Method组件动态变更方法字节码的实现。通过前面一篇，知道ClassVisitor 的visitMethod()方法可以返回一个MethodVisitor的实例。那么我们也基本可以知道，同ClassVisitor改变类成员一样，MethodVIsistor如果需要改变方法成员，注入逻辑，也可以
java编程思想 --内部类百合不是茶 java 内部类匿名内部类
内部类;了解外部类并能与之通信内部类写出来的代码更加整洁与优雅 1,内部类的创建内部类是创建在类中的 package com.wj.InsideClass; /* * 内部类的创建 */ public class CreateInsideClass { public CreateInsideClass(
web.xml报错 crabdave web.xml
web.xml报错 The content of element type "web-app" must match "(icon?,display- name?,description?,distributable?,context-param*,filter*,filter-mapping*,listener*,servlet*,s
泛型类的自定义麦田的设计者 java android 泛型
为什么要定义泛型类，当类中要操作的引用数据类型不确定的时候。采用泛型类，完成扩展。例如有一个学生类 Student{ Student(){ System.out.println("I'm a student....."); } } 有一个老师类
CSS清除浮动的4中方法 IT独行者 JavaScript UI css
清除浮动这个问题，做前端的应该再熟悉不过了，咱是个新人，所以还是记个笔记，做个积累，努力学习向大神靠近。CSS清除浮动的方法网上一搜，大概有N多种，用过几种，说下个人感受。 1、结尾处加空div标签 clear:both 1 2 3 4 .div 1 { background : #000080 ; border : 1px s
Cygwin使用windows的jdk 配置方法 _wy_ jdk windows cygwin
1.[vim /etc/profile] JAVA_HOME="/cgydrive/d/Java/jdk1.6.0_43" (windows下jdk路径为D:\Java\jdk1.6.0_43) PATH="$JAVA_HOME/bin:${PATH}" CLAS
linux下安装maven 无量 maven linux 安装
Linux下安装maven(转) 1.首先到Maven官网下载安装文件，目前最新版本为3.0.3，下载文件为 apache-maven-3.0.3-bin.tar.gz，下载可以使用wget命令； 2.进入下载文件夹，找到下载的文件，运行如下命令解压 tar -xvf apache-maven-2.2.1-bin.tar.gz 解压后的文件夹
tomcat的https 配置,syslog-ng配置 aichenglong tomcat http跳转到https syslong-ng配置 syslog配置
1) tomcat配置https,以及http自动跳转到https的配置 1)TOMCAT_HOME目录下生成密钥(keytool是jdk中的命令) keytool -genkey -alias tomcat -keyalg RSA -keypass changeit -storepass changeit
关于领号活动总结 alafqq 活动
关于某彩票活动的总结具体需求，每个用户进活动页面，领取一个号码，1000中的一个；活动要求 1，随机性，一定要有随机性； 2，最少中奖概率，如果注数为3200注，则最多中4注 3，效率问题，（不能每个人来都产生一个随机数，这样效率不高）； 4，支持断电（仍然从下一个开始），重启服务；（存数据库有点大材小用，因此不能存放在数据库）解决方案 1，事先产生随机数1000个，并打
java数据结构冒泡排序的遍历与排序百合不是茶 java
java的冒泡排序是一种简单的排序规则冒泡排序的原理：比较两个相邻的数，首先将最大的排在第一个，第二次比较第二个，此后一样；针对所有的元素重复以上的步骤，除了最后一个例题；将int array[]
JS检查输入框输入的是否是数字的一种校验方法 bijian1013 js
如下是JS检查输入框输入的是否是数字的一种校验方法： <form method=post target="_blank"> 数字：<input type="text" name=num onkeypress="checkNum(this.form)"><br> </form>
Test注解的两个属性：expected和timeout bijian1013 java JUnit expected timeout
JUnit4：Test文档中的解释：　　The Test annotation supports two optional parameters. 　　The first, expected, declares that a test method should throw an exception. 　　If it doesn't throw an exception or if it
[Gson二]继承关系的POJO的反序列化 bit1129 POJO
父类 package inheritance.test2; import java.util.Map; public class Model { private String field1; private String field2; private Map<String, String> infoMap
【Spark八十四】Spark零碎知识点记录 bit1129 spark
1. ShuffleMapTask的shuffle数据在什么地方记录到MapOutputTracker中的 ShuffleMapTask的runTask方法负责写数据到shuffle map文件中。当任务执行完成成功，DAGScheduler会收到通知，在DAGScheduler的handleTaskCompletion方法中完成记录到MapOutputTracker中
WAS各种脚本作用大全 ronin47 WAS 脚本
　　　http://www.ibm.com/developerworks/cn/websphere/library/samples/SampleScripts.html 　　　无意中，在WAS官网上发现的各种脚本作用，感觉很有作用，先与各位分享一下　　　获取下载这些示例 jacl 和 Jython 脚本可用于在 WebSphere Application Server 的不同版本中自
java-12.求 1+2+3+..n不能使用乘除法、 for 、 while 、 if 、 else 、 switch 、 case 等关键字以及条件判断语句 bylijinnan switch
借鉴网上的思路，用java实现： public class NoIfWhile { /** * @param args * * find x=1+2+3+....n */ public static void main(String[] args) { int n=10; int re=find(n); System.o
Netty源码学习-ObjectEncoder和ObjectDecoder bylijinnan java netty
Netty中传递对象的思路很直观： Netty中数据的传递是基于ChannelBuffer（也就是byte[]）；那把对象序列化为字节流，就可以在Netty中传递对象了相应的从ChannelBuffer恢复对象，就是反序列化的过程 Netty已经封装好ObjectEncoder和ObjectDecoder 先看ObjectEncoder ObjectEncoder是往外发送
spring 定时任务中cronExpression表达式含义 chicony cronExpression
一个cron表达式有6个必选的元素和一个可选的元素，各个元素之间是以空格分隔的，从左至右，这些元素的含义如下表所示：代表含义是否必须允许的取值范围 &nb
Nutz配置Jndi ctrain JNDI
1、使用JNDI获取指定资源： var ioc = { dao : { type :"org.nutz.dao.impl.NutDao", args : [ {jndi :"jdbc/dataSource"} ] } } 以上方法,仅需要在容器中配置好数据源,注入到NutDao即可.
解决 /bin/sh^M: bad interpreter: No such file or directory daizj shell
在Linux中执行.sh脚本，异常/bin/sh^M: bad interpreter: No such file or directory。分析：这是不同系统编码格式引起的：在windows系统中编辑的.sh文件可能有不可见字符，所以在Linux系统下执行会报以上异常信息。解决： 1）在windows下转换：利用一些编辑器如UltraEdit或EditPlus等工具
[转]for 循环为何可恨？ dcj3sjt126com 程序员读书
Java的闭包(Closure)特征最近成为了一个热门话题。一些精英正在起草一份议案，要在Java将来的版本中加入闭包特征。然而，提议中的闭包语法以及语言上的这种扩充受到了众多Java程序员的猛烈抨击。不久前，出版过数十本编程书籍的大作家Elliotte Rusty Harold发表了对Java中闭包的价值的质疑。尤其是他问道“for 循环为何可恨？”[http://ju
Android实用小技巧 dcj3sjt126com android
1、去掉所有Activity界面的标题栏　　修改AndroidManifest.xml 　　在application 标签中添加android:theme="@android:style/Theme.NoTitleBar" 2、去掉所有Activity界面的TitleBar 和StatusBar 　　修改AndroidManifes
Oracle 复习笔记之序列 eksliang Oracle 序列 sequence Oracle sequence
转载请出自出处：http://eksliang.iteye.com/blog/2098859 1.序列的作用序列是用于生成唯一、连续序号的对象一般用序列来充当数据库表的主键值 2.创建序列语法如下： create sequence s_emp start with 1 --开始值 increment by 1 --増长值 maxval
有“品”的程序员 gongmeitao 工作
完美程序员的10种品质　　完美程序员的每种品质都有一个范围，这个范围取决于具体的问题和背景。没有能解决所有问题的完美程序员（至少在我们这个星球上），并且对于特定问题，完美程序员应该具有以下品质：　　1. 才智非凡- 能够理解问题、能够用清晰可读的代码翻译并表达想法、善于分析并且逻辑思维能力强（范围：用简单方式解决复杂问题）　　
使用KeleyiSQLHelper类进行分页查询 hvt sql .net C#asp.net hovertree
本文适用于sql server单主键表或者视图进行分页查询，支持多字段排序。KeleyiSQLHelper类的最新代码请到http://hovertree.codeplex.com/SourceControl/latest下载整个解决方案源代码查看。或者直接在线查看类的代码：http://hovertree.codeplex.com/SourceControl/latest#HoverTree.D
SVG 教程（三）圆形，椭圆，直线天梯梦 svg
SVG <circle> SVG 圆形 - <circle> <circle> 标签可用来创建一个圆：下面是SVG代码： <svg xmlns="http://www.w3.org/2000/svg" version="1.1"> <circle cx="100" c
链表栈 luyulong java 数据结构
public class Node { private Object object; private Node next; public Node() { this.next = null; this.object = null; } public Object getObject() { return object; } public
基础数据结构和算法十：2-3 search tree sunwinner Algorithm 2-3 search tree
Binary search tree works well for a wide variety of applications, but they have poor worst-case performance. Now we introduce a type of binary search tree where costs are guaranteed to be loga
spring配置定时任务 stunizhengjia spring timer
最近因工作的需要，用到了spring的定时任务的功能,觉得spring还是很智能化的,只需要配置一下配置文件就可以了,在此记录一下，以便以后用到： //------------------------定时任务调用的方法------------------------------ /** * 存储过程定时器 */ publi
ITeye 8月技术图书有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的8月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 8月试读活动回顾： http://webmaster.iteye.com/blog/2102830 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《跨终端Web》 gleams：http