热水过敏

Paper Reading: (InPL) 不平衡半监督学习中的分布内伪标记优先

简介

题目：《InPL: Pseudo-labeling the Inliers First for Imbalanced Semi-supervised Learning》, ICLR’23

InPL:不平衡半监督学习中的分布内伪标记优先

日期：2023.2.2
单位：威斯康星大学麦迪逊分校
论文地址：https://openreview.net/forum?id=m6ahb1mpwwX
GitHub：-

作者
Zhuoran Yu

研究领域：之前是目标检测，今年发了两篇半监督相关的，一个是这篇，一个是人体姿态估计

Yin Li， https://www.biostat.wisc.edu/~yli/

Yong Jae Lee

副教授，威斯康星州麦迪逊计算机科学大学系

摘要

最近最先进的不平衡半监督学习（SSL）方法依赖于具有一致性正则化的基于置信度的伪标记。为了获得高质量的伪标签，通常采用高置信度阈值。然而，已经表明，对于远离训练数据的样本，深度网络中基于softmax的置信度得分可以任意高，因此，即使是高置信度的未标记样本的伪标签也可能仍然不可靠。在这项工作中，我们为不平衡SSL的伪标记提供了一个新的视角。在不依赖模型置信度的情况下，我们建议测量未标记的样本是否可能“分布”；即接近于当前训练数据。为了确定未标记样本是“分布中”还是“分布外”，我们采用分布外检测文献中的能量分数。随着训练的进行，越来越多的未标记样本分布并有助于训练，组合的标记和伪标记数据可以更好地近似真实的类分布，以改进模型。实验表明，我们的基于能量的伪标记方法InPL虽然概念简单，但在不平衡SSL基准上显著优于基于置信度的方法。例如，它比CIFAR10-LT的绝对精度提高了约3%。当与最先进的长尾SSL方法相结合时，可以获得进一步的改进。特别是，在最具挑战性的场景之一中，InPL的准确率比最好的竞争对手提高了6.9%。

目标/动机

大多数方法都是为平衡SSL设置而设计的，其中每个类都有相似数量的训练样本，而大多数真实世界的数据自然是不平衡的，通常遵循长尾分布。

最先进的不平衡SSL方法建立在伪标记和一致性正则化框架的基础上，通过增加额外的模块来解决特定的不平衡问题（例如，使用每类平衡采样）。至关重要的是，这些方法仍然依赖于基于置信度的阈值处理来进行伪标记，其中只有预测类别置信度超过非常高阈值（例如0.95）的未标记样本才被伪标记用于训练。

尽管基于置信度的伪标记在平衡SSL中取得了成功，但在不平衡的长尾设置中面临两个主要缺点。首先，应用高置信度阈值会显著降低少数类别的伪标签召回率，导致类别失衡加剧。降低阈值可以提高尾部类别的召回率，但代价是降低其他类别的精度（见第4.4节中的分析）。其次，先前的研究表明，即使在分布外的样本上，深度网络中基于softmax的置信度得分也可以任意高。因此，在模型通常偏向多数类的长尾场景下，即使实例实际上来自尾部类，模型也可以预测头部类的高置信度分数，导致头部类的精度低。

考虑到使用置信度得分作为伪标记标准的缺点，试图设计一种更好的方法来确定是否应该对未标记的样本进行伪标记。

提出了一种新的伪标记方法，该方法解决了不平衡SSL中基于置信度的伪标记的缺点。将是否对未标记的实例进行伪标记，视为分布内与分布外分类问题，而不是依赖模型的预测置信度来决定。

用一个示例来说明InPL的思想

图1：我们用一个示例来说明InPL的思想，其中有一个头部类（绿色）和一个尾部类（红色）。（a）在训练开始时，只有少数未标记的样本足够接近由初始标记数据形成的训练分布。请注意，使用基于置信度的方法，未标记的菱形样本将被添加为绿色类别的伪标签，因为模型对它的置信度非常高（0.97）。相反，我们的InPL忽略了它，因为它的能量分数太高，因此在现阶段被视为不分布。（b）随着训练的进行，训练分布由初始标记数据和伪标记的“分布中”未标记数据演化而来，并且更多的未标记数据可以被包括在训练中。在这个例子中，使用我们的方法InPL，菱形样本最终将被伪标记为红色类别。

一个重要的insight是：如果无标注样本远离带标注数据，即使它的伪标签是高置信度的，也可能不可信。因此，作者借鉴了OOD领域的思想，将赋予伪标签的过程看做是区分伪标签是否分布内or分布外的数据（只是借鉴，非经典OOD的含义），所有人为标注的数据都是分布内数据，其余为分布外数据。自训练的过程实际上演变为逐步拓展分布范围的过程，每次都为最接近分布内的样本赋予伪标签。

为了确定“内部因素”，我们利用能量得分（LeCun et al.，2006），因为它简单且具有良好的经验性能。能量分数是一个非概率标量，从模型的logits中导出，理论上与数据样本的概率密度一致——较低/较高的能量反映了训练分布后出现概率较高/较低的数据，并已被证明对传统的分布外（OOD）检测有用（Liu et al.，2020）。在我们的不平衡SSL设置中，在每次训练迭代时，我们计算每个未标记样本的能量分数。如果未标记样本的能量低于某个阈值，我们用模型生成的预测类对其进行伪标记。（作者说，他们的工作是第一个从分布内与分布外的角度考虑不平衡SSL中的伪标记，也是第一个在不使用softmax分数的情况下执行伪标记的工作。

方法

图2：基于置信度的伪标记与Inlier伪标记的概述。

基于置信度的伪标记框架的一致性正则化的Loss（最经典的方法）：

本文取代了一个步骤——伪标记标准。将赋予伪标签的过程看做是区分伪标签是否分布内or分布外的数据。为了定义分布内样本，作者使用能量得分

这样的好处是：（1）简便，和模型置信度的指标具有相似的简洁性；（2）有效，这和概率密度函数是对应的，能够很好地反映样本是否符合训练集的分布；（3）使用广泛，在以往的OOD目标检测工作中得到广泛使用。能量得分公式如下：

x：输入数据，f_i(x)：指示第i类的对应logit值（f是分类器），K：类的总数，T：可调的温度。

计算每个未标记样本的能量分数，并且只有当相应的能量分数小于预定义阈值τ_e时才生成伪标记，这表明未标记样本接近当前训练分布。实际的伪标签是通过将ω（xb）的弱增广视图上的模型预测转换为独热伪标签来获得的。形式上，无监督损失定义为：

另外，为了解决长尾分布问题，将无监督损失计算中的交叉熵损失函数H(·)，替换为自适应margin loss：

其中, f_i(Ω(x_b))：表示在强增广输入Ω(x_b)上类i的对应logits。

margin 由计算，其中~p是通过指数移动平均在每次迭代时更新的平均模型预测。

实验

图3：可视化：置信度与能量得分：阴影区域显示了产生伪标签的未标记样本。Inlier伪标记可以为许多低置信度的未标记样本产生正确的伪标记，在过滤掉许多假阳性的同时提高召回率。

首先评估了InPL基于能量的伪标记相对于基于标准置信度的伪标记的有效性。为此，我们将InPL集成到FixMatch框架中（表示为FixMatch InPL），并将其与以下FixMatch变体进行比较。结果表明InPL在不平衡SSL中优于基于置信度的伪标记方法

表1:CIFAR 10-LT/100-LT上FixMatch变体的前1位精度。对于CIFAR10-LT和CIFAR100-LT，我们分别使用10%和30%的数据作为标记集。我们将Wide ResNet-282用于CIFAR 10-LT，将WRN-28-8用于CIFAR100-LT。所有方法都使用默认的FixMatch训练计划进行训练。报告了3次不同运行的平均值和标准偏差结果。

接下来，我们将InPL与最先进的不平衡SSL方法进行比较。我们将InPL集成到ABC（Lee et al.，2021）中（ABC是一个最近为不平衡SSL设计的框架）与原始ABC以及其他最先进的不平衡SSL方法DARP、CREST、Adsh和DASO进行了比较。结果如表2和表3所示。结果表明，InPL在不同框架和评估设置的不平衡数据上实现了更好的性能。

表2:ABC评估后，长尾CIFAR10/100的Top-1准确性。我们对CIFAR10-LT使用20%的标记数据，对CIFAR100-LT使用40%的标记数据。我们报告了总体准确度（在“/”之前）和少数类别的准确度（“/”之后）。

请注意，当将InPL集成到ABC框架中时，我们基于能量的伪标记仅应用于辅助类平衡分类器。原始分类器仍然使用基于置信度的伪标记进行训练，因为根据经验，我们发现使用基于能量的伪标记对两者都没有好处。

表3:DASO（Oh et al.，2022）评估后，与SSL-LT方法相比，长尾CIFAR10/100的Top-1准确性。N1和M1表示来自最大多数类的实例数。†由于适应困难，我们使用了Adsh（Cui et al.，2019）中报告的结果。

表4:ImageNet-127和ImageNet的结果。我们使用10%的样本数据作为ImageNet127的标记集，并使用ImageNet的每个类100个标签。我们的方法在两个数据集上都优于FixMatch中基于置信度的方法。

其他标准SSL数据集的结果可以在附录A.8中找到: 附录中的Table C

表C：CIFAR10、SVHN和STL10的前1位精度。†由于适应困难，我们从其原始论文（Xu et al.，2021）中报告了DASH的结果，该论文使用了不同的代码库。所有方法（包括我们的方法）在实验中使用相同的主干。

InPL对于OOD例子的鲁棒性证明

我们从CIFAR10中每类采样4个标记的实例，并使用CIFAR10和SVHN的其余部分作为未标记的数据。

来自不同数据域的未标记实例存在于未标记集中。将InPL与基于置信度的方法UDA和FixMatch进行了比较。当大量OOD示例位于未标记集中时，两种方法的总体性能都会下降，但InPL显示出显著的优势。

表5：当在CIFAR10分类上训练模型时，来自SVHN的OOD样本出现在未标记集中时的结果。
（a）在未标记数据中类别不匹配的情况下的另一个OOD鲁棒性实验
（b）InPL在训练中始终包含较少的OOD示例。表明了InPL对真实异常值的鲁棒性。

图C：（a）：不同类别错配率的CIFAR-10（六个动物类别）的测试误差比较。例如，“50%”表示未标记数据中的四个类中有两个不存在于标记数据中。当类失配率高时，InPL优于其他最先进的方法。（b）伪标记的真正OOD示例的数量。与FixMatch和FlexMatch相比，InPL始终包含更少真实的OOD示例

为什么InPL能很好地处理不平衡的数据？

对CIFAR10-LT提供了详细的伪标签精度和召回分析。在这里，我们将最频繁的三个类称为head类，将最不频繁的三种类称为tail类，将其余类称为body类。图4显示了我们模型预测的伪标签在所有类（a，c）以及尾部类（b，d）上的精度和召回率。头部和身体类别的分析见附录A.4（Fig B）。

图4：精度-召回分析：我们比较了InPL和FixMatch之间的伪标签精度和召回率。橙色和绿色曲线分别表示阈值为0.95和0.6的FixMatch。InPL以蓝色显示，这提高了尾部类的召回率和更好的整体精度。

图B：head和body类别的精密召回分析：橙色和绿色曲线分别表示阈值为0.95和0.6的FixMatch。InPL由蓝色曲线表示。与基于置信度的伪标记基线相比，InPL始终以略低的召回率实现更高的伪标记精度。

消融实验

包括阈值和温度的选择、自适应margin损失

图A：消融研究：（A）和（b）：不平衡率为100的CIFAR10-LT下，不同能量阈值对FixMatch框架和ABC框架的影响。对于ABC框架，使用ReMixmatch基础。（c）：在FixMatch框架下，能量函数中的温度参数对CIFAR10-LT的影响。

> 表A：FixMatch与CIFAR10-LT上各种置信阈值的比较。使用一次10%的标记数据和具有相同随机种子的不平衡率100来生成结果。

表B: AML对ABC框架的影响

总结

Conclusion

在这项工作中，我们提出了一种新的“分布内与分布外”的观点，用于不平衡SSL中的伪标记，以及我们基于能量的伪标记方法（InPL）。重要的是，我们的方法根据从模型输出中得出的未标记样本的能量分数来选择未标记样本进行伪标记。我们展示了我们的方法可以很容易地集成到最先进的不平衡SSL方法中，并取得了很好的效果。我们进一步证明，我们的方法对分布外的样本具有稳健性，并在平衡的SSL基准测试中保持竞争力。一个限制是能量分数缺乏可解释性；能量分数具有不同的尺度并且更难解释。设计更好地理解它的方法将是未来有趣的工作。总的来说，我们相信我们的工作已经表明了基于能源的方法对不平衡SSL的前景，并希望它将推动这方面的进一步研究。

Appendix

本文件通过描述对主要论文的补充：

（1）用于半监督学习的长尾数据集的构建（附录A.1）；

（2）主论文中每个实验的训练细节（附录A.2）；

（3）超参数选择的消融研究（附录A.3）；

（4）对伪标签进行更精确的召回分析（附录A.4）；

（5）具有不同阈值的FixMatch的前1准确性（附录A.5）；

（6）更多关于真实OOD示例在未标记集合中呈现的真实评估的结果（附录A.6）；

（7） InPL中自适应裕度损失的贡献（附录A.7）；

（8）关于标准SSL基准的额外结果（附录A.8）；

（9）置信度得分与能量得分的理论比较。

我将附录内容和正文中相关的实验进行了归并

基于Python实现微信表情轰炸机实现与界面设计程序熊. python 微信开发语言
实现效果：介绍：本教程将向您展示如何使用Python和Tkinter库创建一个微信表情轰炸机。该程序将允许用户选择表情包并设置轰炸次数和间隔时间，然后自动在微信对话框中发送表情。本教程还包含了一个用户界面，使用户可以方便地选择和配置轰炸参数。环境配置：Python3.xTkinter库pynput库（用于键盘和鼠标控制）项目分布：主窗口：包含输入框、列表框、按钮等控件，用于用户输入轰炸参数和选择表
Python 上位机开发 c实例 python
Python上位机开发第一节：入门介绍在这第一节中，我们将对Python上位机开发进行一个初步的了解和探索。首先，什么是上位机？上位机通常是指可以与下位机（如单片机、传感器等硬件设备）进行通信和交互，实现数据采集、控制指令发送以及数据处理和展示的计算机程序。Python作为一种高级编程语言，在开发上位机方面具有诸多优势。它拥有丰富的第三方库，使得开发过程变得相对简单和高效。例如，PySerial库
设计模式-策略模式 whale fall 设计模式设计模式策略模式
策略模式（StrategyPattern）是一种行为设计模式，它定义了一系列算法（策略），并将每个算法封装起来，使得它们可以互相替换。策略模式让算法的变化独立于使用算法的客户端。即将不同的算法封装成独立的策略类，然后在运行时根据需求选择具体的策略进行操作。下面是一个使用Python实现策略模式的示例。1.定义策略接口首先，定义一个策略接口（在Python中通常是一个抽象基类），该接口描述所有策略类
python list列表删除指定元素的四种方法 whale fall python进阶 python
在Python中，要删除列表中的某个元素，可以使用几种不同的方法，具体取决于你希望如何删除该元素。以下是一些常见的方法：1.使用remove()方法remove()方法会删除列表中第一次出现的指定元素。如果该元素不存在，会引发ValueError错误。my_list=[1,2,3,4,5]#删除值为3的元素my_list.remove(3)print(my_list)输出：[1,2,4,5]2.使
深度学习-图像数据标注工具使用（LabelImg和BBox） AI研习图书馆方法教程 LabelImg BBox 图像标注工具
文章与视频资源多平台更新微信公众号|知乎|B站|头条：AI研习图书馆深度学习、大数据、IT编程知识与资源分享，欢迎关注，共同进步~图像数据标注工具的使用教程1.LabelImgLabelImg下载地址：https://github.com/tzutalin/labelImg（下载源码，需要编译）Windows和Linux系统可运行软件：http://tzutalin.github.io/label
python 根据元素值获取span 大紫菜 python java android javascript 数据库
我整理的一些关于【网页内容,HTML,python】的项目学习资料（附讲解～～）和大家一起分享、学习一下：https://d.51cto.com/eDOcp1用Python根据元素值获取在实际的网页开发与数据抓取中，我们经常需要根据元素的值来获取对应的HTML标签，比如。本文将教你如何用Python实现这一功能。本文将详细阐述整个处理的流程，并展示具体的代码示例。流程概览下面是根据元素值获取的主要
python span 抓取_python – Beautifulsoup获取span内容 weixin_39755952 python span 抓取
我已经解析了html页面：使用beautifulsoupuser_page=urllib2.urlopen(user_url)souping_page=bs(user_page)badges=souping_page.body.find('div',attrs={'class':'badges'})在此之后我的徽章对象看起来像这样：93856现在我想从中提取示例9金徽章,38个银徽章,我试图使用b
微信信息轰炸【简易版】老师好，我是刘同学力扣 python
本版本的微信信息轰炸仅能在电脑端使用：简单讲解下其中的原理:在程序中输入我们想要信息轰炸的信息，然后模拟键盘输入。其实我们就是使用了python的库pynput,模拟输入文字和信息，不多说，上代码frompynput.keyboardimportKey,Controlleraskey_clfrompynput.mouseimportController,Buttonimporttimedefkey
基于Python的一个串口程序上位机 DEMO qq_26991191 python 开发语言 pyqt 单片机
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、程序基本功能二、全部代码,代码直接复制可用1.全部代码总结前言`一个简单的串口程序-上位机,基于Python,pyqt5代码实现.需要安装sys,pyqt5.`一、程序基本功能这个程序可以自动搜索电脑上已经连接的端口,自由设置端口,码率,开关串口.接收数据,发送数据.二、全部代码,代码直接复制可用1.全部代码代码如下（
python定位span里面的文字 egzosn python 前端 javascript 开发语言 ecmascript
在网页开发和数据抓取过程中，我们经常需要从HTML页面中提取信息，尤其是span元素中的文本。span标签是一个行内元素，通常用于包装一小段文本或其他元素。在Python中，我们可以通过使用BeautifulSoup或lxml等库来解析HTML并提取span标签中的文本。本文将介绍如何使用Python定位并提取span元素中的文字，并展示一些常见的用法和示例。一、安装相关依赖在开始之前，我们需要安
sorted() 函数：排序的利器 01_6 深度学习计算机视觉opencv 数据结构 opencv 计算机视觉人工智能图像 python
目录一、sorted()函数简介二、函数使用示例示例1：对列表进行排序示例2：对字符串进行排序示例3：指定排序键三、参数详细介绍1、key参数2、reverse参数四、高级用法1、自定义排序键函数2、多级排序五、总结一、sorted()函数简介sorted()函数是Python中的内置函数，用于对可迭代对象进行排序。它的基本语法如下：sorted(iterable,key=None,reverse
Python定位Span标签中的文字：实战指南傻啦嘿哟 python 开发语言
目录一、准备工作二、基本流程三、代码示例四、案例分析五、进阶技巧处理多个标签：根据其他属性定位：结合XPath：使用Selenium：六、注意事项七、总结在网页数据抓取和信息提取的过程中，经常需要定位并获取HTML中特定标签的内容。其中，标签是一个常见的内联元素，用于对文本进行分组或应用样式。本文将详细介绍如何使用Python来定位并提取标签中的文字，通过具体的代码示例和案例，帮助读者快速掌握这一
chatgpt赋能python：如何配置Python中的NumPy？ yakuchrisfor ChatGpt chatgpt python numpy 计算机
如何配置Python中的NumPy？如果您是一名Python程序员，那么您可能已经听说过NumPy。NumPy是一个强大的Python库，可用于处理大型多维数组和矩阵，以及用于数值计算和科学计算。因此，NumPy是数据科学中的黄金库，而它的安装是Python编程环境必不可少的一部分。什么是NumPy？NumPy是Python语言的一个扩展程序库，它支持大量的高级数学函数，以及可以高效地操作大型数组
把Python的pip源修改为国内亦安✘ python 开发语言
我们在用pip下载时访问的是国外pip源超级慢，因此可将源改为国内的镜像，就能飞速的下载,可临时修改，也可永久修改国内pip源：豆瓣http://pypi.douban.com/华中理工大学http://pypi.hustunique.com/山东理工大学http://pypi.sdutlinux.org/中国科学技术大学http://pypi.mirrors.ustc.edu.cn/阿里云htt
Python中如何获取HTTP请求的Response Body 傻啦嘿哟关于python那些事儿 python http 开发语言
目录一、引言二、使用urllib库获取ResponseBody1.基本用法2.发送POST请求三、使用requests库获取ResponseBody1.安装requests库2.基本用法3.发送POST请求4.处理JSON响应四、高级用法1.处理请求头2.设置超时3.处理Cookies五、案例：爬取网页内容六、总结在Python中进行网络编程和Web开发时，经常需要发送HTTP请求并处理服务器返回
Python pip更换国内源王阿菜 python
1.Pycharm内更换File-->Settings-->Project:*****-->PythonInterpreter点击加号-->MangeRepositories选择PIP的地址，修改成国内源-->保存2.Windows上修改在本机的user目录下新建一个pip目录，新建文件pip.ini，代码如下：[global]index-url=https://pypi.tuna.tsinghu
python 合并word文件_merge: 利用Python，合并多个MarkDown文档，并将其转化为Word文档。... weixin_39562606 python 合并word文件
merge项目介绍利用Python，合并多个MarkDown文档，并将其转化为Word文档。这样可以利用事先做好的word文档样式，一定程度上实现word文档的内容与样式分离，减少使用word时重复设置格式的烦恼。安装教程需要安装pandoc，并能全局运行。brewinstallpandoc需要安装python3。brewinstallpython3将merge.py复制到合适路径，并给予运行权限
python post body_python写http post请求的四种请求体 weixin_39606575 python post body
HTTP协议规定POST提交的数据必须放在消息主体(entity-body)中，但协议并没有规定数据必须使用什么编码方式。常见的四种编码方式如下：1、application/x-www-form-urlencoded这应该是最常见的POST提交数据的方式了。浏览器的原生form表单，如果不设置enctype属性，那么最终就会以application/x-www-form-urlencoded方式提
Tox-uv：Python测试环境搭建的新利器码农工具百宝箱码农小工具 python uv 人工智能
在Python开发中，测试环境的搭建是一个不可或缺的环节。传统的虚拟环境管理工具如virtualenv和pip虽然功能强大，但在某些场景下可能存在性能瓶颈。为了解决这一问题，tox-uv应运而生，它是一个tox插件，旨在用uv工具替代virtualenv和pip，以提升测试环境搭建的性能。Tox-uv简介tox-uv是一个创新的tox插件，它通过使用uv工具来创建和管理虚拟环境，从而提高了Pyth
ESP8266开发环境搭建 D_kity ESP8266 iot 物联网 c语言
1、工具安装sudoapt-getinstallgccgitwgetmakelibncurses-devflexbisongperfpythonpython-serial2、下载编译工具or64-bitLinux:https://dl.espressif.com/dl/xtensa-lx106-elf-gcc8_4_0-esp-2020r3-linux-amd64.tar.gzfor32-bitL
pip 修改国内源 sftxlin pip
在Windows系统中修改Python的pip源，可以让你更快地安装Python包，特别是在中国地区，使用国内的源可以显著提高下载速度。下面是详细的步骤：打开命令提示符按下Win+R键，输入cmd，然后按下回车，打开命令提示符。创建或修改pip配置文件在命令提示符中输入以下命令，以创建或修改pip配置文件：arduinoCopycodepipconfigsetglobal.index-urlhtt
Python 修改 pip 源为国内源人生嘚节奏 python pip 开发语言
1.临时换源：#清华源pipinstallmarkdown-ihttps://pypi.tuna.tsinghua.edu.cn/simple#阿里源pipinstallmarkdown-ihttps://mirrors.aliyun.com/pypi/simple/#腾讯源pipinstallmarkdown-ihttp://mirrors.cloud.tencent.com/pypi/simp
新的Python库、项目管理工具——uv CS创新实验室 Python python uv 开发语言
uv是一个由Astral团队开发的高性能Python包和项目管理工具。Astral团队也是广受欢迎的Ruff（一个极速的Pythonlinter）的开发者。uv的目标是成为Python生态中的“一站式”工具，取代传统的工具链（如pip、pip-tools、virtualenv、poetry等），同时提供更快的速度和更强大的功能。uv的核心优势在于其极快的速度和多功能性。它基于Rust编写，充分利用
Python将Markdown格式转为HTML：轻松实现博客文章的自动化处理木头左 python办公自动化 python html 自动化
哈喽，大家好，我是木头左！引言编写一篇高质量的博客文章并非易事，尤其是在排版和格式方面。Markdown作为一种轻量级的标记语言，为博主们提供了一种简洁、高效的写作方式。而Python作为一门强大的编程语言，可以帮助将Markdown格式的文本转换为HTML，从而实现博客文章的自动化处理。安装所需库要实现Markdown转HTML的功能，需要安装两个Python库：markdown和html。可以
GPU架构（1.2）--GPU SoC 中的 CPU 架构小蘑菇二号手把手教你学 GPU SoC 芯片智能电视
目录详细介绍GPUSoC中的CPU架构1.CPU核心概述ARMCortex-A72ARMCortex-A762.多线程处理多核架构多线程支持3.任务调度任务调度器动态调度4.内存管理内存层次结构内存管理技术5.接口和通信总线接口I/O接口6.功耗和热管理功耗优化热管理7.应用实例边缘计算图形处理深度学习结语详细介绍GPUSoC中的CPU架构GPUSoC不仅集成了高性能的GPU，还集成了高性能的CP
[Python] MacOS 修改 pip 源为国内源 Cassius_Zeo python python macos pip
Step1：创建.pip文件夹mkdir~/.pipStep2:设置国内源（如果你是python3,需将pip修改为pip3）--清华源pipconfigsetglobal.index-urlhttps://pypi.tuna.tsinghua.edu.cn/simple--阿里源pipconfigsetglobal.index-urlhttps://
python3各个版本是通用的吗-python有几个版本 weixin_37988176
Python的3.0版本，常被称为Python3000，或简称Py3k。相对于Python的早期版本，这是一个较大的升级。为了不带入过多的累赘，Python3.0在设计的时候没有考虑向下相容。许多针对早期Python版本设计的程式都无法在Python3.0上正常执行。为了照顾现有程式，Python2.6作为一个过渡版本，基本使用了Python2.x的语法和库，同时考虑了向Python3.0的迁移，
《DirectX 12 3D游戏开发实战》读书笔记1：数学基础 tikris 3d 游戏 c++矩阵线性代数
文章目录学习内容内容关于浮点类型误差解决方案参数与D3D数据结构向量类型XMVECTOR与XMFLOATn：XMVECTOR与XMFLOATn的相互转化：取得某个分量或者将某个分量转换为XMVECTOR类型：参数向量特点：表示方法：运算求模：单位化(规范化、标准化等同义)：正交化：加(减)法：乘法：其他函数杂项点常向量矩阵矩阵的传参矩阵的初始化XMMATRIX和XMFLOAT4X4的转换运算矩阵的
directx12 3d+vs2022游戏开发第六章笔记八绘制几何体云缘若仙 directx12 3d 3d 笔记算法 directx12 3d
1.顶点与输入布局在DirectX123D中，顶点是构建几何体的基本单元，它不仅包含了空间位置信息，还可以存储颜色、法线、纹理坐标等其他属性数据。通过定义不同的顶点结构体，可以创建出满足各种需求的顶点格式。例如，以下结构体定义了一个包含位置和颜色信息的顶点：structVertex{ XMFLOAT3Pos; XMFLOAT4Color;};在这个结构体中，XMFLOAT3类型的Pos
【Python报错】已解决NameError: name ‘Image‘ is not defined 云天徽上 python 开发语言 numpy pandas 机器学习
解决Python报错：NameError:name‘Image’isnotdefined在使用Python进行图像处理时，我们经常使用Pillow库（PIL的一个分支）。如果你在尝试创建或处理图像时遇到了NameError:name'Image'isnotdefined的错误，这通常意味着你的代码中存在一些问题。本文将介绍这种错误的原因和解决办法。错误原因NameError:name'Image'
LeetCode[位运算] - #137 Single Number II Cwind java Algorithm LeetCode 题解位运算
原题链接：#137 Single Number II 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现三次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：与#136类似，都是考察位运算。不过出现两次的可以使用异或运算的特性 n XOR n = 0, n XOR 0 = n，即某一
《JavaScript语言精粹》笔记 aijuans JavaScript
0、JavaScript的简单数据类型包括数字、字符创、布尔值（true/false）、null和undefined值，其它值都是对象。 1、JavaScript只有一个数字类型，它在内部被表示为64位的浮点数。没有分离出整数，所以1和1.0的值相同。 2、NaN是一个数值，表示一个不能产生正常结果的运算结果。NaN不等于任何值，包括它本身。可以用函数isNaN(number)检测NaN,但是
你应该更新的Java知识之常用程序库 Kai_Ge java
在很多人眼中，Java 已经是一门垂垂老矣的语言，但并不妨碍 Java 世界依然在前进。如果你曾离开 Java，云游于其它世界，或是每日只在遗留代码中挣扎，或许是时候抬起头，看看老 Java 中的新东西。 Guava Guava[gwɑ:və]，一句话，只要你做Java项目，就应该用Guava（Github）。 guava 是 Google 出品的一套 Java 核心库，在我看来，它甚至应该
HttpClient 120153216 httpclient
/** * 可以传对象的请求转发，对象已流形式放入HTTP中 */ public static Object doPost(Map<String,Object> parmMap,String url) { Object object = null; HttpClient hc = new HttpClient(); String fullURL
Django model字段类型清单 2002wmj django
Django 通过 models 实现数据库的创建、修改、删除等操作，本文为模型中一般常用的类型的清单，便于查询和使用： AutoField：一个自动递增的整型字段，添加记录时它会自动增长。你通常不需要直接使用这个字段；如果你不指定主键的话，系统会自动添加一个主键字段到你的model。(参阅自动主键字段) BooleanField：布尔字段,管理工具里会自动将其描述为checkbox。 Cha
在SQLSERVER中查找消耗CPU最多的SQL 357029540 SQL Server
返回消耗CPU数目最多的10条语句 SELECT TOP 10 total_worker_time/execution_count AS avg_cpu_cost, plan_handle, execution_count, (SELECT SUBSTRING(text, statement_start_of
Myeclipse项目无法部署，Undefined exploded archive location 7454103 eclipse MyEclipse
做个备忘！错误信息为： Undefined exploded archive location 原因：在工程转移过程中，导致工程的配置文件出错；解决方法：
GMT时间格式转换 adminjun GMT 时间转换
普通的时间转换问题我这里就不再罗嗦了，我想大家应该都会那种低级的转换问题吧，现在我向大家总结一下如何转换GMT时间格式，这种格式的转换方法网上还不是很多，所以有必要总结一下，也算给有需要的朋友一个小小的帮助啦。 1、可以使用 SimpleDateFormat SimpleDateFormat EEE-三位星期 d-天 MMM-月 yyyy-四位年
Oracle数据库新装连接串问题 aijuans oracle数据库
割接新装了数据库，客户端登陆无问题，apache/cgi-bin程序有问题，sqlnet.log日志如下： Fatal NI connect error 12170. VERSION INFORMATION: TNS for Linux: Version 10.2.0.4.0 - Product
回顾java数组复制 ayaoxinchao java 数组
在写这篇文章之前，也看了一些别人写的，基本上都是大同小异。文章是对java数组复制基础知识的回顾，算是作为学习笔记，供以后自己翻阅。首先，简单想一下这个问题：为什么要复制数组？我的个人理解：在我们在利用一个数组时，在每一次使用，我们都希望它的值是初始值。这时我们就要对数组进行复制，以达到原始数组值的安全性。java数组复制大致分为3种方式：①for循环方式 ②clone方式 ③arrayCopy方
java web会话监听并使用spring注入 bewithme Java Web
在java web应用中，当你想在建立会话或移除会话时，让系统做某些事情，比如说，统计在线用户，每当有用户登录时，或退出时，那么可以用下面这个监听器来监听。 import java.util.ArrayList; import java.ut
NoSQL数据库之Redis数据库管理(Redis的常用命令及高级应用) bijian1013 redis 数据库 NoSQL
一 .Redis常用命令 Redis提供了丰富的命令对数据库和各种数据库类型进行操作，这些命令可以在Linux终端使用。 a.键值相关命令 b.服务器相关命令 1.键值相关命令 &
java枚举序列化问题 bingyingao java 枚举序列化
对象在网络中传输离不开序列化和反序列化。而如果序列化的对象中有枚举值就要特别注意一些发布兼容问题: 1.加一个枚举值新机器代码读分布式缓存中老对象，没有问题，不会抛异常。老机器代码读分布式缓存中新对像，反序列化会中断，所以在所有机器发布完成之前要避免出现新对象，或者提前让老机器拥有新增枚举的jar。 2.删一个枚举值新机器代码读分布式缓存中老对象，反序列
【Spark七十八】Spark Kyro序列化 bit1129 spark
当使用SparkContext的saveAsObjectFile方法将对象序列化到文件，以及通过objectFile方法将对象从文件反序列出来的时候，Spark默认使用Java的序列化以及反序列化机制，通常情况下，这种序列化机制是很低效的，Spark支持使用Kyro作为对象的序列化和反序列化机制，序列化的速度比java更快，但是使用Kyro时要注意，Kyro目前还是有些bug。 Spark
Hybridizing OO and Functional Design bookjovi erlang haskell
推荐博文： Tell Above, and Ask Below - Hybridizing OO and Functional Design 文章中把OO和FP讲的深入透彻，里面把smalltalk和haskell作为典型的两种编程范式代表语言，此点本人极为同意，smalltalk可以说是最能体现OO设计的面向对象语言，smalltalk的作者Alan kay也是OO的最早先驱，
Java-Collections Framework学习与总结-HashMap BrokenDreams Collections
开发中常常会用到这样一种数据结构，根据一个关键字，找到所需的信息。这个过程有点像查字典，拿到一个key，去字典表中查找对应的value。Java1.0版本提供了这样的类java.util.Dictionary(抽象类)，基本上支持字典表的操作。后来引入了Map接口，更好的描述的这种数据结构。 &nb
读《研磨设计模式》-代码笔记-职责链模式-Chain Of Responsibility bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 业务逻辑：项目经理只能处理500以下的费用申请，部门经理是1000，总经理不设限。简单起见，只同意“Tom”的申请 * bylijinnan */ abstract class Handler { /*
Android中启动外部程序 cherishLC android
1、启动外部程序引用自： http://blog.csdn.net/linxcool/article/details/7692374 //方法一 Intent intent=new Intent(); //包名包名+类名（全路径） intent.setClassName("com.linxcool", "com.linxcool.PlaneActi
summary_keep_rate coollyj SUM
BEGIN /*DECLARE minDate varchar(20) ; DECLARE maxDate varchar(20) ;*/ DECLARE stkDate varchar(20) ; DECLARE done int default -1; /* 游标中注册服务器地址 */ DE
hadoop hdfs 添加数据目录出错 daizj hadoop hdfs 扩容
由于原来配置的hadoop data目录快要用满了，故准备修改配置文件增加数据目录，以便扩容，但由于疏忽，把core-site.xml, hdfs-site.xml配置文件dfs.datanode.data.dir 配置项增加了配置目录，但未创建实际目录，重启datanode服务时，报如下错误： 2014-11-18 08:51:39,128 WARN org.apache.hadoop.h
grep 目录级联查找 dongwei_6688 grep
在Mac或者Linux下使用grep进行文件内容查找时，如果给定的目标搜索路径是当前目录，那么它默认只搜索当前目录下的文件，而不会搜索其下面子目录中的文件内容，如果想级联搜索下级目录，需要使用一个“-r”参数： grep -n -r "GET" . 上面的命令将会找出当前目录“.”及当前目录中所有下级目录
yii 修改模块使用的布局文件 dcj3sjt126com yii layouts
方法一：yii模块默认使用系统当前的主题布局文件，如果在主配置文件中配置了主题比如: 'theme'=>'mythm', 那么yii的模块就使用 protected/themes/mythm/views/layouts 下的布局文件；如果未配置主题，那么 yii的模块就使用 protected/views/layouts 下的布局文件，总之默认不是使用自身目录 pr
设计模式之单例模式 come_for_dream 设计模式单例模式懒汉式饿汉式双重检验锁失败无序写入
今天该来的面试还没来，这个店估计不会来电话了，安静下来写写博客也不错，没事翻了翻小易哥的博客甚至与大牛们之间的差距，基础知识不扎实建起来的楼再高也只能是危楼罢了，陈下心回归基础把以前学过的东西总结一下。 *********************************
8、数组豆豆咖啡二维数组数组一维数组
一、概念数组是同一种类型数据的集合。其实数组就是一个容器。二、好处可以自动给数组中的元素从0开始编号，方便操作这些元素三、格式 //一维数组 1,元素类型[] 变量名 = new 元素类型[元素的个数] int[] arr =
Decode Ways hcx2013 decode
A message containing letters from A-Z is being encoded to numbers using the following mapping: 'A' -> 1 'B' -> 2 ... 'Z' -> 26 Given an encoded message containing digits, det
Spring4.1新特性——异步调度和事件机制的异常处理 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
squid3(高命中率)缓存服务器配置 liyonghui160com
系统:centos 5.x 需要的软件:squid-3.0.STABLE25.tar.gz 1.下载squid wget http://www.squid-cache.org/Versions/v3/3.0/squid-3.0.STABLE25.tar.gz tar zxf squid-3.0.STABLE25.tar.gz &&
避免Java应用中NullPointerException的技巧和最佳实践 pda158 java
1) 从已知的String对象中调用equals()和equalsIgnoreCase()方法，而非未知对象。　　总是从已知的非空String对象中调用equals()方法。因为equals()方法是对称的，调用a.equals(b)和调用b.equals(a)是完全相同的，这也是为什么程序员对于对象a和b这么不上心。如果调用者是空指针，这种调用可能导致一个空指针异常 Object unk
如何在Swift语言中创建http请求 shoothao http swift
概述：本文通过实例从同步和异步两种方式上回答了”如何在Swift语言中创建http请求“的问题。如果你对Objective-C比较了解的话，对于如何创建http请求你一定驾轻就熟了，而新语言Swift与其相比只有语法上的区别。但是，对才接触到这个崭新平台的初学者来说，他们仍然想知道“如何在Swift语言中创建http请求？”。在这里,我将作出一些建议来回答上述问题。常见的
Spring事务的传播方式 uule spring事务
传播方式：新建事务 required required_new - 挂起当前非事务方式运行 supports &nbs

Paper Reading: (InPL) 不平衡半监督学习中的分布内伪标记优先

目录

简介

目标/动机

方法

实验

总结

Appendix

你可能感兴趣的:(Paper,Reading,论文阅读,目标检测,笔记,python,深度学习)