qq_43124103

【论文阅读】APANet: Adaptive Prototypes Alignment Network for Few-Shot Semantic Segmentation

论文地址：https://arxiv.org/abs/2111.12263

论文代码：－

本文目录

文章目录

- 本文目录
- 1.前言
- - 1.1深度学习与数据量
  - 1.2语义分割
  - 1.3元学习
  - 1.4小样本分割
  - 1.5小样本分割目前存在的问题
- 2.APANet概述
- - 2.1提出问题
  - 2.2解决方案
  - 2.3文章贡献
  - 2.4网络结构
  - 2.5参数名词解释
  - 2.6公式介绍
  - 2.7效果展示
- 总结
- - 留一个疑问：

1.前言

1.1深度学习与数据量

如今，深度学习技术在计算机视觉领域取得很大的发展。随着Imagenet、coco、pascal voc等大型数据集的提出，深度学习几乎和大量的有标注的人工数据集绑定在一起。海量的数据集使得网络具有可以不断加深的前提，网络模型的能力也不断提升，深度学习在图像分类，目标检测和图像分割领域都获得了突破。但同时大型数据集也制约了深度学习的发展，个人总结主要有以下两点原因：

1.数据集或带标注的数据集难以获取

在工业生产中或某些场合下，目标图像出现的次数很少，比如缺陷件的图像不容易采集，同时对于目标检测和语义分割任务而言，需要人工对图像矩形或像素进行密集型标注，这种工作周期长，且金钱代价大。

2.深度学习偏向于可见类，具有严重的过拟合现象

如今的深度学习网络动则几十层，上百层或者更深，模型参数量很大，需要庞大的数据集才可以train的动，但是大多数场景下，数据集本身会存在类别不平衡的情况，或者突然有一个新类需要加入训练，而其数据量很小，产生过拟合现象，导致初期的训练效果就会很不理想，需要不断采集加图训练，这样模型的迭代会很慢。

总之就是数据量不够的问题，data augmentation数据增广是一个不错的方法，但是一般的数据增广不一定对模型的性能有所改善，甚至起到负作用，有些研究者使用强大的数据增广来提升模型的泛化能力，但是我觉得在数据集缺少的情况下，他的作用是极其有限的。简单说"可以提升精度，但不一定work"

在介绍本次阅读的文献之前，我先介绍一下相关的知识背景，以后的文章不再叙述。

1.2语义分割

以经典的FCN网络为例，主要结构是采用全卷积的网络结构，先通过编码器对图像进行编码，就是下采样和特征提取，此时获取到的是高维的语义信息，然后通过解码器对特征图进行上采样，一般上采样的原图大小，之后通过激活函数对图像的每一个像素进行分类，通过精细的像素级人工标签，计算交叉熵损失后，得到分割结果，后续分割网络也都采用这种先编码再解码的结构。

1.3元学习

元学习meta learning 他与传统深度学习喂数据和答案的训练方式不同，元学习采用情景训练的学习方式，通过在查询集与支持集之间的对比，让模型自主的学会区分它们的能力，让模型学会学习。具体的元学习的内容比较难懂，具体可以看这篇博文http://t.csdn.cn/Azurt

我们只需要了解它是从有限的support set里面学知识，然后在query set预测的时候就是test set里面直接将这些知识用于判断那些是需要的图片或像素。

（这图也是在一篇c帖找到的，三玖yyds）

1.4小样本分割

小样本语义以分割为目标，在一幅查询图像中对新的类进行像素级分类，条件是只有少量的注释支持图像。OSLSM这篇文章第一次提出了这种方案，大致方案就是通过共享的特征提取器提取支持集和查询集的特征，然后使用再将特征送入元学习器中，进行判断，通过支持集的注释图像获得目标特征，然后在查询图像中分割新类。

1.5小样本分割目前存在的问题

小样本分割总是偏向于基类，分割的新类容易把基类分割进去（Learning What Not to Segment: A New Perspective on Few-Shot Segmentation提及）
小样本分割元学习器不稳定，容易受到支持集与查询集样本空间不一致带来的影响（Learning What Not to Segment: A New Perspective on Few-Shot Segmentation提及）
小样本分割分割一般只能分割支持集里面包含的novel类对于之前分割的类不能有效分割，需要推广到GFSS，即Generalized Few-shot Semantic Segmentation

2.APANet概述

2.1提出问题

APANET认为训练过程中正负样本的划分冲突会影响小样本分割精度的问题，原文中：

将前景原型与查询特征进行特征比较，并在训练时将查询图像中的整个背景特征作为负样本。这将导致FSS的一个问题，因为测试集中的一些新类对象可能出现在训练图像中，但在训练过程中被视为背景。

通过原文的中Fig 2可以具体解释：

众所周知，小样本分割训练过程中，会将图片划分成支持集和查询集，在训练过程中支持集往往给出所需指定novel样本图像极其mask，对于其他可能的样本都会视作背景。如上图所示，四张图中的novel样本分别是：汽车，火车，长颈鹿。而图像上其他的区域都是背景，其中包含了轮船，人类，斑马和巴士。在这次训练过程不会出现歧义的问题，这些背景样本对象会在测试过程中出现在前景中，成为新的novel样本，这会给模型带来严重的歧义。

我们很容易发现一些类，如船、人、斑马和巴士，出现在这些训练图像的背景中，而它们实际上可以是新的类，需要在测试阶段识别为前景。这种训练和测试阶段之间的冲突会带来系统偏差，从而限制小样本学习模型的泛化性能。

综合前面阅读的论文总结的问题，再结合这个问题还是有点让我意外的，总感觉这个问题的提出与小样本分割的原始含义相互冲突。我的理解是小样本学习的元学习是去学会学习，而不是学习固定的基类的是什么样子，小样本分割中应该完全利用support set中给出的原型直接用于query set分割即可，而这篇文章的这种说法意思现在的小样本分割和之前的语义分割类似，模型会记住什么是前景，什么是背景，然后由于正负样本的划分冲突从而影响分割精度，所以不是一种理想的元学习范式。

后续发现文章还提出了一个问题：

如上所述，特定于类的分支将查询图像中的背景特征从前景原型中移开，并鼓励查询图像中的前景特征靠近前景原型。因此，这种学习机制在训练时容易强迫模型记住基类集cBase以外的对象作为背景，限制了模型的泛化能力。

可见由于训练方式的限制，导致模型偏向于基类特征

2.2解决方案

我们解决这个问题的基石是在训练阶段开发类特定和类不可知的原型，从而构建完整的特征对用于比较，如图所示 1(d). 对于特定类的原型，该模型以查询中的前景特征为正样本，以背景特征为负样本。相反，对于每个类不可知的原型，查询中对应的背景特征被视为正样本，而前景特征被视为负样本。请注意，背景被定义为那些注释对象（前景）之外的任何区域。通过这种方式，我们可以减轻先前在训练集中记住NovelClass对象作为背景的偏见。具体来说，利用支持特征映射和掩码注释生成类特定的原型；并根据查询图像的背景特征自适应生成类不可知原型。不同于以前的方法[2]、[8]、[12]从支持图像生成类无关原型，我们只从查询特征中提取这些原型，以确保这些原型与查询图像的背景特征之间的语义相似性。最后，不仅对特定于类的原型和查询特征进行了特征比较，还对不依赖于类的原型和查询特征进行了特征比较。

文章中的特定于类指的是支持集的给出的类

2.3文章贡献

提出了一种新的小样本语义分割学习范式。它不仅学习特定于类的原型和查询特性（在特定于类的分支中）之间的特性比较，还学习不同类的原型和查询特性（在不同类的分支中）之间的特性比较。据我们所知，我们是第一个提出这种互补特征学习方式，以帮助产生一个无偏见的分割模型在FEW SHOT设置。
提出了一个简单而有效的不可知类分支，包括类不可知原型生成和特征对齐。在实践中，该分支能够自适应地从查询图像的背景中生成多个类不可知的原型，并以自我对比的方式学习特征对齐。
我们在PASCAL-5i和COCO-20i数据集上获得了新的最先进的结果，在推断阶段没有额外的参数和计算成本。我们还广泛展示了本文方法的效力。

2.4网络结构

2.5参数名词解释

由于支持集和查询集的前景是已知的，称之为特定于类，而查询集的背景类是不可知的，称之为不可知类

S：支持集 I: 支持集图像 M:支持集掩膜

Q：同上

查询集预测的掩膜

P,F分别表示原型和特征图

以one-shot为例，训练过程可简化为

input:

goal:

θf为超参数，θl为网络可学习参数

学习一个条件概率质量函数p，来有效分割Iq获得质量好的与mq接近的分割图像

2.6公式介绍

MAP掩膜平均池化，通过将特征图与掩膜图像计算得到支持集的原型ps

将支持集原型reshape之后再与查询集特征进行拼接

使用卷积模板g对融合后的特征进行编码

以下介绍原文中不可知类的原型生成方法公式：

查询特征背景分组

文章认为支持集和查询集里面的前景大致相同，特征类似，但是背景缺没有什么必然联系，于是直接利用查询集特征来估计背景原型。这里没有直接通过MAP来获取背景原型，因为文章认为背景中包含的类是复杂的，其中可能包含多个class,所以通过公式4对背景特征进行分类，其中用到了传统的kmeans聚类的方法
不同类别的背景簇更新

文章通过聚类之后，会将背景分成k个不同的掩膜，但这些掩膜会包含前景掩膜（聚类的效果不好），所以需要进行删除重叠的部分。见公式6：

第三行为聚类结果

将聚类结果再和查询集特征进行MAP计算

以下介绍原文中Feature Alignment for Complete Comparison（用于完全比较的特征对齐：）小节，也就是文章的第二个贡献：利用特定类和不可知类的分支，进行特征对齐。

利用查询集直接生成不可知类的映射
再用卷积对Xqq进行编码

其中θl和等式3中一样，共享

我们开发了类特定的和类不可知的原型，从而构造了完整的特征对（即XSQ和XQQ)，以缓解小样本语义分割中有偏见的分类问题。

这里我的理解是利用一个共享权重的g来对由特定类也就是可知的前景原型来分割得到的结果图和不可知类也就是背景原型来分割得到的结果图，保证这两张图都获得很好的效果（准确且互斥），使这个g也可以很好的分割背景类，以保证这个g不偏向于基类，保证了模型的泛化性

损失函数

一方面需要保证通过特定类的前景原型与查询集特征进行比较来分割查询集前景得到的Msq与标注图像Mq相近，一方面需要保证通过通过查询集聚类得到的不可知类的背景原型与查询集特征进行比较分割得到背景图像Mqq与取反的标注图像（1-Mq)相近。两者都利用交叉熵函数。

如果其中的Lambda 对于0,那么不可知类将不会发生作用

2.7效果展示

总结

感觉这篇文章跟Learning What Not to Segment: A New Perspective on Few-Shot Segmentation还是有点像的，论文提出的问题也有点类似，都认为传统的fss方法偏向于base class导致模型分割精度差，两篇文章都有分割背景类的步骤，APANET在查询分支上通过聚类得到背景类原型，再对背景进行分割。而Learning What Not to Segment则s设计了一个base learner直接将背景类分割出来。从阅读感觉上来说APANET读起来更加难理解，但是仔细阅读之后，感觉里面提及的关于FSS的知识点更加详细，特别是在讲述查询集与支持集中的背景前景的相互关系。是之前没有了解的。

留一个疑问：

其中APANET一开始提出的前背景正负样本的冲突问题总感觉怪怪的，我感觉baseline中这种不同类以前景或背景交互出现，这样才能保证模型的泛化性，才能保证不偏向于基类吧，但是baseline效果为啥差呢，后续再继续研究相关文献，看看能不能理解。

Spring Boot与Hazelcast整合教程嘵奇提升自己 spring boot 后端 java
精心整理了最新的面试资料和简历模板，有需要的可以自行获取点击前往百度网盘获取点击前往夸克网盘获取SpringBoot与Hazelcast整合教程简介Hazelcast是一个开源的内存数据网格（IMDG），提供分布式缓存、计算和数据结构功能。与SpringBoot整合后，可以快速实现分布式缓存、会话共享等功能。本教程将演示如何将Hazelcast嵌入SpringBoot应用。环境准备JDK17+Sp
在html中图像标签是什么意思,在html中图像标签是什么意思李白涛在html中图像标签是什么意思
在html中图像标签是指用于定义图像的标签，即“”标签。img元素可以向网页中嵌入一幅图像，“”标签的作用是为被引用的图像创建占位符，将图像链接到HTML页面上。本教程操作环境：windows7系统、CSS3&&HTML5版、DellG3电脑。在html中图像标签是指用于定义图像的标签，即“”标签。HTML标签标签定义HTML页面中的图像。标签有两个必需的属性：src和alt。注释：从技术上讲，图
深度学习模型性能全景评估与优化指南 niuTaylor 深度学习人工智能
深度学习模型性能全景评估与优化指南一、算力性能指标体系1.核心算力指标对比指标计算方式适用场景硬件限制TOPS(TeraOperationsPerSecond)每秒万亿次整数运算量化模型推理NVIDIAJetsonNano仅支持FP16/FP32TFLOPS(TeraFLoating-pointOPerationsperSecond)TFLOPS=Cores×FLOPs/Cycle×Frequen
MATLAB 和 Arduino 之间的串行通信 David WangYang matlab matlab
MATLAB和Arduino之间的串行通信MATLAB是一款多功能软件，可用于各种应用。在前面的MATLAB教程中，我们已经解释了如何使用MATLAB控制直流电机、伺服电机和家用电器。在本教程中，我们将学习如何使用MATLAB进行串行通信。对于串行通信的接收端，我们在这里使用
车牌识别技术揭秘：如何用 C# 实现自动车牌识别系统威哥说编程 c#开发语言
车牌识别（LicensePlateRecognition，LPR）是一项计算机视觉技术，用于自动识别车辆的车牌号码。在实际应用中，车牌识别技术被广泛用于停车场管理、交通监控和安防系统等领域。实现车牌识别系统的关键步骤包括图像预处理、车牌检测、字符分割、字符识别等。C#中可以通过结合OpenCV、EmguCV、TesseractOCR等工具来实现车牌识别系统。一、所需工具和库EmguCV：这是一个封
从零开始：使用原生JS打造简易飞机大战游戏西域情歌
本文还有配套的精品资源，点击获取简介：在本教程中，我们将探讨如何利用原生JavaScript的特性，包括事件处理、DOM操作、定时器和音频处理，来构建一个基础的“飞机大战”游戏。该游戏的核心元素包括玩家飞机、敌机、子弹和碰撞检测，它们通过HTML和CSS展现在页面上。通过编写JavaScript脚本，我们实现游戏对象的创建与状态管理，响应用户的键盘和点击事件，更新游戏内容，并通过定时器维护游戏循环
利用Python和深度学习方法实现手写数字识别的高精度解决方案——从数据预处理到模型优化的全流程解析快撑死的鱼 Python算法精解 python 深度学习开发语言
利用Python和深度学习方法实现手写数字识别的高精度解决方案——从数据预处理到模型优化的全流程解析在人工智能的众多应用领域中，手写数字识别是一项经典且具有重要实际应用价值的任务。随着深度学习技术的飞速发展，通过构建和训练神经网络模型，手写数字识别的精度已经可以达到99%以上。本文将以Python为主要编程语言，结合深度学习的核心技术，详细解析手写数字识别的实现过程，并探讨如何进一步优化模型以提高
强化学习中的深度卷积神经网络设计与应用实例数字扫地僧计算机视觉 cnn 人工智能神经网络
I.引言强化学习（ReinforcementLearning，RL）是机器学习的一个重要分支，通过与环境的交互来学习最优策略。深度学习，特别是深度卷积神经网络（DeepConvolutionalNeuralNetworks，DCNNs）的引入，为强化学习在处理高维度数据方面提供了强大工具。本文将探讨强化学习中深度卷积神经网络的设计原则及其在不同应用场景中的实例。II.深度卷积神经网络在强化学习中的
从零至巅：逆向爬虫之道 0_0 蓝花楹下逆向爬虫爬虫
逆向爬虫-涅槃吾本一介凡鸟，栖于尘世，碌碌无为，浑浑噩噩，如沧海一粟，渺小而无足轻重。然，虽为小雀，心亦怀鸿鹄之志，欲挥羽向天，如凤凰般，翱翔九天，俯瞰苍茫大地。奈何羽翼未丰，学识浅薄，常感力不从心，困于樊笼，不得展翅高飞。然，吾深知，学如逆水行舟，不进则退。故，今执笔为记，以明志，以自勉。愿以此笔记为舟，载吾渡学海，以勤为桨，以思为帆，逐浪前行，终至彼岸。虽前路漫漫，荆棘丛生，然吾心坚定，誓不负
原子操作和互斥锁哪个更高效？原子操作
原子操作和互斥锁都是并发编程中用于同步和保护共享数据的重要工具，但它们的效率和适用场景有所不同。以下是对原子操作和互斥锁的比较，以及它们在不同场景下的性能表现：原子操作原子操作是通过硬件指令实现的，确保对共享数据的访问和修改是不可分割的。C++中的std::atomic提供了原子操作的支持。优点无锁机制：原子操作不需要锁，因此不会引入锁的开销，也不会导致线程阻塞。高效率：对于简单的数据类型（如in
使用 Arduino 和 Wi-Fi 的 Web 控制伺服 David WangYang ESP8266项目前端硬件工程
使用Arduino和Wi-Fi的Web控制伺服在这篇文章中，我们将在Arduino和Wi-Fi模块ESP8266的帮助下使用Web浏览器控制伺服电机。ESP8266将在舵机和web浏览器通过IP地址建立连接，然后通过移动web页面上的Slider，舵机将相应地移动。即使通过在路由器中设置PortForwarding，您也可以从世界任何地方通过Internet控制Servo，我们将在本教程后面解释。
腾讯云大模型知识引擎与DeepSeek：打造懒人专属的谷歌浏览器翻译插件大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 腾讯云云计算
摘要：随着人工智能技术的飞速发展，越来越多的前沿技术和工具已走入日常生活。翻译工具作为跨语言沟通的桥梁，一直处于技术创新的风口浪尖。本文探讨了腾讯云大模型知识引擎与DeepSeek结合谷歌浏览器插件的可能性，旨在为用户提供一种便捷、高效的翻译体验。通过应用深度学习、自然语言处理和知识图谱技术，该插件不仅能实时翻译网页内容，还能根据上下文进行智能推荐，实现精准的语境转换。本文将详细阐述其设计思路、技
FPGA基带平台射频数据处理装置及验证系统设计与方法 BE东欲
本文还有配套的精品资源，点击获取简介：FPGA在射频数据处理领域拥有灵活性和高性能，广泛用于通信、雷达、卫星导航等。本资料包重点介绍FPGA基带平台在数字信号处理中的应用，包括调制解调、滤波和FFT等任务。涵盖射频数据处理装置结构，验证系统设计和实施，以及相关工具的使用方法。为学习者提供实践经验和理论知识，助力开发高效可靠的通信系统。1.FPGA在射频数据处理中的应用数字信号处理（DSP）是现代电
PyTorch深度学习框架60天进阶学习计划 - 第28天：多模态模型实践（二）凡人的AI工具箱深度学习 pytorch 学习 AI编程人工智能 python
PyTorch深度学习框架60天进阶学习计划-第28天：多模态模型实践（二）5.跨模态检索系统应用场景5.1图文匹配系统的实际应用应用领域具体场景优势电子商务商品图像搜索、视觉购物用户可以上传图片查找相似商品或使用文本描述查找商品智能媒体内容推荐、图片库搜索通过内容的语义理解提供更精准的推荐和搜索社交网络基于内容的帖子推荐理解用户兴趣，提供更相关的内容推荐教育技术多模态教学资源检索教师和学生可以更
PyTorch深度学习框架60天进阶学习计划 - 第28天：多模态模型实践（一）凡人的AI工具箱深度学习 pytorch 学习 AI编程人工智能 python
PyTorch深度学习框架60天进阶学习计划-第28天：多模态模型实践（一）引言：跨越感知的边界欢迎来到我们的PyTorch学习旅程第28天！今天我们将步入AI世界中最激动人心的领域之一：多模态学习。想象一下，如果你的模型既能"看"又能"读"，并且能够理解图像与文字之间的联系，这将为我们打开怎样的可能性？今天我们将专注于构建图文匹配系统，学习如何使用CLIP（ContrastiveLanguage
基于FPGA的3U机箱温度采集板PT100，应用于轨道交通/电力储能等深圳信迈主板定制专家轨道交通 NXP+FPGA X86+FPGA fpga开发 arm开发架构人工智能
板卡简介：本板为温度采集板（PT100），对目标进行测温，然后将温度转换成处理器可识别的电流信号。性能规格：电源：DC5V，DC±15V4线制PT100：7路（标称测温范围-50℃~200℃，对应调理后电流4~20mA，精度±0.5℃）3线制PT100：1路（标称测温范围-50℃~200℃，对应调理后电流4~20mA，精度±0.5℃）尺寸：220mm*100mm*1.6mm重量：0.155kg工作
基于MPC8377的MCPU 3U机箱CPCI板卡 ARM+FPGA+AI工业主板定制专家轨道交通 linux Codesys RK3568 PLC RK3588
板卡简介：本板为主控板（MCPU），主要负责逻辑控制、数据的处理、板卡的通信管理、系统安全保护切换以及数据存储等功能。性能规格：电源：DC5VCPU：MPC8377核数：单核32位主频：667MHzMCU：MK60DN512VLL10FPGA：XC6SLX16-2FT256I存储：DDR2256Mb（CPU）PROM16MB（FPGA）NVSRAM512KB（CPU和FPGA共享）NORFLASH
10.2 如何解决从复杂 PDF 文件中提取数据的问题？墨染辉大语言模型 pdf
10.2如何解决从复杂PDF文件中提取数据的问题？解决方案：嵌入式表格检索解释：嵌入式表格检索是一种专门针对从复杂PDF文件中的表格提取数据的技术。它结合了表格识别、解析和语义理解，使得从复杂结构的表格中检索信息成为可能。具体步骤：表格检测和识别：目标：在PDF页面中准确地定位和识别表格区域。方法：使用计算机视觉和深度学习技术，如卷积神经网络（CNN）或其他先进的图像处理算法。效果：能够检测出页面
YashanDB备份数据库
本文内容来自YashanDB官网，原文内容请见https://doc.yashandb.com/yashandb/23.3/zh/%E6%95%B0%E6%8D%AE%...操作说明使用本方式执行备份时，要求数据库运行于OPEN状态且归档模式开启。备份命令仅SYS超级用户或拥有SYSDBA、SYSBACKUP权限的用户才可执行，备份语法详细说明请参考开发手册BACKUPDATABASE。若数据库在
YashanDB恢复数据库
本文内容来自YashanDB官网，原文内容请见https://doc.yashandb.com/yashandb/23.3/zh/%E6%95%B0%E6%8D%AE%...操作说明使用本方式执行恢复时，要求当前数据库实例处于NOMOUNT状态。执行恢复操作的数据库版本需与生成备份集的数据库版本完全一致。共享集群部署中，只能在主集群上执行恢复操作（即其角色必须为MASTER\_ROLE，可查询视图
211 本硕研三，已拿 C++ 桌面应用研发 offer，计划转音视频或嵌入式如何规划学习路线？程序员yt c++音视频学习
今天给大家分享的是一位粉丝的提问，211本硕研三，已拿C++桌面应用研发offer，计划转音视频或嵌入式如何规划学习路线？接下来把粉丝的具体提问和我的回复分享给大家，希望也能给一些类似情况的小伙伴一些启发和帮助。同学提问：前辈您好，我是211本硕，目前研三，秋招拿到C++桌面应用研发的offer，但计划的这个岗位最多干3-4年左右，后续企业规划上想往音视频开发或嵌入式上转；个人感觉C++八股，算法
TensorFlow深度学习实战项目：从入门到精通点我头像干啥 Ai 深度学习 tensorflow 人工智能
引言深度学习作为人工智能领域的一个重要分支，近年来取得了显著的进展。TensorFlow作为Google开源的深度学习框架，因其强大的功能和灵活的架构，成为了众多开发者和研究者的首选工具。本文将带领大家通过一个实战项目，深入理解TensorFlow的使用方法，并掌握深度学习的基本流程。1.TensorFlow简介1.1TensorFlow是什么？TensorFlow是一个开源的机器学习框架，由Go
MySQL学习路线蜡笔小新星 MySQL 数据库 mysql 学习经验分享
本专栏纯干货订阅专栏不迷路以下是一个详细的MySQL学习路线，适合从初学者到中高级用户的逐步学习。整个路线分为几个阶段，每个阶段包含了必要的知识点和学习材料。第一阶段：基础知识（1-2周）目标：了解数据库的基本概念，熟悉MySQL的基本用法。学习内容：数据库基础什么是数据库、数据库管理系统（DBMS）数据库的类型（关系型数据库与非关系型数据库）SQL（结构化查询语言）概述MySQL入门MySQL的
国外7个最佳大语言模型 (LLM) API推荐幂简集成 API新理念语言模型人工智能自然语言处理
大型语言模型(LLM)API将彻底改变我们处理语言的方式。在深度学习和机器学习算法的支持下，LLMAPI提供了前所未有的自然语言理解能力。通过利用这些新的API，开发人员现在可以创建能够以前所未有的方式理解和响应书面文本的应用程序。下面，我们将比较从Bard到ChatGPT、PaLM等市场上顶级LLMAPI。我们还将探讨整合这些LLM的潜在用例，并考虑其对语言处理的影响。什么是大语言模型(LLM)
【深度学习】DeepSeek模型介绍与部署 Nerous_ 深度学习深度学习人工智能
原文链接：DeepSeek-V31.介绍DeepSeek-V3，一个强大的混合专家(MoE)语言模型，拥有671B总参数，其中每个token激活37B参数。为了实现高效推理和成本效益的训练，DeepSeek-V3采用了多头潜在注意力(MLA)和DeepSeekMoE架构，这些架构在DeepSeek-V2中得到了充分验证。此外，DeepSeek-V3首次提出了无辅助损失的负载平衡策略，并设置了多to
【深度学习】 PyTorch一文详解 Nerous_ 深度学习深度学习 pytorch 人工智能机器学习 python
“PyTorchisadeeplearningframeworkthatprioritizessimplicityandflexibility,makingitthego-tochoiceforbothresearchersanddevelopers.”—Anonymous1.PyTorch简介1.1PyTorch的背景与发展PyTorch是由Facebook人工智能研究院（FAIR）开发的一个开
【DNN量化工具】QKeras 工具简介 kanhao100 笔记 dnn 人工智能神经网络
QKeras工具简介QKeras是一个用于量化深度学习模型的Keras扩展库，旨在使深度学习模型的量化（即将模型的浮点权重转换为低精度格式）变得简单而高效。QKeras主要目标是优化模型的存储和推理速度，特别适用于需要在资源受限的设备（如移动设备和嵌入式系统）上运行深度学习模型的场景。QKeras的主要特点量化支持：QKeras提供了对不同类型量化的支持，包括权重量化和激活量化。用户可以根据需求选
Softmax温度调节与注意力缩放：深度神经网络中的平滑艺术 Mark White dnn 人工智能神经网络
Softmax温度调节与注意力缩放：深度神经网络中的平滑艺术在深度学习的精密机械中，有些细微的调整机制往往被视为理所当然，却实际上蕴含着深刻的数学洞察和巧妙的工程智慧。今天，我们将探讨两个看似独立却本质相通的机制：生成模型中的温度参数与Transformer注意力机制中的缩放因子。这两个设计都围绕着同一个核心概念——softmax分布的平滑控制。Softmax函数：概率分布的催化剂在深入讨论之前，
mysql修改表中所有字段不许为空_如何用SQL语句修改一个表的字段，让它不能为空... Asama浅间
展开全部ALTERTABLE表ALTERCOLUMN[字段名]字段类型NOTNULLSQL语句1、基32313133353236313431303231363533e78988e69d8331333365643661本介绍：sql语句是对数据库进行操作的一种语言。结构化查询语言(StructuredQueryLanguage)简称SQL，结构化查询语言是一种数据库查询和程序设计语言，用于存取数据以
GS-SLAM论文阅读笔记-MGSO zenpluck GS论文阅读论文阅读笔记
前言MGSO首字母缩略词是直接稀疏里程计(DSO)，我们建立的光度SLAM系统和高斯飞溅(GS)的混合。这应该是第一个前端用DSO的高斯SLAM，不知道这个系统的组合能不能打得过ORB-SLAM3，以及对DSO会做出怎么样的改进以适应高斯地图，接下来就看一下吧！GishelloG^s_ihelloGishello我是红色文章目录前言1.背景介绍2.关键内容2.1SLAMmodule2.2Dense
Spring中@Value注解，需要注意的地方无量 spring bean @Value xml
Spring 3以后,支持@Value注解的方式获取properties文件中的配置值，简化了读取配置文件的复杂操作 1、在applicationContext.xml文件(或引用文件中)中配置properties文件 <bean id="appProperty" class="org.springframework.beans.fac
mongoDB 分片开窍的石头 mongodb
mongoDB的分片。要mongos查询数据时候先查询configsvr看数据在那台shard上，configsvr上边放的是metar信息，指的是那条数据在那个片上。由此可以看出mongo在做分片的时候咱们至少要有一个configsvr,和两个以上的shard（片）信息。第一步启动两台以上的mongo服务 &nb
OVER(PARTITION BY)函数用法 0624chenhong oracle
这篇写得很好，引自 http://www.cnblogs.com/lanzi/archive/2010/10/26/1861338.html OVER(PARTITION BY)函数用法 2010年10月26日 OVER(PARTITION BY)函数介绍开窗函数 &nb
Android开发中，ADB server didn't ACK 解决方法一炮送你回车库 Android开发
首先通知：凡是安装360、豌豆荚、腾讯管家的全部卸载，然后再尝试。一直没搞明白这个问题咋出现的，但今天看到一个方法，搞定了！原来是豌豆荚占用了 5037 端口导致。参见原文章：一个豌豆荚引发的血案——关于ADB server didn't ACK的问题简单来讲，首先将Windows任务进程中的豌豆荚干掉，如果还是不行，再继续按下列步骤排查。 &nb
canvas中的像素绘制问题换个号韩国红果果 JavaScript canvas
pixl的绘制，1.如果绘制点正处于相邻像素交叉线，绘制x像素的线宽，则从交叉线分别向前向后绘制x/2个像素，如果x/2是整数，则刚好填满x个像素，如果是小数，则先把整数格填满，再去绘制剩下的小数部分，绘制时，是将小数部分的颜色用来除以一个像素的宽度，颜色会变淡。所以要用整数坐标来画的话（即绘制点正处于相邻像素交叉线时），线宽必须是2的整数倍。否则会出现不饱满的像素。 2.如果绘制点为一个像素的
编码乱码问题灵静志远 java jvm jsp 编码
1、JVM中单个字符占用的字节长度跟编码方式有关，而默认编码方式又跟平台是一一对应的或说平台决定了默认字符编码方式；2、对于单个字符：ISO-8859-1单字节编码，GBK双字节编码，UTF-8三字节编码；因此中文平台(中文平台默认字符集编码GBK)下一个中文字符占2个字节，而英文平台(英文平台默认字符集编码Cp1252(类似于ISO-8859-1))。 3、getBytes()、getByte
java 求几个月后的日期 darkranger calendar getinstance
Date plandate = planDate.toDate(); SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd"); Calendar cal = Calendar.getInstance(); cal.setTime(plandate); // 取得三个月后时间 cal.add(Calendar.M
数据库设计的三大范式（通俗易懂） aijuans 数据库复习
关系数据库中的关系必须满足一定的要求。满足不同程度要求的为不同范式。数据库的设计范式是数据库设计所需要满足的规范。只有理解数据库的设计范式，才能设计出高效率、优雅的数据库，否则可能会设计出错误的数据库. 目前，主要有六种范式：第一范式、第二范式、第三范式、BC范式、第四范式和第五范式。满足最低要求的叫第一范式，简称1NF。在第一范式基础上进一步满足一些要求的为第二范式，简称2NF。其余依此类推。
想学工作流怎么入手 atongyeye jbpm
工作流在工作中变得越来越重要，很多朋友想学工作流却不知如何入手。很多朋友习惯性的这看一点，那了解一点，既不系统，也容易半途而废。好比学武功，最好的办法是有一本武功秘籍。研究明白，则犹如打通任督二脉。系统学习工作流，很重要的一本书《JBPM工作流开发指南》。本人苦苦学习两个月，基本上可以解决大部分流程问题。整理一下学习思路，有兴趣的朋友可以参考下。 1 首先要
Context和SQLiteOpenHelper创建数据库百合不是茶 android Context创建数据库
一直以为安卓数据库的创建就是使用SQLiteOpenHelper创建,但是最近在android的一本书上看到了Context也可以创建数据库,下面我们一起分析这两种方式创建数据库的方式和区别,重点在SQLiteOpenHelper 一:SQLiteOpenHelper创建数据库: 1,SQLi
浅谈group by和distinct bijian1013 oracle 数据库 group by distinct
group by和distinct只了去重意义一样，但是group by应用范围更广泛些，如分组汇总或者从聚合函数里筛选数据等。譬如：统计每id数并且只显示数大于3 select id ,count(id) from ta
vi opertion 征客丶 mac opration vi
进入 command mode （命令行模式）按 esc 键再按 shift + 冒号注：以下命令中带 $ 【在命令行模式下进行】，不带 $ 【在非命令行模式下进行】一、文件操作 1.1、强制退出不保存 $ q! 1.2、保存 $ w 1.3、保存并退出 $ wq 1.4、刷新或重新加载已打开的文件 $ e 二、光标移动 2.1、跳到指定行数字
【Spark十四】深入Spark RDD第三部分RDD基本API bit1129 spark
对于K/V类型的RDD,如下操作是什么含义？ val rdd = sc.parallelize(List(("A",3),("C",6),("A",1),("B",5)) rdd.reduceByKey(_+_).collect reduceByKey在这里的操作，是把
java类加载机制 BlueSkator java 虚拟机
java类加载机制 1.java类加载器的树状结构引导类加载器 ^ | 扩展类加载器 ^ | 系统类加载器 java使用代理模式来完成类加载，java的类加载器也有类似于继承的关系，引导类是最顶层的加载器，它是所有类的根加载器，它负责加载java核心库。当一个类加载器接到装载类到虚拟机的请求时，通常会代理给父类加载器，若已经是根加载器了，就自己完成加载。虚拟机区分一个Cla
动态添加文本框 BreakingBad 文本框
<script> var num=1; function AddInput() { var str=""; str+="<input
读《研磨设计模式》-代码笔记-单例模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ public class Singleton { } /* * 懒汉模式。注意，getInstance如果在多线程环境中调用，需要加上synchronized，否则存在线程不安全问题 */ class LazySingleton
iOS应用打包发布常见问题 chenhbc ios iOS发布 iOS上传 iOS打包
这个月公司安排我一个人做iOS客户端开发，由于急着用，我先发布一个版本，由于第一次发布iOS应用，期间出了不少问题，记录于此。 1、使用Application Loader 发布时报错：Communication error.please use diagnostic mode to check connectivity.you need to have outbound acc
工作流复杂拓扑结构处理新思路 comsci 设计模式工作算法企业应用 OO
我们走的设计路线和国外的产品不太一样，不一样在哪里呢？国外的流程的设计思路是通过事先定义一整套规则(类似XPDL)来约束和控制流程图的复杂度(我对国外的产品了解不够多，仅仅是在有限的了解程度上面提出这样的看法)，从而避免在流程引擎中处理这些复杂的图的问题，而我们却没有通过事先定义这样的复杂的规则来约束和降低用户自定义流程图的灵活性，这样一来，在引擎和流程流转控制这一个层面就会遇到很
oracle 11g新特性Flashback data archive daizj oracle
1. 什么是flashback data archive Flashback data archive是oracle 11g中引入的一个新特性。Flashback archive是一个新的数据库对象，用于存储一个或多表的历史数据。Flashback archive是一个逻辑对象，概念上类似于表空间。实际上flashback archive可以看作是存储一个或多个表的所有事务变化的逻辑空间。
多叉树:2-3-4树 dieslrae 树
平衡树多叉树,每个节点最多有4个子节点和3个数据项,2,3,4的含义是指一个节点可能含有的子节点的个数,效率比红黑树稍差.一般不允许出现重复关键字值.2-3-4树有以下特征: 1、有一个数据项的节点总是有2个子节点(称为2-节点) 2、有两个数据项的节点总是有3个子节点(称为3-节
C语言学习七动态分配 malloc的使用 dcj3sjt126com c language malloc
/* 2013年3月15日15:16:24 malloc 就memory(内存) allocate(分配)的缩写本程序没有实际含义，只是理解使用 */ # include <stdio.h> # include <malloc.h> int main(void) { int i = 5; //分配了4个字节静态分配 int * p
Objective-C编码规范[译] dcj3sjt126com 代码规范
原文链接 : The official raywenderlich.com Objective-C style guide 原文作者 : raywenderlich.com Team 译文出自 : raywenderlich.com Objective-C编码规范译者 : Sam Lau
0.性能优化-目录 frank1234 性能优化
从今天开始笔者陆续发表一些性能测试相关的文章，主要是对自己前段时间学习的总结，由于水平有限，性能测试领域很深，本人理解的也比较浅，欢迎各位大咖批评指正。主要内容包括：一、性能测试指标吞吐量、TPS、响应时间、负载、可扩展性、PV、思考时间 http://frank1234.iteye.com/blog/2180305 二、性能测试策略生产环境相同基准测试预热等 htt
Java父类取得子类传递的泛型参数Class类型 happyqing java 泛型父类子类 Class
import java.lang.reflect.ParameterizedType; import java.lang.reflect.Type; import org.junit.Test; abstract class BaseDao<T> { public void getType() { //Class<E> clazz =
跟我学SpringMVC目录汇总贴、PDF下载、源码下载 jinnianshilongnian springMVC
----广告-------------------------------------------------------------- 网站核心商详页开发掌握Java技术，掌握并发/异步工具使用，熟悉spring、ibatis框架；掌握数据库技术，表设计和索引优化，分库分表/读写分离；了解缓存技术，熟练使用如Redis/Memcached等主流技术；了解Ngin
the HTTP rewrite module requires the PCRE library 流浪鱼 rewrite
./configure: error: the HTTP rewrite module requires the PCRE library. 模块依赖性Nginx需要依赖下面3个包 1. gzip 模块需要 zlib 库 ( 下载: http://www.zlib.net/ ) 2. rewrite 模块需要 pcre 库 ( 下载: http://www.pcre.org/ ) 3. s
第12章 Ajax（中） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Optimize query with Query Stripping in Web Intelligence blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Optimize+query+with+Query+Stripping+in+Web+Intelligence and a very straightfoward video http://www.sdn.sap.com/irj/scn/events?rid=/library/uuid/40ec3a0c-936
Java开发者写SQL时常犯的10个错误 tomcat_oracle java sql
1、不用PreparedStatements 　　有意思的是，在JDBC出现了许多年后的今天，这个错误依然出现在博客、论坛和邮件列表中，即便要记住和理解它是一件很简单的事。开发者不使用PreparedStatements的原因可能有如下几个：　　他们对PreparedStatements不了解　　他们认为使用PreparedStatements太慢了　　他们认为写Prepar
世纪互联与结盟有感阿尔萨斯
10月10日，世纪互联与（Foxcon）签约成立合资公司，有感。全球电子制造业巨头（全球500强企业）与世纪互联共同看好IDC、云计算等业务在中国的增长空间，双方迅速果断出手，在资本层面上达成合作，此举体现了全球电子制造业巨头对世纪互联IDC业务的欣赏与信任，另一方面反映出世纪互联目前良好的运营状况与广阔的发展前景。众所周知，精于电子产品制造（世界第一），对于世纪互联而言，能够与结盟