hellopipu

[调研] 通用实例分割方法

目前的实例分割方法可分为3类：

top-down，也叫做 detect-then-segment，顾名思义，先检测后分割，如FCIS, Mask-RCNN, PANet, Mask Scoring R-CNN；
bottom-up，也叫Embedding-cluster，将每个实例看成一个类别；然后按照聚类的思路，最大类间距，最小类内距，对每个像素做embedding，最后做grouping分出不同的instance。Grouping的方法：learned associative embedding，A discriminative loss function，SGN，SSAP. 一般bottom-up效果差于top-down；
direct的方法。不同与上述两类方法，直接得到实例分割结果，如SOLO。

目录

Deep Snake for Real-Time Instance Segmentation [2001]
PointRend: Image Segmentation as Rendering [1912]
SOLO: Segmenting Objects by Locations [1912]
FCOS: Fully Convolutional One-Stage Object Detection [1904]
TensorMask: A Foundation for Dense Object Segmentation [1903]
Hybrid Task Cascade for Instance Segmentation [1901]
Path Aggregation Network for Instance Segmentation [1803]
Mask R-CNN [1703]
Fully Convolutional Instance-aware Semantic Segmentation [1611]
Deep Watershed Transform for Instance Segmentation [1611]
InstanceCut: from Edges to Instances with MultiCut [1611]
Instance-sensitive Fully Convolutional Networks [1603]
SGN: Sequential Grouping Networks for Instance Segmentation [16XX]

Deep Snake for Real-Time Instance Segmentation [2001]

物体轮廓用循环卷积来学习特征确定offset

文章提出two-stage、real-time的instance segmentation方法：1、得到初始的目标轮廓；2、轮廓迭代变形，以得到最终精准的目标边界；

不同于CornerNet、ExtremeNet等方法直接回归目标边界上的点，受到传统snake算法的启发，Deep Snake 通过迭代变形一个初始轮廓来得到最终的目标边界；文章使用循环卷积来学习目标轮廓的结构特征；对512x512大小的图片在1080Ti上达到32.3 fps

先得到检测框，再得到diamond框，学习offset得到四个极点，得到octagon 轮廓；输入到 deep snake，学习边缘；

PointRend: Image Segmentation as Rendering [1912]

方法：对输出的coarse mask 和 fine-grained 特征选部分点进行学习，用提出的subdivision mask rendering算法迭代，得到不确定边界区域的mask

Render方法：subdivision 、adaptive sampling、 ray-tracing
Subdivision: 只在（与周围区域十分不同的）区域计算；其他区域直接插值；
如何选点：将coarse mask 上采样X2；选择p接近0.5的N个点；用MLP得到这N个点预测值；一直迭代，直到到达某一分辨率；

但训练阶段，不采用迭代的方式训练；而是使用随机采样

SOLO: Segmenting Objects by Locations [1912]

现有方法分为两类：
top-down，也叫做 detect-then-segment，顾名思义，先检测后分割，如FCIS, Mask-RCNN, PANet, Mask Scoring R-CNN、TensorMask
bottom-up，也叫Embedding-cluster，将每个实例看成一个类别；然后按照聚类的思路，最大类间距，最小类内距，对每个像素做embedding，最后做grouping分出不同的instance。Grouping的方法：learned associative embedding，A discriminative loss function，SGN，SSAP. 一般bottom-up效果差于top-down。

但这些方法是two-step而且indirect。我们思考12，不同的instance的真正区别是什么，我们的答案是 location 和 object size。

Location：将图像分成S*S个cell，就形成了S^2个location类别；网络输出的一个channel就代表了一个location类别；相应的这个channel map就输出属于这个location类别的instance。
将每个像素分类到不同的location class，等价于对每个像素的中心位置做回归；相比起回归；用分类来做对位置预测的任务，更加直观，且用固定的channel能预测不同数量的instance。且不需要grouping或者embedding的后处理。

Size：FPN做不同大小的类别，不同的level预测不同的大小

传统卷积是spatial invariant，但这里需要position sensitive.受CoordConv启发，直接把归一化坐标信息与特征拼接（简单易行）。
最后接NMS后输出实例分割结果。
FPN-backbone + prediction head –{ semantic category
---------------------------------------------- { instance mask

为验证方法有效性，选择了不同backbone+head+loss来进行试验。
标签赋值：Center sampling (在FCOS2019, Beyond anchor-based中都有使用)
中心区域定义：(cx, cy, εw, εh) ，ε=0.2，平均有3个positive sample

损失函数：category的focal 分类损失+ mask的分割损失（DICE）
在MS-COCO上与其他方法对比结果：

用FPN比直接设置grid num效果好很多✅

FPN各level的grid num

COORDCONV作用：

Decoupled方法

GPU显存更少

速度：
SOLO – RESNET-50 Speed 12FPS ON V100

FCOS: Fully Convolutional One-Stage Object Detection [1904]

Method：不预测检测框；而是直接预测点距离四个边的距离

Centerness：一个branch抑制离中心点远的低质量proposal；训练时，计算；(l,t,r,b)为该点距离四个边的距离；不同level使用同一head对性能不太好，添加一个可学习的参数s用于回归，使得性能略微上升

CE作为loss；测试时，nms抑制低的得分。
同一点对应不同目标，可以用FPN解决；不同level预测不同scale

TensorMask: A Foundation for Dense Object Segmentation [1903]

滑动窗目标检测；dense sliding-window instance segmentation network
利用滑窗来寻找物体，是CV中古老又传统的方法。
Insight：
Faster-rcnn、mask-rcnn都是用滑窗检测出候选框，再用refinement net来进一步挑选；
SSD和RetinaNet舍弃了refinement，直接用滑窗得到检测结果。然而目前这类方法没有拓展到instance 分割上。本文即填补这个gap
方法：
定义 nature representation 与 aligned representation

方法总结：精度比不过mask rcnn，而且还慢3倍；

Hybrid Task Cascade for Instance Segmentation [1901]

Insight:充分利用detection与segmentation的相互(reciprocal)关系设计级联方式

现有方法粗略分为两类：
detection-based：detector先产生bbox或region proposal，再在区域内预测mask；
segmentation-based：

method：
交织进行bbox 回归与mask预测，而非并行
Mask brainch，上阶段信息直接输入到当前；
加入了额外的语义分割branch，并融入到bbox与mask branch中
这些改进改善了stage以及task的信息流

速度、性能比较：

CASCADE R-CNN: iou=0.5 ，FP多，iou升高，性能下降；原因：1、由于指数消失的正样本导致过拟合；2、训练与测试的mismatch（即在train上取得最佳的IOU阈值对inference时产生的proposal并不能很好地进行回归）
方法：级连不同iou的detector；iou逐渐升高；

Path Aggregation Network for Instance Segmentation [1803]

PANET CVPR2018
关键词：information flow
1st place in the COCO 2017 Challenge Instance Segmentation task
Method：bottom-up path + adaptive feature pooling + mask branch中添加了 fc；

Mask R-CNN [1703]

FPN + FPN + ROI Align + 3 branch （class, mask , box ）
FCIS缺点：重叠instance、虚假边缘

实验：cityscape + coco

Fully Convolutional Instance-aware Semantic Segmentation [1611]

FCIS. : 首个端到端的实例分割网路；CVPR2017 spotlight
检测与分割同时进行. 用RPN代替sliding window。
此前的技术分为三步：1、FCN提取特征；2、将每个ROI pooling成相同尺寸的特征图；3、全连接层输出ROI mask。注意：translation-variant在fc上引入。
缺点如下：1、ROIpooling损失空间细节；2、使用fc层参数量过多；3、最后一步每个ROI之间的计算不共享；
Method：
position-sensitive score map
joint mask prediction and classification
RPN得到的检测框，直接在score map上裁剪，特征图一半(inside)做softmax得到实例分割图；特征图另一半(outside)max + avg Pooling + softmax，判断是否为instance
inside score：像素在目标内 segment+
outside score:像素在目标外 segment-

总共有3个loss， C+1类的检测loss，分割loss以及bbox的回归loss
实验：pascal+coco

Deep Watershed Transform for Instance Segmentation [1611]

需要好的语义分割图像（由PSPNet得到）；
优点：适合学习相互连接的物体
缺点：遮挡、重叠；学不到实例类别；性能比mask-rcnn差很多
方法：网络学习分水岭变换；得到能量图，再根据能量图，直接得到每个实例：DN net （梯度图，单位向量，得到2维）+ WT net （能量图）

InstanceCut: from Edges to Instances with MultiCut [1611]

方法：输出语义分割图+所有instance的边界— 之后用MultiCut来分割最终的instance； instance-aware；
ituition ： Semantic seg 的中间特征可以用来学习edge
数据：cityscape，8个类别；2975 images for training, 500 for validation and 1525 for testing

Instance-sensitive Fully Convolutional Networks [1603]

ECCV2016
优点：普通卷积有平移不变形，同一位置，响应总是一样，这阻碍了实例分割；为此文章引入instance-sensitive score map，同一个像素，因为相对位置发生了变化，选择了不同的score map的值，因此有了translation-variant。
缺点：1、非端到端的实例分割；因为无法判断instance分割的语义类别；2、固定的224大小滑窗+ image pyramid scanning，十分耗费时间；
细节：测试训练都使用多尺度

基于像素的相对位置来进行分类，从而产生一些instance-sensitive的score map，后续通过一个简单的assembling module来得到最终的instance分割结果

具体实现上，特征提取使用VGG16网络，输出特征(H/8,W/8)；第一个分支，经过两个卷积，先输出K^2个score map (K=5)，用mXm的滑动窗用assemble 得到instance，再从得到的instance里面随机抽样256个，这些instance 和instance的分割gt计算loss；

第二个分支，预测分支一得到256个instance是真正的instance 的概率，计算loss；

测试阶段：
对分支一上sliding window得到的instance score map，先二值化，再用分支二的概率以及instance的box的iou来做NMS，最后选择top-N作为最终结果。

预处理上，scale jittering在多篇文章中大量运用；

SGN: Sequential Grouping Networks for Instance Segmentation [16XX]

ICCV17 ; 内容过于繁琐，且无开源代码
Insight:点成线；线成面
Method：一串子网络逐渐完成任务；
子网络1:水平以及垂直预测breakpoints；产生线的分割
子网络2:将线分割连成联通的区域；将对pixel的分类降维成对线的分类；RNN网络 LineNet（很小）;输入为9个通道
子网络3:连通区域形成最后instance； MergerNet（很小）

1、每个像素额外标注成background，interior，starting point，termination point
2、水平、垂直两个方向成线

你可能感兴趣的:(论文笔记,调研综述,计算机视觉,实例分割)

山东大学小树林支教调研团青青仓木队——翟晓楠山东大学青青仓木队
过了半年，又一次启程，又一次回到支教的初心之地。比起上一次的试探与不安，我更多了一丝稳重与熟练。心境、处境也都随着半个学期的过去而变得不同，半个学期中，身体上的，心理上的，太多的逆境让我变得步履维艰，曲曲折折，弯弯绕绕，我仿佛打不起精神，没有胃口，没有动力。感觉走的不顺畅的时候，支教这个旅程，给了我力量。自告奋勇承担起队长这一职务的我，从组织时的复杂和困难的经历，协调各种问题，从无到有，和校长和队
把握“三度”打造“三有”干部队伍辛德瑞拉卡卡卡
“胜败兴亡之分，不得不归咎于人事也”。干部队伍建设工作的好坏，关系到党和国家的发展全局。近日，新疆维吾尔自治区党委书记马兴瑞在部分党群单位走访调研时强调，要努力培养造就忠诚干净担当的高素质专业化干部队伍。各级组织部门应当在培养选拔干部、吸收优秀青年到党内来、培养造就优秀人才上下功夫，切实增强干部投身实践、解决问题、推进工作的能力，着力打造高素质专业化干部队伍。“天生我材必有用”，增强选育有“准度”
AI论文题目生成器怎么用？9款论文写作网站简单3步搞定小猪包333 写论文人工智能深度学习计算机视觉
在当今信息爆炸的时代，AI写作工具的出现极大地提高了写作效率和质量。本文将详细介绍9款优秀的论文写作网站，并重点推荐千笔-AIPassPaper。一、千笔-AIPassPaper千笔-AIPassPaper是一款功能强大的AI论文生成器，基于最新的自然语言处理技术，能够一键生成高质量的毕业论文、开题报告等文本内容。它不仅提供智能选题、文献推荐和论文润色等功能，还具有较高的用户评价。其文献综述生成功
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
计算机视觉中，Pooling的作用 Wils0nEdwards 计算机视觉人工智能
在计算机视觉中，Pooling（池化）是一种常见的操作，主要用于卷积神经网络（CNN）中。它通过对特征图进行下采样，减少数据的空间维度，同时保留重要的特征信息。Pooling的作用可以归纳为以下几个方面：1.降低计算复杂度与内存需求Pooling操作通过对特征图进行下采样，减少了特征图的空间分辨率（例如，高度和宽度）。这意味着网络需要处理的数据量会减少，从而降低了计算量和内存需求。这对大型神经网络
OpenCV图像处理技术（Python）——入门森屿_ opencv
©FuXianjun.AllRightsReserved.OpenCV入门图像作为人类感知世界的视觉基础，是人类获取信息、表达信息的重要手段，OpenCV作为一个开源的计算机视觉库，它包括几百个易用的图像成像和视觉函数，既可以用于学术研究，也可用于工业邻域，它于1999年由因特尔的GaryBradski启动，OpenCV库主要由C和C++语言编写，它可以在多个操作系统上运行。1.1图像处理基本操作
腾讯发表多模态综述，一文详解多模态大模型存内计算开发者社区多模态大模型人工智能 chatgpt AIGC 量子计算 AI-native gpt agi
多模态大语言模型（MLLM）是近年来兴起的一个新的研究热点，它利用强大的大语言模型作为大脑来执行多模态任务。MLLM令人惊讶的新兴能力，如基于图像写故事和无OCR的数学推理，在传统方法中是罕见的，这表明了一条通往人工通用智能的潜在道路。在本文中，追踪多模态大模型最新热点，讨论多模态关键技术以及现有在情绪识别上的应用。腾讯AILab发表了一篇关于多模态大模型的最新综述《MM-LLMs:RecentA
"五项管理"之作业胡军锋
（一）统筹规划，轻负高效1.制定作业管理规范。加强教务处、年级组、班级三级统筹管理，合理调控学科作业结构和总量，严格控制电子作业内容与时长，引导学生正确使用网络、注意用眼卫生，杜绝家庭作业变家长作业，严禁布置家长作业，要求所有作业在校内完成。2.建立作业公示制度。每月定期开展学生作业情况反馈调研，并将调查结果及时反馈到每位学科教师。3.强化延时服务管理。在老师的指导下，应在延时期间完成作业。以完成
CV、NLP、数据控掘推荐、量化海的那边- AI算法自然语言处理人工智能
下面是对CV（计算机视觉）、NLP（自然语言处理）、数据挖掘推荐和量化的简要概述及其应用领域的介绍：1.CV（计算机视觉，ComputerVision）定义：计算机视觉是一门让计算机能够从图像或视频中提取有用信息，并做出决策的学科。它通过模拟人类的视觉系统来识别、处理和理解视觉信息。主要任务：图像分类：识别图像中的物体并分类，比如猫、狗、车等。目标检测：在图像或视频中定位并识别多个对象，如人脸检测
Apache HBase基础（基本概述，物理架构，逻辑架构，数据管理，架构特点，HBase Shell） May--J--Oldhu HBase HBase shell hbase物理架构 hbase逻辑架构 hbase
NoSQL综述及ApacheHBase基础一.HBase1.HBase概述2.HBase发展历史3.HBase应用场景3.1增量数据-时间序列数据3.2信息交换-消息传递3.3内容服务-Web后端应用程序3.4HBase应用场景示例4.ApacheHBase生态圈5.HBase物理架构5.1HMaster5.2RegionServer5.3Region和Table6.HBase逻辑架构-Row7.
《中国特殊教育》专注知识产权服务13937636601 职称评审知网期刊核心期刊核心期刊职称评审
刊物名称《中国特殊教育》刊号国内CN11-3826/G4国际ISSN1007-3728投稿须知1．征稿范围及各类稿件的要求特殊教育与心理学研究各领域的实证研究、综述、教学改革研究等，具体研究领域包括全纳教育、特殊教育理论、听力障碍、视力障碍、智力障碍、学习障碍、自闭症、情绪与行为障碍、康复与治疗、超常儿童教育、特殊群体教育（留守儿童、流动儿童、孤儿、小团伙、网络成瘾儿童、工读学生）等1.1实证类稿
从“新疆之行”领悟成长为新疆“行” Wikyou
近日，习近平总书记先后来到乌鲁木齐、石河子、吐鲁番等地，深入学校、国际陆港区、社区、博物馆、农村和新疆生产建设兵团等进行调研，看似几日的调研，其中蕴含着总书记对新疆发展的重视。辅车相依，唇亡齿寒。作为党员干部要读懂总书记此次“新疆之行”的关注与关心，聚焦新疆工作总目标，做好推动事关长治久安的基础性、长远性工作。从“新疆之行”领悟育人是立德之根，筑牢信念之基。思想越是坚定，行动就越是坚定；思想若是松
山东大学小树林支教调研团青青仓木队山东大学青青仓木队
传承红色基因赓续红色血脉---希望小屋·山大担当暑期社会实践7月25日，山东大学“青青仓木”暑期线上支教队给枣庄欧峪小学四年级的小朋友们开展了“一起红色寻访”主题班会。第一个模块叫做“红领巾心向党”。大学生为小朋友们详细介绍了中国少年先锋队，从性质、标志、纪念日以及精神等方面加深了小朋友们对少先队的理解。在讨论环节中，小朋友们展开热烈讨论，对自己身上的“红领巾”有了更深入的认识，意识到了自己肩负的
Python计算机视觉编程第三章图像到图像的映射一只小小程序猿计算机视觉 python opencv
目录单应性变换直接线性变换算法仿射变换图像扭曲图像中的图像分段仿射扭曲创建全景图RANSAC拼接图像单应性变换单应性变换是将一个平面内的点映射到另一个平面内的二维投影变换。在这里，平面是指图像或者三维中的平面表面。单应性变换具有很强的实用性，比如图像配准、图像纠正和纹理扭曲，以及创建全景图像。单应性变换本质上是一种二维到二维的映射，可以将一个平面内的点映射到另一个平面上的对应点。代码如下：impo
DIODE：超高分辨率室内室外数据集（猫脸码客第186期）猫脸码客: catCode2024 开源数据集猫脸码客开源数据集超高分辨率室内室外数据集
亲爱的读者们，您是否在寻找某个特定的数据集，用于研究或项目实践？欢迎您在评论区留言，或者通过公众号私信告诉我，您想要的数据集的类型主题。小编会竭尽全力为您寻找，并在找到后第一时间与您分享。在计算机视觉和深度学习领域，深度信息作为三维空间感知的重要组成部分，对于实现高级视觉任务如场景理解、机器人导航、增强现实等具有至关重要的作用。然而，获取准确且密集的深度数据一直是一个挑战，尤其是在同时涵盖室内和室
概率图模型（PGM）综述医学影像处理概率图模型概率图模型综述
RefLink:http://www.sigvc.org/bbs/thread-728-1-1.htmlGraphicalModel的基本类型基本的GraphicalModel可以大致分为两个类别：贝叶斯网络(BayesianNetwork)和马尔可夫随机场(MarkovRandomField)。它们的主要区别在于采用不同类型的图来表达变量之间的关系：贝叶斯网络采用有向无环图(DirectedAc
参政议政湘笨儿
20190305今天参加区委参政议政会议。我感到很震撼。以前大家伙也会积极建言献策，但主要还是靠区委统筹布置调研和执笔任务。但是今天，我明显感觉到，每个同志都具有极强的政党意识，把参政议政当做自己的一项人生使命。同志们不但发言积极，到后来完全不需要领导布置，发表了自己感兴趣的议题后，都做出了初稿完成时间的承诺。完成一个议案，需要投入极大的精力查閲资料、详实调研。而这些都只能在工作之余去完成，甚至需
深度学习入门篇：PyTorch实现手写数字识别 AI_Guru人工智能深度学习 pytorch 人工智能
深度学习作为机器学习的一个分支，近年来在图像识别、自然语言处理等领域取得了显著的成就。在众多的深度学习框架中，PyTorch以其动态计算图、易用性强和灵活度高等特点，受到了广泛的喜爱。本篇文章将带领大家使用PyTorch框架，实现一个手写数字识别的基础模型。手写数字识别简介手写数字识别是计算机视觉领域的一个经典问题，目的是让计算机能够识别并理解手写数字图像。这个问题通常作为深度学习入门的练习，因为
OpenCV高阶操作富士达幸运星 opencv 人工智能计算机视觉
在图像处理与计算机视觉领域，OpenCV（OpenSourceComputerVisionLibrary）无疑是最为强大且广泛使用的工具之一。从基础的图像读取、1.图片的上下，采样下采样（Downsampling）下采样通常用于减小图像的尺寸，从而减少图像中的像素数。这个过程可以通过多种方法实现，但最常见的是通过图像金字塔中的pyrDown函数（在OpenCV中）或其他类似的滤波器（如平均池化、最
深入掌握大模型精髓：《实战AI大模型》带你全面理解大模型开发！努力的光头强人工智能 langchain prompt transformer 深度学习
今天，人工智能技术的快速发展和广泛应用已经引起了大众的关注和兴趣，它不仅成为技术发展的核心驱动力，更是推动着社会生活的全方位变革。特别是作为AI重要分支的深度学习，通过不断刷新的表现力已引领并定义了一场科技革命。大型深度学习模型（简称AI大模型）以其强大的表征能力和卓越的性能，在自然语言处理、计算机视觉、推荐系统等领域均取得了突破性的进展。尤其随着AI大模型的广泛应用，无数领域因此受益。AI大模型
Python：100行完成属于你的第一个贪吃蛇 ling1s python 开发语言
目录综述制作前的分析任务分析对象分析编程思路分析代码块引用定义变量函数函数一：change（x，y）函数二：inside_map()函数三：inside_snake()函数四：deffruit_appear()函数五：gameLoop()蛇吃东西的机制死亡判定画图相关主函数完整程序总结综述turtle库是Python的一个图形绘制库，它可以通过简单的命令来控制一个小海龟在窗口上绘制图形。这个库的设
pygame制作贪吃蛇 ling1s pygame python
目录综述制作前的分析面向对象和面向过程对象相关（地图，蛇，食物）地图和墙体的绘制蛇的绘制食物的绘制总结代码游戏的基础（gamebase.py）引用一些基础参数的设置颜色点类（方块元素）文本类游戏主体（snake.py）引用基础参数（其实可以加到gamebase里）一些函数食物生成画图方块圆形初始化函数游戏主体暂停功能死亡判断正常游戏操作按键监听相关吃东西相关移动和检测渲染和绘制完整代码gameba
计算机视觉—照相机（下） zidea
封面焦距(FieldofView)同一位置相机用不同焦距，28mmFieldofView就变小，85mm时候的Fieldofview也就是只有28度视野，每一个物体在通常尺寸的胶片上像素也就是越多，chromaticAberration焦距和是波长相关，不同颜色光聚焦在不同位置。这种现象在物体边缘尤为明显。颜色颜色说简单也简单，说复杂也复杂，我们在高中物理已经知道可见光是电磁波，不同颜色对应不同波
综述论文“A Survey of Zero-Shot Learning: Settings, Methods, and Applications” 硅谷秋水机器学习机器学习神经网络深度学习
该零样本学习综述，发表于ACMTrans.Intell.Syst.Technol.10,2,Article13(January2019)摘要：大多数机器学习方法着重于对已经在训练中看到其类别的实例进行分类。实际上，许多应用程序需要对实例进行分类，而这些实例的类以前没有见过。零样本学习（Zero-ShotLearning）是一种强大而有前途的学习范例，其中训练实例涵盖的类别与想分类的类别是不相交的。
arXiv综述论文“Graph Neural Networks: A Review of Methods and Applications” 硅谷秋水自动驾驶
arXiv于2019年7月10日上载的GNN综述论文“GraphNeuralNetworks:AReviewofMethodsandApplications“。摘要：许多学习任务需要处理图数据，该图数据包含元素之间的丰富关系信息。建模物理系统、学习分子指纹、预测蛋白质界面以及对疾病进行分类都需要一个模型从图输入学习。在其他如文本和图像之类非结构数据学习的领域中，对提取的结构推理，例如句子的依存关系
Python OpenCV精讲系列 - 高级图像处理技术（五）极客代码 Python OpenCV精讲 python opencv 图像处理开发语言人工智能计算机视觉
⚡️⚡️专栏：PythonOpenCV精讲⚡️⚡️本专栏聚焦于Python结合OpenCV库进行计算机视觉开发的专业教程。通过系统化的课程设计，从基础概念入手，逐步深入到图像处理、特征检测、物体识别等多个领域。适合希望在计算机视觉方向上建立坚实基础的技术人员及研究者。每一课不仅包含理论讲解，更有实战代码示例，助力读者快速将所学应用于实际项目中，提升解决复杂视觉问题的能力。无论是入门者还是寻求技能进
2022-01-07 炸鸡可以加热_9938
萤火虫实践队寒调实践活动圆满成功（通讯员钱逾2022-01-07）2022年1月7日，湖北师范大学萤火虫实践队寒调活动接近尾声。为了探究‘双减政策’教育背景下，师生，家长面临的新挑战背后的真实情况，以及适应双减政策的解决办法，湖北师范大学萤火虫实践队对问卷与访谈的数据进行了专业的分析，并召开线上会议就寒调心得与寒调研究报告撰写的具体要求以及注意事项进行了指导、交流与分享。上午九点半，实践队全体队员
坑爹的 xwiki 二次开发 iamdll xwiki
boss提出一个需求，要对xwiki进行二次开发，建立一系列的模板来满足不同团队的文档需求。其中，需要在页面上实现一级tag的选择，然后根据一级tag去display二级tag，并且在将相应的tag加到tag云中。为了这件事情，我调研了2天，其中各种文档缺失--xwiki的document就是一坨乱七八糟，杂乱无章，除了不停的search，没有任何办法。调研结果：能不能做呢-肯定是可以的，好不好做
计算机视觉中的数据增强方法总结 CV技术指南(公众号) CV技术总结计算机视觉深度学习卷积神经网络
前言：在计算机视觉方向，数据增强的本质是人为地引入人视觉上的先验知识，可以很好地提升模型的性能，目前基本成为模型的标配。最近几年逐渐出了很多新的数据增强方法，在本文将对数据增强做一个总结。本文介绍了数据增强的作用，数据增强的分类，数据增强的常用方法，一些特殊的方法，如Cutout，RandomErasing，Mixup，Hide-and-Seek，CutMix，GridMask，FenceMask
Java实现的简单双向Map，支持重复Value superlxw1234 java 双向map
关键字：Java双向Map、DualHashBidiMap 有个需求，需要根据即时修改Map结构中的Value值，比如，将Map中所有value=V1的记录改成value=V2，key保持不变。数据量比较大，遍历Map性能太差，这就需要根据Value先找到Key，然后去修改。即：既要根据Key找Value，又要根据Value
PL/SQL触发器基础及例子百合不是茶 oracle数据库触发器 PL/SQL编程
触发器的简介; 触发器的定义就是说某个条件成立的时候，触发器里面所定义的语句就会被自动的执行。因此触发器不需要人为的去调用，也不能调用。触发器和过程函数类似过程函数必须要调用, 一个表中最多只能有12个触发器类型的,触发器和过程函数相似触发器不需要调用直接执行, 触发时间：指明触发器何时执行，该值可取： before：表示在数据库动作之前触发
[时空与探索]穿越时空的一些问题 comsci 问题
我们还没有进行过任何数学形式上的证明,仅仅是一个猜想..... 这个猜想就是; 任何有质量的物体(哪怕只有一微克)都不可能穿越时空,该物体强行穿越时空的时候,物体的质量会与时空粒子产生反应,物体会变成暗物质,也就是说,任何物体穿越时空会变成暗物质..(暗物质就我的理
easy ui datagrid上移下移一行商人shang js 上移下移 easyui datagrid
/** * 向上移动一行 * * @param dg * @param row */ function moveupRow(dg, row) { var datagrid = $(dg); var index = datagrid.datagrid("getRowIndex", row); if (isFirstRow(dg, row)) {
Java反射 oloz 反射
本人菜鸟，今天恰好有时间，写写博客，总结复习一下java反射方面的知识，欢迎大家探讨交流学习指教首先看看java中的Class package demo; public class ClassTest { /*先了解java中的Class*/ public static void main(String[] args) { //任何一个类都
springMVC 使用JSR-303 Validation验证杨白白 spring mvc
JSR-303是一个数据验证的规范，但是spring并没有对其进行实现，Hibernate Validator是实现了这一规范的，通过此这个实现来讲SpringMVC对JSR-303的支持。 JSR-303的校验是基于注解的，首先要把这些注解标记在需要验证的实体类的属性上或是其对应的get方法上。登录需要验证类 public class Login { @NotEmpty
log4j 香水浓 log4j
log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, HTML, DATABASE #log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, ROLLINGFILE, HTML #console log4j.appender.STDOUT=org.apache.log4j.ConsoleAppender log4
使用ajax和history.pushState无刷新改变页面URL agevs jquery 框架 Ajax html5 chrome
表现如果你使用chrome或者firefox等浏览器访问本博客、github.com、plus.google.com等网站时，细心的你会发现页面之间的点击是通过ajax异步请求的，同时页面的URL发生了了改变。并且能够很好的支持浏览器前进和后退。是什么有这么强大的功能呢？ HTML5里引用了新的API，history.pushState和history.replaceState，就是通过
centos中文乱码 AILIKES centos OS ssh
一、CentOS系统访问 g.cn ，发现中文乱码。于是用以前的方式：yum -y install fonts-chinese CentOS系统安装后，还是不能显示中文字体。我使用 gedit 编辑源码，其中文注释也为乱码。后来，终于找到以下方法可以解决，需要两个中文支持的包： fonts-chinese-3.02-12.
触发器 baalwolf 触发器
触发器(trigger)：监视某种情况，并触发某种操作。触发器创建语法四要素：1.监视地点(table) 2.监视事件(insert/update/delete) 3.触发时间(after/before) 4.触发事件(insert/update/delete) 语法： create trigger triggerName after/before
JS正则表达式的i m g bijian1013 JavaScript 正则表达式
g:表示全局（global)模式，即模式将被应用于所有字符串，而非在发现第一个匹配项时立即停止。 i:表示不区分大小写（case-insensitive）模式，即在确定匹配项时忽略模式与字符串的大小写。 m:表示
HTML5模式和Hashbang模式 bijian1013 JavaScript AngularJS Hashbang模式 HTML5模式
我们可以用$locationProvider来配置$location服务（可以采用注入的方式，就像AngularJS中其他所有东西一样）。这里provider的两个参数很有意思，介绍如下。 html5Mode 一个布尔值，标识$location服务是否运行在HTML5模式下。 ha
[Maven学习笔记六]Maven生命周期 bit1129 maven
从mvn test的输出开始说起当我们在user-core中执行mvn test时，执行的输出如下： /software/devsoftware/jdk1.7.0_55/bin/java -Dmaven.home=/software/devsoftware/apache-maven-3.2.1 -Dclassworlds.conf=/software/devs
【Hadoop七】基于Yarn的Hadoop Map Reduce容错 bit1129 hadoop
运行于Yarn的Map Reduce作业，可能发生失败的点包括 Task Failure Application Master Failure Node Manager Failure Resource Manager Failure 1. Task Failure 任务执行过程中产生的异常和JVM的意外终止会汇报给Application Master。僵死的任务也会被A
记一次数据推送的异常解决端口解决 ronin47 记一次数据推送的异常解决
　　需求：从db获取数据然后推送到B 程序开发完成，上jboss,刚开始报了很多错，逐一解决，可最后显示连接不到数据库。机房的同事说可以ping 通。　　自已画了个图，逐一排除，把linux 防火墙　和　setenforce　设置最低。　　　service iptables stop
巧用视错觉-UI更有趣 brotherlamp UI ui视频 ui教程 ui自学 ui资料
我们每个人在生活中都曾感受过视错觉（optical illusion）的魅力。视错觉现象是双眼跟我们开的一个玩笑，而我们往往还心甘情愿地接受我们看到的假象。其实不止如此，视觉错现象的背后还有一个重要的科学原理——格式塔原理。格式塔原理解释了人们如何以视觉方式感觉物体，以及图像的结构，视角，大小等要素是如何影响我们的视觉的。在下面这篇文章中，我们首先会简单介绍一下格式塔原理中的基本概念，
线段树-poj1177-N个矩形求边长（离散化+扫描线） bylijinnan 数据结构算法线段树
package com.ljn.base; import java.util.Arrays; import java.util.Comparator; import java.util.Set; import java.util.TreeSet; /** * POJ 1177 (线段树+离散化+扫描线)，题目链接为http://poj.org/problem?id=1177
HTTP协议详解 chicony http协议
引言
Scala设计模式 chenchao051 设计模式 scala
Scala设计模式我的话：在国外网站上看到一篇文章，里面详细描述了很多设计模式，并且用Java及Scala两种语言描述，清晰的让我们看到各种常规的设计模式，在Scala中是如何在语言特性层面直接支持的。基于文章很nice，我利用今天的空闲时间将其翻译，希望大家能一起学习，讨论。翻译
安装mysql daizj mysql 安装
安装mysql (1)删除linux上已经安装的mysql相关库信息。rpm -e xxxxxxx --nodeps (强制删除) 执行命令rpm -qa |grep mysql 检查是否删除干净 (2)执行命令 rpm -i MySQL-server-5.5.31-2.el
HTTP状态码大全 dcj3sjt126com http状态码
完整的 HTTP 1.1规范说明书来自于RFC 2616，你可以在http://www.talentdigger.cn/home/link.php?url=d3d3LnJmYy1lZGl0b3Iub3JnLw%3D%3D在线查阅。HTTP 1.1的状态码被标记为新特性，因为许多浏览器只支持 HTTP 1.0。你应只把状态码发送给支持 HTTP 1.1的客户端，支持协议版本可以通过调用request
asihttprequest上传图片 dcj3sjt126com ASIHTTPRequest
NSURL *url =@"yourURL"; ASIFormDataRequest*currentRequest =[ASIFormDataRequest requestWithURL:url]; [currentRequest setPostFormat:ASIMultipartFormDataPostFormat];[currentRequest se
C语言中，关键字static的作用 e200702084 C++c C#
在C语言中，关键字static有三个明显的作用： 1)在函数体，局部的static变量。生存期为程序的整个生命周期，（它存活多长时间）；作用域却在函数体内（它在什么地方能被访问（空间））。一个被声明为静态的变量在这一函数被调用过程中维持其值不变。因为它分配在静态存储区，函数调用结束后并不释放单元，但是在其它的作用域的无法访问。当再次调用这个函数时，这个局部的静态变量还存活，而且用在它的访
win7/8使用curl geeksun win7
1. WIN7/8下要使用curl，需要下载curl-7.20.0-win64-ssl-sspi.zip和Win64OpenSSL_Light-1_0_2d.exe。下载地址： http://curl.haxx.se/download.html 请选择不带SSL的版本，否则还需要安装SSL的支持包 2. 可以给Windows增加c
Creating a Shared Repository; Users Sharing The Repository hongtoushizi git
转载自： http://www.gitguys.com/topics/creating-a-shared-repository-users-sharing-the-repository/ Commands discussed in this section: git init –bare git clone git remote git pull git p
Java实现字符串反转的8种或9种方法 Josh_Persistence 异或反转递归反转二分交换反转 java字符串反转栈反转
注：对于第7种使用异或的方式来实现字符串的反转，如果不太看得明白的，可以参照另一篇博客： http://josh-persistence.iteye.com/blog/2205768 /** * */ package com.wsheng.aggregator.algorithm.string; import java.util.Stack; /**
代码实现任意容量倒水问题 home198979 PHP 算法倒水
形象化设计模式实战 HELLO!架构 redis命令源码解析倒水问题：有两个杯子，一个A升，一个B升，水有无限多，现要求利用这两杯子装C
Druid datasource zhb8015 druid
推荐大家使用数据库连接池 DruidDataSource. http://code.alibabatech.com/wiki/display/Druid/DruidDataSource DruidDataSource经过阿里巴巴数百个应用一年多生产环境运行验证，稳定可靠。它最重要的特点是：监控、扩展和性能。下载和Maven配置看这里： http
两种启动监听器ApplicationListener和ServletContextListener spjich java spring 框架
引言:有时候需要在项目初始化的时候进行一系列工作，比如初始化一个线程池，初始化配置文件，初始化缓存等等，这时候就需要用到启动监听器，下面分别介绍一下两种常用的项目启动监听器 ServletContextListener 特点: 依赖于sevlet容器，需要配置web.xml 使用方法: public class StartListener implements
JavaScript Rounding Methods of the Math object 何不笑 JavaScript Math
The next group of methods has to do with rounding decimal values into integers. Three methods — Math.ceil(), Math.floor(), and Math.round() — handle rounding in differen

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他