晓飞的算法工程笔记

论文速递 | 实例分割算法BlendMask，实时又state-of-the-art

BlendMask通过更合理的blender模块融合top-level和low-level的语义信息来提取更准确的实例分割特征，该模型效果达到state-of-the-art，但结构十分精简，推理速度也不慢，精度最高能到41.3AP，实时版本BlendMask-RT性能和速度分别为34.2mAP和25FPS，并且论文的优化方法很有学习的价值，值得一读

论文:BlendMask: Top-Down Meets Bottom-Up for Instance Segmentation

论文地址：https://arxiv.org/abs/2001.00309

Introduction

密集实例分割模型早期主要有两种，top-down apporach和bottom-up apporach

top-down apporach

top-down模型先通过一些方法获取box区域，然后对区域内的像素进行mask提取，这种模型一般有以下几个问题：

特征和mask之间的局部一致性会丢失，论文讨论的是Deep-Mask，用fc来提出mask
冗余的特征提取，不同的bbox会重新提取一次mask
由于使用了缩小特征图的卷积，位置信息会损失

bottom-up apporach

bottom-up模型先对整图进行逐像素预测(per-pixel prediction)，每个像素生成一个特征向量，然后通过一些方法来对像素进行分组。由于进行的是逐像素级预测且步长很小，局部一致性和位置信息可以很好的保存，但是依然存在以下几个问题：

严重依赖逐像素预测的质量，容易导致非最优的分割
由于mask在低维提取，对于复杂场景(类别多)的分割能力有限
需要复杂的后处理方法

hybridizing apporach

考虑到上面的问题，论文综合了top-down和bottom-up的策略，利用instance-level信息(bbox)对per-pixel prediction进行裁剪和加权输出。虽然FCIS和YOLACT已有类似的思想，但论文认为他们都没有很好的处理top-level和bottom-level的特征，高维特征包含整体的instance信息，而低维特征的则保留了更好的位置信息，论文的重点在于研究如何合并高低维特征，主要贡献有以下几点：

提出了proposal-based的instance mask合并方法，blender，在COCO上对比YOLACT和FCIS的合并方法分别提升了1.9和1.3mAP
基于FCOS提出简洁的算法网络BlendMask
BlendMask的推理时间不会像二阶检测器一样随着预测数量的增加而增加
BlendMask的准确率和速度比Mask R-CNN要好，且mask mAP比最好的全卷积实例分割网络Tensor-Mask要高1.1
由于bottom模块能同时分割多种物体，BlendMask可直接用于全景分割
Mask R-CNN的mask输出固定为$28\times 28$，BlendMask的mask输出像素可以很大，且不受FPN的限制
BlendMask通用且灵活，只要一些小修改，就可以用于其它instance-level识别任务中，例如关键点检测

Our methods

Overall pipeline

BlendMask包含检测网络和mask分支，mask分支包含3个部分，bottom module用于预测score maps，top layer用于预测实例的attentions，blender module用于整合分数以及attentions，整体的架构如图2所示

Bottom module

bottom module预测的score maps在文中称为基底(base)$B$。$B$的大小为$N\times K\times \frac{H}{s}\times \frac{W}{s}$，其中N为batch size，K为基底的数量，$H\times W$是输入的大小，而$s$则是score maps的输出步长。

论文采用DeepLab V3+的decoder，该decoder包含两个输入，一个低层特征和一个高层特征，对高层特征进行upsample后与低层特征融合输出。这里使用别的结构也是可以的，而bottom module的输入可以是backbone的feature，也可以是类似YOLACT或Panoptic FPN的特征金字塔

Top Layer

在每一个detection tower后接了一层卷积层用来预测top-level attentions$A$。在YOLACT中，每一层金字塔($H_l\times W_l$)输出的$A$为$N\times K\times H_l\times W_l$，即对应基底每个channel的整体的权重值。而论文输出的$A$为$N\times (K\cdot M\cdot M)\times H_l\times W_l$，$M\times M$是attention的分辨率，即对应基底每个channel的像素点的权重值，粒度更细，是element-wise的操作(后面会讲到)。
由于attentions是3D结构($K\cdot M\cdot M$)，因此可以学习到一些实例级别的信息，例如对象大致的形状和姿态。$M$的值是比较小的，只做粗略的预测，一般最大为14，使用output channel为($K\cdot M\cdot M$)的卷积来实现。在送到一下个模块之前，先使用FCOS post-process方法来选择top D个bbox $P={p_d \in \mathbb{R}_{\ge0}^4 |d=1...D}$和对应的attentions $A={a_d \in \mathbb{R}^{K\times M\times M} |d=1...D}$，具体的选择方法是选择分类置信度$\ge$阈值的top D个bbox，阈值一般为0.05

Blender module

Blender module是BlendMask的关键部分，根据attentions对位置敏感的基底进行合并输出

Blender module

blender模块的输入为bottom-level的基底$B$以及选择的top-level attentions$A$和bbox$P$

首先，使用Mask R-CNN的ROIPooler来截取每个bbox$p_d$对应的基底区域，并resize成固定$R\times R$大小的特征图$r_d$。具体地，使用sampleing ratio=1的RoIAlign，每个bin只采样1个点，Mask R-CNN每个bin采样4个点。在训练的时候，直接使用gt bbox作为proposals，而在推理时，则直接用FCOS的检测结果

attention大小$M$是比$R$小的，因此需要对$a_d$进行插值，从$M\times M$变为$R\times R$，$R={r_d|d=1...D}$

接着对$a_d^{'}$的K维attention分别进行softmax归一化，产生一组score map $s_d$

然后对每个region$R$的$r_d$和对应的score map$S$的$s_d$进行element-wise product，最后将K个结果进行相加得到$m_d$

图1对blend module的操作进行了可视化，可以看到attenttions和基底的特征以及融合的过程，可以说十分生动形象了

Configurations and baselines

BlendMask的超参数如下：

$R$，bottom-level RoI的分辨率
$M$，top-level预测的分辨率
$K$，基底的数量(channel)
bottom模块的输入可以是骨干网络或FPN的feature
基底的采样方法可以是最近邻或双线性池化
top-level attentions的插值方法可以是最近邻或双线性采样

论文用缩写$R_K_M$来表示模型，使用骨干特征C3和C5作为bottom模块的输入，top-level attention使用最近邻插值，bottom level使用双线性插值，与RoIAlign一致

Semantics encoded in learned bases and attentions

基底和attentions的可视化结果如图3所示，论文认为BlendMask能提取两种位置信息：

像素是否在对象上(semantic masks)
像素是否在对象的具体部位上(position-sensitive features)，比如左上角，右下角

红蓝两个基底分别检测了目标的右上和左下部分点，黄色基底则检测了大概率在目标上的点(semantic mask)，而绿色基底则激活了物体的边界，position-sensitive features有助于进行实例级别的分割，而semantic mask则可以对postion-sensitive进行补充，让最后的结果更加顺滑。由于学习到了更多准确的特征，BlendMask使用了比YOLACT和FCIS少很多的基底纬度(4 vs. 32 vs. 49)

Experiment

消融实验

Merging methods: Blender vs. YOLACT vs. FCIS

论文将blender改造成其它两个算法的merge模型进行实验，从Table1可以看出，Blender的merge方法要比其它两个算法效果好

Top and bottom resolutions

从Table2可以看出，随着resolution的增加，精度越来越高，为了保持性价比，R/M的比例保持大于4，总体而言，推理的时间是比较稳定的

Number of bases

从Table3可以看出，K=4是最优

Bottom feature locations: backbone vs. FPN

从图4可以看出，使用FPN特征作为bottom模块的输入，不仅效率提升了，推理时间也加快了

Interpolation method: nearest vs. bilinear

在对top-level attentions进行插值时，双线性比最近邻高0.2AP

而对bottom-level score maps进行插值时双线性比最近邻高2AP

Other improvements

论文也尝试了其它提升网络效果的实验，虽然这些trick对网络有一定的提升，但是没有加入到最终的网络中

Main result

Quantitative results

从结果来看，BlendMask在效果和速度上都优于目前的实例分割算法，但是有一点，在R-50不使用multi-scale的情况下，BlendMask的效果要比Mask R-CNN差

Real-time setting

为了跟YOLACT对比，论文改造了一个紧凑版的BlendMask-RT: 1) 减少prediction head的卷积数 2) 合并classification tower和box tower 3) 使用Proto-FPN并去掉P7。从结果来看，BlendMask-RT比YOLACT快7ms且高3.3AP

Qualitative results

图4展示了可视化的结果，可以看到BlendMask的效果比Mask R-CNN要好，因为BlendMask的mask分辨为56而Mask R-CNN的只有28，另外YOLACT是难以区分相邻实例的，而BlendMask则没有这个问题

Discussions

Comparison with Mask R-CNN

BlendMask的结构与Mask R-CNN类似，通过去掉position-sensitive feature map以及重复的mask特征提取来进行加速，并通过attentions指导的blender来替换原来复杂的全局特征计算
BlendMask的另一个优点是产生了高质量的mask，而分辨率输出是不受top-level采样限制。对于Mask R-CNN增大分辨率，会增加head的计算时间，而且需要增加head的深度来提取准确的mask特征。另外Mask R-CNN的推理时间会随着bbox的数量增加而增加，这对实时计算是不友好的
最后，blender模块是十分灵活的，因为top-level的实例attention预测只有一个卷积层，对于加到其它检测算法中几乎是无花费的

Panoptic Segmentation

BlendMask可以通过使用Panoptic-FPN的语义分割分支来进行全景分割任务，从结果来看，BlendMask效果更好

总结

BlendMask通过更合理的blender模块融合top-level和low-level的语义信息来提取更准确的实例分割特征，该模型综合各种优秀算法的结构，例如YOLACT，FOCS，Mask R-CNN，比较tricky，但是很有参考的价值。BlendMask模型十分精简，效果达到state-of-the-art，推理速度也不慢，精度最高能到41.3AP，实时版本BlendMask-RT性能和速度分别为34.2mAP和25FPS，并且论文实验做得很充足，值得一读

参考内容

论文阅读学习 - (DeeplabV3+)Encoder-Decoder with Atrous Separable Convolution
加州大学提出：实时实例分割算法YOLACT，可达33 FPS/30mAP！现已开源！
FCOS-一个挺不错的anchor free目标检测方法

如果本文对你有帮助，麻烦点个赞或在看呗～
更多内容请关注个人微信公众号【晓飞的算法工程笔记】

你可能感兴趣的:(论文速递 | 实例分割算法BlendMask，实时又state-of-the-art)

具身智能的视觉-语言导航综述
24年2月来自曲阜师范、华东师大和哈工大的论文“Vision-LanguageNavigationwithEmbodiedIntelligence:ASurvey”。作为人工智能领域的长期愿景，具身智能的核心目标是提升智体与环境的感知、理解和交互能力。视觉-语言导航（VLN）作为实现具身智能的重要研究路径，致力于探索智体如何利用自然语言与人进行有效沟通，接收并理解指令，并最终依靠视觉信息实现精准导
python折半查找算法_python二分查找代码试用递归法编写python程序实现折半查找算法...
python二分查找算法函数bi_search(),该函数实现检回忆，很美却很伤；回忆只是回不到过去的记忆。输入格式:第一行为正整数n接下来若干行为待查找的数字，每行输入一个总是女人为了天长地久而烦恼，男人却可以洒脱地出乎意料。defprime(n):ifnend:return-1mid=(start+end)//2ifprimelist[mid]==prime:returnmidelifprim
《一禅小和尚》经典语录梦想写作者
（13）害怕孤独，却又不敢去轻易接近谁，渴望被爱，却又习惯了一个人，懒得去费尽心思讨好谁，从陌生到熟悉，最后回到陌生，如此小心翼翼，是因为知道，人生最大的遗憾不是错过最好的人，而是当你遇见更好的人时，却已经把最好的自己用完了！（14）太想要一样东西，是失去的开始，得不到会朝思暮想，得到了又害怕失去，一把沙抓得越紧，流失的越快，一个人抱的越紧，跑的越快，当你张开双臂，两手空空，你怀里拥抱的是整个世界
具身智能：从理论到实践的跨越
具身智能（EmbodiedAI）的概念起源与发展是一个跨越半个多世纪的学术探索历程，其核心思想在不同学科的交叉碰撞中逐渐成型。以下从理论源头、技术奠基、术语演进三个维度展开解析，揭示这一概念的学术脉络与产业价值：一、理论源头：从图灵的哲学构想到认知科学的具身化转向1.图灵的"感官机器"设想（1950年）在人工智能奠基性论文《计算机器与智能》中，图灵提出了两种智能发展路径：抽象计算路径：如国际象棋等
今天是个好日子走到底的花姑娘
大学闺蜜下午四点多发信息说她的儿砸提早来报道了。中午快十二点时本想发信息问她最近怎么样了，又考虑到这时间点她可能在吃饭，等下午迟点再联系她。因为她跟我当时怀孕一样有妊娠糖尿病，想了解一下她最近控糖效果如何。结果，我还没来得及问，她就直接告诉我生了，提早了一个月。好在小孩各项指标都比较正常，体重4.3斤，毕竟是早产儿为了保险起见得在保温箱中观察几天。真庆幸母子健康，真替她开心。他们夫妻俩年纪相对也比
舔狗舔到最后，她又丢钱又丢命全集章节小说免费阅读完整版（沈熹微赵庭深）-舔狗舔到最后，她又丢钱又丢命小说免费阅读一米文库2
舔狗舔到最后，她又丢钱又丢命全集章节小说免费阅读完整版（沈熹微赵庭深）-舔狗舔到最后，她又丢钱又丢命小说免费阅读主角配角：沈熹微赵庭深小说别名：舔狗舔到最后，她又丢钱又丢命简介：孟清然这会儿趴在桌上，被一群人众星捧月的围着。她胃痛，大家都在关心她。最关心她的人，当然是裴云霄。他是孟清然的男朋友。每次考试排名，第一第二都是他俩，裴云霄对其它人冷淡，对孟清然很好。正文：孟清然这会儿趴在桌上，被一群人众
《第十五次网课收获》宛如初夏
伊川王利珍坚持原创分享第386天今天晚上是网络中级第15次课程。再有一次就要结束了，还真的有点恋恋不舍呢！刘老师已经开始提前给我们预告了，以期降低我们的分离焦虑！四个月的学习历程。我们彼此由陌生到熟悉。现在经常在一块约练的几个学员已经是老朋友的感觉。虽然从未谋面，但心灵相通，互相扶持，互相帮助。电波相连的情谊也是一种别样的美好！首先通过顾老师展示的案例，大家各抒己见，加上刘老师的讲解。又收获了很多
亲子（919）厦门路小学邵艺馨妈妈
2019.10.6星期日阴转小雨今天真是幸福滴一天，白天店里顾客不是很多，俺悠哉悠哉滴过了一天。傍晚突然想吃猪肉土豆疙瘩汤，于是去了趟超市，切了八块钱猪后肘肉，又买了蘑菇和一些小咸菜。老公接俩孩子回来时，热乎乎的饭菜正好上桌(✪✪)。美的老公直喊：“不错不错(*๓´╰╯`๓)味道好极了～”孩子们也吃的肠滚肚圆，连老公给他俩买的汉堡和三文治都没吃了^ω^你们是开心的，俺就是幸福滴(^o^)o四（1）
Valentino耳饰怎么买便宜？便宜又好看女生耳钉在哪买直返APP拼多多优惠券
在时尚的世界里，Valentino耳饰以其独特的设计和精湛的工艺，成为了众多时尚爱好者追捧的焦点。今天，让我们一同来领略Valentino耳饰的魅力所在。Valentino耳饰是对优雅与时尚的完美诠释。每一款耳饰都仿佛是一件艺术品，精心雕琢，细节之处尽显匠心。从华丽的宝石镶嵌到精致的金属纹理，每一个元素都在诉说着品牌的奢华与独特。戴上Valentino耳饰，瞬间便能提升整体造型的档次与气质。无论是
使用Meteor构建实时仪表板的完整指南杏花朵朵 Meteor 实时仪表板 Vue组件路由设置集合集成
背景简介随着现代Web应用对实时性和响应性的要求不断提高，开发人员需要使用强大的框架来构建能够满足这些需求的应用程序。Meteor作为一个全栈JavaScript框架，提供了一种快速开发实时Web应用的方法。本文将通过构建一个实时仪表板项目，详细探讨Meteor的特点和使用方法。Meteor简介Meteor是一个全栈JavaScript框架，用于构建Web应用程序。它的主要元素包括Web客户端、基
机器学习之——认识机器学习 -睡到自然醒~ golang 重构开发语言
首先，什么是机器学习？参照百度百科的讲解，“机器学习是一门多领域交叉学科，设计概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习能力，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。”什么意思呢？也就是说，机器学习是一门跨领域的学科，是一种能够让机器模仿人类学习能力的一种学科。在Andrew的课程中，提到了几个机器学习的定义：1，A
ISO11898 与 SAE J1939 通信协议详细介绍芊言凝语汽车常见功能分享网络
ISO11898与SAEJ1939通信协议的详细介绍：ISO11898通信协议ISO11898是一系列国际标准，专门用于道路车辆的控制器局域网（CAN）的数据链路层和物理层6。它定义了CAN网络的基本操作，规定了网络设计、实施和测试的要求，为CAN网络的设计和实施提供了全面的指导。其核心技术特点包括高可靠性、实时性、支持多主控系统、高效的数据包结构以及灵活性等7。具体如下5：ISO11898-1：
【沧海行系列】鬼域行——第十六章乱琼碎玉沧海行人
而我最不喜欢阴阳分明的东西了。要知道阴在阳之内，不在阳之对。我们要充分利用自己的优势，打入敌营陇南地界，早早就有人准备好了酒菜等候何平等人。为首的人回报道：“何长老，我等追查了很久，没有黄长老的痕迹啊。”何平听了，心里已经有九成把握听到的是这个回答了，但她还是叹了口气去，又问道：“上次那妖女的事可曾继续扩散？”那人又说：“这事奇就奇在这，眼下不知是什么人，平息了流言，如今知道那女子身有鉴空遗书的人
2021-01-12 蹦哒吧小蹦儿
终于开始明白为什么很多人不愿从舒适圈里出来，并不是因为舒适圈有多舒服，只是因为舒适圈外挑战太多了——需要去适应这个社会，需要去学习很多新的东西，需要去接受挑战……本来拍照就可以完成的事，现在需要拍摄视频，而如何拍出好的视频，并且剪辑好看，这真是一门技术呀。需要学习太多东西。为了能更好的拍片，特意买了云台，但是为什么云台不听使唤？令人发愁，于是又开始新一轮的学习。汽车领域的平台开始了讲师课，可以有更
如何使用React Native与Meteor集成：一个全面指南
如何使用ReactNative与Meteor集成：一个全面指南项目介绍react-native-meteor是一个强大的开源项目，它允许开发者无缝地将ReactNative应用程序与Meteor后端连接起来。此库让你能够充分利用Meteor特有的功能，如自动化的账户系统、响应式数据追踪等，为你的移动应用带来无与伦比的开发体验。通过结合ReactNative的强大UI能力和Meteor的实时Web框
健身房 af6846e218f2
今天下午没有事情突然心血来潮想去健身房逛一圈。可是到了那里呢不知道练啥而而且那里一个人也没有嗯，我就先上了跑步机然后跑了四公里下来下来之后腿酸胳膊酸。可是我看时间才过了半个小时我想要是这么早就回去唉跟没来有啥区别。所以我又练了会儿胸。今天完美的一天我也回家了
Python --- day 10 Opencv模块的使用 AnAn__kang python opencv 开发语言
系列文章目录前言今天博主带大家进入Opencv的学习，这是一个专门针对处理图像和视频的一个模块，大家以理解为主，增强自己的编程思维，再后续我们训练模型时会大批量的处理图片时会经常用到这个模块。1OpenCV介绍OpenCV（开放源代码计算机视觉库）是一个开源的计算机视觉和机器学习软件库。由一系列C++类和函数构成，用于图像处理、计算机视觉领域的算法实现。1.1OpenCV优势**开源免费：**完全
[资治通鉴365]8.17武后两次行废立太平公主嫁薛家明月无疆
8月17日武后两次行废立太平公主嫁薛家太子李弘死后，弟弟李贤被立为太子。可是宫里的人叽叽喳渣，私下里说李贤不是武后亲生的，是武后的大姐韩国夫人的儿子。这话传到太子耳中，他又疑又怕，不知如何是好。【680.8太子贤闻宫中窃议，以贤为天后姊韩国夫人所生，内自疑惧。】术士明崇俨，懂一套符咒和幻术，经常出入宫廷，使高宗和武后入了迷，官儿升到正谏大夫。他常在武后面前进谗言：“太子是不能继承大统的。其实，只有
2018-10-24 幸好不是道德专家远山的轮廓
我不传播正能量，不分享善与道德，因为我自己还一肚子坏水呢!今天不得不写到一本"善书"，因为找到了我欣赏这本书的一个点，我想表达出来。我平时是不喜欢看善书的，甚至都是绕着走的，因为里面不是一言堂式的道德说教，就是武断的业报恐吓，读起来真是又烦又厌。这本《责任与修养——青年男女的相处之道》，我在学校里看见好多次，同时有这么多本，那它不是某家长送的，就是学生一下子从某寺院请回来的。这种流通方式的，多是善
时序数据库在数据库领域的应用前景数据库管理艺术数据库时序数据库 struts ai
时序数据库在数据库领域的应用前景关键词：时序数据库、时间序列数据、物联网、监控系统、金融分析、大数据、实时分析摘要：本文深入探讨了时序数据库在现代数据管理中的关键作用和应用前景。我们将从时序数据的基本特性出发，分析时序数据库的核心架构和设计原理，比较主流时序数据库产品的技术特点，并通过实际案例展示其在物联网、金融科技、运维监控等领域的应用价值。文章还将提供时序数据库选型指南，探讨未来技术发展趋势，
时序数据库在数据库领域的行业应用数据库管理艺术数据库时序数据库 ai
时序数据库在数据库领域的行业应用关键词：时序数据库、数据库领域、行业应用、时间序列数据、实时分析摘要：本文深入探讨了时序数据库在数据库领域的行业应用。首先介绍了时序数据库的背景知识，包括其目的、适用读者、文档结构和相关术语。接着阐述了时序数据库的核心概念、架构和工作原理，通过Python代码详细讲解了核心算法。还介绍了相关的数学模型和公式，并举例说明。在项目实战部分，给出了开发环境搭建、源代码实现
时序数据库在工业物联网领域的核心优势与应用价值时序数据说时序数据库物联网数据库 iotdb 大数据
一、工业物联网的数据挑战与需求工业物联网(IIoT)正在重塑全球制造业格局，通过连接设备、传感器和控制系统，实现了生产过程的数字化与智能化。然而，这一转型也带来了前所未有的数据管理挑战：海量数据：单个工厂可能部署数万个传感器，每秒产生数千万数据点高速写入：工业设备常需毫秒级数据采集，对数据库写入性能要求极高严格时效：质量控制、故障预测等场景要求实时数据分析长期存储：设备生命周期数据需保存数年甚至数
Python --- Day3 推导式及常见语句和内置函数的学习！！！
系列文章目录前言相信各位伙伴们在前俩次的文章和Python的基础学习中大有收获，这次我们将进入推导式，常见语句和内置函数的学习！跟着博主一起成为一名Ai的算法工程师！一、推导式用更简洁的方式创建列表、字典和集合。是Python特有的一种表达式形式。1.1列表推导式a=[1,2,3,4]result=[x*2forxina]#创建一个新列表，元素是原列表每个元素的两倍1.2字典推导式a=['a','
【散文诗】那年冬天青禾吖
文／逗号注定是一个孤独的冬天当黑夜来临的时候周围只能被寂静和黑暗包围黑的天空黑色的树似乎连影子都没有那个冬天给了自己一个期限那年冬天的离别为这个冬天相聚做了铺垫一如期待的美好只是相聚多了沉重如果黑的夜蒙住的只是眼睛愿闭上眼睛还能看见光明这个冬天一如既往的冷冷的看不见阳光可能阳光会居住在心脏的一个角落又或许它也会偷懒如我一般倦怠图片发自App
2023-08-08 安得争渡
以高质量“纪检监察”答卷推动经济社会高质量发展围绕中心才能找准方向，服务大局才能体现价值。纪检监察机关作为党内的“纪律部队”，担负着保证党的政治纲领和政治目标实现的重大责任，必须始终把各项工作置于党的工作大局中去思考推进。省委十二届三次全会是系统谋划四川经济社会发展的一次重要会议，对四川未来发展有着深远战略考量和重大现实意义。必须找准服务中心大局的切入点、着力点，忠诚履职，既督又战，充分发挥监督保
深度学习图像分类数据集—百种病虫害分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：百种病虫害识别分类，训练集45095张，验证集7508张，测试集22619张具体类别为以下：insect_classes=["rice_leaf_roller","rice_leaf_caterpillar
机器学习数据预处理阶段为什么需要——归一化处理
参考：https://www.cnblogs.com/bjwu/p/8977141.html通常，在DataScience中，预处理数据有一个很关键的步骤就是数据的标准化。这里主要引用sklearn文档中的一些东西来说明，主要把各个标准化方法的应用场景以及优缺点总结概括，以来充当笔记。提升模型精度在机器学习算法的目标函数(例如SVM的RBF内核或线性模型的l1和l2正则化)，许多学习算法中目标函数
云烟成雨(陈向虞江惜)完整版免费阅读_免费完结版小说云烟成雨陈向虞江惜喵喵美文
《云烟成雨》主角：陈向虞江惜简介：出院那天，妻子说要来接我。可等到我都回家了，还没看到她人影。手机上，我却看到妻子一个小时前发的朋友圈动态。她正和前任在一起。我最需要妻子的时候，她总为了那个前任一次次舍弃我。口口声声说，他们只是朋友关系。我留下一纸离婚协议书成全他们。拎着行李箱准备离开的时候，妻子却红着眼求我，她很后悔。可我已经不爱了。生病手术出院那天，妻子说要来接我。可直到医院门口公交换了一班又
基于小样本学习的图像分类综述 cdyyyyyyy 学习分类机器学习
目录引言基本概念小样本学习方法分类1、数据增强2、迁移学习3、元学习小样本学习主流方法1、基于度量的小样本学习2、基于Pretraining+FineTuning的方法3、基于元学习的小样本学习总结引言因为课程设计要求，所以进行了关于小样本学习的调研。目前小样本学习还是一个比较热门的研究，很多关于小样本学习的论文也陆续发表。本文只是一个概述，具体方法研究还有待深入。基本概念小样本学习（FSL：Fe
48Days-Day03 | 删除公共字符，两个链表的第一个公共结点，mari和shiny TinaAmber 笔试训练48Days 链表 java 算法
删除公共字符删除公共字符_牛客题霸_牛客网算法思路直接哈希，把第二个字符塞集合里面，遍历第一个，只要在集合里面有的就跳过代码importjava.util.HashSet;importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannerscan=newScanner(System.in);Strin
安装数据库首次应用 Array_06 java oracle sql
可是为什么再一次失败之后就变成直接跳过那个要求 enter full pathname of java.exe的界面这个java.exe是你的Oracle 11g安装目录中例如：【F:\app\chen\product\11.2.0\dbhome_1\jdk\jre\bin】下的java.exe 。不是你的电脑安装的java jdk下的java.exe！注意第一次，使用SQL D
Weblogic Server Console密码修改和遗忘解决方法 bijian1013 Welogic
在工作中一同事将Weblogic的console的密码忘记了，通过网上查询资料解决，实践整理了一下。一.修改Console密码打开weblogic控制台，安全领域 --> myrealm -->&n
IllegalStateException: Cannot forward a response that is already committed Cwind java Servlets
对于初学者来说，一个常见的误解是：当调用 forward() 或者 sendRedirect() 时控制流将会自动跳出原函数。标题所示错误通常是基于此误解而引起的。示例代码： protected void doPost() { if (someCondition) { sendRedirect(); } forward(); // Thi
基于流的装饰设计模式木zi_鸣设计模式
当想要对已有类的对象进行功能增强时，可以定义一个类，将已有对象传入，基于已有的功能，并提供加强功能。自定义的类成为装饰类模仿BufferedReader，对Reader进行包装，体现装饰设计模式装饰类通常会通过构造方法接受被装饰的对象，并基于被装饰的对象功能，提供更强的功能。装饰模式比继承灵活，避免继承臃肿，降低了类与类之间的关系装饰类因为增强已有对象，具备的功能该
Linux中的uniq命令被触发 linux
Linux命令uniq的作用是过滤重复部分显示文件内容，这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个及以后更多个重复行将被删去，行比较是根据所用字符集的排序序列进行的。该命令加工后的结果写到输出文件中。输入文件和输出文件必须不同。如果输入文件用“- ”表示，则从标准输入读取。 AD： uniq [选项] 文件说明：这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个
正则表达式Pattern 肆无忌惮_ Pattern
正则表达式是符合一定规则的表达式，用来专门操作字符串，对字符创进行匹配，切割，替换，获取。例如，我们需要对QQ号码格式进行检验规则是长度6~12位不能0开头只能是数字，我们可以一位一位进行比较，利用parseLong进行判断，或者是用正则表达式来匹配[1-9][0-9]{4,14} 或者 [1-9]\d{4,14} &nbs
Oracle高级查询之OVER (PARTITION BY ..) 知了ing oracle sql
一、rank()/dense_rank() over(partition by ...order by ...) 现在客户有这样一个需求，查询每个部门工资最高的雇员的信息，相信有一定oracle应用知识的同学都能写出下面的SQL语句： select e.ename, e.job, e.sal, e.deptno from scott.emp e, (se
Python调试矮蛋蛋 python pdb
原文地址： http://blog.csdn.net/xuyuefei1988/article/details/19399137 1、下面网上收罗的资料初学者应该够用了，但对比IBM的Python 代码调试技巧： IBM：包括 pdb 模块、利用 PyDev 和 Eclipse 集成进行调试、PyCharm 以及 Debug 日志进行调试： http://www.ibm.com/d
webservice传递自定义对象时函数为空，以及boolean不对应的问题 alleni123 webservice
今天在客户端调用方法 NodeStatus status=iservice.getNodeStatus(). 结果NodeStatus的属性都是null。进行debug之后，发现服务器端返回的确实是有值的对象。后来发现原来是因为在客户端，NodeStatus的setter全部被我删除了。本来是因为逻辑上不需要在客户端使用setter，结果改了之后竟然不能获取带属性值的
java如何干掉指针，又如何巧妙的通过引用来操作指针————>说的就是java指针百合不是茶
C语言的强大在于可以直接操作指针的地址，通过改变指针的地址指向来达到更改地址的目的,又是由于c语言的指针过于强大，初学者很难掌握， java的出现解决了c，c++中指针的问题 java将指针封装在底层，开发人员是不能够去操作指针的地址，但是可以通过引用来间接的操作：定义一个指针p来指向a的地址（&是地址符号）：
Eclipse打不开，提示“An error has occurred.See the log file ***/.log” bijian1013 eclipse
打开eclipse工作目录的\.metadata\.log文件，发现如下错误： !ENTRY org.eclipse.osgi 4 0 2012-09-10 09:28:57.139 !MESSAGE Application error !STACK 1 java.lang.NoClassDefFoundError: org/eclipse/core/resources/IContai
spring aop实例annotation方法实现 bijian1013 java spring AOP annotation
在spring aop实例中我们通过配置xml文件来实现AOP，这里学习使用annotation来实现，使用annotation其实就是指明具体的aspect,pointcut和advice。1.申明一个切面(用一个类来实现)在这个切面里,包括了advice和pointcut AdviceMethods.jav
[Velocity一]Velocity语法基础入门 bit1129 velocity
用户和开发人员参考文档 http://velocity.apache.org/engine/releases/velocity-1.7/developer-guide.html 注释 1.行级注释## 2.多行注释#* *# 变量定义使用$开头的字符串是变量定义，例如$var1, $var2, 赋值使用#set为变量赋值，例
【Kafka十一】关于Kafka的副本管理 bit1129 kafka
1. 关于request.required.acks request.required.acks控制者Producer写请求的什么时候可以确认写成功，默认是0， 0表示即不进行确认即返回。 1表示Leader写成功即返回，此时还没有进行写数据同步到其它Follower Partition中 -1表示根据指定的最少Partition确认后才返回，这个在 Th
lua统计nginx内部变量数据 ronin47 lua nginx　统计
server { listen 80; server_name photo.domain.com; location /{set $str $uri; content_by_lua ' local url = ngx.var.uri local res = ngx.location.capture(
java-11.二叉树中节点的最大距离 bylijinnan java
import java.util.ArrayList; import java.util.List; public class MaxLenInBinTree { /* a. 1 / \ 2 3 / \ / \ 4 5 6 7 max=4 pass "root"
Netty源码学习-ReadTimeoutHandler bylijinnan java netty
ReadTimeoutHandler的实现思路：开启一个定时任务，如果在指定时间内没有接收到消息，则抛出ReadTimeoutException 这个异常的捕获，在开发中，交给跟在ReadTimeoutHandler后面的ChannelHandler，例如 private final ChannelHandler timeoutHandler = new ReadTim
jquery验证上传文件样式及大小(好用) cngolon 文件上传 jquery验证
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> <script src="jquery1.8/jquery-1.8.0.
浏览器兼容【转】 cuishikuan css 浏览器 IE
浏览器兼容问题一：不同浏览器的标签默认的外补丁和内补丁不同问题症状：随便写几个标签，不加样式控制的情况下，各自的margin 和padding差异较大。碰到频率:100% 解决方案：CSS里 *{margin:0;padding:0;} 备注：这个是最常见的也是最易解决的一个浏览器兼容性问题，几乎所有的CSS文件开头都会用通配符*来设
Shell特殊变量：Shell $0, $#, $*, $@, $?, $$和命令行参数 daizj shell $#$?特殊变量
前面已经讲到，变量名只能包含数字、字母和下划线，因为某些包含其他字符的变量有特殊含义，这样的变量被称为特殊变量。例如，$ 表示当前Shell进程的ID，即pid，看下面的代码： $echo $$ 运行结果 29949 特殊变量列表变量含义 $0 当前脚本的文件名 $n 传递给脚本或函数的参数。n 是一个数字，表示第几个参数。例如，第一个
程序设计KISS 原则-------KEEP IT SIMPLE, STUPID! dcj3sjt126com unix
翻到一本书，讲到编程一般原则是kiss：Keep It Simple, Stupid.对这个原则深有体会，其实不仅编程如此，而且系统架构也是如此。 KEEP IT SIMPLE, STUPID! 编写只做一件事情，并且要做好的程序；编写可以在一起工作的程序，编写处理文本流的程序，因为这是通用的接口。这就是UNIX哲学.所有的哲学真正的浓缩为一个铁一样的定律，高明的工程师的神圣的“KISS 原
android Activity间List传值 dcj3sjt126com Activity
第一个Activity： import java.util.ArrayList;import java.util.HashMap;import java.util.List;import java.util.Map;import android.app.Activity;import android.content.Intent;import android.os.Bundle;import a
tomcat 设置java虚拟机内存 eksliang tomcat 内存设置
转载请出自出处：http://eksliang.iteye.com/blog/2117772 http://eksliang.iteye.com/ 常见的内存溢出有以下两种: java.lang.OutOfMemoryError: PermGen space java.lang.OutOfMemoryError: Java heap space ------------
Android 数据库事务处理 gqdy365 android
使用SQLiteDatabase的beginTransaction()方法可以开启一个事务，程序执行到endTransaction() 方法时会检查事务的标志是否为成功，如果程序执行到endTransaction()之前调用了setTransactionSuccessful() 方法设置事务的标志为成功则提交事务，如果没有调用setTransactionSuccessful() 方法则回滚事务。事
Java 打开浏览器 hw1287789687 打开网址 open浏览器 open browser 打开url 打开浏览器
使用java 语言如何打开浏览器呢? 我们先研究下在cmd窗口中,如何打开网址使用IE 打开 D:\software\bin>cmd /c start iexplore http://hw1287789687.iteye.com/blog/2153709 使用火狐打开 D:\software\bin>cmd /c start firefox http://hw1287789
ReplaceGoogleCDN：将 Google CDN 替换为国内的 Chrome 插件 justjavac chrome Google google api chrome插件
Chrome Web Store 安装地址： https://chrome.google.com/webstore/detail/replace-google-cdn/kpampjmfiopfpkkepbllemkibefkiice 由于众所周知的原因，只需替换一个域名就可以继续使用Google提供的前端公共库了。同样，通过script标记引用这些资源，让网站访问速度瞬间提速吧
进程VS.线程 m635674608 线程
资料来源： http://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000/001397567993007df355a3394da48f0bf14960f0c78753f000 1、Apache最早就是采用多进程模式 2、IIS服务器默认采用多线程模式 3、多进程优缺点优点：多进程模式最大
Linux下安装MemCached 字符串 memcached
前提准备：1. MemCached目前最新版本为：1.4.22，可以从官网下载到。2. MemCached依赖libevent，因此在安装MemCached之前需要先安装libevent。2.1 运行下面命令，查看系统是否已安装libevent。[root@SecurityCheck ~]# rpm -qa|grep libevent libevent-headers-1.4.13-4.el6.n
java设计模式之--jdk动态代理（实现aop编程） Supanccy2013 java DAO 设计模式 AOP
与静态代理类对照的是动态代理类，动态代理类的字节码在程序运行时由Java反射机制动态生成，无需程序员手工编写它的源代码。动态代理类不仅简化了编程工作，而且提高了软件系统的可扩展性，因为Java 反射机制可以生成任意类型的动态代理类。java.lang.reflect 包中的Proxy类和InvocationHandler 接口提供了生成动态代理类的能力。 &
Spring 4.2新特性-对java8默认方法(default method)定义Bean的支持 wiselyman spring 4
2.1 默认方法(default method) java8引入了一个default medthod; 用来扩展已有的接口,在对已有接口的使用不产生任何影响的情况下,添加扩展使用default关键字 Spring 4.2支持加载在默认方法里声明的bean 2.2 将要被声明成bean的类 public class DemoService {

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他