FLY

论文链接：https://arxiv.org/abs/1901.03784?context=cs.CV

简介

文章提出UPSNet，一个统一的全景分割网络。以ResNet做基干，首先设计了一个基于可变形卷积的语义分割头和一个MaskR-CNN风格的实例分割头，同时解决了这两个子任务。文章还提出了parameter-free全景分割头，它应用了来自前两个分支的得分，并将特征扩展从而能够预测一个额外的未知类，这个未知类能更好地解决语义分割和实力分割之间的冲突。除此之外，它还处理了变化的实例数目带来的挑战，并实现了端到端。该网络在Cityscapes和COCO数据集上都进行了评估，达到了当时最优，并且预测速度很快。

一、引言

语义分割和实力分割有相同之处，因此设计一个统一的表征是有益的，但是由于传统的语义分割和实力分割的实现结构差别很大，前者是基于fcn，后者则是普遍基于区域提议，因此，实现统一很难。

为了利用语义分割和实力分割之间的互补性，并且将分割更多的利用到实际应用中，文章[1]中统一了二者任务并提出了所谓的全景分割。其实在深度学习广泛应用之前，也已经有雷同全景分割的任务被研究，如图像解析[2]，场景解析[2]，全局场景理解[3]。

与之前使用独立的两个分支来完成全景分割和实例分割的方法[1][4]不同，文章使用了统一的基干网络，并在该基干上搭建两个分支同时完成两个任务。文章语义分支基于可变形卷积[5]搭建，使用了来自FPN[6]的多层多规模特征做输入，实例分支同Mask R-CNN[7]的设计,实验证明使用这两个轻量级头部与使用两个单独的网络达到的效果相当。更重要的是，文章还搭建了全景分割头，通过像素级的分类预测最终的全景分割图，其中的类别数目随着不同的图像有所改变，它利用来自上面两个分支的得分，并加入一个新的通道，该通道对应着一个额外的未知类，这能更好地解决语义分割和实例分割之间的矛盾。文章的parameter-free全景分割头是轻量级的，可以跟各种基干网络搭配使用。实现了端到端。

二、相关工作

语义分割
由于上下文环境对语义分割的重要性，出现了空洞卷积[8][9]，它带来了更大的感受野，且并无参数负担。金字塔场景解析网络（PSPNet）[10]就在其基干中使用了空洞卷积，它的实时应用变体[11]更是被广泛应用到实际应用中。基于FPN和PSPNet，一个多任务的架构在文章[12]中提出，并十分有效。
实例分割
大部分实例分割工作分为两个阶段，因此较慢，文章[13]提出了全卷积实例感知分割方法，除此之外还有Mask R-CNN。
全景分割
全景分割的基线方法[1]使用了两个独立的网络进行语义分割和实例分割，分别为PSPNet和Mask R-CNN，并使用启发式方法进行结果融合。近期，文章[4]提出一个弱半监督的全景分割方法，他们通过使用绑定框来监管事物类，通过使用图像级标记来监管事物类，从而减轻了GT约束。文章[14]提出了JSIS-Net，其使用一个统一的特征提取基干，并使用启发式方法进行结果融合，实现了统一的全景分割结构。文章[15]提出了一个注意力引导的统一网络（AUNet），利用了提议区域和mask级的注意力去更好地分割背景，与文章[1]中相同的预处理启发式方法被用在了生成最终的全景分割结果中。文章[16]提出things and stuff consistency network（TASCNet），该网络建立了一个能在things和stuff之间为每个像素进行二值掩膜预测的结构，还额外增加了一个loss来加强things和stuff预测间的一致性。

与上述大多数方式不同的是，文章使用了单一的基干网络为予以分割和实例分割提供特征，更重要的是，文章提出了一个简单的但是有效的全景分割头，能够准确的预测实例和类别。

三、UPSNet

文章在这部分介绍了文章模型并进而揭示了实施细节。用Nstuff和Nthing来代表stuff和thing类的个数。

3.1UPSNet结构

网络的整体结构如图1所示。

基干使用的是Mask R-CNN的基干，即resnet+fpn，实例分割头使用的也是Mask R-CNN的结构。
语义分割头
语义分割可以帮助提升实例分割的效果，文章使用基于变形卷积的语义分割网络头，以FPN的多层特征（P2-P5）为输入，这些特征首先各自经过相同的变形卷积进而被上采样到原图1/4大小，然后联合各个特征使用11卷积和softmax来预测语义类别，如图2所示。

实验证明使用这种方法能达到与使用独立的PSPNet方法效果相当。使用常规的像素级交叉熵损失。为了更多的关注如行人等前景物体，文章还引进了ROI loss。在训练过程中，使用GT box来剪裁各个实例的语义得分图并将其resize到2828，这是根据Mask R-CNN来的。ROI loss即在28*28的批上进行的交叉熵计算，能帮助惩罚实例物体内的像素的错误分类。后续实验也证明了，引入ROI loss 能在不损害语义分割的情况下提升全景分割效果。
全景分割头
来自语义分割头的得分表示为X，它的尺寸为N stuff +N thing , H ，W，X可以从通道维度被分为Xstuff和Xthing，分别代表stuff和thing中各个类别的语义得分。对各个图像，在训练过程中，根据GT的实例个数决定实例个数Ninst，在预测过程中，文章依赖一个掩模修剪过程决定实例个数Ninst，Nstuff是固定的因为stuff类别个数固定。全景分割头旨在首先生成一个得分向量Z，它的尺寸是(N stuff +N inst )×H×W ，进而决定每个像素的类别和实例ID。

文章首先将Xstuff直接给了Z的前Nstuff个通道，来提供stuff得分。而对于任何一个实例i，文章有它的对应类别掩膜得分Yi，这来自于实例分割头，尺寸为2828，同时还有它的box Bi和类别ID Ci，在训练过程中，Bi和Ci来自GT，在预测过程中二者来自Mask R-CNN的预测，因此，文章可以通过在语义分割图中根据Bi的位置和Ci从Xthing对应Ci类的通道中取得对应特征，且只取框Bi中的值，框外的值置零，即从语义分割头获取第i个实例的另一个特征Xmaski，Xmaski的尺寸为HW。进而，将Yi双线性插值成跟Xmaski相同尺寸，对框Bi外的值同样置零，示意为Ymaski，最终的第i个实例的特征表示为Z N stuff +i = X mask i + Y mask i 。当对每个实例完成以上工作并得到ZNstuff+Nthing后，对其通道维度进行softmax操作，以预测像素级的类别。如果某像素处的各个通道中最大值处于前Nstuff层，则该像素为对应的stuff类，否则，则最大值对应的通道指示实例ID。全景分割头结构如图3所示。

在训练过程中，文章根据用于建立全景得分的GT boxes来生成GT实例ID，全景分割头进而与标准像素级交叉熵损连接。

在预测过程中，文章根据上述方法预测好实例id后，仍需要确定每个实例的类别ID。这时，可以选择使用Mask R-CNN中预测的类别ID Cinst或者语义分割头预测的类别ID Csem，对于该处选择，文章利用了一个更好的启发式规则。具体地，对任何实例，文章可以知道哪些像素属于它，即在Z中，那些通道维度上的最大值对应的通道与该实例ID相对应的像素，都是属于该实例的。对这些像素，文章首先检查它们的Cinst和Csem是否都相同，如果是，文章按照Cinst的判断对该实例指派类别ID，否则，文章将计算这些像素的Csem的众数，表示为C^{sem。如果该众数所指类别在这些像素类别中所占的比例大于0.5，并且C}sem属于stuff类，则将这些像素预测为C^sem类别，即不再是实例，否则，将这些像素分配类别为Cinst类别ID，即仍为实例。简而言之，当遇到语义分割和实例分割预测的不一致时，只有在语义分割头更多地指示该实例其实为stuff类时才相信语义分割头的最大决断。选择以这样的启发式方法解决该矛盾，是因为语义分割头往往在stuff类别上能够实现很好的分割结果。
未知预测
文章介绍了一个崭新的方法，该方法能够允许UPSNet将一个像素分类为未知类。而不是做一个错误的预测。即如果一个行人被预测为自行车，因为该预测错过了正确的行人类别，则行人的FN值会增加1，另一方面，自行车的FP会增加1。考虑到PQ的定义为：

可以看到FP和FN增大都会导致PQ下降，因此如果错误的预测是难免的，则将该像素预测为未知类别，则只会增加原本该类的FN，而不会升高其他某一类的FP。

为减轻这个问题，文章用Z unknown = max(X thing ) − max(X mask )来计算额外的未知类的得分，其中Xmask是对Xmaski的联合，在通道维度上，Xmask的尺寸为N inst ×H ×W，最大值从通道维度获取。这样做的背后原理是，对于任何像素，如果Xthing的最大值大于Xmask的最大值，则很大可能上是忽略了一些实例，造成了（FN），图3示意了得分的组成。为了给未知类生成GT，在训练过程中，文章随机采样了30%的GT掩膜并设置他们为未知。在评估这个机制时，任何属于未知累的像素被忽略，例如，设置它为无用，这不会对结果产生影响。

3.2实施细节

继承自Mask R-CNN的部分大多沿袭它的设置和超参数，只介绍不同的部分。
训练
Pytorch,16Gpus,分布式训练框架Horovod[17],图像预处理与Mask R-CNN相同，batchsize=1，前面提到，训练阶段文章使用GT box，mask和类别标签来建立全景分割头的得分，文章的区域提案网络(RPN)是端到端的连同基干训练，而它是在Mask R-CNN的实施中是单独训练的。由于Cityscapes的分辨率太高，语义分割头和全景分割头的得分被下采样到1/4大小，虽然没有对基干的BN进行微调，但仍然达到了与目前最优的语义分割网络如PSPNet相当的性能，根据经验，文章提出如果能对BN进行微调，性能还能上升。

文章的UPSNet网络包含8个loss：语义分割头（全图和ROI 像素级分类loss）、全景分割头（全图像素级分类loss）、RPN（框分类、框回归loss）和实例分割头（框分类、框回归、掩膜分割loss），对这些多任务loss的不同加权机制可能导致很不相同的训练结果。后续的实验找到了loss平衡策略，比如，确保所有loss的规模都大致相同。
预测
预测阶段，当从实例分割头得到boxes、masks和预测的类别标签之后，就可以进行掩膜修剪，以此来决定哪个掩膜将被用于构建全景得分（在预测过程中，文章依赖一个掩模修剪过程决定实例个数Ninst，）。特别的，首先执行类不可知的非极大值抑制，box的IoU阈值为0.5，以此过滤掉部分重叠box，接下来，将剩余的box的类别概率进行排序，并保留概率大于0.6的。对每一个类别，对于每个类，创建一个与图像大小相同的画布。然后，将该类别的masks进行插值到原本图像规模对应的box尺寸大小，进而，按照概率从大到小的顺序一个个地将mask贴到画布上。每复制一次mask，如果当前mask和已经存在于当前mask位置上的其他掩码之间的交集大于阈值，则丢弃它，否则，复制非交叉部分到画布上。文章将该阈值设置为0.3。在预测阶段，来自语义分割和全景分割头的得分与原图尺寸相同。

四、实验结果

由于RQ很敏感，文章将所有stuff类的分割中面积小于阈值的分类为未知类。在Cityscapes中为2048，在COCO中为4096。实验结果如下。

关于运行时间，对比如下。

使用一个NVIDIA GeForce GTX 1080 Ti GPU 和一个 Intel Xeon E5-2687W CPU(3.00GHz)。结果是平均化后的，随着图片尺寸增大，文章模型在运行时间上更具优势。

五、消融实验

全景分割头
由于全景分割头是无参数的，可以当成一个简单的后处理，只对语义分割和实例分割进行训练后，在使用全景分割头进行预测，也可以对三个网络头同时训练，即也考虑全景分割的loss，从下表可见，对全景分割头的训练可以提高PQ

实例类别分配
还验证了不同的实例类别分配方法，对比了之前文中提到的启发式方法和直接以实例预测为准的方法，从上表中也可以看到启发式方法的有效性。
损失平衡
使用损失平衡可以提升效果
ROI损失和未知类预测
也能提升效果

除此之外，可以看到增加GTseg到预测中，也可以将PQth的值提升约10%。这是因为文章利用了语义分割辅助实例分割。

五、结论

文章提出了用于全景分割的统一的网络UPSNet，使用了统一的基干和轻量级的头部设计，更重要的是，文章的无参数全景分割网络头使用了上述两个网络头的得分并且预测了未知类。它解决了每个图片中变化的类别数量，并且实现了端到端的训练。在各个数据集上的实验结果表明文章模型实现了最佳效果并且与其他模型相比预测速度很快，未来，文章作者将探索更有力量的基干网络和更精明的全景分割头参数化。

六、参考文献

[1] A. Kirillov, K. He, R. Girshick, C. Rother, and P. Dollár.Panoptic segmentation. arXiv preprint arXiv:1801.00868,2018. 1, 2, 3, 4, 5, 6, 7, 8, 10, 11, 12, 13, 14, 15
[2] Z. Tu, X. Chen, A. L. Yuille, and S.-C. Zhu. Image parsing:Unifying segmentation, detection, and recognition. IJCV,63(2):113–140, 2005. 1
[3] J. Yao, S. Fidler, and R. Urtasun. Describing the scene asa whole: Joint object detection, scene classification and se-mantic segmentation. In CVPR, pages 702–709. IEEE, 2012.1
[4] Q. Li, A. Arnab, and P. H. Torr. Weakly-and semi-supervised panoptic segmentation. In ECCV, pages 102–118, 2018. 1,2, 6, 7, 12
[5] J. Dai, H. Qi, Y. Xiong, Y. Li, G. Zhang, H. Hu, and Y. Wei.Deformable convolutional networks. In ICCV, pages 764–773, 2017. 1, 3
[6] T.-Y. Lin, P. Dollár, R. B. Girshick, K. He, B. Hariharan, and S. J. Belongie. Feature pyramid networks for object detec-tion. In CVPR, volume 1, page 4, 2017. 1, 3
[7] K. He, G. Gkioxari, P. Dollár, and R. Girshick. Mask r-cnn. In ICCV, 2017. 1, 2, 3, 5
[8] F. Yu and V. Koltun. Multi-scale context aggregation by dilated convolutions. In ICLR, 2016. 2
[9] F. Yu, V. Koltun, and T. A. Funkhouser. Dilated residual networks. In CVPR, 2017. 2
[10] H. Zhao, J. Shi, X. Qi, X. Wang, and J. Jia. Pyramid scene parsing network. In CVPR, 2017. 1, 2, 5
[11] H. Zhao, J. Shi, X. Qi, X. Wang, and J. Jia. Pyramid scene parsing network. In CVPR, 2017. 1, 2, 5
[12] T. Xiao, Y. Liu, B. Zhou, Y. Jiang, and J. Sun. Unified perceptual parsing for scene understanding. In ECCV, 2018. 2
[13] Y. Li, H. Qi, J. Dai, X. Ji, and Y. Wei. Fully convolutional instance-aware semantic segmentation. In CVPR, 2017. 2
[14] D. de Geus, P. Meletis, and G. Dubbelman. Panoptic segmentation with a joint semantic and instance segmentation network. arXiv preprint arXiv:1809.02110, 2018. 2, 5, 6, 12
[15] Y. Li, X. Chen, Z. Zhu, L. Xie, G. Huang, D. Du, and X. Wang. Attention-guided unified network for panoptic segmentation. arXiv preprint arXiv:1812.03904, 2018. 2, 6
[16] J. Li, A. Raventos, A. Bhargava, T. Tagawa, and A. Gaidon. Learning to fuse things and stuff. arXiv preprint arXiv:1812.01192, 2018. 2, 6, 7
[17] A. Sergeev and M. D. Balso. Horovod: fast and easy distributed deep learning in TensorFlow. arXiv preprint arXiv:1802.05799, 2018. 5

Github上神仙级大模型项目：大语言模型(LLM)入门学习路线图，三个月让你从大模型基础到精通！ AI大模型-大飞 github 语言模型学习人工智能 AI大模型程序员 AI
Github项目上有一个大语言模型学习路线笔记，它全面涵盖了大语言模型的所需的基础知识学习，LLM前沿算法和架构，以及如何将大语言模型进行工程化实践。这份资料是初学者或有一定基础的开发/算法人员入门活深入大型语言模型学习的优秀参考。这份资料重点介绍了我们应该掌握哪些核心知识，并推荐了一系列优质的学习视频和博客，旨在帮助大家系统性地掌握大型语言模型的相关技术。大语言模型（LargeLanguageM
安卓 vs iOS 文件系统深度解析：开放自由与封闭安全的终极博弈 jingling1007 Android android ios 安全安全性测试
安卓和iOS的差异远不止于界面和生态，它们的文件系统设计更是体现了两种截然不同的技术哲学。安卓的开放目录允许用户“为所欲为”，而iOS的沙盒机制则像一座密不透风的堡垒。本文将通过技术细节对比、真实场景案例、用户操作指南，深度剖析两大系统的核心设计，回答一个关键问题：谁的设计更能平衡自由与安全？一、文件系统架构：从根目录到沙盒1.安卓：Linux的开放基因目录结构全景根目录（/）：包含所有系统层级（
AtCoder备赛冲刺必刷题（C++） | 洛谷 AT_abc396_a Triple Four 热爱编程的通信人 c++算法开发语言
本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来，并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构，旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。欢迎大家订阅我的专栏：算法题解：C++与Python实现！附上汇总贴：算法竞赛备考冲刺必刷题（C++）|汇总【题目来源】洛谷：AT_abc396_a[ABC396A]
算法及数据结构系列 - 滑动窗口诺亚凹凸曼算法及数据结构算法数据结构 java
系列文章目录算法及数据结构系列-二分查找算法及数据结构系列-BFS算法算法及数据结构系列-动态规划算法及数据结构系列-双指针算法及数据结构系列-回溯算法算法及数据结构系列-树文章目录滑动窗口框架思路经典题型76.最小覆盖子串567.字符串的排列438.找到字符串中所有字母异位词3.无重复字符的最长子串滑动窗口框架思路/*滑动窗口算法框架*/voidslidingWindow(strings,str
QHDBO基于量子计算和多策略融合的蜣螂优化算法算法小狂人算法改进智能优化算法量子计算算法
2.DBO基本的蜣螂算法通过模拟蜣螂在自然界中的四种行为（滚动、产卵、觅食和偷窃）来执行种群位置更新。2.1滚动蜣螂在自然界中，蜣螂必须通过太阳导航，使其球滚动的路线尽可能直线。方程(1)用于原始论文中更新滚动蜣螂的位置：xi(t+1)=xi(t)+α⋅k⋅xi(t−1)+b⋅Δx(1)x_i(t+1)=x_i(t)+\alpha\cdotk\cdotx_i(t-1)+b\cdot\Deltax\
AI模型技术演进与行业应用图谱智能计算研究中心其他
内容概要当前AI模型技术正经历从基础架构到行业落地的系统性革新。主流深度学习框架如TensorFlow和PyTorch持续优化动态计算图与分布式训练能力，而MXNet凭借高效的异构计算支持在边缘场景崭露头角。与此同时，模型压缩技术通过量化和知识蒸馏将参数量降低60%-80%，联邦学习则通过加密梯度交换实现多机构数据协同训练。在应用层面，医疗诊断模型通过迁移学习在CT影像分类任务中达到98.2%的准
H800能效架构实战解析智能计算研究中心其他
内容概要H800能效架构以异构计算资源调度与动态功耗控制为核心，通过系统级协同设计实现算力密度与能耗优化的双重目标。其核心技术覆盖智能负载分配、电压频率动态调节及热管理三大模块，形成从芯片级到数据中心级的垂直优化链路。在架构设计中，异构资源调度算法通过实时分析任务特征与硬件状态，动态分配CPU、GPU及专用加速器资源，最大化硬件利用率；动态功耗模块则基于负载波动自适应调整供电策略，结合多级电压频率
模型优化驱动产业应用创新智能计算研究中心其他
内容概要当前模型优化技术的迭代正沿着多维路径快速演进，其核心驱动力在于突破算法性能与产业需求间的适配瓶颈。以自适应学习机制与迁移学习框架为基础的优化策略，显著提升了模型在跨场景应用中的泛化能力，而超参数自动调优技术则通过PyTorch、TensorFlow等主流框架的接口标准化，降低了复杂模型的开发门槛。在部署层面，边缘计算与联邦学习的协同应用不仅缩短了金融预测、医疗影像分析等场景的响应延迟，更通
算力网协同创新与多场景应用实践智能计算研究中心其他
内容概要算力网协同创新正通过技术融合与场景适配，驱动算力资源的高效整合与跨域调度。核心突破方向涵盖异构计算架构优化、边缘计算实时响应能力提升，以及智能算力在工业互联网、数字孪生等场景的动态供给。随着“东数西算”工程推进，算力网络需兼顾性能与可持续性，在芯片制程优化、模型压缩算法及能耗管理等领域形成技术闭环。技术方向应用场景关键指标异构计算架构工业检测任务延迟<10ms模型压缩算法医疗影像分析计算资
算力技术创新与多场景应用突破智能计算研究中心其他
内容概要算力技术创新正成为驱动数字经济发展的核心引擎，其演进路径呈现出多维度突破态势。从量子计算颠覆性架构到光子计算超高速特性，从异构计算资源动态整合到边缘计算实时响应机制，技术革新持续突破物理边界与能耗瓶颈。应用层面，工业互联网实时控制、元宇宙沉浸式交互、生物计算精准建模等场景对算力提出差异化需求，推动智能调度算法与能效管理体系的协同优化。与此同时，全国一体化算力网络建设加速芯片制程迭代、数据中
搜索插入位置(力扣题）风继续吹.. LeetCode算法题 leetcode 算法职场和发展前端
题目：给定一个排序数组和一个目标值，在数组中找到目标值，并返回其索引。如果目标值不存在于数组中，返回它将会被按顺序插入的位置。来源：力扣（LeetCode）请必须使用时间复杂度为O(logn)的算法示例以及输出结果来源：力扣（LeetCode）示例1:输入:nums=[1,3,5,6],target=5输出:2示例2:输入:nums=[1,3,5,6],target=2输出:1示例3:输入:num
MMO基础双端架构（五）：如何O(1)的处理心跳消息晴空～蓝兮 MMO双端游戏架构游戏算法 c#
更多代码细节，球球各位观众老爷给鄙人的开源项目点个Star，持续更新中~Free项目开源地址5.LRU算法淘汰超时心跳消息采用双向链表+线程安全哈希字典处理心跳消息的超时和检查机制仿照了经典算法LRU（也就是最少关注移除算法，当容器内的size大于最大容许size时，最少关注的那个单位就会被移除）这样的设计可以实现，平均o(1)插入删除，整个链表的长度只与客户端连接的数量有关，每一次查询都会均摊超
PX4飞控之位置控制（1）整体架构 Felix_ZL px4飞控 PX4 位置控制架构
位置控制是无人机飞控的核心算法之一，一方面根据commander中的flag标志位和Navigator中提供的航点信息进行控制（自主模式下），另一方面得到期望姿态角（setpoint）的四元数信息，给到姿态控制模块进行姿态控制。本文重点PX4飞控的位置控制的代码整体架构（mc_pos_control）,具体的控制算法将在后续文章中陆续奉上。位置控制模块的主函数：task_main()1.订阅结构体
C++徒手造国密SM算法！码农の头发消失术实录 skyksksksksks C++个人杂记物联网国密算法国密算法密码学 c++开发语言
【开场暴击：程序员的修仙之路】各位在秃头边缘疯狂试探的代码战士！今天我们要挑战史诗级成就——用纯C++手搓国家密码管理局钦定的SM2/SM3/SM4算法！没有现成库！没有外挂！只有头铁和即将离你而去的头发！(ง•̀_•́)ง【SM2加密：和椭圆曲线谈恋爱の玄学】这玩意儿就像追女神——你永远猜不透她的心思！来看加密の奥义三连：SM2加密vs追妹子对比表行为SM2加密流程追妹子流程第一步生成随机数k制
C++ 用ECC算法 Curve为EC_NIST_FP_521写个示例签名和验签。PCI认证小黄人软件经验分享 ssl 学习
以下是一个使用OpenSSL实现ECC(椭圆曲线密码)签名和验签的C++示例，曲线使用secp521r1（即NISTP-521）。这个程序：生成NISTP-521曲线的EC密钥。使用SHA-512进行哈希并签名数据。验证签名的正确性。编译：g++-oecc_signecc_sign.cpp-lssl-lcrypto运行：./ecc_sign你可以试试看，看看签名和验签是否成功！
基于springboot的在线点餐系统爱编程的小哥 java毕设 spring boot 后端 java vue
全栈在线点餐系统架构解析|SpringBoot+ElementUI后台管理实战（附高并发订单处理方案）一、系统全景透视基于五张效果图分析，该系统是餐饮行业全流程数字化解决方案，采用SpringBoot+MyBatisPlus+Vue2+ElementUI技术栈，实现用户端订餐与商家端管理的双向闭环。通过RBAC权限控制+订单状态机+实时库存预警三大核心机制，支持日均万级订单处理，覆盖从用户选餐、支
AI大模型训练教程 Small踢倒coffee_氕氘氚 python自学经验分享笔记
1.引言随着人工智能技术的快速发展，大模型（如GPT-3、BERT等）在自然语言处理、计算机视觉等领域取得了显著的成果。训练一个大模型需要大量的计算资源、数据和专业知识。本教程将带你了解如何从零开始训练一个AI大模型。2.准备工作2.1硬件要求GPU：推荐使用NVIDIA的高性能GPU，如A100、V100等。内存：至少64GBRAM。存储：SSD存储，至少1TB。#2.2软件环境操作系统：Lin
使用Jupyter Notebook进行深度学习编程 - 深度学习教程 shandianfk_com ChatGPT AI jupyter 深度学习 ide
大家好，今天我们要聊聊如何使用JupyterNotebook进行深度学习编程。深度学习是人工智能领域中的一项重要技术，通过模仿人脑神经网络的方式进行学习和分析。JupyterNotebook作为一个强大的工具，可以帮助我们轻松地进行深度学习编程，尤其适合初学者和研究人员。本文将带领大家一步步了解如何在JupyterNotebook中开展深度学习项目。一、什么是JupyterNotebook？Jup
Opencv之计算机视觉一闭月之泪舞计算机视觉计算机视觉 opencv python
一、环境准备使用opencv库来实现简单的计算机视觉。需要安装两个库：opencv-python和opencv-contrib-python，版本可以自行选择，注意不同版本的opencv中的某些函数名和用法可能不同pipinstallopencv-python==3.4.18.65-ihttps://pypi.tuna.tsinghua.edu.cn/simplepipinstallopencv-
计算机视觉总结 Trank-Lw 计算机视觉深度学习人工智能
以下是针对上述问题的详细解答，并结合代码示例进行说明：1.改进YOLOv5人脸检测模块，复杂光照场景准确率从98.2%提升至99.5%优化具体过程：光照补偿：在数据预处理阶段，采用自适应光照补偿算法，对图像进行实时增强，以减少光照变化对人脸检测的影响。数据增强：在训练数据中增加复杂光照场景下的样本，如强光、弱光、背光等，通过数据增强提高模型对不同光照条件的适应性。模型调整：对YOLOv5模型的网络
自动驾驶系统的车辆动力学建模：自行车模型与汽车模型的对比分析赛卡自动驾驶自动驾驶数学建模 python numpy matplotlib 算法
在自动驾驶系统的车辆动力学建模中，自行车模型（BicycleModel）和更复杂的汽车模型（如双轨模型或多体动力学模型）各有其适用场景和优缺点。以下是两者的详细对比及选择原因解析：1.模型定义与核心差异特性自行车模型复杂汽车模型（如双轨模型）简化假设将四轮车辆简化为两轮（前轮转向，后轮驱动）考虑四轮独立运动、悬架系统、轮胎侧偏特性自由度2-3自由度（位置x,y，航向角θ）6+自由度（含横向、俯仰、
每日一题一一Leetcode128. 最长连续序列 - 力扣 Blue.ztl 写写算法 leetcode 算法数据结构
每日一题一一Leetcode128.最长连续序列-力扣作者：blue时间：2025.3.14128.最长连续序列-力扣（LeetCode）本题的要求是：给定一个未排序的整数数组nums，找出其中数字连续的最长序列（不要求序列元素在原数组中连续）的长度。本题用排序加遍历的方法非常容易解决，但是算法的效率太低。本题正真的解题思路如下，首先，数组中是有可能出现重复的数字，但是重复的数字其实并不影响我们找
DeepSeek关键RL算法GRPO，有人从头跑通了，贡献完整代码强化学习曾小健2 大语言模型LLM 算法
DeepSeek关键RL算法GRPO，有人从头跑通了，贡献完整代码机器之心2025年03月02日11:54北京选自GitHub作者：AndriyBurkov机器之心编译GRPO（GroupRelativePolicyOptimization）是DeepSeek-R1成功的基础技术之一，我们之前也多次报道过该技术，比如《DeepSeek用的GRPO占用大量内存？有人给出了些破解方法》。简单来说，GR
深度学习 Deep Learning 第8章深度学习优化 odoo中国 AI编程人工智能深度学习人工智能优化
深度学习第8章深度学习的优化章节概述本章深入探讨了深度学习中的优化技术，旨在解决模型训练过程中面临的各种挑战。优化是深度学习的核心环节，直接关系到模型的训练效率和最终性能。本章首先介绍了优化在深度学习中的特殊性，然后详细讨论了多种优化算法，包括随机梯度下降（SGD）、动量法、Nesterov动量法、AdaGrad、RMSProp和Adam等。此外，还探讨了参数初始化策略、自适应学习率方法以及二阶优
DAY33 贪心算法Ⅱ Useee 贪心算法算法
122.买卖股票的最佳时机II-力扣（LeetCode）想到把整体利润分解为每天的利润，就豁然开朗了。classSolution{public:intmaxProfit(vector&prices){intresult=0;for(inti=1;i&nums){intcover=0;if(nums.size()==1)returntrue;for(inti=0;i=nums.size()-1)re
众数(masses)（c++）羊蜜不是羊 c++算法数据结构
题目描述由文件给出N个1到30000间无序数正整数，其中1≤N≤10000，同一个正整数可能会出现多次，出现次数最多的整数称为众数。求出它的众数及它出现的次数。输入描述输入文件第一行是正整数的个数N，第二行开始为N个正整数。输出描述输出文件有若干行，每行两个数，第1个是众数，第2个是众数出现的次数。（两个数之间由一个空格间隔，行末无多余空格）样例输入12242325372343输出2434来源算法
简单密码破解（c++）羊蜜不是羊 c++算法开发语言
题目描述密码是我们生活中非常重要的东东，我们的那么一点不能说的秘密就全靠它了。哇哈哈.接下来渊子要在密码之上再加一套密码，虽然简单但也安全。假设渊子原来一个BBS上的密码为zvbo941987,为了方便记忆，他通过一种算法把这个密码变换成YUANzi1987，这个密码是他的名字和出生年份，怎么忘都忘不了，而且可以明目张胆地放在显眼的地方而不被别人知道真正的密码。他是这么变换的，大家都知道手机上的字
HTML语言的贪心算法宇瞳月包罗万象 golang 开发语言后端
HTML语言的贪心算法：理论与实践引言在编程和算法研究中，贪心算法是一种广泛应用的解决问题的方法。它通过对每一阶段选择最优解的方式来构建整个问题的解决方案。贪心算法不一定能在所有情况下得到最优解，但在许多实际问题中，它能够提供一个足够好的近似解。本文将探讨贪心算法的基本概念、典型应用、优缺点，并结合HTML语言的特点，提出一些具体的实现示例和思考。一、贪心算法的基本概念贪心算法是一种求解最优化问题
景联文科技提供高质量文本标注服务，驱动AI技术发展景联文科技科技人工智能
文本标注是指在原始文本数据上添加标签的过程，这些标签可以用来指示特定的实体、关系、事件等信息，以帮助计算机理解和处理这些数据。文本标注是自然语言处理（NLP）领域的一个重要环节，它通过为文本的不同部分提供具体的含义和上下文信息，增强机器学习和深度学习模型对文本内容的理解能力。标注类型情感分析情感极性：确定文本表达的情感倾向，如正面、负面或中立。强度评估：衡量情感的强烈程度，从轻微到极端不等。命名实
《Hello 算法》火了！！！一本写给算法初学者的入门算法书籍遇码分享算法 hello hello算法算法书籍
曾经也放出豪言壮语，决心要刷遍力扣上的所有算法题目。然而现实就很快啪啪的打脸。不知道多少人和我有过一样的经历。在读到《Hello算法》的序中，作者靳宇栋给了我们一个“台阶”。随后就表达了针对我们的现状，他特地写了《Hello算法》这本书，代表广大算法初学者表示感激涕零。《Hello算法》为什么适合入门动画图解、一键运行的数据结构与算法教程全书采用动画图解，内容清晰易懂、学习曲线平滑，引导初学者探索
开发者关心的那些事圣子足道 ios 游戏编程 apple 支付
我要在app里添加IAP，必须要注册自己的产品标识符（product identifiers）。产品标识符是什么？产品标识符（Product Identifiers）是一串字符串，它用来识别你在应用内贩卖的每件商品。App Store用产品标识符来检索产品信息，标识符只能包含大小写字母（A-Z）、数字（0-9）、下划线（-）、以及圆点(.)。你可以任意排列这些元素，但我们建议你创建标识符时使用
负载均衡器技术Nginx和F5的优缺点对比 bijian1013 nginx F5
对于数据流量过大的网络中，往往单一设备无法承担，需要多台设备进行数据分流，而负载均衡器就是用来将数据分流到多台设备的一个转发器。目前有许多不同的负载均衡技术用以满足不同的应用需求，如软/硬件负载均衡、本地/全局负载均衡、更高
LeetCode[Math] - #9 Palindrome Number Cwind java Algorithm 题解 LeetCode Math
原题链接：#9 Palindrome Number 要求：判断一个整数是否是回文数，不要使用额外的存储空间难度：简单分析：题目限制不允许使用额外的存储空间应指不允许使用O(n)的内存空间，O(1)的内存用于存储中间结果是可以接受的。于是考虑将该整型数反转，然后与原数字进行比较。注：没有看到有关负数是否可以是回文数的明确结论，例如
画图板的基本实现 15700786134 画图板
要实现画图板的基本功能，除了在qq登陆界面中用到的组件和方法外，还需要添加鼠标监听器，和接口实现。首先，需要显示一个JFrame界面： public class DrameFrame extends JFrame { //显示
linux的ps命令被触发 linux
Linux中的ps命令是Process Status的缩写。ps命令用来列出系统中当前运行的那些进程。ps命令列出的是当前那些进程的快照，就是执行ps命令的那个时刻的那些进程，如果想要动态的显示进程信息，就可以使用top命令。要对进程进行监测和控制，首先必须要了解当前进程的情况，也就是需要查看当前进程，而 ps 命令就是最基本同时也是非常强大的进程查看命令。使用该命令可以确定有哪些进程正在运行
Android 音乐播放器下一曲连续跳几首歌肆无忌惮_ android
最近在写安卓音乐播放器的时候遇到个问题。在MediaPlayer播放结束时会回调 player.setOnCompletionListener(new OnCompletionListener() { @Override public void onCompletion(MediaPlayer mp) { mp.reset(); Log.i("H
java导出txt文件的例子知了ing java servlet
代码很简单就一个servlet,如下： package com.eastcom.servlet; import java.io.BufferedOutputStream; import java.io.IOException; import java.net.URLEncoder; import java.sql.Connection; import java.sql.Resu
Scala stack试玩, 提高第三方依赖下载速度矮蛋蛋 scala sbt
原文地址： http://segmentfault.com/a/1190000002894524 sbt下载速度实在是惨不忍睹, 需要做些配置优化下载typesafe离线包, 保存为ivy本地库 wget http://downloads.typesafe.com/typesafe-activator/1.3.4/typesafe-activator-1.3.4.zip 解压r
phantomjs安装(linux，附带环境变量设置) ，以及casperjs安装。 alleni123 linux spider
1. 首先从官网 http://phantomjs.org/下载phantomjs压缩包，解压缩到/root/phantomjs文件夹。 2. 安装依赖 sudo yum install fontconfig freetype libfreetype.so.6 libfontconfig.so.1 libstdc++.so.6 3. 配置环境变量 vi /etc/profil
JAVA IO FileInputStream和FileOutputStream，字节流的打包输出百合不是茶 java核心思想 JAVA IO操作字节流
在程序设计语言中，数据的保存是基本，如果某程序语言不能保存数据那么该语言是不可能存在的，JAVA是当今最流行的面向对象设计语言之一，在保存数据中也有自己独特的一面，字节流和字符流 1，字节流是由字节构成的，字符流是由字符构成的字节流和字符流都是继承的InputStream和OutPutStream ,java中两种最基本的就是字节流和字符流类 FileInputStream
Spring基础实例（依赖注入和控制反转） bijian1013 spring
前提条件：在http://www.springsource.org/download网站上下载Spring框架，并将spring.jar、log4j-1.2.15.jar、commons-logging.jar加载至工程1.武器接口 package com.bijian.spring.base3; public interface Weapon { void kil
HR看重的十大技能 bijian1013 提升能力 HR 成长
一个人掌握何种技能取决于他的兴趣、能力和聪明程度，也取决于他所能支配的资源以及制定的事业目标，拥有过硬技能的人有更多的工作机会。但是，由于经济发展前景不确定，掌握对你的事业有所帮助的技能显得尤为重要。以下是最受雇主欢迎的十种技能。　　一、解决问题的能力　　每天，我们都要在生活和工作中解决一些综合性的问题。那些能够发现问题、解决问题并迅速作出有效决
【Thrift一】Thrift编译安装 bit1129 thrift
什么是Thrift The Apache Thrift software framework, for scalable cross-language services development, combines a software stack with a code generation engine to build services that work efficiently and s
【Avro三】Hadoop MapReduce读写Avro文件 bit1129 mapreduce
Avro是Doug Cutting(此人绝对是神一般的存在）牵头开发的。开发之初就是围绕着完善Hadoop生态系统的数据处理而开展的（使用Avro作为Hadoop MapReduce需要处理数据序列化和反序列化的场景）,因此Hadoop MapReduce集成Avro也就是自然而然的事情。这个例子是一个简单的Hadoop MapReduce读取Avro格式的源文件进行计数统计，然后将计算结果
nginx定制500，502，503，504页面 ronin47 nginx　错误显示
server { listen 80; error_page 500/500.html; error_page 502/502.html; error_page 503/503.html; error_page 504/504.html; location /test {return502;}} 配置很简单，和配
java-1.二叉查找树转为双向链表 bylijinnan 二叉查找树
import java.util.ArrayList; import java.util.List; public class BSTreeToLinkedList { /* 把二元查找树转变成排序的双向链表题目：输入一棵二元查找树，将该二元查找树转换成一个排序的双向链表。要求不能创建任何新的结点，只调整指针的指向。 10 / \ 6 14 / \
Netty源码学习-HTTP-tunnel bylijinnan java netty
Netty关于HTTP tunnel的说明： http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/socket/http/package-summary.html#package_description 这个说明有点太简略了一个完整的例子在这里： https://github.com/bylijinnan
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别 coder_xpf jquery json map val()
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别数据库查询出来的map有一个字段为空通过System.out.println()输出 JSONUtil.serialize(map)： {"one":"1","two":"nul
Hibernate缓存总结 cuishikuan 开源 ssh javaweb hibernate缓存三大框架
一、为什么要用Hibernate缓存？ Hibernate是一个持久层框架，经常访问物理数据库。为了降低应用程序对物理数据源访问的频次，从而提高应用程序的运行性能。缓存内的数据是对物理数据源中的数据的复制，应用程序在运行时从缓存读写数据，在特定的时刻或事件会同步缓存和物理数据源的数据。二、Hibernate缓存原理是怎样的？ Hibernate缓存包括两大类：Hib
CentOs6 dalan_123 centos
首先su - 切换到root下面1、首先要先安装GCC GCC-C++ Openssl等以来模块：yum -y install make gcc gcc-c++ kernel-devel m4 ncurses-devel openssl-devel2、再安装ncurses模块yum -y install ncurses-develyum install ncurses-devel3、下载Erang
10款用 jquery 实现滚动条至页面底端自动加载数据效果 dcj3sjt126com JavaScript
无限滚动自动翻页可以说是web2.0时代的一项堪称伟大的技术，它让我们在浏览页面的时候只需要把滚动条拉到网页底部就能自动显示下一页的结果，改变了一直以来只能通过点击下一页来翻页这种常规做法。无限滚动自动翻页技术的鼻祖是微博的先驱：推特(twitter)，后来必应图片搜索、谷歌图片搜索、google reader、箱包批发网等纷纷抄袭了这一项技术，于是靠滚动浏览器滚动条
ImageButton去边框&Button或者ImageButton的背景透明 dcj3sjt126com imagebutton
在ImageButton中载入图片后，很多人会觉得有图片周围的白边会影响到美观，其实解决这个问题有两种方法一种方法是将ImageButton的背景改为所需要的图片。如：android:background="@drawable/XXX" 第二种方法就是将ImageButton背景改为透明，这个方法更常用在XML里； <ImageBut
JSP之c:foreach eksliang jsp forearch
原文出自：http://www.cnblogs.com/draem0507/archive/2012/09/24/2699745.html <c:forEach>标签用于通用数据循环，它有以下属性属性描述是否必须缺省值 items 进行循环的项目否无 begin 开始条件否 0 end 结束条件否集合中的最后一个项目 step 步长否 1
Android实现主动连接蓝牙耳机 gqdy365 android
在Android程序中可以实现自动扫描蓝牙、配对蓝牙、建立数据通道。蓝牙分不同类型，这篇文字只讨论如何与蓝牙耳机连接。大致可以分三步：一、扫描蓝牙设备： 1、注册并监听广播： BluetoothAdapter.ACTION_DISCOVERY_STARTED BluetoothDevice.ACTION_FOUND BluetoothAdapter.ACTION_DIS
android学习轨迹之四：org.json.JSONException: No value for hyz301 json
org.json.JSONException: No value for items 在JSON解析中会遇到一种错误，很常见的错误 06-21 12:19:08.714 2098-2127/com.jikexueyuan.secret I/System.out﹕ Result:{"status":1,"page":1,&
干货分享：从零开始学编程系列汇总 justjavac 编程
程序员总爱重新发明轮子，于是做了要给轮子汇总。从零开始写个编译器吧系列 (知乎专栏) 从零开始写一个简单的操作系统 (伯乐在线) 从零开始写JavaScript框架 (图灵社区) 从零开始写jQuery框架 (蓝色理想 ) 从零开始nodejs系列文章 (粉丝日志) 从零开始编写网络游戏
jquery-autocomplete 使用手册 macroli jquery Ajax 脚本
jquery-autocomplete学习一、用前必备官方网站：http://bassistance.de/jquery-plugins/jquery-plugin-autocomplete/ 当前版本：1.1 需要JQuery版本：1.2.6 二、使用 <script src="./jquery-1.3.2.js" type="text/ja
PLSQL-Developer或者Navicat等工具连接远程oracle数据库的详细配置以及数据库编码的修改超声波 oracle plsql
　　在服务器上将Oracle安装好之后接下来要做的就是通过本地机器来远程连接服务器端的oracle数据库，常用的客户端连接工具就是PLSQL-Developer或者Navicat这些工具了。刚开始也是各种报错，什么TNS:no listener;TNS:lost connection;TNS:target hosts...花了一天的时间终于让PLSQL-Developer和Navicat等这些客户
数据仓库数据模型之：极限存储--历史拉链表 superlxw1234 极限存储数据仓库数据模型拉链历史表
在数据仓库的数据模型设计过程中，经常会遇到这样的需求： 1. 数据量比较大; 2. 表中的部分字段会被update,如用户的地址，产品的描述信息，订单的状态等等; 3. 需要查看某一个时间点或者时间段的历史快照信息，比如，查看某一个订单在历史某一个时间点的状态，比如，查看某一个用户在过去某一段时间内，更新过几次等等; 4. 变化的比例和频率不是很大，比如，总共有10
10点睛Spring MVC4.1-全局异常处理 wiselyman spring mvc
10.1 全局异常处理使用@ControllerAdvice注解来实现全局异常处理; 使用@ControllerAdvice的属性缩小处理范围 10.2 演示演示控制器 package com.wisely.web; import org.springframework.stereotype.Controller; import org.spring

UPSNet: A Unified Panoptic Segmentation Network 论文阅读

UPSNet: A Unified Panoptic Segmentation Network 论文阅读

简介

一、引言

二、相关工作

三、UPSNet

3.1UPSNet结构

3.2实施细节

四、实验结果

五、消融实验

五、结论

六、参考文献

你可能感兴趣的:(全景分割,计算机视觉,算法,自动驾驶,深度学习)

UPSNet: A Unified Panoptic Segmentation Network 论文阅读

UPSNet: A Unified Panoptic Segmentation Network 论文阅读

简介

一、 引言

二、 相关工作

三、UPSNet

3.1UPSNet结构

3.2实施细节

四、实验结果

五、消融实验

五、结论

六、参考文献

你可能感兴趣的:(全景分割,计算机视觉,算法,自动驾驶,深度学习)

一、引言

二、相关工作