KirutoCode

自助收款机项目记录与总结

研一主要做了两件事情，一是收款机项目，二是6Dpose估计的比赛，这两块做的都不好。
我是跨专业进来的，考完研之后学了一点吴恩达的网课，来了之后就直接安排进入项目了，

收款机项目

过程总览

先是做的tensorRT的优化，然后是边缘设备的移植

tensorRT

先说结果，没搞出来，用的剪枝模型代替

tensorRT需要将权重文件转化为ONNX格式，然后再将ONNX转换成trt格式。

在接手tensorrt的处理后，想通过之前的同学提供的 model转onnx 和 onnx转trt 程序对剪枝后的yolo进行处理，第一步model转onnx顺利进行，但到了第二部转trt发现无法将onnx序列化。

model转onnx问题

起初，认为是 onnx转trt 程序有问题，之后查阅网上资料，但发现网上的PyTorch框架转trt的程序都大同小异，几乎都一样，此时，怀疑是 model转onnx 程序转出来的 onnx 文件有问题。

为了验证怀疑是否正确，从网上下载了一个训练mnist的onnx文件，发现可成功转为trt文件。

初步认为是 model转onnx 程序有问题，但为了巩固此结论，将官方的yolov3.onnx文件拿来试验，但是运行报错：

经搜索，是batch_size过大的问题，官方的batch_size是64，如图

而我们平时用的batch_size是1，机器支持不起来这个大的batch_size，此时无法验证官方onnx是否能转rtr。

此时我换了一种方法，通过Nerotn可视化来比较官方onnx和我们自己转出来的onnx的差别，差别如下：
我们自己的onnx（用的原版cfg和best.pt, 是未剪枝的，所以所用的资源是和官方相同的）的最后几层：

官方的onnx的最后几层如下：

初步断定是 model转onnx程序出了问题，开始查阅资料，但是此时又发现，PyTorch框架的写法也基本都是一样的，其他人都可顺利转换至最后。
尝试用官方的tensorrt写的解析器转换model，但是报错（python2.7版本，直接复制过来的，只修改了读取cfg和weight的地址），错误尚未找到解决方法。

此时，问题开始焦灼，对于如何解决问题，现有一些几个思路：

通读官方tensorrt写的关于yolov3的解析器（python2.7版本，近800行），然后对其进行改进（改进后不知和框架直接写的能有多少差别，时间成本高，可能收益也不好）
直接使用官方的trt来加速，如果对未剪枝的yolo加速后的效果比剪枝后但未加速的yolo 好，那或许可能采用这种方法
用其他框架来转换，如tensorflow，tensorflow框架是不需要转onnx的，可直接用tensorrt加速推理，但是也可能遇到新的tensorflow难题（网上多是用tensorrt加速PyTorch框架写的yolo，一方面说明PyTorch框架的优越性，一方面是否也说明其他框架在tensorrt加速方面表现没有PyTorch好？）

为了解决问题，我找了个新的开源项目，作者是在官方转换sample（手写解析器）上进行改动的，添加了1_batch_size和multi_size的代码，因此上个周的64_batch_size无法处理得问题就解决了。

作者的cfg和weights解析器和官方相同，但这次我找到了读取cfg文件报错的原因，就是剪枝的cfg文件最后少了一个\n。

项目1地址：https://github.com/Cw-zero/TensorRT_yolo3_module

这个项目带来的价值：解决了官方代码只能处理64_batch_size, 无法处理1_batch_size的问题

利用该项目的代码，可完整将原版和剪枝的cfg和weights -> onnx ->trt（利用的是官方手写yolo解析器相关代码，不是用的Pytorch框架）

对剪枝模型的加速：

之后，试了一下这个项目的tensorrt推理，没有计算速度，只是检测能否顺利运行，结果是运行蛮顺利的。
下一步，将该项目的利用tensorrt推理的代码移植到了剪枝的yolo上，发现竟然画不出任何bounding_box。
然后将原版yolo的trt也放到用于处理剪枝的代码中，虽然精度不高但是能顺利画出bounding_box。
输出剪枝的trt推导出的detection，发现全都是0，而原版的trt推导出来的不是。
回头检查问题，发现剪枝的onnx可视化后，有几个数据是独立于整个框架的，仔细观察剪枝的cfg,发现其中有maxpool层，然而原版yolo中并没有maxpool层，
所以官方给出的解析器也无法处理maxpool层，只是跳过了。

出现这种情况的问题在于我不了解该剪枝算法，我原本以为只是减掉了几个层，又合并了几个层，没有加额外的其它层，这时开始寻找新的方法。

两个思路：
一、用Pytorch框架转换onnx，然后又项目1的代码转trt（之所以不用pytorch一口气转，是因为tensorrt5.0不支持upsample层，而无论是剪枝还是原版yolo，都要用到upsample层，官方的没用框架的代码可以很好的解析upsample层，如果要用pytorch那么就得自己定义upsample层解析），之前失败的原因，经过这几天的查阅，发现确实是Pytorch版本的问题，tensorrt5.0出的时候是对应的Pytorch0.4.1的，从0.4.1到1.0，Pytroch中带的ONNX已经升级了，tensorrt未必能解读新版本的ONNX。
但相对应的问题有是：需要装双版本cuda，现安装版本是10.0，而Pytorch0.4.1要求的是cuda9.0。

二、找新的剪枝模型，和原版结构相同的那种
项目2地址：https://github.com/Lam1360/YOLOv3-model-pruning
找到如上模型，原版的剪枝，层数更少，没有maxpool层，而且还是检测手的，已经训练好可以直接使用。
相对应的问题：需要在python3.6环境运行，Pytorch1.0及以上版本

一开始先以第一个为执行方案，先在自己电脑的虚拟机中安装pytorch0.4.1和cuda，但是cuda安装失败了，经查阅，发现虚拟机中无法安装cuda, 硬安装的方法也有，但很麻烦，而装双版本cuda也很麻烦，所以先执行第二个思路试试

将项目2的cgf和pth文件放到项目1的转换代码中，顺利的转出onnx和trt文件，可视化onnx文件，发现这次没有奇怪的层和脱离框架的数据，很欣慰。
然后建立python3.6的虚拟环境，安装pytorch时出现Bug，发现服务器cuda10.0的软连接没有了，可能是之前换pytorch版本时搞坏了

这个周在进行项目2的tensorrt加速，换了多种方法，改动shape也无法正确用tensorrt推理，折腾多天无果。后来看了下这个剪枝模型参考的论文，发现与原版相比，减掉了很多CNN的channel，可能这就是我使用的tensorrt加速代码无法正常运行的原因，这个代码是针对原版yolo写的，或许对层进行了改动会无法识别？
在陷入困难之际，决定试试项目2在tx2上的速度，发现最高能达到9 fps，所以之后就没有继续搞tensorrt了

边缘设备

在这个项目的时间里，大部分时间都是在搞移植，一共接触了四块板子：Nano，TX1，TX2，rk3399pro。其中前三块板子还好，支持pytorch模型(我们的代码就是pytorch写的)，但是第四块就有点拉跨了，而且公司那边还就想用第四块(便宜，有NPU，计算速度稍快)。

公司那边提出用rk3399pro，经调研，发现当其GPU和NPU同时运行时，速度能达到Nano的二倍左右，然后用新的模型在Nano上试了一下，能达到4帧，如果3399的效果真的能达到Nano二倍，或许可以试试，测试了下，rk3399 pro是可以运行tensorflow框架的yolo的，能跑到7帧左右，然后就开始着手模型转换的工作。

问题就在于第四块支持的框架有限(仅部分tensorflow，caffe，darknet，不支持pytorch）。

一开始的想法是，想直接用网上的代码将pytorch框架转换成tensorflow框架，经查阅后，发现有两种方式：

一、pytorch -> onnx -> keras -> tensorflow
由于之前研究tensorRT的时候用到了很多的onnx文件，而且现在还保存的，就先尝试了这种方法。
这是该方法用到的代码来源：https://github.com/nerox8664/onnx2keras
但是转换时发现了问题，就是只能转换layer，到了转换weight的时候就会卡住，keras model转换不出来
报错代码：TypeError: unhashable type:‘google.protobuf.pyext._message.RepeatedScalarContainer’
之后尝试更换多个protobuf版本，发现还是不可以，目前认为可能是onnx文件有些问题，但是还没找到解决的方法。就先尝试了另一种方法

二、pytorch -> keras -> tensorflow
这个方法用到的代码来源：https://github.com/nerox8664/pytorch2keras
查看更多的资料，发现这个代码并不支持yolo层的转换，所以这个方法也不能用。
解决问题的思路：

用tensorflow复现剪枝和微调的代码（我们现在正在尝试，但是我觉得以我们现在的水平，不太可能）
在网上找一些tensorflow的yolo剪枝代码（这是我最开始尝试的方法，但是没找到，下个周再仔细看看）

尝试了使用ONNX模型和Darknet模型来让之前的剪枝yolo能在rk3399 pro上运行，遇到的问题：
ONNX模型：
将之前搞tensorrt的时候用的onnx放到rk3399提供的 onnx转rknn 代码中转换，转出来不能用。剪枝和原版的都试过了，判断不是剪枝的问题，原版的也不能用，网上说这个rk3399只对tensorflow有完整支持，而对其他模型支持不全，这可能是个原因。
Darknet框架：
我之前使用的权重文件是.pth文件，Darknet需要.weights文件，我是用之前代码自带的转换函数来转换：
model = Darknet(‘prune_yolov3-hand.cfg’)
weights = ‘prune_yolov3_ckpt.pth’
model.load_state_dict(torch.load(weights, map_location=‘cpu’))
model.save_darknet_weights(path=‘converted.weights’)
但是也报错
IndexError: index 1 is out of range
还没找到那里出了问题，这些转换看起来不是怎么靠谱

尝试了对yolo剪掉用不掉的小尺度来提高速度，后来发现无论只保留那个尺度，都能检测出近距离和远距离的手


这两张手分别是只保留大尺度和只保留小尺度检测出来的，按理来讲不应该这样，但是运行起来三种尺度除了最大框的大小以外几乎没什么区别。

开始着手Darknet框架的处理，主要使用到了两个网站的内容:
ToyBrick社区：http://t.rock-chips.com/forum.php?mod=viewthread&tid=184
yolov3官网：https://pjreddie.com/darknet/train-cifar/

过程：

一开始直接对cfg进行改动，然后使用原版的weights，在pytorch框架下的yolov3是可以运行这样的文件并进行预测的。但是在Darknet框架中，这样没有用。
后来使用原版的weights，对cfg进行修改，然后提取相应的卷积层参数进行训练，这里只用了3张图片epoch了8次，训练的classes只有3种，只为尝试该思路的可行性。
成功训练之后，将其放到rk3399的darknet网络中，rknn的inference能顺利执行，并输出最后卷积层输出的参数。
之后对inference之后的数据维度处理进行了调整，使用图片进行测试，可以执行完检测程序(但是是没有检测效果的)，证明darknet的修改基本没有什么问题了。
对视频进行测试，能够达到10 FPS

先是训练了单尺度的yolov3，但是效果奇差，根本检测不出东西来；现在在训完整的单分类yolov3，如果效果好，就提取前82层(单尺度)的网络再试试。

完整的尺度的yolov3训练出来了，但是仍然发现什么都检测不到，一开始以为是训练的不好，后来将权重放到服务器上，发现可以正常预测，精度还可以。
因此，回头看了下官方提供的yolo_demo的代码，感觉他写的不太对，训练的单尺度权重放上去什么都跑不出来，object_threshold计算用了一种没见过的公式，跟之前看过的一些yolov3源码不太一样：
obj_thresh = -np.log(1/OBJ_THRESH - 1)
之后尝试用tensorflow的代码，但是因为对tensorflow不够了解，改起来很吃力，就尝试在服务器的代码中，将Pytorch实现的部分用Numpy来写，但是我对这两个也不是很熟，改起来比较慢，比较花费时间。

将Pytorch模型改为Numpy的工作已经完成了，但是预测的效果还是很差

那么大的模型想要在小的板子上运行，必然是要量化的，将文件大小从200+MB压缩到50+MB，必然会损失一些精度。而我遇到的问题是，检测不出任何的手，精度损失巨大，如何去处理这个量化损失精度问题就不懂了，这个交给专业移植人士了。

总结：
刚来的时候什么也不懂，也没能对这个项目面临的问题提出一些有效的方法，所以感觉在这一块收获不是很大，但是作为一个入门我感觉还是蛮好的，如果是已经学了半年，而且一开始就是我们处理的话，我感觉是能做出些好的效果的。
在这个项目中获得的提升：

对yolov3的代码的理解加深
对于神经网络的检测效果有一定了解，在这个项目里跟手相似的颜色都很用被误检，且背景颜色对检测效果也有较大影响，色差越大越好
熟悉各个板子的刷机和环境配置 ( 汗 - -！)
熟悉了numpy、darknet的部分使用方法

需求：基于单目RGB摄像头和超市扫码器实现自助收银的需求，摄像头位于扫码器的上方，客户使用时将购物物品放于桌上的指定位置，然后依次拿起物品经过扫码器，然后放到桌上另一端的指定位置，设计算法判断该过程有无漏扫、偷拿等行为。

整体流程：摄像头监控一个长桌，摄像头的视野对应长桌被分为三个部分，一部分是未扫描商品放置区，一部分是执行商品扫描区域，一部分是扫描后的商品放置区。该过程执行过程中，有可能商品直接从一个放置区到另一个放置区，没经过扫码区，这样是违规的会触发警报。还有可能从一个放置区拿起，然后直接出了摄像头视野，这也是违法的，还有一些其他的逻辑判断是否违法，而我负责的工作是目标检测算法的训练和边缘设备的移植。

我的工作：一开始是算法的改动，使用检测算法检测手里是否存在物品，我们自己做了一些数据集然后标注，使用的是yolov3算法，然后利用TensorRT进行加速，但是原版的yolov3加速后在边缘设备上还是达不到要求，每秒只有不到3帧的速度，之后又在在github上找了剪枝的yolov3，但是使用TensorRT加速这个剪枝代码后，检测不到任何bounding_box，分析了原版的yolov3和剪枝的yolov3的网络结构之后，发现剪枝的版本里面有原版没有的maxpool层，而TensorRT需要将原本的权重文件转换成ONNX文件，ONNX当时并不支持maxpool层，所以不能用TensorRT加速。这个时候TensorRT加速原版能到3帧，剪枝的yolov3能到4帧，我们就换了设备，换了之后发现剪枝的代码是可以在tx2上达到9帧的，能满足实时的要求，所以此时暂时选用这个方案。

但是公司嫌tx2太贵了，又搞了个rk3399pro板子来让我们做，但是这个板子不支持pytorch模型，只支持tensorflow，而且还支持的不完整，当时网上并没有tensorflow版本的剪枝带啊吗，所以我尝试了一些pytorch权重文件转tensorflow的方法，都不行。不过这个板子支持Darknet框架，我就配上剪枝yolov3的网络配置文件，使用Darknet来训练出Darknet格式的权重文件，然后把pytorch的输出处理代码改成了Numpy的，但是速度不行，只有4帧。然后我分析了一下检测的结果还有网络的结构，发现在当前场景下，手和摄像头的距离基本是固定的，而yolov3有三个检测尺度，然后我将两个尺度砍掉了，再训练，在服务器上效果相同，在rk3399pro上速度能达到10帧。但是又出现了新的问题，同样的代码，原本的权重文件在服务器上效果不错，但是将这个权重文件使用设备提供的代码进行压缩，在边缘设备上却检测效果很差。然后查了下量化的文件，权重大小从200MB压缩到了50MB，实在是不能用，这个量化算法我解决不了，当时找了个专门负责移植的公司，打算让他们来做量化。

后来这个公司用这个项目申请青岛创新项目，只拿了第三名，第一第二被海尔海信拿走了，然后资金不够了，就没继续做了。

[论文阅读] 人工智能 + 软件工程 | 代码注释不一致问题研究：从数据革新到端到端解决方案张较瘦_ 前沿技术论文阅读人工智能软件工程
代码注释不一致问题研究：从数据革新到端到端解决方案原文：CCISOLVER:End-to-EndDetectionandRepairofMethod-LevelCode-CommentInconsistencyarXiv:2506.20558CCISolver:End-to-EndDetectionandRepairofMethod-LevelCode-CommentInconsistencyRe
硬件工程师入门与进阶全攻略攻城狮-鹏哥单片机单片机 stm32 dsp开发 fpga开发 51单片机 mcu 嵌入式硬件
一、硬件工程师成长阶段划分（一）能力成长四象限模型（二）成长阶段对照表阶段理论要求实践技能项目经验典型岗位入门期数电模电基础万用表/示波器使用简单电路焊接硬件助理工程师成长期单片机/嵌入式系统原理图设计/PCBLayout功能模块开发初级硬件工程师成熟期高速电路设计/EMC理论信号完整性分析完整产品硬件开发资深硬件工程师专家期前沿技术跟踪系统级方案设计复杂系统架构设计硬件系统工程师二、入门阶段：夯
YOLOv12_ultralytics-8.3.145_2025_5_27部分代码阅读笔记-loss.py 红色的山茶花 YOLO 笔记深度学习
loss.pyultralytics\utils\loss.py目录loss.py1.所需的库和模块2.classVarifocalLoss(nn.Module):3.classFocalLoss(nn.Module):4.classDFLoss(nn.Module):5.classBboxLoss(nn.Module):6.classv8DetectionLoss:7.classE2EDetec
YOLOv11-ultralytics-8.3.67部分代码阅读笔记-predict.py 红色的山茶花 YOLO 笔记深度学习
predict.pyultralytics\models\yolo\detect\predict.py目录predict.py1.所需的库和模块2.classDetectionPredictor(BasePredictor):1.所需的库和模块#UltralyticsAGPL-3.0License-https://ultralytics.com/licensefromultralytics.eng
安全对抗相关技术和概念的总结和分析 frhdd 安全
流量对抗与行为对抗流量对抗核心目标：规避通过网络流量分析进行的恶意行为检测。关键点：流量加密：通过SSL/TLS或自定义加密协议，隐藏网络通信内容。流量伪装：模拟合法流量模式（如HTTP、HTTPS流量），降低被发现的可能性。流量随机化：动态改变通信的大小、时间间隔和模式，避免流量特征被检测到。行为对抗核心目标：规避基于行为检测的杀软和EDR（EndpointDetectionandRespons
软件测试面试前该准备些什么？ AIZHINAN 面试软件测试面试软件测试面经简历包装面试技巧
在软件测试面试前，充分的准备可以显著提升你的信心和表现。以下是需要重点关注的准备方向，分为技术能力、项目经验、面试技巧和软技能四个部分：一、技术能力准备基础理论软件测试基本概念：测试类型（功能、性能、安全、兼容性等）、测试阶段（单元测试、集成测试、系统测试等）。经典面试题：黑盒vs白盒测试的区别？什么是边界值分析、等价类划分？Bug的生命周期是怎样的？如何设计测试用例？（举例：测试一个登录页面）测
基于级联深度学习算法在双参数MRI中检测前列腺病变的评估| 文献速递-AI辅助的放射影像疾病诊断有Li 人工智能深度学习算法
Title题目EvaluationofaCascadedDeepLearning–basedAlgorithmforProstateLesionDetectionatBiparametricMRI基于级联深度学习算法在双参数MRI中检测前列腺病变的评估Background背景MultiparametricMRI(mpMRI)improvesprostatecancer(PCa)detectionc
mot数据集_MOT数据集转化成VOC格式脚本(mot2voc) 飞啦不休 mot数据集
使用mmdetection检测框架进行相关的训练，由于MOT的数据集标注格式和检测常用的VOC以及COCO格式有很大的差距，因此用于检测任务的时候，需要将mot格式的数据集转化成VOC格式用于检测任务的训练，评估。HUST小菜鸡：将MOT17-Det数据集转成VOC格式zhuanlan.zhihu.com之前我写过一篇将MOT17转化成VOC格式的文章，但是该方法是一个分布的步骤，而且在实际操作过
HCCDA – AI华为云人工智能开发者认证-60道单选题题库及答案_华为人工智能入门级开发者认证题库 2401_89172925 人工智能华为云华为
单选题及答案AI模型的评测指标主要分为精度指标和性能指标，以下哪一项不属于常用的性能指标？A.FPS(FramesPerSecond)B.FLOPs(Floating-pointOperationsPerSecond)C.aPs（QueryPerSecond）D．F1值Mask＿Detection技能模板提供了口罩检测技能，针对每个人，若没有检测到人脸，也没有检测到口罩，则会显示什么信息？A.No
Python编程：使用 YOLO 目标检测倔强老吕 python 开发语言
YOLO（YouOnlyLookOnce）是一种基于深度学习的实时目标检测算法，由JosephRedmon等人于2016年首次提出。与传统的两阶段目标检测方法（如R-CNN系列）不同，YOLO将目标检测任务视为一个单一的回归问题，直接在图像上进行一次推理即可预测边界框和类别概率。YOLO的核心思想单次前向传播（SingleShotDetection）：YOLO只需对输入图像进行一次神经网络推理，就
鸿蒙开发：资讯项目实战之项目框架设计
前言本项目API>=13写了那么多的文章，总感觉缺少点什么，沉下心来细细一想，原来是没有把相关知识应用于实战，对于我们这些开发过项目，有过项目经验的人来说，项目开发小菜一点，但是对于刚接触鸿蒙的开发者而言，确实需要一个从0到1的项目进行磨炼一下，授人以鱼不如授人以渔，说干就干，那么接下来的一段时间，我会时不时的进行穿插项目实战的文章，当然了其他的技术文章也会不间断更新。关于项目实战，选来选去，最终
PillarNet: Real-Time and High-PerformancePillar-based 3D Object Detection justtoomuchforyou 目标检测人工智能计算机视觉智驾
ECCV2022paper：[2205.07403]PillarNet:Real-TimeandHigh-PerformancePillar-based3DObjectDetectioncode：https://github.com/VISION-SJTU/PillarNet-LTS纯点云基于pillar3D检测模型网络比较SECOND基于voxel，one-stage，基于sparse3Dc
计算机毕业设计项目、管理系统、可视化大屏、大数据分析、协同过滤、推荐系统、SSM、SpringBoot、Spring、Mybatis、小程序项目编号1000-1499 lonzgzhouzhou spring 课程设计 spring boot
大家好，我是DeBug，很高兴你能来阅读！作为一名热爱编程的程序员，我希望通过这些教学笔记与大家分享我的编程经验和知识。在这里，我将会结合实际项目经验，分享编程技巧、最佳实践以及解决问题的方法。无论你是初学者还是有一定经验的程序员，我都希望能够为你提供有价值的内容，帮助你更好地理解编程世界。让我们一起探索编程的乐趣，一起成长，一起学习，谢谢你们的支持与关注！【源码咨询】可接Java程序设计，Bug
深度学习计算机视觉开源系统OpenMMLab（mmsegmentation、mmdetection、mmpose）环境配置【详细、可运行】 nomoremorphine 深度学习计算机视觉开源
OpenMMLab（mmsegmentation、mmdetection、mmpose）环境配置OpenMMLab简介优势：一、Windows/Linux下环境配置（以mmsegmentationv1.2.2（最新版）为例）0.确认安装版本信息1）确认电脑显卡版本2）确认mmcv对应版本3）确认版本1.安装CUDA和cuDNN2.创建conda环境，下载pytorch3.安装mmcv4.安装MMS
【HTTP】取消已发送的请求 Am1nnn 前端 javascript 开发语言
场景在页面中，可能会因为某些操作多次触发某个请求，如多次点击某按钮触发请求，实际上我们只需要最后一次请求的返回值，但是由于请求的耗时不一，请求未必会按发送的顺序返回，导致我们最终获取到的值≠最后一次发送请求的返回值。根据项目经验，目前一共尝试过两种方法1.设置请求的唯一id2.使用axios官方方法：AbortController解决1.设置请求的唯一id为每个请求设置一个唯一id，每触发一次请求
Leaflet面试题200道还是大剑师兰特 #leaflet综合教程150+大剑师 leaflet面试题 leaflet示例
查看本专栏目录文章目录第一部分：基础知识（1-50）第二部分：插件与扩展（51-100）⚙️第三部分：性能与调试（101-130）️第四部分：GIS与地理空间知识（131-160）️第五部分：实战与项目经验（161-200）以下是200个Leaflet面试题的完整列表（第1-200题），涵盖基础、进阶、插件、性能优化、GIS知识、实战经验等多个维度。第一部分：基础知识（1-50）什么是Leafle
flink:风控/反欺诈检测系统案例研究1,2,3 菠萝科技 java·未分类 flink flink 风控欺诈
https://flink.apache.org/news/2020/01/15/demo-fraud-detection.htmlhttps://flink.apache.org/news/2020/03/24/demo-fraud-detection-2.htmlhttps://flink.apache.org/news/2020/07/30/demo-fraud-detection-3.ht
目标检测——YOLOX算法解读
论文：YOLOX:ExceedingYOLOSeriesin2021(2021.7.18)作者：ZhengGe,SongtaoLiu,FengWang,ZemingLi,JianSun链接：https://arxiv.org/abs/2107.08430代码：https://github.com/Megvii-BaseDetection/YOLOXYOLO系列算法解读：YOLOv1通俗易懂版解读、
用无人机和AI守护高原净土：高海拔自然保护区的垃圾检测新方法是纯一呀 DeepLearning AI 无人机人工智能计算机视觉
这篇题为《AutomaticDetectionofScatteredGarbageRegionsUsingSmallUnmannedAerialVehicleLow-AltitudeRemoteSensingImagesforHigh-AltitudeNaturalReserveEnvironmentalProtection》的论文，发表于EnvironmentalScience&Technolo
道路点云分割+边界提取+中心线方法总结 asdbhkasgb 相关论文深度学习计算机视觉人工智能算法 3d
1.FastLIDAR-basedRoadDetectionUsingFullyConvolutionalNeuralNetworks2017流程点云数据转换为俯视图图像从激光雷达获取的点云数据是无结构的，因此需要先将其转换为适合全卷积神经网络（FCN）处理的格式。具体来说，作者在激光雷达的XY平面上创建一个网格，并将点云中的每个点分配到相应的网格单元。对每个网格单元计算一些基础统计数据，例如：平
广州AR公司诚推广州华锐互动广州华锐视点 ar
(一)丰富的行业经验华锐互动自成立以来，便全身心投入到AR领域的探索与实践中，在这一领域已经深耕长达十八载。多年来，其凭借着对AR技术的深刻理解和敏锐的市场洞察力，成功服务了超过30个行业的数百家知名企业，积累了海量且丰富的项目经验。从大型央企到创新型中小企业，从教育科研机构到文化旅游景区，华锐互动的足迹遍布各个行业，为不同客户量身定制的AR解决方案，都取得了显著的成效。在与某大型央企的合作中，华
在C++/c的opencv中实现高速视频文字检测的筛选与加速策略
精益求精：在C++中实现高速视频文字检测的筛选与加速策略日期:2025年6月21日视频内容分析已成为计算机视觉领域的核心应用之一，而视频文字检测（VideoTextDetection）是其中的关键技术，广泛应用于字幕提取、内容审核、车辆识别等场景。然而，将先进的深度学习检测模型（如DBNet++,EAST,PSENet）直接应用于视频流时，其巨大的计算开销往往导致处理速度远低于实时要求。本文将深入
Task01. 时序数据与 PyPOTS 介绍三分梦~ python 机器学习时序数据库数据挖掘
Task01.时序数据与PyPOTS介绍Task01.时序数据与PyPOTS介绍1.时间序列数据介绍️举例：与i.i.d数据的区别示例：1.1时间序列数据的类型1.2常见时间序列数据示例1.3时间序列研究与应用方向主要任务：1.预测（Forecasting）2.分类（Classification）3.聚类（Clustering）4.异常检测（AnomalyDetection）5.时间序列生成（Ge
CVTE Android面试题及参考答案（100道题）大模型大数据攻城狮 android 大厂面试 android面试移动开发安卓面试大厂春招大厂校招
目录插件化组件化合并相似接口抽象通用方法使用接口代理引入设计模式编写源代码资源文件准备编译资源文件编译源代码生成dex文件打包APK文件技术能力提升项目经验积累职业发展知识分享与团队协作建立良好的沟通机制明确团队目标和职责尊重和理解团队成员采用合适的解决方法建立团队凝聚力性能优化兼容性问题帧动画属性动画转场动画动画集合基于物理的动画内存管理优化代码优化资源管理优化多线程优化虚拟机参数调整内存优化性
mmdetection3d系列--（1）安装步骤（无坑版） h i i l mmdetection3d 目标检测计算机视觉自动驾驶深度学习 pytorch
最近在看一些基于点云3d目标检测的文章，需要复现甚至修改一些算法，就找到了mmlab开源的mmdetection3d目标检测框架，方便后续学习。在安装的时候遇到一点坑，比如环境问题，安装完能跑demo但是不能跑训练测试问题等。在解决问题后还是完成了安装。在这里记录一下正确的安装流程，已备再次查阅，也给大家提供一点参考。首先建环境，最好是新建一个环境condacreate-ndetpython=3.
Ubuntu20.04LTS 安装 mmdetection 全记录
Ubuntu20.04LTS安装mmdetection全记录环境需求准备工作anaconda安装gcc/g++安装安装nvidia显卡驱动安装CUDA正式安装mmdetection创建一个conda虚拟环境安装PyTorch和Torchvision安装mmcvmmdetection安装后记环境需求Requirements：·Linux(Windowsisnotofficiallysupported
Datawhale组队学习 - 202505 - PyPOTS - Task01时序数据与PyPOTS 来两个炸鸡腿学习 python 人工智能
系列文章目录Task01-时序数据与PyPOTS文章目录系列文章目录前言1时间序列数据1.1时间序列数据的类型1.2时间序列数据示例1.3时间序列的研究与应用方向1.3.1预测Forecasting1.3.2分类Classification1.3.3聚类Clustering1.3.4异常监测AnomalyDetection1.3.5时间序列生成Generation1.3.6插补Imputation
我的创作纪念日盛夏绽放纪念
我的创作之旅：从编程新手到技术分享者机缘最初成为创作者，源于我在学习编程过程中的几个简单愿望：记录学习历程：刚开始学习JavaScript时，经常遇到各种问题，希望能记录下解决过程项目经验沉淀：完成学校项目后，想总结其中的技术难点和解决方案技术交流渴望：看到社区中大家的热烈讨论，也想加入其中分享自己的见解帮助后来者：自己曾被优秀的教程帮助过，希望也能帮助其他初学者收获在创作过程中，我获得了许多意外
无监督学习中的特征选择与检测（FSD）在医疗动线流程优化中的应用 Allen_Lyb 医疗高效编程研发学习健康医疗架构人工智能
无监督学习中的特征选择与检测（FeatureSelectionandDetection,FSD）算法在医疗动线流程优化中具有重要的应用价值，尤其适用于从海量、复杂且缺乏明确标签的医疗行为数据中自动挖掘关键模式和瓶颈。以下是如何编程实现这种应用的思路和步骤：引言医疗动线流程优化是提升医疗机构运营效率、改善患者体验的关键领域。传统的流程优化方法往往依赖于人工观察和经验分析，难以从海量、复杂且缺乏明确标
大规模胰腺癌检测通过非对比增强CT和深度学习| 文献速递-视觉通用模型与疾病诊断有Li 深度学习人工智能
Title题目Large-scalepancreaticcancerdetectionvianon-contrastCTanddeeplearning大规模胰腺癌检测通过非对比增强CT和深度学习01文献速递介绍胰腺导管腺癌（PDAC）是最致命的实体恶性肿瘤，通常在晚期和不可手术的阶段被检测到。早期或偶然发现与延长生存期相关，但使用单一测试筛查无症状个体的PDAC仍然不可行，因为假阳性的潜在危害和低
多线程编程之理财周凡杨 java 多线程生产者消费者理财
现实生活中，我们一边工作，一边消费，正常情况下会把多余的钱存起来，比如存到余额宝，还可以多挣点钱，现在就有这个情况：我每月可以发工资20000万元（暂定每月的1号），每月消费5000（租房+生活费）元（暂定每月的1号），其中租金是大头占90%，交房租的方式可以选择（一月一交，两月一交、三月一交），理财：1万元存余额宝一天可以赚1元钱，
[Zookeeper学习笔记之三]Zookeeper会话超时机制 bit1129 zookeeper
首先，会话超时是由Zookeeper服务端通知客户端会话已经超时，客户端不能自行决定会话已经超时，不过客户端可以通过调用Zookeeper.close()主动的发起会话结束请求，如下的代码输出内容 Created /zoo-739160015 CONNECTEDCONNECTED .............CONNECTEDCONNECTED CONNECTEDCLOSEDCLOSED
SecureCRT快捷键 daizj secureCRT 快捷键
ctrl + a : 移动光标到行首ctrl + e ：移动光标到行尾crtl + b: 光标前移1个字符crtl + f: 光标后移1个字符crtl + h : 删除光标之前的一个字符ctrl + d ：删除光标之后的一个字符crtl + k ：删除光标到行尾所有字符crtl + u : 删除光标至行首所有字符crtl + w: 删除光标至行首
Java 子类与父类这间的转换周凡杨 java 父类与子类的转换
最近同事调的一个服务报错，查看后是日期之间转换出的问题。代码里是把 java.sql.Date 类型的对象强制转换为 java.sql.Timestamp 类型的对象。报java.lang.ClassCastException。代码：
可视化swing界面编辑朱辉辉33 eclipse swing
今天发现了一个WindowBuilder插件，功能好强大，啊哈哈，从此告别手动编辑swing界面代码，直接像VB那样编辑界面，代码会自动生成。首先在Eclipse中点击help，选择Install New Software,然后在Work with中输入WindowBui
web报表工具FineReport常用函数的用法总结（文本函数）老A不折腾 finereport web报表工具报表软件 java报表
文本函数 CHAR CHAR(number):根据指定数字返回对应的字符。CHAR函数可将计算机其他类型的数字代码转换为字符。 Number:用于指定字符的数字，介于1Number:用于指定字符的数字，介于165535之间（包括1和65535）。示例: CHAR(88)等于“X”。 CHAR(45)等于“-”。 CODE CODE(text):计算文本串中第一个字
mysql安装出错林鹤霄 mysql安装
[root@localhost ~]# rpm -ivh MySQL-server-5.5.24-1.linux2.6.x86_64.rpm Preparing... #####################
linux下编译libuv aigo libuv
下载最新版本的libuv源码，解压后执行： ./autogen.sh 这时会提醒找不到automake命令，通过一下命令执行安装（redhat系用yum，Debian系用apt-get）： # yum -y install automake # yum -y install libtool 如果提示错误：make: *** No targe
中国行政区数据及三级联动菜单 alxw4616
近期做项目需要三级联动菜单,上网查了半天竟然没有发现一个能直接用的! 呵呵,都要自己填数据....我了个去这东西麻烦就麻烦的数据上. 哎,自己没办法动手写吧. 现将这些数据共享出了,以方便大家.嗯,代码也可以直接使用文件说明 lib\area.sql -- 县及县以上行政区划分代码（截止2013年8月31日)来源：国家统计局发布时间：2014-01-17 15:0
哈夫曼加密文件百合不是茶哈夫曼压缩哈夫曼加密二叉树
在上一篇介绍过哈夫曼编码的基础知识,下面就直接介绍使用哈夫曼编码怎么来做文件加密或者压缩与解压的软件,对于新手来是有点难度的,主要还是要理清楚步骤; 加密步骤: 1,统计文件中字节出现的次数,作为权值 2,创建节点和哈夫曼树 3,得到每个子节点01串 4,使用哈夫曼编码表示每个字节
JDK1.5 Cyclicbarrier实例 bijian1013 java thread java多线程 Cyclicbarrier
CyclicBarrier类一个同步辅助类，它允许一组线程互相等待，直到到达某个公共屏障点 (common barrier point)。在涉及一组固定大小的线程的程序中，这些线程必须不时地互相等待，此时 CyclicBarrier 很有用。因为该 barrier 在释放等待线程后可以重用，所以称它为循环的 barrier。 CyclicBarrier支持一个可选的 Runnable 命令，
九项重要的职业规划 bijian1013 工作学习
一. 学习的步伐不停止古人说，活到老，学到老。终身学习应该是您的座右铭。世界在不断变化，每个人都在寻找各自的事业途径。您只有保证了足够的技能储
【Java范型四】范型方法 bit1129 java
范型参数不仅仅可以用于类型的声明上，例如 package com.tom.lang.generics; import java.util.List; public class Generics<T> { private T value; public Generics(T value) { this.value =
【Hadoop十三】HDFS Java API基本操作 bit1129 hadoop
package com.examples.hadoop; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FSDataInputStream; import org.apache.hadoop.fs.FileStatus; import org.apache.hadoo
ua实现split字符串分隔 ronin47 lua split
LUA并不象其它许多"大而全"的语言那样，包括很多功能，比如网络通讯、图形界面等。但是LUA可以很容易地被扩展：由宿主语言(通常是C或 C++)提供这些功能，LUA可以使用它们，就像是本来就内置的功能一样。LUA只包括一个精简的核心和最基本的库。这使得LUA体积小、启动速度快，从而适合嵌入在别的程序里。因此在lua中并没有其他语言那样多的系统函数。习惯了其他语言的字符串分割函
java-从先序遍历和中序遍历重建二叉树 bylijinnan java
public class BuildTreePreOrderInOrder { /** * Build Binary Tree from PreOrder and InOrder * _______7______ / \ __10__ ___2 / \ / 4
openfire开发指南《连接和登陆》开窍的石头 openfire 开发指南 smack
第一步官网下载smack.jar包下载地址：http://www.igniterealtime.org/downloads/index.jsp#smack 第二步把smack里边的jar导入你新建的java项目中开始编写smack连接openfire代码 p
[移动通讯]手机后盖应该按需要能够随时开启 comsci 移动
看到新的手机，很多由金属材质做的外壳，内存和闪存容量越来越大，CPU速度越来越快，对于这些改进，我们非常高兴，也非常欢迎但是，对于手机的新设计，有几点我们也要注意第一：手机的后盖应该能够被用户自行取下来，手机的电池的可更换性应该是必须保留的设计,
20款国外知名的php开源cms系统 cuiyadll cms
内容管理系统，简称CMS，是一种简易的发布和管理新闻的程序。用户可以在后端管理系统中发布，编辑和删除文章，即使您不需要懂得HTML和其他脚本语言，这就是CMS的优点。在这里我决定介绍20款目前国外市面上最流行的开源的PHP内容管理系统，以便没有PHP知识的读者也可以通过国外内容管理系统建立自己的网站。 1. Wordpress WordPress的是一个功能强大且易于使用的内容管
Java生成全局唯一标识符 darrenzhu java uuid unique identifier id
How to generate a globally unique identifier in Java http://stackoverflow.com/questions/21536572/generate-unique-id-in-java-to-label-groups-of-related-entries-in-a-log http://stackoverflow
php安装模块检测是否已安装过, 使用的SQL语句 dcj3sjt126com sql
SHOW [FULL] TABLES [FROM db_name] [LIKE 'pattern'] SHOW TABLES列举了给定数据库中的非TEMPORARY表。您也可以使用mysqlshow db_name命令得到此清单。本命令也列举数据库中的其它视图。支持FULL修改符，这样SHOW FULL TABLES就可以显示第二个输出列。对于一个表，第二列的值为BASE T
5天学会一种 web 开发框架 dcj3sjt126com Web 框架 framework
web framework层出不穷，特别是ruby/python,各有10+个,php/java也是一大堆根据我自己的经验写了一个to do list,按照这个清单，一条一条的学习，事半功倍，很快就能掌握一共25条，即便很磨蹭，2小时也能搞定一条，25*2=50。只需要50小时就能掌握任意一种web框架各类web框架大同小异:现代web开发框架的6大元素，把握主线，就不会迷路建议把本文
Gson使用三(Map集合的处理,一对多处理) eksliang json gson Gson map Gson 集合处理
转载请出自出处：http://eksliang.iteye.com/blog/2175532 一、概述 Map保存的是键值对的形式，Json的格式也是键值对的，所以正常情况下，map跟json之间的转换应当是理所当然的事情。二、Map参考实例 package com.ickes.json; import java.lang.refl
cordova实现“再点击一次退出”效果 gundumw100 android
基本的写法如下： document.addEventListener("deviceready", onDeviceReady, false); function onDeviceReady() { //navigator.splashscreen.hide(); document.addEventListener("b
openldap configuration leaning note iwindyforest configuration
hostname // to display the computer name hostname <changed name> // to change go to: /etc/sysconfig/network, add/modify HOSTNAME=NEWNAME to change permenately dont forget to change /etc/hosts
Nullability and Objective-C 啸笑天 Objective-C
https://developer.apple.com/swift/blog/?id=25 http://www.cocoachina.com/ios/20150601/11989.html http://blog.csdn.net/zhangao0086/article/details/44409913 http://blog.sunnyxx
jsp中实现参数隐藏的两种方法 macroli JavaScript jsp
在一个JSP页面有一个链接，//确定是一个链接?点击弹出一个页面，需要传给这个页面一些参数。//正常的方法是设置弹出页面的src="***.do?p1=aaa&p2=bbb&p3=ccc"//确定目标URL是Action来处理?但是这样会在页面上看到传过来的参数，可能会不安全。要求实现src="***.do"，参数通过其他方法传！//////
Bootstrap A标签关闭modal并打开新的链接解决方案 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
Bootstrap里面的js modal控件使用起来很方便，关闭也很简单。只需添加标签 data-dismiss="modal" 即可。可是偏偏有时候需要a标签既要关闭modal，有要打开新的链接，尝试多种方法未果。只好使用原始js来控制。 <a href="#/group-buy" class="btn bt
二维数组在Java和C中的区别流淚的芥末 java c 二维数组数组
Java代码： public class test03 { public static void main(String[] args) { int[][] a = {{1},{2,3},{4,5,6}}; System.out.println(a[0][1]); } } 运行结果： Exception in thread "mai
systemctl命令用法 wmlJava linux systemctl
对比表，以 apache / httpd 为例任务旧指令新指令使某服务自动启动 chkconfig --level 3 httpd on systemctl enable httpd.service 使某服务不自动启动 chkconfig --level 3 httpd off systemctl disable httpd.service 检查服务状态 service h