2301_79810943

基于深度学习的动物智能识别系统设计与实现

收藏和点赞，您的关注是我创作的动力

文章目录

概要

一、基于YOLOv4的动物图像检测

3.1 YOLOv4网络结构

3.1.1 输入层

3.1.2 主干特征提取网络CSPDarknet53

3.1.3 Neck层

3.1.4 预测层

3.2 YOLOv4图像检测

二、智能动物识别系统设计

5.1 需求分析

5.2 系统设计

5.3 系统展示

5.3.2 视频识别模块测试

三、总结

四、目录

概要

本文设计了一个动物智能识别系统，采用YOLOv4和Mobilenetv2-YOLOv4算法对上传的图片、视频以及摄像头录入的画面进行特定动物种类的目标检测。在图像识别模块中，本文采用了YOLOv4算法对动物图像进行识别。在视频识别模块和摄像头识别模块中，为了进一步提高算法的识别速度，使用轻量级神经网络Mobilenetv2作为YOLOv4的新主干网络，并改进了模型中的部分标准卷积，显著地提升了模型的运算速率。本文通过Pytorch框架搭建了YOLOv4和Mobilenetv2-YOLOv4模型，并分别使用COCO动物数据集和VOC动物数据集对两个模型进行训练。在本文测试环境下，YOLOv4和Mobilenetv2-YOLOv4在各自测试集上的mAP分别可以达到88.73%和78.33%。而在检测速度对比上，YOLOv4和·原文对照报告· ·研究生版·Mobilenetv2-YOLOv4的平均检测速度分别可以达到1.26张/秒和5.37张/秒。
　　最后本文通过Flask框架搭建了本地网站，部署了两种目标检测模型。实现了对用户上传的图像、视频以及摄像头录入的画面进行动物目标识别的功能，并可以在前端页面展示最后的检测结果。
关键词：动物识别；目标检测；YOLOv4；Mobilenetv2

一、基于YOLOv4的动物图像检测

3.1 YOLOv4网络结构

YOLOv4 对YOLOv3做出了进一步的改进。YOLOv4网络结构可以分为输入层、主干特征提取网络、Neck层和预测层。整体网络结构可以用下图3.1描述：

图3.1 YOLOv4网络结构

3.1.1 输入层

YOLOv4在输入层使用了Mosaic数据增强的方法。其原理是对每次输入的四张图片进行随机的旋转、放缩、裁剪等，并且按照四个方向排布，实现图片和边框的重新整合。这样做的好处是扩大了数据集，并且能使网络一次性计算多张图片的参数，减少了GPU的消耗。

3.1.2 主干特征提取网络CSPDarknet53

YOLOv4的主干网络CSPDarknet53包含了Darknet53和CSPNet结构。CSP结构主要将输入分为两个部分分别进行处理。一部分经过原有的主干结构进行计算，即原本的残差卷积块的堆积结构。另一部分则输入到残差边结构，只经过少量的计算就和输出相连。CSP中的残差边结构可以最大化梯度组合的差异，增强网络的学习能力，在保证准确率的同时降低计算的内存流量。
　　CSPDarknet53中有5个CSP模块。输入图像在进入每个CSP模块前都会先通过一个3×3的卷积核进行下采样。在每个CSP模块中，会先使用一个1×1的卷积核将输入特征图分为两个部分，并使每部分的通道数都会减半。因此，对于输入到主干部分的特征图，需要再使用一次1×1的卷积改变通道数。其输出经过多个残差卷积块后再通过一个1×1的卷积与残差边的输出相连，并使用一个1×1的卷积整合输出特征图信息。由于在每个CSP模块前都使用了降采样结构，因此网络的参数量大大减少。并且因为CSP模块的引入，使得网络抑制了梯度消失的现象，在降低计算量的同时增强了其学习能力。CSPDarknet53还引用了新的Mish激活函数。其公式如下式3.1所示：
　　

该激活函数由于在正数部分没有最大值边界，克服了过饱和问题。同时相比于ReLU，Mish可以得到绝对值较小的负值从而获得更优的梯度。Mish的函数曲线对比ReLU也更加平滑，从而可以使网络达到更好的精度与鲁棒性。

3.1.3 Neck层

在进行目标检测任务时，一般会在网络的骨干网络和输出层之间加入Neck层来更好地挖掘整合特征。YOLOv4中·的Neck层主要由SPPNet和PANet结构组成。
（1）空间金字塔池化结构SPPNet
　　YOLOv4在主干网络之后加入了SPPNet结构进行池化。该结构会对主干网络的输出特征图先进行三次卷积，然后利用1×1、5×5、9×9、13×13的池化核进行最大值池化，将结果整合后再进行三次卷积。对于任意的输入尺寸，SPPNet都能够产生固定的输出大小，可以适用于多尺度训练。
　　SPPNet的多核池化结构相比于使用单一尺寸的池化核，显著地提升了主干网络对特征的学习能力。同时它将特征图都归一化到单一尺寸，使得网络更加容易收敛。
（2）路径聚合网络PANet
　　YOLOv4使用了PANet结构来完成融合特征。PANet主要可以分为特征金字塔、自底向上路径增强、自适应特征特征和全连接聚变四个模块。相比于YOLOv3中FPN结构使用自顶向下的路径来获取特征，PANet使用了另一条自底向上的连接，该结构大约只有十层，极大的缩短了高低层特征融合的距离，丰富了每层的特征。同时，与YOLOv4中FPN只对高层特征进行池化，PANet中的自适应特征池化可以对各个层级不同尺度的特征层进行操作，使得网络能够更好地聚合不同层之间的特征，保证特征信息的完整性。

3.1.4 预测层

YOLOv4的预测层主要包括YOLO Head结构。YOLO Head的主要作用是利用PANet整合的特征进行预测。YOLO Head由3×3和1×1的卷积核组成。对于输入的特征图，Head部分会先使用3×3的卷积整合前面的特征，再使用1×1的卷积将特征转换为YOLOv4的结果。最后对生成的预测框通过阈值进行判断，并使用CIOU回归损失函数加上DIOU非极大值抑制的方法调整筛选预测框的位置，得到最后的输出结果，

3.2 YOLOv4图像检测

YOLOv4的动物图像检测流程如图3.2所示：

图3.2 YOLOv4检测流程

二、智能动物识别系统设计

5.1 需求分析

传统的动物识别系统需要依靠人工比对图片去识别并框定动物的位置，整个过程不仅效率低、速度慢，且需要耗费大量的人力，无法大量部署在实际环境中对动物进行实时检测。因而需要设计一个可以自动对图像或视频进行实时动物检测的系统。
　　本文所设计的智能动物识别系统的核心是可以通过动物检测算法来识别出图像以及视频中的动物种类，并框定出不同动物的位置。本系统搭建了一个用于动物识别的网站，网站后端部分采用Flask框架搭建，前端部分采用HTML、CSS、JavaScript、Bootstrap来设计网页界面，程序开发环境为PyCharm。该网站的主要功能需求有如下几点：
　　（1）图像识别功能：用户可以向网站上传图像文件，网站调用本文所设计的YOLOv4动物目标检测模型对上传的图像进行动物识别及检测，并将检测结果直观的展示在网页界面上。检测结果中需要将识别的动物种类及动物所在的位置框定出来，并展示出动物识别种类的置信度。
　　（2）视频识别功能：用户可以向网站上传视频文件，网站调用本文所设计的Mobilenetv2-YOLOv4或YOLOv4动物检测模型对上传的视频进行动物识别及检测。视频检测处理时需要实时展示处理后的视频，并在视频中将识别的动物种类及动物所在的位置框定出来。整个视频处理过程需要尽量实时高效。
（3）摄像头识别功能：网站可以开启摄像头，然后调用算法对摄像头画面内的动物目标进行识别。
　　（4）结果展示功能：网站可以提供动物检测处理框定后的图像及视频文件的下载，并在网页上以表格形式展示图像中框定的动物种类、置信度、动物的位置坐标等信息，使使用者可以查看并使用检测的结果。
　　整个系统在处理图像和视频时需要具有较快的检测速度和较高的准确率，特别是在检测视频时需要保持尽量高的帧率，贴合实际环境下的野生动物检测场景。

5.2 系统设计

本系统对前两章提到的图像和视频识别算法进行了程序设计，并将算法模型部署在了本地网站上。用户通过本地网站上传图像或视频，然后调用相应的模型接口对文件进行处理，最后在前端网页进行结果展示。
网站的后端部分采用Flask框架搭建，前端部分采用HTML、CSS、JavaScript、Bootstrap来设计网页界面，功能上主要分为图像识别模块、视频识别模块和摄像头识别模块三个部分，其中视频识别模块又包含YOLOv4和Mobilenetv2-YOLOv4两种算法，其功能示意图如图5.1所示

图5.1 动物识别系统功能示意图

5.3 系统展示

启动服务端程序后，首先访问系统主页http://127.0.0.1:5000，动物检测系统主页如图5.5所示：

图5.5 动物识别系统首页
　　开始测试系统图像识别模块。依次点击“选择图片”、“上传并识别图片”按钮，上传图片后，系统自动跳转到http://127.0.0.1:5000/uploadpic。测试结果如图5.6、5.7所示。系统成功框定出了图像中的目标动物，并将目标动物的检测信息以表格形式展现了出来。

5.3.2 视频识别模块测试

然后测试系统视频识别模块，先测试使用YOLOv4模型进行视频识别。依次点击“选择视频（YOLOv4）”、“上传并识别视频（YOLOv4）”按钮，上传视频后，系统自动跳转到http://127.0.0.1:5000/uploadvideo。测试结果如图5.8所示，系统基本正确框定出了视频中的目标动物，此时处理视频的FPS为1.15。
　　
图5.8 YOLOv4动物视频识别结果
　　再测试使用Mobilenetv2-YOLOv4模型进行视频识别。依次点击“选择视频（Mobilenetv2-YOLOv4）”、“上传并识别视频（Mobilenetv2-YOLOv4）”按钮，上传视频后，系统自动跳转到http://127.0.0.1:5000/uploadvideo2。测试结果如图5.9所示，系统也基本正确框定出了视频中的目标动物，此时处理视频的FPS为8.35，明显大于YOLOv4处理视频时的1.15。
　　

图5.9 Mobilenet-YOLOv4动物视频识别结果
　　比较两次视频识别测试结果，可以看出，在使用Mobilenetv2-YOLOv4模型时，系统的处理速度要明显快与YOLOv4模型，而识别的准确率与YOLOv4模型差别不大，这与本文的设计预期相符。

三、总结

动物目标检测是目标检测领域中重要的应用场景之一。本文从检测速度和准确性考虑，使用了单阶段目标检测算法YOLOv4。YOLOv4模型主要包括输入层、主干网络、Neck层和输出层。对于输入的图像，主干网络CSPDarknet53会先挖掘出初步的有效特征图，并将特征图输入到Neck层中进行处理，得到更好的特征图，最后经由输出层得到预测结果。对于视频识别，系统会将视频逐帧转换成图片后输入到模型中完成检测。如果直接使用YOLOv4模型进行检测，则会因为模型较大而导致检测速率过慢，难以应用到实时场景中。针对该问题，本文设计了参数更少，运算速度更快的改进模型Mobilenetv2-YOLOv4。该模型将YOLOv4的主干网络CSPDarknet53替换为了参数更少的Mobilenetv2，并将网络中3×3的卷积核替换为了在Mobilenetv1中广泛使用的深度可分离卷积核，大大降低了YOLOv4的网络参数数量，显著提高了模型在视频检测和摄像头检测时的检测速度。
　　最后，本文将这两种检测算法部署在了本地网站上。用户可以通过本地网站上传图片或视频文件直接进行检测处理，得到检测结果并以可视化的界面展现出来，也可以直接打开设备摄像头进行检测。

四、目录

摘要 3
第1章绪论 7
1.1 研究背景及意义 7
1.2 国内外研究现状 7
1.3 本文工作及结构 8
第2章相关背景知识 10
2.1 卷积神经网络 10
2.1.1 卷积层 10
2.1.2 池化层 11
2.1.3 全连接层 12
2.2 基于深度学习的目标检测算法 12
2.2.1 两阶段目标检测算法 12
2.2.2 单阶段目标检测算法 13
2.3 本章小结 14
第3章基于YOLOv4的动物图像检测 15
3.1 YOLOv4网络结构 15
3.1.1 输入层 15
3.1.2 主干特征提取网络CSPDarknet53 15
3.1.3 Neck层 16
3.1.4 预测层 16
3.2 YOLOv4图像检测 17
3.3 实验结果及分析 18
3.3.1 YOLOv4模型训练配置 18
3.3.2 YOLOv4模型Loss和精度 18
3.4 本章小结 20
第4章基于Mobilenetv2-YOLOv4的动物视频检测 21
4.1 Mobilenetv2网络 21
4.2 Mobilenetv2-YOLOv4网络的实现 22
4.2.1 主干网络替换 22
4.2.2 卷积核替换 23
4.3 实验结果及分析 23
4.3.1 Mobilenetv2-YOLOv4模型训练配置 23
4.3.2 Mobilenetv2-YOLOv4模型Loss和精度 24
4.3.3 YOLOv4和Mobilenetv2-YOLOv4模型对比 25
4.3 本章小结 26
第5章智能动物识别系统设计 27
5.1 需求分析 27
5.2 系统设计 27
5.2.1 动物检测系统网站相关技术 28
5.2.2 图像识别模块 29
5.2.3 视频识别模块 30
5.2.4 摄像头识别模块 31
5.3 系统测试 32
5.3.1 图像识别模块测试 32
5.3.2 视频识别模块测试 33
5.3.3 摄像头识别模块测试 35
5.4 本章小结 35
第6章总结与展望 36
6.1 总结 36
6.2 展望 36
参考文献 37
致谢 39

获取PPT中的MSO格式图片报错 ♢.＊ ppt python
亲爱的小伙伴们，在求知的漫漫旅途中，若你对深度学习的奥秘、Java与Python的奇妙世界，亦或是读研论文的撰写攻略有所探寻，那不妨给我一个小小的关注吧。我会精心筹备，在未来的日子里不定期地为大家呈上这些领域的知识宝藏与实用经验分享。每一个点赞，都如同春日里的一缕阳光，给予我满满的动力与温暖，让我们在学习成长的道路上相伴而行，共同进步✨。期待你的关注与点赞哟！image.ext的报错ValueEr
知识图谱技术剖析 ♢.＊人工智能知识图谱大数据
亲爱的小伙伴们，在求知的漫漫旅途中，若你对深度学习的奥秘、Java与Python的奇妙世界，亦或是读研论文的撰写攻略有所探寻，那不妨给我一个小小的关注吧。我会精心筹备，在未来的日子里不定期地为大家呈上这些领域的知识宝藏与实用经验分享。每一个点赞，都如同春日里的一缕阳光，给予我满满的动力与温暖，让我们在学习成长的道路上相伴而行，共同进步✨。期待你的关注与点赞哟！一、引言在当今数字化信息爆炸的时代，如
Deepseek技术浅析（一）爱研究的小牛 AIGC—概述大模型 AIGC 人工智能深度学习自然语言处理
DeepSeek是北京深度求索人工智能基础技术研究有限公司推出的人工智能技术品牌，专注于大语言模型（LLM）的研发与应用。其技术涵盖了从模型架构、训练方法到应用部署的多个层面，展现出强大的创新能力和应用潜力。以下将详细介绍DeepSeek的核心技术、工作原理以及具体实现方式。一、核心技术1.大语言模型（LLM）DeepSeek的核心产品是自研的大语言模型，其主要特点包括：(1)基于Transfor
启元世界（Inspir.ai）技术浅析（一）爱研究的小牛 AIGC—游戏制作人工智能机器学习 AIGC 深度学习
启元世界（Inspir.ai）作为全球领先的通用人工智能平台公司，自2017年成立以来，一直致力于通过人工智能技术提升产业效能和生活体验。公司汇聚了来自全球顶尖公司和高等学府的技术专家，专注于深度强化学习、推荐算法以及机器学习系统平台等前沿领域，并成功将人工智能技术应用于数字娱乐、智能决策和机器人等多个领域。一、核心技术启元世界在人工智能领域取得了多项突破性进展，其核心技术涵盖了以下几个方面：1.
Lumen5——AI视频制作，提取关键信息生成带有视觉效果的视频爱研究的小牛 AIGC—视频人工智能 AIGC 深度学习
一、Lumen5介绍Lumen5是一款基于人工智能的自动化视频制作平台，专为非专业用户设计，帮助其将博客、文章、新闻等文字内容快速转换为视频。Lumen5的目标是简化视频制作流程，让内容创作者、市场营销人员、社交媒体团队等无需视频制作经验即可轻松制作吸引观众的高质量视频。二、Lumen5的主要功能文字转视频Lumen5最具特色的功能是通过AI自动将文本转化为视频。用户可以输入一段文字或直接粘贴文章
python神经网络框架有哪些,python调用神经网络模型小明技术分享 python 神经网络深度学习
人工智能Python深度学习库有哪些由于Python的易用性和可扩展性，众多深度学习框架提供了Python接口，其中较为流行的深度学习库如下：第一：CaffeCaffe是一个以表达式、速度和模块化为核心的深度学习框架，具备清晰、可读性高和快速的特性，在视频、图像处理方面应用较多。Caffe中的网络结构与优化都以配置文件形式定义，容易上手，无须通过代码构建网络;网络训练速度快，能够训练大型数据集与S
python求一个数的阶乘_阶乘计算python weixin_39540725 python求一个数的阶乘
广告关闭腾讯云11.11云上盛惠，精选热门产品助力上云，云服务器首年88元起，买的越多返的越多，最高返5000元！问题本身很简单，主要是通过这个小问题来演示python的一些用法，例如测试代码运行时间、函数嵌套定义等等。fromtimeimporttimefrommathimportfactorialfromfunctoolsimportreducefromrandomimportrandintd
python上机_Python上机7 weixin_39575170 python上机
1.使用函数编写程序p1.py实现函数isOdd()，参数为整数，如果整数为奇数，返回True，否则返回False。然后在主程序中调用该函数，打印结果。2.使用函数编写程序p2.py实现函数isNum()，参数为一个字符串，如果这个字符串属于整数、浮点数或复数的表示，则返回True，否则返回False。在主程序输入一个字符串，调用该函数判断其是否为数字类型，并输出判断结果。参考代码：defisNu
人工智能的前景与未来就业市场：机遇、挑战与社会影响苹果酱0567 面试题汇总与解析 java 开发语言中间件 spring boot 后端
随着科技的飞速发展，人工智能（AI）已经逐渐渗透到我们生活的方方面面，它不仅引领着技术革新的浪潮，更在无声中重塑着我们的就业市场和社会结构。站在这个时代的交汇点上，我们不禁要问：人工智能将如何影响我们的未来就业市场？它带来的究竟是机遇还是挑战？回望过去，每一次科技革命都伴随着就业市场的剧烈震荡。而今，人工智能作为第四次工业革命的核心驱动力，正以前所未有的速度改变着劳动力市场的格局。从自动化生产线上
2020-08-15 打开秋天的内核深度学习 python python tkinter
Python科学计算器本文分三部分特点介绍程序设计说明最终完整代码如果是高手，请直接跳过设计说明看最终完整代码。一、特点介绍这个计算器之所以称“Python科学计算器”，也绝非浪得虚名，肯定有它独特的地方才向大家推荐。1、具有科学计算功能。按照Python的方式输入，键盘按键和鼠标点击按钮混合输入。一般的计算例如12+34-56*78/910肯定不在话下，2\sqrt2
一句代码计算阶乘(python) iteye_19871 Python
printreduce(lambdaa,b:a*b,range(1,1001))Reurns:402387260077093773543702433923003985719374864210714632543799910429938512398629020592044208486969404800479988610197196058631666872994808558901323829669944
Python实现复原毫米波雷达呼吸波形的示例 go5463158465 python 算法机器学习 python 开发语言
以下是一个使用Python实现复原毫米波雷达呼吸波形的示例，该示例将涉及模型算法在重建损失和KL（Kullback-Leibler）损失之间的平衡问题。我们将使用深度学习中的变分自编码器（VAE）作为模型来进行呼吸波形的复原，因为VAE可以很好地处理重建和潜在空间分布的问题。步骤概述数据准备：生成或加载毫米波雷达的呼吸波形数据。定义VAE模型：包括编码器和解码器。定义损失函数：结合重建损失和KL损
阶乘的六种实现代码 ← Python hnjzsyjyj Python程序设计 Python 阶乘
阶乘是一个常见的数学概念。一个正整数n的阶乘是所有小于等于n的正整数的乘积。阶乘通常用符号n!来表示。其中n是一个正整数。【算法代码一：for循环】deffac(n):p=1foriinrange(1,n+1):p=p*ireturnpx=eval(input())print(fac(x))【算法代码二：while循环】Python中没有++和--这两个运算符。deffac(n):i=1p=1wh
Python抖音爬虫 yzx991013 python基础学习 python 爬虫开发语言
代码：#导入自动化模块的安装：需要安装pipinstallDrissionPagefromDrissionPageimportChromiumPage#导入时间转换模块fromdatetimeimportdatetime#导入csv模块，用于操作CSV文件importcsv#导入格式化输出模块frompprintimportpprint#使用with语句管理文件资源，自动关闭文件withopen(
正则表达式（Regex）-- 捕获组（capture group） xdsemo 编程语言正则表达式 python
RegularExpressionHOWTO—Python3.10.4documentation捕获组就是把正则表达式中子表达式匹配的内容，保存到内存中以数字编号或显式命名的组里，方便后面引用。分为普通捕获组(Expression)和命名捕获组(?Expression)。普通捕获组：如果没有显式为捕获组命名，即没有使用命名捕获组，那么需要按数字顺序来访问所有捕获组。在只有普通捕获组的情况下，捕获组
Python技术栈 —— Poetry CS-Polaris Python技术栈 python 开发语言
Python技术栈——Poetry一、什么是Poetry？二、Poetry的安装与使用2.1Poetry的安装2.2Poetry的使用2.3查看并指定poetry的镜像源三、Python包管理工具对比一、什么是Poetry？一种Python包管理工具。参考文章或视频链接[1]Introduction-Poetry[2]《poetry入门完全指南》-CSDN[3]ManagingPythonDepe
python 离线翻译软件_简单翻译软件好豆美食 python 离线翻译软件
简单翻译软件是一个可以自助翻译的小工具，可以读入多种语种如英语、日语、韩语等的翻译服务。python写的，捣鼓了一个界面，输入英文单词，回车，如果词库存在该单词，输出对应的中文意思，不存在则提示不存在。软件特色：1、可以翻译菜单，编辑框等控件；2、支持中文版本；3、软件完全免费无毒！代码说明：importurllib.requestimporturllib.parseimportjsonimpor
python中content的用法_python中append函数用法讲解 weixin_39902085
如果在做一个地区的统计工作，可以使用列表来帮助我们。输入汉字或者其他字符，比如“01代表汉族”，那么在写民族的时候有下拉列表，就可以打01，就会自动识别为汉族。列表是用来大规模数据填报的时候使用，在python中，也有很多使用到列表的时候，那你知道如何在列表的末尾添加新的对象？今天，我们就来认识一下python中可以在列表末尾添加元素的append函数。1、append()函数用于在列表末尾添加新
对话系统(Chatbots) 原理与代码实例讲解 AI天才研究院 AI大模型企业级应用开发实战大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍1.1对话系统的发展历程对话系统，又称聊天机器人(Chatbots)，是模拟人类对话的计算机程序。从早期的基于规则的系统到如今基于深度学习的智能体，对话系统经历了漫长的发展历程。第一阶段：基于规则的系统(1960s-1990s)早期的对话系统主要基于预先定义的规则和模板。例如，ELIZA(1966)是一个模拟心理治疗师的程序，通过模式匹配和关键词识别来生成回复。这些系统只能处理有限的对
JDK7 正则表达式捕获组命名 u010466329 正则表达式正则表达式
jdk6之前的正则表达式不支持命名捕获组功能，只能通过捕获组的索引来访问捕获组。当正则表达式比较复杂的时候，里面含有大量的捕获组和非捕获组,通过从左至右数括号来得知捕获组的计数也是一件很烦人的事情；而且这样做代码的可读性也不好，当正则表达式需要修改的时候也会改变里面捕获组的计数。解决这个问题的方法是通过给捕获组命名来解决,就像Python,PHP,.Net以及Perl这些语言里的正则表达式一样.新
python列表append()函数九天小牛 python列表 append()函数 list-append()函数
python列表语法大全链接append()函数描述：在列表ls最后(末尾)添加一个元素object语法：ls.append(object)->None无返回值object——要添加的元素。可以添加列表，字典，元组，集合，字符串等。程序示例：ls1=[1,2,3,4,5,6]ls2=[1,2,3,4,5,6]ls1.append(12) #可以添加列表，字典，元组，集合，字符串等ls2.appen
如何使用深度学习中的 Transformer 算法进行视频目标检测 go5463158465 python 算法深度学习 python 开发语言
以下将介绍如何使用深度学习中的Transformer算法进行视频目标检测，并给出一个复现相关论文思路及示例代码。这里以DETR（End-to-EndObjectDetectionwithTransformers）为基础进行说明，它是将Transformer引入目标检测领域的经典论文。步骤概述环境准备：安装必要的库，如PyTorch、torchvision等。数据准备：使用公开的视频目标检测数据集，
探索SakuraLLM：轻小说与Galgame翻译的新纪元蒋素萍Marilyn
探索SakuraLLM：轻小说与Galgame翻译的新纪元SakuraLLM适配轻小说/Galgame的日中翻译大模型项目地址:https://gitcode.com/gh_mirrors/sa/SakuraLLM在人工智能的浪潮中，SakuraLLM以其独特的魅力和强大的功能，成为了日中翻译领域的一颗璀璨明星。本文将深入介绍SakuraLLM项目，分析其技术特点，探讨其应用场景，并揭示其与众不同
Python 包管理之 poetry 奔跑的大西吉 Python
poetry是一个Python虚拟环境和依赖管理的工具。poetry和pipenv类似，另外还提供了打包和发布的功能。官方文档：python-poetry.org/docs/python项目部署：poetry管理本地环境,上线用dockerpoetry安装poetry提供多种安装方式，个人推荐从以下2种方式中选择：方式一：（推荐）$curl-sSLhttps://raw.githubusercon
python处理NC文件时，常用的一些函数胡修修 python
一、glob.glob()返回所有匹配的文件路径列表。参数pathname，定义了文件路径匹配规则，可以是绝对路径，也可以是相对路径。例如以下代码就会返回所有符合该规则的文件路径：t2m_path_list=glob.glob('G:/aaa/sat_dir/mask_daily/era5_t2m_????????.tif')可以通过循环遍历每一个文件：forpathintif_path_list
使用 Python Poetry 进行依赖管理 AudiA6LV6 后端 python 开发语言爬虫职场和发展面试
当您的Python项目依赖于外部包时，您需要确保使用每个包的正确版本。更新后，软件包可能无法像更新前那样工作。PythonPoetry之类的依赖项管理器可帮助您指定、安装和解析项目中的外部包。通过这种方式，您可以确保始终在每台机器上使用正确的依赖版本。使用Poetry将帮助您启动新项目、维护现有项目并掌握依赖项管理。您将准备好使用pyproject.toml文件，这将是在Python项目中定义构建
大模型问答机器人的智能化程度 AI大模型应用之禅 AI大模型与大数据 java python javascript kotlin golang 架构人工智能
大模型、问答机器人、智能化程度、自然语言处理、深度学习、Transformer模型、知识图谱、推理能力、对话系统1.背景介绍近年来，人工智能技术取得了飞速发展，特别是深度学习的兴起，为自然语言处理（NLP）领域带来了革命性的变革。其中，大模型问答机器人作为一种新型的智能交互系统，凭借其强大的语言理解和生成能力，在客服、教育、娱乐等领域展现出广阔的应用前景。问答机器人是指能够理解用户自然语言问题并给
Python----Python高级（正则表达式：语法规则，re库）蹦蹦跳跳真可爱589 Python 正则表达式 python
一、正则表达式1.1、概念正则表达式，又称规则表达式,（RegularExpression，在代码中常简写为regex、regexp或RE），是一种文本模式，包括普通字符（例如，a到z之间的字母）和特殊字符（称为"元字符"）。正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串，通常被用来检索、替换那些符合某个模式（规则）的文本。通俗的说，正则表达式就是一种语法规则，用来匹配文本中的
Python中内置函数append()、extend()的用法及区别万里春风 1024程序员节 python
1.append()函数的基本用法append(）函数可以在列表末尾添加任意类型的元素1.1添加整数、浮点数、字符串实例：list1=[1,2]list1.append(0)#添加整数类型print('list1=',list1)list2=[1,2]list2.append(1.23)#添加浮点数类型print('list2=',list2)list3=[1,2]list3.append('ev
Python-作业统计管理系统 Vicky__3021 Python实例 python 编程语言
目录一、设计目的二、需求分析三、总体设计1.系统流程设计2.系统模块设计四、详细设计1.模块选择2.界面设计3.模块实现五、总结六、感想七、Python源码mainexcelhandlejob一、设计目的1、教学目的本课程设计是学生学习完《Python程序设计》课程后，进行的一次全面的综合训练，通过课程设计，更好地掌握使用Python语言进行程序设计的方法，加深对Python语言特点和使用Pyth
关于旗正规则引擎规则中的上传和下载问题何必如此文件下载压缩 jsp 文件上传
文件的上传下载都是数据流的输入输出，大致流程都是一样的。一、文件打包下载 1.文件写入压缩包 string mainPath="D:\upload\"; 下载路径 string tmpfileName=jar.zip; &n
【Spark九十九】Spark Streaming的batch interval时间内的数据流转源码分析 bit1129 Stream
以如下代码为例（SocketInputDStream）： Spark Streaming从Socket读取数据的代码是在SocketReceiver的receive方法中，撇开异常情况不谈(Receiver有重连机制，restart方法，默认情况下在Receiver挂了之后，间隔两秒钟重新建立Socket连接)，读取到的数据通过调用store(textRead)方法进行存储。数据
spark master web ui 端口8080被占用解决方法 daizj 8080 端口占用 spark master web ui
spark master web ui 默认端口为8080，当系统有其它程序也在使用该接口时，启动master时也不会报错，spark自己会改用其它端口，自动端口号加1，但为了可以控制到指定的端口，我们可以自行设置，修改方法： 1、cd SPARK_HOME/sbin 2、vi start-master.sh 3、定位到下面部分
oracle_执行计划_谓词信息和数据获取周凡杨 oracle 执行计划
oracle_执行计划_谓词信息和数据获取(上) 一：简要说明在查看执行计划的信息中，经常会看到两个谓词filter和access，它们的区别是什么，理解了这两个词对我们解读Oracle的执行计划信息会有所帮助。简单说，执行计划如果显示是access，就表示这个谓词条件的值将会影响数据的访问路径（表还是索引），而filter表示谓词条件的值并不会影响数据访问路径，只起到
spring中datasource配置 g21121 dataSource
datasource配置有很多种，我介绍的一种是采用c3p0的，它的百科地址是： http://baike.baidu.com/view/920062.htm  <bean name="propertiesConfig" class="org.springframework.b
web报表工具FineReport使用中遇到的常见报错及解决办法（三）老A不折腾 finereport FAQ 报表软件
这里写点抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、repeated column width is largerthan paper width：这个看这段话应该是很好理解的。比如做的模板页面宽度只能放
mysql 用户管理墙头上一根草 linux mysql user
1.新建用户 //登录MYSQL@>mysql -u root -p@>密码//创建用户mysql> insert into mysql.user(Host,User,Password) values(‘localhost’,'jeecn’,password(‘jeecn’));//刷新系统权限表mysql>flush privileges;这样就创建了一个名为：
关于使用Spring导致c3p0数据库死锁问题 aijuans spring Spring 入门 Spring 实例 Spring3 Spring 教程
这个问题我实在是为整个 springsource 的员工蒙羞如果大家使用 spring 控制事务，使用 Open Session In View 模式， com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.
百度词库联想 annan211 百度
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> <title>RunJS</title&g
int数据与byte之间的相互转换实现代码百合不是茶位移 int转byte byte转int 基本数据类型的实现
在BMP文件和文件压缩时需要用到的int与byte转换,现将理解的贴出来; 主要是要理解;位移等概念 http://baihe747.iteye.com/blog/2078029 int转byte; byte转int; /** * 字节转成int,int转成字节 * @author Administrator *
简单模拟实现数据库连接池 bijian1013 java thread java多线程简单模拟实现数据库连接池
简单模拟实现数据库连接池实例1： package com.bijian.thread; public class DB { //private static final int MAX_COUNT = 10; private static final DB instance = new DB(); private int count = 0; private i
一种基于Weblogic容器的鉴权设计 bijian1013 java weblogic
服务器对请求的鉴权可以在请求头中加Authorization之类的key，将用户名、密码保存到此key对应的value中，当然对于用户名、密码这种高机密的信息，应该对其进行加砂加密等，最简单的方法如下： String vuser_id = "weblogic"; String vuse
【RPC框架Hessian二】Hessian 对象序列化和反序列化 bit1129 hessian
任何一个对象从一个JVM传输到另一个JVM，都要经过序列化为二进制数据(或者字符串等其他格式，比如JSON)，然后在反序列化为Java对象，这最后都是通过二进制的数据在不同的JVM之间传输(一般是通过Socket和二进制的数据传输)，本文定义一个比较符合工作中。 1. 定义三个POJO Person类 package com.tom.hes
【Hadoop十四】Hadoop提供的脚本的功能 bit1129 hadoop
1. hadoop-daemon.sh 1.1 启动HDFS ./hadoop-daemon.sh start namenode ./hadoop-daemon.sh start datanode 通过这种逐步启动的方式，比start-all.sh方式少了一个SecondaryNameNode进程，这不影响Hadoop的使用，其实在 Hadoop2.0中，SecondaryNa
中国互联网走在“灰度”上 ronin47 管理灰度
中国互联网走在“灰度”上（转）文/孕峰第一次听说灰度这个词，是任正非说新型管理者所需要的素质。第二次听说是来自马化腾。似乎其他人包括马云也用不同的语言说过类似的意思。灰度这个词所包含的意义和视野是广远的。要理解这个词，可能同样要用“灰度”的心态。灰度的反面，是规规矩矩，清清楚楚，泾渭分明，严谨条理，是决不妥协，不转弯，认死理。黑白分明不是灰度，像彩虹那样
java-51-输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。 bylijinnan java
public class PrintMatrixClockwisely { /** * Q51.输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。例如：如果输入如下矩阵： 1 2 3 4 5 6 7 8 9
mongoDB 用户管理开窍的石头 mongoDB用户管理
1:添加用户第一次设置用户需要进入admin数据库下设置超级用户（use admin） db.addUsr({user:'useName',pwd:'111111',roles:[readWrite,dbAdmin]}); 第一个参数用户的名字第二个参数
[游戏与生活]玩暗黑破坏神3的一些问题 comsci 生活
暗黑破坏神3是有史以来最让人激动的游戏。。。。但是有几个问题需要我们注意玩这个游戏的时间，每天不要超过一个小时，且每次玩游戏最好在白天结束游戏之后，最好在太阳下面来晒一下身上的暗黑气息，让自己恢复人的生气 &nb
java 二维数组如何存入数据库 cuiyadll java
using System; using System.Linq; using System.Text; using System.Windows.Forms; using System.Xml; using System.Xml.Serialization; using System.IO; namespace WindowsFormsApplication1 {
本地事务和全局事务Local Transaction and Global Transaction(JTA) darrenzhu java spring local global transaction
Configuring Spring and JTA without full Java EE http://spring.io/blog/2011/08/15/configuring-spring-and-jta-without-full-java-ee/ Spring doc -Transaction Management http://docs.spring.io/spri
Linux命令之alias - 设置命令的别名，让 Linux 命令更简练 dcj3sjt126com linux alias
用途说明设置命令的别名。在linux系统中如果命令太长又不符合用户的习惯，那么我们可以为它指定一个别名。虽然可以为命令建立“链接”解决长文件名的问题，但对于带命令行参数的命令，链接就无能为力了。而指定别名则可以解决此类所有问题【1】。常用别名来简化ssh登录【见示例三】，使长命令变短，使常用的长命令行变短，强制执行命令时询问等。常用参数格式：alias 格式：ali
yii2 restful web服务[格式响应] dcj3sjt126com PHP yii2
响应格式当处理一个 RESTful API 请求时，一个应用程序通常需要如下步骤来处理响应格式：确定可能影响响应格式的各种因素，例如媒介类型，语言，版本，等等。这个过程也被称为 content negotiation。资源对象转换为数组，如在 Resources 部分中所描述的。通过 [[yii\rest\Serializer]]
MongoDB索引调优（2）——[十] eksliang mongodb MongoDB索引优化
转载请出自出处：http://eksliang.iteye.com/blog/2178555 一、概述上一篇文档中也说明了，MongoDB的索引几乎与关系型数据库的索引一模一样，优化关系型数据库的技巧通用适合MongoDB，所有这里只讲MongoDB需要注意的地方二、索引内嵌文档可以在嵌套文档的键上建立索引，方式与正常
当滑动到顶部和底部时，实现Item的分离效果的ListView gundumw100 android
拉动ListView，Item之间的间距会变大，释放后恢复原样； package cn.tangdada.tangbang.widget; import android.annotation.TargetApi; import android.content.Context; import android.content.res.TypedArray; import andr
程序员用HTML5制作的爱心树表白动画 ini JavaScript jquery Web html5 css
体验效果：http://keleyi.com/keleyi/phtml/html5/31.htmHTML代码如下： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"><head><meta charset="UTF-8" > <ti
预装windows 8 系统GPT模式的ThinkPad T440改装64位 windows 7旗舰版 kakajw ThinkPad 预装改装 windows 7 windows 8
该教程具有普遍参考性，特别适用于联想的机器，其他品牌机器的处理过程也大同小异。该教程是个人多次尝试和总结的结果，实用性强，推荐给需要的人！缘由小弟最近入手笔记本ThinkPad T440，但是特别不能习惯笔记本出厂预装的Windows 8系统，而且厂商自作聪明地预装了一堆没用的应用软件，消耗不少的系统资源（本本的内存为4G，系统启动完成时，物理内存占用比
Nginx学习笔记 mcj8089 nginx
一、安装nginx 1、在nginx官方网站下载一个包，下载地址是： http://nginx.org/download/nginx-1.4.2.tar.gz 2、WinSCP(ftp上传工
mongodb 聚合查询每天论坛链接点击次数 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 18 */ { "_id" : ObjectId("5596414cbe4d73a327e50274"), "msgType" : "text", "sendTime" : ISODate("2015-07-03T08:01:16.000Z"
java术语（PO/POJO/VO/BO/DAO/DTO） Luob. DAO POJO DTO po VO BO
PO(persistant object) 持久对象在o/r 映射的时候出现的概念,如果没有o/r映射,就没有这个概念存在了.通常对应数据模型(数据库),本身还有部分业务逻辑的处理.可以看成是与数据库中的表相映射的java对象.最简单的PO就是对应数据库中某个表中的一条记录,多个记录可以用PO的集合.PO中应该不包含任何对数据库的操作. VO(value object) 值对象通
算法复杂度 Wuaner Algorithm
Time Complexity & Big-O： http://stackoverflow.com/questions/487258/plain-english-explanation-of-big-o http://bigocheatsheet.com/ http://www.sitepoint.com/time-complexity-algorithms/