收尾人VEM

聊一聊mmdetection代码框架和自己对于目标检测的新理解

聊一聊mmdetection代码框架和目标检测

文章目录

聊一聊mmdetection代码框架和目标检测
- 一.为什么要写这篇文章
- 二.关于图像识别任务的共性
- - 1.图像分类
  - 2.语义分割
  - 3.目标检测
- 三.mmdetection代码框架解析
- - 1.配置环境方面
  - 2.demo文件夹
  - 3.weights文件夹
  - 4.setup以及与setup相关的脚本
  - 5.训练
  - - (1)train.py
    - (2)config
  - 6.总结一下
- 四.结语

阅读注意事项：

本篇文章主要内容为我自己对于mmdetection工作原理的分析以及部分图像识别任务的个人看法，至于mmdetection的安装和使用，网上有很多非常详细的讲解视频，我就不详解了。
由于是个人理解，写文章来做个笔记，若有错误，敬请指正。

import argparse

一.为什么要写这篇文章

前段日子比较忙，忘了对再前些日子学到的东西进行一个总结和归纳：前些日子学习一下目标检测的论文并尝试复现了一下YOLOv1，再加上最近在弄时空检测模型，就趁着这个机会表达一小部分自己的见解并较为仔细地讲一下自己对于mmdetection的代码框架和工作原理。

二.关于图像识别任务的共性

在我看来，像语义分割/目标检测/图像分类这三大图像识别任务都是先通过backbone提取主干特征然后进行对应的处理，比如说：

1.图像分类

对于图像分类，在得到了卷积层输出的高维度特征张量后，需要先展平空间特征，
$batch size,channels,height,width)->(batch_size,spatial feature)$
然后进入全连接层(CNN其实就是卷积层+全连接层，其中全连接层可以看作传统的BP神经网络)，得到最后的输出特征向量。

2.语义分割

至于语义分割，就以最经典的U形神经网络Unet来解释一下，Unet前半部分是Encoder，而后半部分是Decoder——通过卷积可以进行下采样操作，特征图语义信息增加、尺寸变小，这便是Encoder；通过反卷积则可以降低语义信息、增加图像尺寸，这便是Decoder。

其中Encoder操作就是我们说的backbone提取主干特征，而Decoder则是起到一个特征还原的作用，本质上还是对提取到的信息进行一个处理。

3.目标检测

对于目标检测，由于目标检测算法较多且复杂，这里就以YOLO系列为主(目标检测算法可以分为one-stage和two-stage，YOLO系列为one-stage代表模型)，用v2-v5来讲一下目标检测与图像识别任务的共性:

为何不先讲v1呢？因为YOLOv1到YOLOv2的改进非常大，对于YOLOv1而言，再进行了特征提取后，剩下的操作与图像分类一样，但是唯一不同的是，YOLOv1需要将输出特征向量规范为:
$batch_size,30,7,7)$
的大小，可见这里的YOLOv1使用到了全连接层(不了解YOLOv1原理的小伙伴可以参考一下我复现YOLOv1的文章)。但是在YOLOv2中，作者为了解决YOLOv1中存在的一些问题，eg：coordinate收敛缓慢或者无法收敛(位置信息)，直接将全连接层该去掉并且引入锚框等新概念用于改进特征处理过程。到了v3，作者又创造性地给YOLv2网络加入了FPN(特征金字塔)以及Darknet53等结构，但是无论是后面v4、v5新增的结果或者是激活函数，整体上都是在backbone输出特征信息的处理以及backbone提取信息的过程下手。因此，YOLO系列在我看来进步最大的就是YOLOv1的产生以及YOLOv2从YOLOv1的改进。

故而，我们可以看到不管是什么任务最关键的就是对于特征的提取以及对提取到的特征的进一步提取或者利用。

三.mmdetection代码框架解析

多说无益，我们现在就对这个代码框架的工作原理进行解析。

1.配置环境方面

配置环境方面，我一般用的是这个命令：

conda create -n mmdet python=3.8
conda activate mmdet
conda install pytorch=1.8 torchvision cudatoolkit=10.2 -c pytorch

来安装pytorch1.8和python3.8 or python3.7，主要是因为这两个版本的pytorch和python比较稳定——pytorch1.9有一些烦人的bug，而python3.7 or python3.8可以兼容大部分python包。

后面就只需要安装好MMCV并通过如下命令：

pip install -r requirements.txt
python setup.py develop

安装好所需库和mmdetection。

2.demo文件夹

一般来说，对于每一个mmlab系列的深度学习工具包，其主干目录下一般都会有一个叫做demo的文件夹，这个文件夹里面村的都是一些预测代码或者是用于预测文件，当然还可能有其他功能的杂项文件：

比如说上图中的这个文件夹，一般来说用于前向传播预测到的脚本都会以“webcam”这个前缀开始。一般来说这个文件夹主要分为两大部分：参数解析与主程序调用：

上图为参数解析部分。

可以看到上面的参数列表中主要包含：config、checkpoint、device：

config是测试使用的配置文件；
checkpoint一般是用于前向传播预测要使用的权重文件；
device就是使用的计算平台——cpu or gpu；

同时，还有2个额外参数：

camera-id：目标检测一般可以用在视频的目标检测中，那么就需要摄像头，如果存在多个摄像头，需要自行设定参数；
score-thr：这个老熟人了，目标检测在NMS操作中，需要设定阈值去除置信度没达到我们设定阈值要求的bounding box。

另外，再说一下这个参数解析的原理：

通过上面的参数解析函数我们得到了一个返回形参args，这个对象是一个argparse.Namespace的类的对象，这个类的属性便是我们上面定义的config、checkpoint等数据，通过访问这些属性便可以得到一个参数值，可见这个类起到一个“参数存储器”的作用——参数被解析器parser解析后用一个Namespace参数存储器存储起来。

在main函数中，通过调用一些模块化的函数，这些函数高度的“抽象化”（具体个怎么抽象化我们后面分板块来说，先了解好这个demo文件夹的作用以及这种“参数解析+主程序调用”的结构），在上图中通过调用模块化函数init_detector初始化模型，并通过访问Namespace对象的config等属性来得到参数。

3.weights文件夹

这个文件夹没什么好说的，存放的是一些官方已经训练好的网络权重，但是严格意义上来讲，这种权重应该叫做“网络+数据集+输入权重”，意思就是说，一般这些权重由三个维度去定义：

训练所需的backbone或者是算法
输入的尺寸或者大小
数据集格式或者类型，eg：voc、coco
另外，对于特殊的训练任务可能还有其他定义维度，eg：mmaction（mmlab的视频理解工具包）对于权重还有一个定义维度叫做训练方法：rgb或者光流。

4.setup以及与setup相关的脚本

一般来说，setup开头的脚本，eg：setup.cfg或者setup.py是用于mmdetection工具包的安装，搭配setuptools包库使用。

5.训练

这里的话，我们按照这个训练流程来“寻根溯源”，找到背后的运行原理。

(1)train.py

这是一个位于./tools下的脚本文件，先说一下tools文件夹吧，这个文件夹顾名思义，存放了一些训练工具，以目标检测的mmdetection举例子，就主要包括了：训练分析工具以及能够在不同平台(linux和windows)上运行的脚本文件(.sh or .py)。

至于train.py文件，我们先看一下文件开头吧：

可以发现，他会从一个mmdet的下的datasets、models、utils导入一些函数，这些函数就是我上面提到的高度“抽象化”函数，什么叫高度抽象化呢？也就是说一般我们在写不同目标检测算法的时候，对于一个流程，eg：构建数据集，这个流程其实对于不同算法或是任务会有不同的搭建函数，也就是说你每次任务都得写一次，这就是高度具体化。

那么高度抽象化就是我可以只写一个函数，比如说这里的build_dataset来完成一个数据集的搭建，对于每一个目标检测任务我都可以用这个，只不过要调整、输入的参数可能变多了而已。

说的简单一点，人家就是把各种功能相似的模块函数集合在一起了，你直接调用就。

因此可见这个mmdet可谓是整个工具包中的核心部件。

train.py从这些库中导入了自己训练所需要的基本组件函数，然后我们继续往下看。

我们发现，接下来的还是一些类似于预测脚本的参数解析，但是相比于预测，这里一般需要填写的参数为：

config：训练配置文件（后续会讲到）；
resume-from：导入的预训练权重路径；
–no-validate：决定是否需要去进行验证；
work-dir：工作目录，aka：训练日志存储目录；
gpus和gpu_ids：gpu的个数以及当前使用gpu的下标；

基本上，主要的就这几个，其他的不常用，若要用可以自行阅读help。

然后，还是跟预测代码一样为main函数调用，总体上，如果你要训练自己的数据集，可以自行调整参数。

(2)config

这个config其实就是一些py文件，但是这些py文件很意思，首先，我们train.py的参数解析中就有config这一参数，但是一般来说，训练不应该还要给数据集定义参数吗？但是参数解析器中没有add呀~其实很明显了，说明这些参数在config中呗，config文件夹的结构如下：

-config
--_base_
--fast_rcnn
--faster_rcnn
--yolo
......

对于_base_之外的python脚本（都是存储字典或者src列表，字典存配置，src列表存其他python脚本的src），一般要么是存储了数据配置的字典，要么是存储了model的字典，要么是存储了存储其他python脚本src的列表。

_base_内的python脚本分一般主要分为models和datasets，这个就很明确了，models就是存backbone结构配置、datasets存储数据集配置，至于_base_之外的，，，嗯，我估计是开发者更新的时候给“随便”排在那儿的吧，当然，我在用mmaction2的时候，作者干脆就直接在一个脚本里面将dataset和model配置都放在一起。

至于config调用，那就是train or demo中的预测脚本调用config脚本路径，然后会调用一个mmcv中类，叫做Config：

mmcv呢，大家用mmlab都肯定是耳熟能详——必备的基库，对于每一个mmlab计算机视觉工具包都需要mmcv的支持。而这个Config和其他mmcv的类都是mmlab开发人员写出来的，首先跟普通python库ConfigParser一样，实例化一个parser对象:

cfg = Config(....)

然后通过cfg去访问这些配置字典，eg:访问model结构配置字典——cfg.model。

因此，一般如果要自己训练一个自定义数据集的话，就好创建一个data目录，然后把python配置脚本改成固定路径就行了。

一般就是这种data root的地方改就可以了。

6.总结一下

如果要训练自己定义的数据集：（环境配好的前提下）

创建data目录，按照官方文档，将数据集转换为正确格式；
找到自己训练任务对应的python配置脚本，修改data root和其他自己想要的参数；
修改tools/train.py脚本下的一些主要参数——特别是config。
运行train.py就可以开启漫长的训练之旅啦。

四.结语

这篇文章只是我个人对mmlab和目标检测一些见解，如果说对在使用mmlab系列工具包的小伙伴有啥用处的话，可能就是让你们能够更加透析mmlab系列代码构架和工作原理，从而让你们更好地debug和高效率完成任务。

简单来说，mmlab系列“张持有度”，不仅仅是在pytorch等浅层深度学习框架上进行了更高级的封装，还在原基础上融合了更多模型和数据集，在一定程度上既具象化，又抽象化。

最后呢，不得不佩服mmlab的大佬们，首先就是编程的严谨性和这种产品构架思考的创新型，不得不说，作者本人都觉得这些代码都算得上是艺术品，等自己大四或者大三卷完了或者是现在有空，我自己也想并且也在尝试自己复刻mmlab的代码框架。

如有不足和错误，敬请指正。

本文可能会随着博主的研究推进、进一步剖析代码框架而不断更新哦~

常见的设计模式(单例模式&工厂模式) 客行. 设计模式单例模式观察者模式
目录一.为什么要学习设计模式？二.单例模式概念优点缺点1.饿汉模式1.1概念1.2示例2.懒汉模式2.1概念2.2示例三.工厂模式1.概念2.使用场景3.工厂方法一.为什么要学习设计模式？设计模式（Designpattern）代表了最佳的实践，是很多优秀的软件开发人员的经验总结，是解决特定问题的解决方案。它并不是语法规定，也不拘泥于特定语言。恰当的使用设计模式可以代码的可复用性，可维护性，可扩展性
Kubernetes学习笔记-移除Nacos迁移至K8s 人生偌只如初见 Kubernetes J2EE kubernetes k8s java
项目服务的配置管理和服务注册发现由原先的Nacos全面迁移到Kubernetes上。一、移除Nacos移除Nacos组件依赖。com.alibaba.cloudspring-cloud-starter-alibaba-nacos-discoverycom.alibaba.cloudspring-cloud-starter-alibaba-nacos-configorg.springframewor
【Java学习日记6】：字面量的分类与使用小蛋6g Java学习日记 java 开发语言
一、字面量的定义与作用字面量是程序中直接书写的数据值，无需通过变量或计算获取。它用于表示固定的值，如数字、字符、布尔值等，例如：数字100、字符串"Hello"、字符'A'等。字面量告诉编译器数据的类型和值。字面量就是告诉程序员:数据在程序中的书写格式.---二、字面量的分类Java中的字面量按数据类型可分为以下六类：类型说明示例整数类型不带小数点的数字123,-456小数类型带小数点的数字3.1
Python, Java, C ++开发全球热能动态监测APP Geeker-2025 python java c++
开发一个“全球热能动态监测APP”是一个非常有意义的想法，尤其是在能源管理和环境保护领域。以下是开发该APP的详细思路和技术实现方案，分别针对Python、Java和C++。---###**功能需求分析**1.**全球热能数据展示**：-各国或地区的热能生产、消费和进出口数据。-实时监测热能动态（如发电厂的热能输出、温度变化等）。2.**地图可视化**：-在地图上标注热能发电厂的位置。-使用颜色或
强化学习中的深度卷积神经网络设计与应用实例数字扫地僧计算机视觉 cnn 人工智能神经网络
I.引言强化学习（ReinforcementLearning，RL）是机器学习的一个重要分支，通过与环境的交互来学习最优策略。深度学习，特别是深度卷积神经网络（DeepConvolutionalNeuralNetworks，DCNNs）的引入，为强化学习在处理高维度数据方面提供了强大工具。本文将探讨强化学习中深度卷积神经网络的设计原则及其在不同应用场景中的实例。II.深度卷积神经网络在强化学习中的
动物识别系统代码python_动物识别系统__代码 weixin_39812065 动物识别系统代码python
1动物识别专家系统动物识别专家系统是流行的专家系统实验模型，它用产生式规则来表示知识，共15条规则、可以识别七种动物，这些规则既少又简单，可以改造他们，也可以加进新的规则，还可以用来识别其他东西的新规则来取代这些规则。动物识别15条规则的中文表示是：规则1：如果：动物有毛发则：该动物是哺乳动物规则2：如果：动物有奶则：该单位是哺乳动物规则3:如果：该动物有羽毛则：该动物是鸟规则4：如果：动物会飞，
动物识别系统代码python_动物识别系统代码 weixin_39862794 动物识别系统代码python
简易动物识别专家系统源代码（调试无错！）#includevoidbirds(){inta;printf("**************************************\n");printf("1.长腿，长脖子，黑色，不会飞。\n");printf("2.不会飞，会游泳，黑色.\n");printf("3.善飞\n");printf("4.无上述特征\n");printf("****
C++ 学习需要多长时间？ c++
学习C++所需的时间因个人的学习目标、基础、学习方法和投入的时间而异。以下是一些大致的时间范围和学习阶段的参考：一、初学者阶段（0-3个月）目标：掌握C++的基本语法、数据类型、控制结构（如循环、条件语句）、函数等基础知识。学习内容：学习变量声明、数据类型（如int、float、char等）。掌握基本的输入输出操作（如cin和cout）。理解并使用循环（for、while）和条件语句（if、swi
Python深浅拷贝 Karl_zhujt Python python
文章目录1概述2数据类型2.1可变类型2.2不可变类型3深浅拷贝3.1浅拷贝3.2深拷贝4深浅拷贝对数据类型的影响4.1对于不可变类型的影响4.2对于可变类型的影响4.3总结5实现机制5.1copy5.2id6示例6.1普通赋值6.2浅拷贝可变类型6.3浅拷贝不可变类型6.4深拷贝可变类型6.5深拷贝不可变类型7注意事项1概述在Python中，可变类型和不可变类型的拷贝行为有所不同。理解它们的区别
基于 EMA12 指标结合 iTick 外汇报价 API 、股票报价API、指数报价API的量化策略编写与回测
iTick提供了强大的外汇报价API、股票报价API和指数报价API服务，为量化策略的开发提供了丰富的数据支持。本文将详细介绍如何使用Python结合EMA12指标和iTick的报价API来构建一个简单的量化交易策略，并对该策略进行回测。1.引言在量化交易领域，技术指标是构建交易策略的重要基础。iTick提供了强大的外汇报价API、股票报价API和指数报价API服务，为量化策略的开发提供了丰富的数
视频剪辑行业的现状与进阶之路：一个双视角分析程序员
视频剪辑行业的现状与进阶之路：一个双视角分析一、现状解析商业角度分析成本控制培训需要投入时间和人力成本快节奏的市场环境要求快速产出人员流动性大，培训投入可能无法获得长期回报市场需求大量内容需要快速产出标准化的剪辑模板更容易管理追求效率大于创新风险规避现成模板降低出错风险统一风格便于品控减少个人风格带来的不确定性剪辑师角度分析职业发展受限难以系统学习完整工作流程创意空间被压缩技能提升遇到瓶颈技能断层
【C++】Vector和List的区别信手斩龙 C++
在学习stl的时候，总是有同学分不清楚Vector和List的使用，在这里我总结一下它们的区别和使用方法。一、底层结构 vector的底层结构是动态顺序表，在内存中是一段连续的空间。 list的底层结构是带头节点的双向循环链表，在内存中不是一段连续的空间。二、支持随机访问 vector支持随机访问，可以利用下标精准定位到一个元素上，访问某个元素的时间复杂度是O(1)。 list不支持随机访问，要
腾讯云大模型知识引擎与DeepSeek：打造懒人专属的谷歌浏览器翻译插件大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 腾讯云云计算
摘要：随着人工智能技术的飞速发展，越来越多的前沿技术和工具已走入日常生活。翻译工具作为跨语言沟通的桥梁，一直处于技术创新的风口浪尖。本文探讨了腾讯云大模型知识引擎与DeepSeek结合谷歌浏览器插件的可能性，旨在为用户提供一种便捷、高效的翻译体验。通过应用深度学习、自然语言处理和知识图谱技术，该插件不仅能实时翻译网页内容，还能根据上下文进行智能推荐，实现精准的语境转换。本文将详细阐述其设计思路、技
python动物识别系统(仅有识别功能) OnlySecondS
''@Time:2022/03/298:39@Author:11863@File:AIS_main.py@software:PyCharm'''rules={}#以字典形式存储#读取文件defreadRules():rulesFile=open("rules.txt","r",encoding='utf-8')forlineinrulesFile:#按行读取line=line.replace('I
【产品经理修炼之道】- 新能源发展的基石-储能系统 xiaoli8748_软件开发产品经理产品经理
什么是储能系统？在这篇文章里，作者给出了他的回答，储能系统即一个“巨型充电宝”，可以在发电侧、电网侧、用户侧等场景应用，起到平衡供需、优化电网运行、节省用电成本、应急备用等关键作用。一起来看看作者关于储能系统的解读。动机近期，个人对储能产品相关的知识进行了学习与研究，基于通过输入-输出的方式，进一步梳理和强化自己的认知的目的，我从什么是储能？为什么需要储能？储能的几种方式？电化学储能的构成等方面，
深度优先搜索和广度优先搜索详细解析和区别潇杨爱吃粉深度优先宽度优先算法数据结构
一、深度优先搜索（DFS）1.核心思想像探险家走迷宫，遇到岔路就选一条路走到头，无路可走时返回上一个岔路口换另一条路。2.实现方式数据结构：栈（Stack，先进后出）或递归（隐式栈）遍历顺序：纵向深入，优先访问最深层的节点3.图解示例假设有以下树结构：A/\BC/\/DEFDFS遍历顺序（从根节点A出发）：A→B→D→E→C→F4.代码实现（Python）defdfs(graph,start):s
DeepSeek 模型未来怎么走？技术创新、行业落地全解析！网罗开发 AI 大模型人工智能人工智能职场和发展
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
2025年渗透测试面试题总结-某四字大厂实习面试复盘一面二面三面（题目+回答）独行soc 2025年渗透测试面试指南面试职场和发展安全 web安全红蓝攻防 python
网络安全领域各种资源，学习文档，以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具，欢迎关注。目录一面1.数组和链表各自的优势和原因2.操作系统层面解析和进程3.线程和进程通信方式及数据安全问题4.线程和多进程的选用场景及原因5.SQL注入绕WAF方式6.FUZZ绕WAF的payload长度通常是多少7.不查资料直接写IPv4正则regex8.Fastjson反序
AI学习教程DeepSeek使用教程合集免费下载 oneboxai 学习
1.DeepSeek本地部署2.Deepseek搭建个人知识库3.DeepSeek提示词详解4.Deepseek使用技巧大全5.DeepSeek提示词大全6.DeepSeek保姆级新手教程7.DeepSeek各类应用8.Deepseek写小说9.DeepSeekV3部署教程10.DeepseekwordExcel11.Deepseek科研论文12.Deepseek开发游戏13.大模型通用一-A1指
Python-modbustcp通信-plc读写张凯的工作室 python python
Python-modbustcp通信-plc读写1，功能码说明读取：%m对应READ_COILS线圈寄存器数值0和1%mw存单字节%mf浮点数%md双字节对应READ_HOLDING_REGISTERS保持寄存器写入单个写入线圈寄存器WRITE_SINGLE_COIL%m单个写入保持寄存器WRITE_SINGLE_REGISTER写入多个保持寄存器WRITE_MULTIPLE_REGISTERS写
PyCharm v2024.3.5 强大的Python IDE工具支持M、Intel芯片 2401_89264762 python ide pycharm
PyCharm是一种PythonIDE，带有一整套可以帮助用户在使用Python语言开发时提高其效率的工具，比如调试、语法高亮、Project管理、代码跳转、智能提示、自动完成、单元测试、版本控制。此外，该IDE提供了一些高级功能，以用于支持Django框架下的专业Web开发。应用介绍PyCharm是由JetBrains打造的一款PythonIDE，VS2010的重构插件Resharper就是出自
ESP32学习 -从STM32工程架构进阶到ESP32架构古希腊掌握嵌入式的神学习 stm32 架构 esp32
ESP32与STM32项目文件结构对比解析以下是对你提供的ESP32项目文件结构的详细解释，并与STM32（以STM32CubeIDE为例）的常见结构进行对比，帮助你理解两者的差异：1.ESP32项目文件解析文件/目录作用STM32对应或差异settingsIDE（如VSCode或Eclipse）的用户配置文件，存储个性化设置。STM32CubeIDE中类似配置存储在.settings目录或IDE
oceanbase 是不是架构比较复杂和mysql对比分析 hxsln11 金融数据库 oceanbase 架构 mysql
我先来分析用户的需求。用户的问题是关于OceanBase和MySQL的架构复杂度对比，并希望了解两者在架构上的具体差异。这是一个技术性较强的问题，用户可能是数据库开发者、架构师或者对分布式数据库感兴趣的学习者。结合上下文，用户之前已经提到过OceanBase的学习曲线较陡峭，可能是因为其分布式架构的复杂性，所以这次的问题很可能是想进一步明确OceanBase和MySQL在架构上的具体差异，以及为什
SvelteKit 最新中文文档教程（6）—— 状态管理冴羽yayujs Svelte 中文文档前端 javascript 前端框架 vue.js react svelte sveltekit
前言Svelte，一个语法简洁、入门容易，面向未来的前端框架。从Svelte诞生之初，就备受开发者的喜爱，根据统计，从2019年到2024年，连续6年一直是开发者最感兴趣的前端框架No.1：Svelte以其独特的编译时优化机制著称，具有轻量级、高性能、易上手等特性，非常适合构建轻量级Web项目。为了帮助大家学习Svelte，我同时搭建了Svelte最新的中文文档站点。如果需要进阶学习，也可以入手我
免费界面库 python_一个非常简单好用的Python图形界面库(PysimpleGUI) 不妧免费界面库 python
前一阵，我在为朋友编写一个源代码监控程序的时候，发现了一个Python领域非常简单好用的图形界面库。说起图形界面库，你可能会想到TkInter、PyQt、PyGUI等流行的图形界面库，我也曾经尝试使用，一个很直观的感受就是，这太难用了。就去网上搜搜，看看有没有一些demo，拿来改改，结果很少有，当时我就放弃了这些图形库的学习，转而使用了vue+flask的形式以浏览器网页作为程序界面，因为我会这个
Python 网络爬虫：从入门到实践一ge科研小菜菜编程语言 Python python
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注网络爬虫是一种自动化的程序，用于从互联网上抓取数据。Python以其强大的库和简单的语法，是开发网络爬虫的绝佳选择。本文将详细介绍Python网络爬虫的基本原理、开发工具、常用框架以及实践案例。一、网络爬虫的基本原理网络爬虫的工作流程通常包括以下步骤：发送请求：向目标网站发送HTTP请求，获取网页内容。解析内容：提取需要的数据，可以是HTML标签
PySimpleGUI 4.60.5 孔帆贝
PySimpleGUI4.60.5【下载地址】PySimpleGUI4.60.5**PySimpleGUI**是一款专为简化PythonGUI（图形用户界面）编程而生的库。该库设计宗旨在于通过提供简洁、易懂的API接口，使开发者能够以更快的速度和更少的代码量创建出美观实用的应用程序。对于无论是GUI编程新手还是寻求快速开发工具的老手来说，PySimpleGUI都是一个极具吸引力的选择。其通过封装了
《今日AI-人工智能-编程日报》-源自2025年3月19日小亦编辑部每日AI-人工智能-编程日报人工智能
1.豆包AI编程功能迎来三项重磅升级豆包平台今日宣布其AI编程功能迎来三项重要升级，包括：HTML实时预览：支持用户在编写HTML代码时实时查看网页效果，显著提升前端开发效率，尤其适用于小游戏和网页制作。Python代码直接运行与一键修复：用户可直接运行Python代码，并在出错时一键修复，极大降低了编程门槛，提升了开发效率。生成完整项目：新增生成完整项目的功能，帮助用户快速创建应用程序，缩短开发
智能体认识澄子兮 Dify 人工智能
什么是智能体？智能体是指能够感知环境、进行决策并采取行动的系统。它们可以是软件程序、机器人或其他自动化设备，具备一定的自主性和智能性，智能体通过与环境的交互，不断学习和适应，从而实现特定的目标。其核心在于自主性，智能体能够根据环境的变化调整行为，展现出一定的智能水平。智能体可分为物理智能体与虚拟智能体，前者如机器人，后者则包括各种软件代理。智能体的特征主要包括自主性、适应性、互动性和学习能力。自主
模拟退火算法：原理、应用与优化策略尹清雅算法
摘要模拟退火算法是一种基于物理退火过程的随机搜索算法，在解决复杂优化问题上表现出独特优势。本文详细阐述模拟退火算法的原理，深入分析其核心要素，通过案例展示在函数优化、旅行商问题中的应用，并探讨算法的优化策略与拓展方向，为解决复杂优化问题提供全面的理论与实践指导，助力该算法在多领域的高效应用与创新发展。一、引言在现代科学与工程领域，复杂优化问题无处不在，如资源分配、路径规划、机器学习模型参数调优等。
安装数据库首次应用 Array_06 java oracle sql
可是为什么再一次失败之后就变成直接跳过那个要求 enter full pathname of java.exe的界面这个java.exe是你的Oracle 11g安装目录中例如：【F:\app\chen\product\11.2.0\dbhome_1\jdk\jre\bin】下的java.exe 。不是你的电脑安装的java jdk下的java.exe！注意第一次，使用SQL D
Weblogic Server Console密码修改和遗忘解决方法 bijian1013 Welogic
在工作中一同事将Weblogic的console的密码忘记了，通过网上查询资料解决，实践整理了一下。一.修改Console密码打开weblogic控制台，安全领域 --> myrealm -->&n
IllegalStateException: Cannot forward a response that is already committed Cwind java Servlets
对于初学者来说，一个常见的误解是：当调用 forward() 或者 sendRedirect() 时控制流将会自动跳出原函数。标题所示错误通常是基于此误解而引起的。示例代码： protected void doPost() { if (someCondition) { sendRedirect(); } forward(); // Thi
基于流的装饰设计模式木zi_鸣设计模式
当想要对已有类的对象进行功能增强时，可以定义一个类，将已有对象传入，基于已有的功能，并提供加强功能。自定义的类成为装饰类模仿BufferedReader，对Reader进行包装，体现装饰设计模式装饰类通常会通过构造方法接受被装饰的对象，并基于被装饰的对象功能，提供更强的功能。装饰模式比继承灵活，避免继承臃肿，降低了类与类之间的关系装饰类因为增强已有对象，具备的功能该
Linux中的uniq命令被触发 linux
Linux命令uniq的作用是过滤重复部分显示文件内容，这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个及以后更多个重复行将被删去，行比较是根据所用字符集的排序序列进行的。该命令加工后的结果写到输出文件中。输入文件和输出文件必须不同。如果输入文件用“- ”表示，则从标准输入读取。 AD： uniq [选项] 文件说明：这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个
正则表达式Pattern 肆无忌惮_ Pattern
正则表达式是符合一定规则的表达式，用来专门操作字符串，对字符创进行匹配，切割，替换，获取。例如，我们需要对QQ号码格式进行检验规则是长度6~12位不能0开头只能是数字，我们可以一位一位进行比较，利用parseLong进行判断，或者是用正则表达式来匹配[1-9][0-9]{4,14} 或者 [1-9]\d{4,14} &nbs
Oracle高级查询之OVER (PARTITION BY ..) 知了ing oracle sql
一、rank()/dense_rank() over(partition by ...order by ...) 现在客户有这样一个需求，查询每个部门工资最高的雇员的信息，相信有一定oracle应用知识的同学都能写出下面的SQL语句： select e.ename, e.job, e.sal, e.deptno from scott.emp e, (se
Python调试矮蛋蛋 python pdb
原文地址： http://blog.csdn.net/xuyuefei1988/article/details/19399137 1、下面网上收罗的资料初学者应该够用了，但对比IBM的Python 代码调试技巧： IBM：包括 pdb 模块、利用 PyDev 和 Eclipse 集成进行调试、PyCharm 以及 Debug 日志进行调试： http://www.ibm.com/d
webservice传递自定义对象时函数为空，以及boolean不对应的问题 alleni123 webservice
今天在客户端调用方法 NodeStatus status=iservice.getNodeStatus(). 结果NodeStatus的属性都是null。进行debug之后，发现服务器端返回的确实是有值的对象。后来发现原来是因为在客户端，NodeStatus的setter全部被我删除了。本来是因为逻辑上不需要在客户端使用setter，结果改了之后竟然不能获取带属性值的
java如何干掉指针，又如何巧妙的通过引用来操作指针————>说的就是java指针百合不是茶
C语言的强大在于可以直接操作指针的地址，通过改变指针的地址指向来达到更改地址的目的,又是由于c语言的指针过于强大，初学者很难掌握， java的出现解决了c，c++中指针的问题 java将指针封装在底层，开发人员是不能够去操作指针的地址，但是可以通过引用来间接的操作：定义一个指针p来指向a的地址（&是地址符号）：
Eclipse打不开，提示“An error has occurred.See the log file ***/.log” bijian1013 eclipse
打开eclipse工作目录的\.metadata\.log文件，发现如下错误： !ENTRY org.eclipse.osgi 4 0 2012-09-10 09:28:57.139 !MESSAGE Application error !STACK 1 java.lang.NoClassDefFoundError: org/eclipse/core/resources/IContai
spring aop实例annotation方法实现 bijian1013 java spring AOP annotation
在spring aop实例中我们通过配置xml文件来实现AOP，这里学习使用annotation来实现，使用annotation其实就是指明具体的aspect,pointcut和advice。1.申明一个切面(用一个类来实现)在这个切面里,包括了advice和pointcut AdviceMethods.jav
[Velocity一]Velocity语法基础入门 bit1129 velocity
用户和开发人员参考文档 http://velocity.apache.org/engine/releases/velocity-1.7/developer-guide.html 注释 1.行级注释## 2.多行注释#* *# 变量定义使用$开头的字符串是变量定义，例如$var1, $var2, 赋值使用#set为变量赋值，例
【Kafka十一】关于Kafka的副本管理 bit1129 kafka
1. 关于request.required.acks request.required.acks控制者Producer写请求的什么时候可以确认写成功，默认是0， 0表示即不进行确认即返回。 1表示Leader写成功即返回，此时还没有进行写数据同步到其它Follower Partition中 -1表示根据指定的最少Partition确认后才返回，这个在 Th
lua统计nginx内部变量数据 ronin47 lua nginx　统计
server { listen 80; server_name photo.domain.com; location /{set $str $uri; content_by_lua ' local url = ngx.var.uri local res = ngx.location.capture(
java-11.二叉树中节点的最大距离 bylijinnan java
import java.util.ArrayList; import java.util.List; public class MaxLenInBinTree { /* a. 1 / \ 2 3 / \ / \ 4 5 6 7 max=4 pass "root"
Netty源码学习-ReadTimeoutHandler bylijinnan java netty
ReadTimeoutHandler的实现思路：开启一个定时任务，如果在指定时间内没有接收到消息，则抛出ReadTimeoutException 这个异常的捕获，在开发中，交给跟在ReadTimeoutHandler后面的ChannelHandler，例如 private final ChannelHandler timeoutHandler = new ReadTim
jquery验证上传文件样式及大小(好用) cngolon 文件上传 jquery验证
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> <script src="jquery1.8/jquery-1.8.0.
浏览器兼容【转】 cuishikuan css 浏览器 IE
浏览器兼容问题一：不同浏览器的标签默认的外补丁和内补丁不同问题症状：随便写几个标签，不加样式控制的情况下，各自的margin 和padding差异较大。碰到频率:100% 解决方案：CSS里 *{margin:0;padding:0;} 备注：这个是最常见的也是最易解决的一个浏览器兼容性问题，几乎所有的CSS文件开头都会用通配符*来设
Shell特殊变量：Shell $0, $#, $*, $@, $?, $$和命令行参数 daizj shell $#$?特殊变量
前面已经讲到，变量名只能包含数字、字母和下划线，因为某些包含其他字符的变量有特殊含义，这样的变量被称为特殊变量。例如，$ 表示当前Shell进程的ID，即pid，看下面的代码： $echo $$ 运行结果 29949 特殊变量列表变量含义 $0 当前脚本的文件名 $n 传递给脚本或函数的参数。n 是一个数字，表示第几个参数。例如，第一个
程序设计KISS 原则-------KEEP IT SIMPLE, STUPID! dcj3sjt126com unix
翻到一本书，讲到编程一般原则是kiss：Keep It Simple, Stupid.对这个原则深有体会，其实不仅编程如此，而且系统架构也是如此。 KEEP IT SIMPLE, STUPID! 编写只做一件事情，并且要做好的程序；编写可以在一起工作的程序，编写处理文本流的程序，因为这是通用的接口。这就是UNIX哲学.所有的哲学真正的浓缩为一个铁一样的定律，高明的工程师的神圣的“KISS 原
android Activity间List传值 dcj3sjt126com Activity
第一个Activity： import java.util.ArrayList;import java.util.HashMap;import java.util.List;import java.util.Map;import android.app.Activity;import android.content.Intent;import android.os.Bundle;import a
tomcat 设置java虚拟机内存 eksliang tomcat 内存设置
转载请出自出处：http://eksliang.iteye.com/blog/2117772 http://eksliang.iteye.com/ 常见的内存溢出有以下两种: java.lang.OutOfMemoryError: PermGen space java.lang.OutOfMemoryError: Java heap space ------------
Android 数据库事务处理 gqdy365 android
使用SQLiteDatabase的beginTransaction()方法可以开启一个事务，程序执行到endTransaction() 方法时会检查事务的标志是否为成功，如果程序执行到endTransaction()之前调用了setTransactionSuccessful() 方法设置事务的标志为成功则提交事务，如果没有调用setTransactionSuccessful() 方法则回滚事务。事
Java 打开浏览器 hw1287789687 打开网址 open浏览器 open browser 打开url 打开浏览器
使用java 语言如何打开浏览器呢? 我们先研究下在cmd窗口中,如何打开网址使用IE 打开 D:\software\bin>cmd /c start iexplore http://hw1287789687.iteye.com/blog/2153709 使用火狐打开 D:\software\bin>cmd /c start firefox http://hw1287789
ReplaceGoogleCDN：将 Google CDN 替换为国内的 Chrome 插件 justjavac chrome Google google api chrome插件
Chrome Web Store 安装地址： https://chrome.google.com/webstore/detail/replace-google-cdn/kpampjmfiopfpkkepbllemkibefkiice 由于众所周知的原因，只需替换一个域名就可以继续使用Google提供的前端公共库了。同样，通过script标记引用这些资源，让网站访问速度瞬间提速吧
进程VS.线程 m635674608 线程
资料来源： http://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000/001397567993007df355a3394da48f0bf14960f0c78753f000 1、Apache最早就是采用多进程模式 2、IIS服务器默认采用多线程模式 3、多进程优缺点优点：多进程模式最大
Linux下安装MemCached 字符串 memcached
前提准备：1. MemCached目前最新版本为：1.4.22，可以从官网下载到。2. MemCached依赖libevent，因此在安装MemCached之前需要先安装libevent。2.1 运行下面命令，查看系统是否已安装libevent。[root@SecurityCheck ~]# rpm -qa|grep libevent libevent-headers-1.4.13-4.el6.n
java设计模式之--jdk动态代理（实现aop编程） Supanccy2013 java DAO 设计模式 AOP
与静态代理类对照的是动态代理类，动态代理类的字节码在程序运行时由Java反射机制动态生成，无需程序员手工编写它的源代码。动态代理类不仅简化了编程工作，而且提高了软件系统的可扩展性，因为Java 反射机制可以生成任意类型的动态代理类。java.lang.reflect 包中的Proxy类和InvocationHandler 接口提供了生成动态代理类的能力。 &
Spring 4.2新特性-对java8默认方法(default method)定义Bean的支持 wiselyman spring 4
2.1 默认方法(default method) java8引入了一个default medthod; 用来扩展已有的接口,在对已有接口的使用不产生任何影响的情况下,添加扩展使用default关键字 Spring 4.2支持加载在默认方法里声明的bean 2.2 将要被声明成bean的类 public class DemoService {