jiraiya_wl

通过配置xml文件对MMDetection2.0部分参数进行快速设置并对其进行训练及测试的方法

通过配置xml文件快速设置mmd2.0并训练及测试的方法

引言
一、config.xml文件设置
二、读取xml文件语句
三、定义标签：edit_label.py
四、修改MMDetection数据集配置文件
- 修改class_names.py
- 修改voc.py和coco.py
五、数据集预处理：preprocess_data.py
六、修改MMDetection模型配置文件
- faster_rcnn_r50_fpn.py
- coco_detection.py
- schedule_1x.py
- default_runtime.py
七、训练模型：my_train.py
八、解决程序报错
- 报错1
- 报错2
九、测试程序：infer_test.py

引言

原先使用MMDetection1.0的时候，为了避免每次训练新模型时都要修改各种配置文件的麻烦，同事写了一个config.xml文件，并修改了MMDetection的各个文件，使之能读取该配置xml中的相应参数。这样在训练时，如果要修改标签、数据集大小、使用模型、训练次数等参数，可以通过修改xml文件中的相应参数来实现，而不需要进入到MMDetection的各个配置文件里面手动修改，增加了模型训练和测试的便捷性，节省了研发时间。

最近部门统一改用MMDetection2.11，发现与MMDetection1.0略微存在差别，深层次的差别我没有进行探究，最明显的是2.0版本对模型配置文件进行了拆分，但是每个拆分后的文件都还比较眼熟，算是熟面孔。这里参考同事写MMDetection1.0配置xml文件和修改MMDetection配置文件的思路，对MMDetection2.11的配置文件进行修改，使之能实现上述功能。

一、config.xml文件设置

首先，在config.xml文件里对所有在训练时会经常修改的参数进行预定义，具体实现方法如下：

将MMDetection2.11解压在mmdetection-master-v211文件夹中，并在此文件夹下进行编译，安装成功后，创建工程。文件夹名可以任意定义，但是在后面配置文件的编写中，该名称将作为锚点使用，用于不同文件之间互相查找并确定位置，因此一旦确定后，就不应当再进行修改。

在该文件夹下创建program文件夹，用于存放config.xml文件和运行程序。

config.xml文件内容如下：


	faster_rcnn/faster_rcnn_r50_fpn_1x_coco.py
	256,128
	suokou,guzhangac
	4
	12
	0.95
	Faster-RCNN
	/home/work2/023_X05_P01/400AF/fortest/

参数说明：
--module_type：定义训练和测试时使用的模型，示例中所示的路径在configs文件夹中。
--image_size：定义数据集中的图片在训练和测试时resize的大小（w, h），配置文件中不需要加括号。
--traindata_lable：标签名，在写配置xml时可以暂不定义，后面有程序可以读取数据集中的xml文件，确定数据集中所有的标签，并自动写入该xml中。如果对标签名的顺序有要求，则可以自定义。
--train_batch：定义训练时的batchsize。
--train_epochs：定义训练时的epoch。
--train_percent：定义划分数据集时数据集与验证集比例。
--save_path_name：定义训练结果的保存路径文件夹名，该文件夹将被创建在tools文件夹下。
--predict_imagePath：定义测试文件夹路径，如定义为0，则自动测试验证集。

注：这里只给出了我平时经常会修改的参数，如果还有其他参数修改频率较高，可在config.xml文件中继续添加参数，并在程序中进行相应修改。

二、读取xml文件语句

在配置好config.xml文件后，为了能够读取配置xml中的参数，在自定义程序和修改后的MMDetection配置文件中对相应参数进行设置，需要使用函数实现xml文件的读取和参数输出。该函数定义如下：

def config_parse(path, input_list):
	tree = ET.parse(path)
    root = tree.getroot()
    output = []
    for input_i in input_list:
    	output.append(root.find(input_i).text)
   	return output

函数功能：给定想要从config.xml文件中读取的参数标签名，输出查找结果。输入参数以列表形式给出。
如：[pathDirMmdet, save_path_name] = config_parse(path_config, ['pathDirMmdet','save_path_name'])

三、定义标签：edit_label.py

在program文件夹下创建edit_label.py程序，由于与config.xml文件在同文件夹下，所以不需确定配置文件位置，可直接读取。
程序功能：自动读取数据集中的图片xml，确定所有标签，并写入config.xml中traindata_lable参数。
除去前面的config_parse()函数外，该文件还包括两个主要函数：get_labels()函数，用于读取图片xml并确定标签；和set_labels()函数，用于向config.xml文件写入标签名。
代码分别如下：

def get_labels(xml_path):
	xml_path_list = os.listdir(xml_path)
    labelList = []
    for xml_i in xml_path_list:
        if 'xml' in xml_i:
        file_path = os.path.join(xml_path, xml_i)
        tree = ET.parse(file_path)
        root = tree.getroot()
        for obj in root.findall('object'):
        	name = obj.find('name').text
            if name not in labelList:
            	labelList.append(name)
   	return labelList

def set_labels(path, labelList):
    tree = ET.parse(path)
    root = tree.getroot()
    root.find('traindata_lable').text = (',').join(labelList)
    tree.write(path)
    print('设置标签为：', (',').join(labelList))

由此，完成了训练和测试标签的自定义。但是此时MMDetection程序还不能读取自定义标签，仍在使用coco或voc数据集中的默认标签，因此还需要修改MMDetection中的一些数据集配置文件，使其标签与自定义标签相一致。

四、修改MMDetection数据集配置文件

要修改的文件主要包括：
~/mmdet/datasets/voc.py
~/mmdet/datasets/coco.py
~/mmdet/core/evaluation/class_names.py
其中，~表示主文件夹目录。

由于这几个文件与config.xml文件不在同级目录，所以读取文件内容时，要先确定config.xml文件位置，使用：
path_config = os.path.join(sys.argv[0].split('mmdetection-master-v211')[0], 'mmdetection-master-v211', 'programs', 'config.xml')
语句进行查找定位。

以列表形式读到标签内容：

[label_str] = config_parse(path_config, ['traindata_lable'])
label_list = label_str.split(',')

修改class_names.py

对于class_names.py文件，修改后的voc_classes()如下：

def voc_classes():
	print('\n【class_names.py -> voc_classes()】', '\npathPyClassVoc:', pathPyClassVoc)
    [label_str] = config_parse(path_config, ['traindata_lable'])
    label_list = label_str.split(',')
    print('voc list_class:', label_list)
    print('len(list_class):', len(label_list))
    return label_list

下面的coco_classes()同理。

在class_names.py中，label_list本身的类别就是列表，因此无需进行进一步的修改，而在voc.py与coco.py中，还需进一步修改。

修改voc.py和coco.py

由于MMDetection中标签名是以元组形式存储的，所以要使用语句CLASSES = tuple(label_list)将标签列表转化为元组，并且注释掉原本对CLASSES的定义。

特别注意的是：之前我参考的教程里说，如果只有一个标签，比如数据集中的标签只有“suokou”，则在写CLASSES的时候，要写为CLASSES=('suokou',)，即在唯一的标签名后加一个逗号，不然会报错。我尝试了一下，发现确实如此，刚开始不知道原因，后来无意中看到在Python中，如果定义一个元组，二元组中只有一个元素时，元组tuple会被转化为字符串str，而如果在这唯一的元素后增加一个逗号，则可以避免这一情况。具体如下：

>>>a = ('x')
>>> type(a)
<class 'str'>

>>> b = ('x',)
>>> type(b)
<class 'tuple'>

而在MMDetection中，CLASSES的类型必须是元组，不然则会报错。因此前面所说，单一标签时额外添加的逗号是这个原因。而使用CLASSES = tuple(label_list)转化后的标签，及时只有单一元素，转化后的也是元组，不会变为字符串，不需要手动在末尾添加逗号。

修改后的class VOCDataset()如下：

class VOCDataset(XMLDataset):
	path_config = os.path.join(sys.argv[0].split('mmdetection-master-v211')[0]
	, 'mmdetection-master-v211','programs', 'config.xml')
	[label_str] = config_parse(path_config, ['traindata_lable'])
    label_list = label_str.split(',')
    CLASSES = tuple(label_list)

coco.py中的CocoDataset()同理。

五、数据集预处理：preprocess_data.py

在program文件夹下创建preprocess_data.py程序。
程序功能：按config.xml文件中train_percent参数设定的比例划分训练集与验证集；将voc数据集转为coco数据集，将instances_train2017.json、instances_val2017.json、instances_test2017.json和训练集、验证集图片保存在config.xml文件中save_path_name参数设定的保存路径下相应的coco文件夹中。

这部分代码网上参考很多，可以直接拿来用，不做赘述。

六、修改MMDetection模型配置文件

以faster_rcnn_r50_fpn_1x_coco.py为例，打开该文件，发现比起MMDetection1.0, 2.0版本将该模型拆分成四个部分：

_base_ = ['../_base_/models/faster_rcnn_r50_fpn.py',
		  '../_base_/datasets/coco_detection.py',
		  '../_base_/schedules/schedule_1x.py',
		  '../_base_/default_runtime.py'
          ]

对这四个文件以此进行修改。

faster_rcnn_r50_fpn.py

该文件中，对网络结构进行了定义，主要需要修改的变量为标签类别数numClass。

获得numClass 的方法：读取config.xml文件的标签，求标签列表的长度。值得注意的是，MMDetection2.0中，背景不再单独作为一类，所以numClass 不需在标签数的基础上+1，有几个标签，numClass 就写多少。

其他的一些参数有时也会修改，比如backbone的type、rpn_head下anchor_generator的scales和ratios等，但我的修改频率不高，所以没有单拎出来作为可以在config.xml中直接修改的变量，如果遇到需要修改这些参数的情况，需要进到faster_rcnn_r50_fpn.py文件中进行手动修改。

coco_detection.py

该文件主要定义训练和测试集路径、图像缩放尺寸、训练批大小等。

数据存放的主路径为config.xml文件中save_path_name参数定义的路径，数据均按COCO格式存放，不需额外修改。

图像缩放尺寸img_scale参数、训练批大小batchSize均由config.xml定义。

其中，MMDetection要求img_scale为元组格式，因此读入config.xml里自定义的trainimage_size参数后，需使用scaleImgResize = tuple([int(i) for i in imgSize.split(',')])语句对其进行转化。

batchSize的定义很简单，只需读入config.xml的train_batch参数，再使用int()将其转化为整数即可。

schedule_1x.py

该文件主要定义学习策略，修改初始学习率、训练次数、优化器类型等。

其中，训练次数通过config.xml文件进行设置，其他参数暂时不动，使用默认。

default_runtime.py

该文件主要定义预训练权重，是否从断点继续训练模型等，不需要额外修改。

顺带一提，该文件中resume_from与load_from的区别在于：
resume_from不仅要从checkpoint文件中读取权重也需要得到特定的优化器状态和epoch数目，用于程序运行过程中中断后继续训练；
而load_from仅用于加载模型并微调。

七、训练模型：my_train.py

在program文件夹下创建my_train.py程序。

程序的主要功能是调用系统自带的train.py训练程序，调用时输入自定义训练参数，包括使用的模型和权重保存路径等，上述参数均由config.xml文件获得。

运行程序，发现程序报错。由于报错涉及到MMDetection2.0的代码，与my_train.py程序本身无关，所以放在下一部分进行解决。

八、解决程序报错

报错1

在进行上述修改之后，直接运行my_train.py程序，会发现报如下错误：

Traceback (most recent call last):
  File "/home/work1/mmdetection-master-v211/tools/train.py", line 187, in <module>
    main()
  File "/home/work1/mmdetection-master-v211/tools/train.py", line 89, in main
    cfg = Config.fromfile(args.config)
  File "/home/work1/mmdetection-master-v211/mmcv/utils/config.py", line 257, in fromfile
    use_predefined_variables)
  File "/home/work1/mmdetection-master-v211/mmcv/utils/config.py", line 183, in _file2dict
    raise KeyError('Duplicate key is not allowed among bases')
KeyError: 'Duplicate key is not allowed among bases'

这时就需要通过debug定位报错位置，在train.py的cfg = Config.fromfile(args.config)这行添加断点，进入到~/mmcv/utils/config.py程序中，再进入cfg_dict, cfg_text = Config._file2dict(filename,use_predefined_variables)函数，发现报错原因是函数的这部分语句：

for c in cfg_dict_list:
	if len(base_cfg_dict.keys() & c.keys()) > 0:
		raise KeyError('Duplicate key is not allowed among bases')
	base_cfg_dict.update(c)

检查cfg_dict_list的内容，发现该变量为长度为4的列表，再检查列表中的内容，发现列表中每一元素均为长度不一的字典，字典的key比较眼熟，包括'ET'、'os'、'sys'等为了读取config.xml而自己导入的包；'imgSize'、'save_path_name'、'train_epoch'等在读取config.xml时定义的中间变量；和'numClass'、'batchSize'、'maxEpoch'等各个模型配置文件中官方定义的模型参数。

由此可以确定，列表中的四个元素分别对应faster_rcnn_r50_fpn_1x_coco.py文件下_base_中的四个模型配置文件，即以下四个文件。

_base_ = ['../_base_/models/faster_rcnn_r50_fpn.py',
		  '../_base_/datasets/coco_detection.py',
		  '../_base_/schedules/schedule_1x.py',
		  '../_base_/default_runtime.py'
          ]

而通过单步运行程序可以发现，程序在通过for c in cfg_dict_list这行语句遍历列表中的每个元素，即遍历上述四个配置文件中引入的参数时，有部分参数同时出现在了多个配置文件中，导致列表中存储的四个字典中存在重复的key，触发了报警程序。而正常情况下，由于这四个配置文件设置了不同的参数，彼此之间没有重复，所以不会出现参数重复的情况，因此也就不会报警。

重复的参数包括：

import的包：'ET'、'os'、'sys'，在四个配置文件中均import了这三个包
读取config.xml时的中间变量：path_config等

这时我有了一个大胆的想法：反正多出点变量影响又不大，又没碍着谁，我把这行报警注释掉试试呢？

~~（先改了再说，只要程序能跑起来，哪管身后洪水滔天（不是））~~

于是我注释掉了这两行程序：

if len(base_cfg_dict.keys() & c.keys()) > 0:
	raise KeyError('Duplicate key is not allowed among bases')

很好，确实不报这个错了呢！（要是还报就怪了）

然而这时报了新的错误——

报错2

……
  File "/home/work1/mmdetection-master-v211/mmcv/utils/config.py", line 418, in pretty_text
    text, _ = FormatCode(text, style_config=yapf_style, verify=True)
……
 ParseCodeToTree
    ast.parse(code)
  File "/home/ty/anaconda3/envs/mmdet2/lib/python3.7/ast.py", line 35, in parse
    return compile(source, filename, mode, PyCF_ONLY_AST)
  File "", line 1
    ET=<module 'xml.etree.ElementTree' from '/home/ty/anaconda3/envs/mmdet2/lib/python3.7/xml/etree/ElementTree.py'>
       ^
SyntaxError: invalid syntax

看起来还是自己导入的包惹的祸。

但是这次的报错就乱七八糟地报了一堆，进入到各种乱七八糟的程序里，乱七八糟的也看不明白。

考虑到报警里涉及到我自己导入的包，报警原因肯定还是我对模型配置文件的修改，所以我分析问题还是出现在程序在运行时，我导入的包和自定义的参数对后面程序的某些运行过程造成了一些影响。所以还是同样在debug中单步执行config.py程序，又进入到_file2dict函数中，程序顺利运行过之后，检查base_cfg_dict这个变量，通过与修改前的变量进行比对，这样就发现了问题：

我的base_cfg_dict比程序未修改时的base_cfg_dict多了key，和前面重复的变量一样，多的内容主要就是我import的包：'ET'、'os'、'sys'，和在四个配置文件中读取config.xml时的各种中间变量。

这个也很好理解，因为我只是单纯注释掉了重复变量，而这些我自定义的内容，全都通过base_cfg_dict.update(c)这行语句加入到base_cfg_dict字典中，很显然这个字典中的内容在后面的程序中被用到了，程序读取到了我自定义的变量，又没有相应的处理手段，因此报错。

所以我又有了一个大胆的想法：我把这些我自定义的变量都从这个字典里简单直接粗暴地删掉，让字典恢复如初呢？

于是我仔细比对了修改前后的base_cfg_dict内容，对自己新加入的键值十分暴力地进行删除：

del base_cfg_dict['ET'], base_cfg_dict['os'], base_cfg_dict['sys']\
    , base_cfg_dict['config_parse'], base_cfg_dict['path_config']\
    , base_cfg_dict['label_str'], base_cfg_dict['label_list'], base_cfg_dict['save_path_name']\
    , base_cfg_dict['img_size'], base_cfg_dict['train_batch'], base_cfg_dict['train_epochs']

“啪”的一下，很快啊！问题解决了！

程序跑起来了！

简直喜闻乐见！大快人心！普天同庆！奔走相告！

这一刻，我的脑海中不禁出现了这张图：

于是我火速备份了工程，写下了这篇文章，并发誓不再动它。

然鹅不行，我还得搞个程序来实现测试。

九、测试程序：infer_test.py

在program文件夹下创建infer_test.py程序。

实现功能：设置测试时的batchsize，根据config.xml中设置的测试路径，按批测试图片；并将测试结果（包括图片和标签、置信度）保存在~/result文件夹下。

按批测试功能在TensorFlow相关文章中有很多代码可以参考，毕竟Google API很久之前就支持按批测试了，这里采取的思路是：

计算图片总数除以batchsize的余数，即为需要填充的图片数，生成相应的纯黑图片，保存在文件夹中。

list_name_test_img = os.listdir(pathDirTestImg)  # pathDirTestImg为测试路径，默认路径下全为图片
num_add = batchSize - len(list_name_test_img) % batchSize
for i in range(num_add):
	img_ = np.zeros(img_size, dtype=np.uint8)
	path_img_ = os.path.join(pathDirTestImg, '{a}.jpg'.format(a=i))
	cv2.imwrite(path_img_, img_)
	list_name_test_img.append('{a}.jpg'.format(a=i))

按张读取图片，凑够一个batch后扔给MMDetection一起测试

list_test_img_batch = []
list_test_img_name_batch = []
for i in range(len(list_name_test_img)):
	path_test_img = os.path.join(pathDirTestImg, list_name_test_img[i])
	img = cv2.imread(path_test_img, cv2.IMREAD_COLOR)
	list_test_img_batch.append(img)
	list_test_img_name_batch.append(list_name_test_img[i])
	if len(list_test_img_batch) == batchSize:
		list_result_inf = inference_detector(model, list_test_img_batch)
		for j in range(len(list_result_inf)):  # 单张图片测试结果
			img_src = list_test_img_batch[j]  # 单张图片内容
			for k in range(len(class_dic)):  # 单张图片里单一标签结果
				scores = list_result_inf[j][k][:, -1] # 单张图片里单一标签检出的所有置信度
               	for jj in range(len(scores)):  # 单张图片里单一标签检出的某一置信度
                	if scores[jj] > thersMinConfidence:  # thersMinConfidence：最小报警阈值
                		# cv2.rectangle、cv2.putText等图片处理代码
			cv2.imwrite(os.path.join(result_path, list_test_img_name_batch[j]), list_test_img_batch[j])
		list_test_img_batch.clear()
		list_test_img_name_batch.clear()

写了很多for循环，习惯不太好，但是反正数据量也不大，就凑活着用了（躺）

这样，就基本实现了通过xml文件对部分参数进行快速设置的MMDetection2.0的训练和测试功能。

你可能感兴趣的:(深度学习,python,深度学习)

virtualenv 小小怪吃吃吃
virtualenv就是用来为一个应用创建一套“隔离”的Python运行环境。(1)用pip安装virtualenv:pip3installvirtualenv(2)创建开发项目目录:mkdirprojectcdproject/(3)创建一个独立的Python运行环境，命名为venv:virtualenv--no-site-packagesvenv命令virtualenv就可以创建一个独立的Pyt
VSCode使用Jupyter完整指南配置机器学习环境 z日火校招学习日记 vscode jupyter 机器学习
接下来开始机器学习部分第一步配置环境：VSCode使用Jupyter完整指南1.安装必要的扩展打开VSCode，按Ctrl+Shift+X打开扩展市场，搜索并安装以下扩展：必装扩展：Python(Microsoft官方)-Python语言支持Jupyter(Microsoft官方)-Jupyternotebook支持Pylance(Microsoft官方)-Python智能提示和语法检查推荐扩展：
python虚拟环境打包_python项目打包虚拟环境 weixin_39933356 python虚拟环境打包
python项目打包时，需要将虚拟环境与python自身安装路径下的lib包整合在一起，将该文件保存为packvenv.sh，放入虚拟环境目录下，chmod+xpackvenv.sh，./packvenv.sh执行即可#!/bin/bashPYTHON_PATH=/usr/local/python2.7VENV_PATH=~/.virtualenvs/venv-linux6VENV_NAME=`b
python连接数据库的方法,Python 连接数据库的多种方法 AI MIU python连接数据库的方法
JZGKCHINAPython是一种计算机程序设计语言，它是一种动态的、面向对象的脚本语言。它是一种跨平台的，可以运行在Windows，Mac和Linux/Unix系统上。在日常使用中需要对大量数据进行数据分析，那么就必然用到数据库，我们常用的数据库有SQLServer,MySQL,Oracle,DB2,SQLite，Hive，PostgreSQL,MongoDB还有其他常用的MicrosoftA
pycharm2023，修改文件夹路径，venv解释器无法新增 day_323 python pycharm
pycharm2023，修改文件夹路径，venv解释器无法新增1问题描述2处理方法1问题描述我的pycharm版本为2023.1.2。原有代码所在文件夹路径变更后，再用pycharm打开代码，然后进入setting-pythoninterpreter中，新增venv虚拟环境，pycharm无反应，venv环境一直无法新增。2处理方法1关闭pycharm。然后进入代码文件夹，删除.idea文件夹和v
python 连接数据库小鱼拉灯 mysql 数据库 python
一.连接MYSQL1.下载PyMySql模块2.在MYSQL中创建数据库并连接importpymysqlconn=pymysql.connect(host='localhost',user='root',password='123456',database='ikun',charset='utf8',port=3306)3.创建表importpymysqlconn=pymysql.connect(
养老院管理系统基于SpringBoot的养老院管理系统系统设计与实现（源码+论文+部署讲解等）
博主介绍：✌全网粉丝60W+,csdn特邀作者、Java领域优质创作者、csdn/掘金/哔哩哔哩/知乎/道客/小红书等平台优质作者，计算机毕设实战导师，目前专注于大学生项目实战开发,讲解,毕业答疑辅导，欢迎高校老师/同行前辈交流合作✌技术栈范围：SpringBoot、Vue、SSM、Jsp、HLMT、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习、单片机
python基础笔记大大的大大笔记 python 前端数据库
输入就是print()；#括号里面双引号(“xxxx”)=单引号('xxxx')必须在一行；但是三引号"""xxxx"""='''xxx'''可以换行输出；#'''xxxnnn'''xx=open(('C:\py\py笔记.txt','a+')print('hello',file=xx)xx.close()可以在python中新建文本文本档等(看后缀)："xx"=open('C:\py\py笔记.
python venv不适合变更路径（路径变更）的几种解决方案（venvpack、pip download、pip install --no-index --find-links=packages）
文章目录**为什么会出现路径问题？**1.**`pyvenv.cfg`文件**：该文件记录了虚拟环境的Python解释器路径（`home`字段）。如果源和目标机器的Python安装路径不一致，虚拟环境将无法找到正确的解释器。2.**脚本路径硬编码**：虚拟环境中的激活脚本（如`activate`）和可执行文件（如`python`）可能包含绝对路径或硬编码的相对路径，导致路径不匹配时失效。**解决方
python-程序编程-实例“温度转换”
实例：温度刻画的两种不同的体系。摄氏度、华氏度需求：将两种不同的摄氏度进行转换。问题分析：输入：输入一个华氏度的温度或者摄氏度的温度值处理：根据温度标志进行温度转换。输出：输出一个带华氏度或者摄氏度的温度值。(f代表华氏度，c代表是摄氏度)c=(f-32)/1.8f=c*1.8+32代码如下：temp=input("请输入有符号的温度值")iftemp[-1]in['f','F']:c=(eval
基于Docker构建Python后端项目落地总结
Docker使用总结基于Dockerfile的镜像构建示例dockerfile解析#加载centos7的最小镜像源FROMcentos:7RUNyumcleanallRUNyum-yupdate#修改时区RUNln-sf/usr/share/zoneinfo/Asia/Shanghai/etc/localtime&&echo"Asia/Shanghai">/etc/timezone#安装中文支持R
python集合常用函数 Lo-Y-eH python
Python集合是一种无序、可变且不重复的数据类型，常用于处理一组唯一的数据。下面是常用的Python集合函数及其用法：add()：向集合添加一个元素。s=set()s.add(1)s.add(2)s.add(3)print(s)#输出{1,2,3}clear()：移除集合中的所有元素。s=set([1,2,3])s.clear()print(s)#输出set()copy()：返回集合的一个浅拷贝
【NLP舆情分析】基于python微博舆情分析可视化系统(flask+pandas+echarts) 视频教程 - 基于wordcloud库实现词云图
大家好，我是java1234_小锋老师，最近写了一套【NLP舆情分析】基于python微博舆情分析可视化系统(flask+pandas+echarts)视频教程，持续更新中，计划月底更新完，感谢支持。今天讲解基于wordcloud库实现词云图视频在线地址：2026版【NLP舆情分析】基于python微博舆情分析可视化系统(flask+pandas+echarts+爬虫)视频教程（火爆连载更新中..
Python领域制造业的Python应用 Python编程之道 Python编程之道 python 开发语言 ai
Python在制造业中的应用：从自动化到智能制造关键词：Python、制造业、工业自动化、数据分析、机器学习、物联网、智能制造摘要：本文深入探讨Python编程语言在制造业中的广泛应用。从基础的自动化脚本到复杂的智能制造系统，Python凭借其丰富的库生态系统和易用性，正在重塑现代制造业。我们将分析Python在制造业中的核心应用场景，包括设备监控、质量控制、预测性维护和供应链优化等，并通过实际案
【机器学习】探索未来科技的前沿：人工智能、机器学习与大模型 AIGC零基础入门小白 AI大模型大模型教程人工智能机器学习科技 AI大模型 AIGC AI教程大模型教程
文章目录引言一、人工智能：从概念到现实1.1人工智能的定义1.2人工智能的发展历史1.3人工智能的分类1.4人工智能的应用二、机器学习：人工智能的核心技术2.1机器学习的定义2.2机器学习的分类2.3机器学习的实现原理2.4机器学习的应用2.5机器学习的示例代码2.6解释代码三、大模型：推动AI前沿发展的关键技术3.1大模型的定义3.2大模型的发展历程3.3深度学习与神经网络3.4大模型的优势与挑
Python 爬虫实战：自动化获取学术会议数据（会议安排、论文提交等） Python爬虫项目 python 爬虫自动化智能家居数据分析开发语言运维
1.引言学术会议是研究人员获取最新科研成果、发表论文、交流思想的重要平台。对于研究者而言，掌握最新的会议安排、论文提交截止日期、会议议程以及演讲嘉宾等信息至关重要。然而，学术会议信息通常分散在不同的官方网站上，人工查找和整理这些数据既费时又容易遗漏。为了提高效率，我们可以使用Python爬虫自动化获取学术会议数据，包括：会议名称、日期、地点论文提交截止日期会议议程及嘉宾信息论文录用结果重要通知及相
Python条件语句(if-elif-else)的完整用法与嵌套技巧梦幻南瓜 python python 网络服务器
引言条件语句是编程中最基础也是最重要的控制结构之一，它使程序能够根据不同条件执行不同的代码路径。Python中的条件语句以if、elif和else关键字实现，语法简洁但功能强大。本文将全面介绍Python条件语句的各种用法，从基础语法到高级嵌套技巧，通过大量代码示例、对比表格和实际应用场景，帮助你掌握条件语句的精髓。1.条件语句基础1.1基本语法结构Python条件语句的基本结构如下：if条件1:
Python特性：装饰器解决数据库长时间断连问题超龄超能程序猿数据库 python
前言在基于Python的Web应用开发里，数据库连接是极为关键的一环。不过，像网络波动、数据库服务器维护这类因素，都可能造成数据库长时间断连，进而影响应用的正常运作。本文将详细介绍怎样运用retry_on_failure装饰器来解决数据库长时间断连的难题一问题背景在实际开发场景中，应用和数据库之间的连接可能会由于各种缘由中断（长时间系统无人访问，再次访问，数据库连接超时）。当应用尝试执行数据库操作
基于YOLOv8的火灾智能检测系统设计与实现斟的是酒中桃深度学习人工智能 pyqt yolo
在各类安全事故中，火灾因其突发性强、破坏力大，一直是威胁人们生命财产安全的重大隐患。传统的火灾检测方式多依赖烟雾传感器、温度传感器等，存在响应滞后、易受环境干扰等问题。随着深度学习技术的飞速发展，基于计算机视觉的火灾检测方法凭借其实时性强、检测范围广等优势，逐渐成为研究热点。本文将简单介绍一款基于深度学习的火灾智能检测系统的设计与实现过程。一、系统整体设计本火灾智能检测系统旨在通过深度学习技术实现
人工智能入门指南：从基础概念到实际应用
前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。https://www.captainbed.cn/north文章目录1.**人工智能的基本概念**1.1什么是人工智能？1.2人工智能的分类2.**人工智能的核心技术**2.1机器学习（MachineLearning）2.1.1机器学习的类型2.1.2机器学习流程2.2深度学习（DeepLearni
Python 字符串前缀详解
Python提供了多种字符串前缀，用于改变字符串的创建方式和行为。下面我将全面汇总并详细解释每种字符串前缀的特性、用途和示例。1.原始字符串(RawString)-r前缀语法:r'...'或r"..."作用:禁用字符串中的转义字符反斜杠\被视为普通字符特别适合处理包含大量反斜杠的字符串适用场景:文件路径(特别是Windows路径)正则表达式需要保留反斜杠的任何情况示例:#普通字符串中的转义path
Python中的条件语句：if-else使用指南 AI软件改变生活 Python 数据库前端 python
在编程中，条件语句是控制程序流程的核心工具之一，它允许程序根据不同的条件执行不同的代码块。Python提供了简洁而强大的条件语句语法，其中最常用的就是if-else语句。本文将详细介绍Python中if-else的使用方法、常见用法以及一些高级技巧。1.基本语法if-else语句的基本结构如下：Python复制if条件表达式:#如果条件表达式为True，执行这里的代码块passelse:#如果条件
这么简单的从零到一做HTML 网页，你确定不来看看吗？ paid槮 html 服务器前端
HTML网页的介绍HTML(HypertextMarkupLanguage,超文本标记语言)是一种用于创建网页的标准标记语言,是一种与Python不同的编程语言。网页文件的扩展名通常为,html或.htm,这两种扩展名都可使用,并不会影响文件内容简单的HTML网页框架每一个HTML网页都包含一个基础框架，其他的内容都是在基础框架内进行扩充的。示例代码:这里是标题在这里填入正文这是一个较为基础的HT
Python 2和Python 3的区别？山禾家的猫
Python社区，有这么个怪问题：“学Python到底是学2还是学3？”这个问题就像月经一样每隔断时间就出现在你面前，也成了很多初学者的选择困惑，这个问题的“始作俑者”当然是Python它爹，大家众说纷纭，有说Python2是主流，大公司都在用，你应该学2。也有说Python3才是未来主流，大多数第三方框架已基本支持Python3。个人看法是Python2还会存在很长一段时间（只要那些用Pytho
Python基础和高级【抽取复习】斟的是酒中桃 python 学习
1.Python的深拷贝和浅拷贝有什么区别？浅拷贝【ls.copy()】：将列表的不可变对象【值】复制一份，同时引用其中的可变对象【列表】，共用一个内存地址深拷贝【ls=copy.deepcopy(list)】：完全的复制原可变对象，生成新的可变对象，两个对象互相独立2.列表和元组的区别是什么？1.列表概念：有序序列，使用[]定义，元素之间用，隔开有序序列增删改操作：可以增删改列表的任意元素不可变
[Python]Python中if-else的语法，用法示例 LN花开富贵 Python python 学习笔记嵌入式单片机 opencv
Python中多条件判断通过if-elif-else结构实现，elif是elseif的缩写。一、基础语法结构if条件1:#条件1为真时执行的代码块elif条件2:#条件2为真时执行的代码块elif条件3:#条件3为真时执行的代码块else:#所有条件均不满足时执行的代码块顺序判断，当第一个条件满足时其对应的代码块会被执行，后续elif的条件不在检查，如果都是if语句，那么执行完第一个if后后面的i
python源码下载
python源码下载(2010-12-1823:11)不知道python.org一直被堵在墙外…1、http://ftp.python.org/ftp/python/2、http://www.python.org/ftp/python/
Python接地气入门。
欢迎来到"鑫哆哆"编程角世界上最好的语言PYTHON?鑫哆哆跟python的机缘为什么选择python合理的设计学习计划，有助于攻略的成功合理驯服自己脑子合理骗过自己脑子合理安排反馈鑫哆哆的学习python计划基础语法缩进语句规则控制语句规则表达式规则函数规则对象规则类型规则数学运算直接觉醒！鑫哆哆的课程选取迈出第一步恭喜大家成功入门python！总结世界上最好的语言PYTHON?新的一年祝大家心
Python镜像源染诗 python
https://www.cnblogs.com/songzhixue/p/11296720.html
python设置国内源 twilightdream python
mkdir.pipcd.piptouchpip.confnanopip.conf贴上[global]trusted-host=mirrors.aliyun.comindex-url=http://mirrors.aliyun.com/pypi/simple
Maven Array_06 eclipse jdk maven
Maven Maven是基于项目对象模型(POM)，信息来管理项目的构建，报告和文档的软件项目管理工具。 Maven 除了以程序构建能力为特色之外，还提供高级项目管理工具。由于 Maven 的缺省构建规则有较高的可重用性，所以常常用两三行 Maven 构建脚本就可以构建简单的项目。由于 Maven 的面向项目的方法，许多 Apache Jakarta 项目发文时使用 Maven，而且公司
ibatis的queyrForList和queryForMap区别 bijian1013 java ibatis
一.说明 iBatis的返回值参数类型也有种：resultMap与resultClass，这两种类型的选择可以用两句话说明之： 1.当结果集列名和类的属性名完全相对应的时候，则可直接用resultClass直接指定查询结果类
LeetCode[位运算] - #191 计算汉明权重 Cwind java 位运算 LeetCode Algorithm 题解
原题链接：#191 Number of 1 Bits 要求：写一个函数，以一个无符号整数为参数，返回其汉明权重。例如，‘11’的二进制表示为'00000000000000000000000000001011', 故函数应当返回3。汉明权重：指一个字符串中非零字符的个数；对于二进制串，即其中‘1’的个数。难度：简单分析：将十进制参数转换为二进制，然后计算其中1的个数即可。 “
浅谈java类与对象 15700786134 java
java是一门面向对象的编程语言，类与对象是其最基本的概念。所谓对象，就是一个个具体的物体，一个人，一台电脑，都是对象。而类，就是对象的一种抽象，是多个对象具有的共性的一种集合，其中包含了属性与方法，就是属于该类的对象所具有的共性。当一个类创建了对象，这个对象就拥有了该类全部的属性，方法。相比于结构化的编程思路，面向对象更适用于人的思维
linux下双网卡同一个IP 被触发 linux
转自： http://q2482696735.blog.163.com/blog/static/250606077201569029441/ 由于需要一台机器有两个网卡，开始时设置在同一个网段的IP，发现数据总是从一个网卡发出，而另一个网卡上没有数据流动。网上找了下，发现相同的问题不少：一、关于双网卡设置同一网段IP然后连接交换机的时候出现的奇怪现象。当时没有怎么思考、以为是生成树
安卓按主页键隐藏程序之后无法再次打开肆无忌惮_ 安卓
遇到一个奇怪的问题，当SplashActivity跳转到MainActivity之后，按主页键，再去打开程序，程序没法再打开（闪一下），结束任务再开也是这样，只能卸载了再重装。而且每次在Log里都打印了这句话"进入主程序"。后来发现是必须跳转之后再finish掉SplashActivity 本来代码： // 销毁这个Activity fin
通过cookie保存并读取用户登录信息实例知了ing JavaScript html
通过cookie的getCookies()方法可获取所有cookie对象的集合；通过getName()方法可以获取指定的名称的cookie；通过getValue()方法获取到cookie对象的值。另外，将一个cookie对象发送到客户端，使用response对象的addCookie()方法。下面通过cookie保存并读取用户登录信息的例子加深一下理解。（1）创建index.jsp文件。在改
JAVA 对象池矮蛋蛋 java ObjectPool
原文地址： http://www.blogjava.net/baoyaer/articles/218460.html Jakarta对象池 ☆为什么使用对象池恰当地使用对象池化技术，可以有效地减少对象生成和初始化时的消耗，提高系统的运行效率。Jakarta Commons Pool组件提供了一整套用于实现对象池化
ArrayList根据条件+for循环批量删除的方法 alleni123 java
场景如下： ArrayList<Obj> list Obj-> createTime, sid. 现在要根据obj的createTime来进行定期清理。（释放内存） ------------------------- 首先想到的方法就是 for(Obj o:list){ if(o.createTime-currentT>xxx){
阿里巴巴“耕地宝”大战各种宝百合不是茶平台战略
“耕地保”平台是阿里巴巴和安徽农民共同推出的一个 “首个互联网定制私人农场”，“耕地宝”由阿里巴巴投入一亿，主要是用来进行农业方面，将农民手中的散地集中起来不仅加大农民集体在土地上面的话语权，还增加了土地的流通与利用率，提高了土地的产量，有利于大规模的产业化的高科技农业的发展，阿里在农业上的探索将会引起新一轮的产业调整，但是集体化之后农民的个体的话语权将更少，国家应出台相应的法律法规保护
Spring注入有继承关系的类（1） bijian1013 java spring
一个类一个类的注入 1.AClass类 package com.bijian.spring.test2; public class AClass { String a; String b; public String getA() { return a; } public void setA(Strin
30岁转型期你能否成为成功人士 bijian1013 成功
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
[Velocity三]基于Servlet+Velocity的web应用 bit1129 velocity
什么是VelocityViewServlet 使用org.apache.velocity.tools.view.VelocityViewServlet可以将Velocity集成到基于Servlet的web应用中，以Servlet+Velocity的方式实现web应用 Servlet + Velocity的一般步骤 1.自定义Servlet，实现VelocityViewServl
【Kafka十二】关于Kafka是一个Commit Log Service bit1129 service
Kafka is a distributed, partitioned, replicated commit log service.这里的commit log如何理解？ A message is considered "committed" when all in sync replicas for that partition have applied i
NGINX + LUA实现复杂的控制 ronin47 lua nginx 控制
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-14.输入一个已经按升序排序过的数组和一个数字，在数组中查找两个数，使得它们的和正好是输入的那个数字 bylijinnan java
public class TwoElementEqualSum { /** * 第 14 题：题目：输入一个已经按升序排序过的数组和一个数字，在数组中查找两个数，使得它们的和正好是输入的那个数字。要求时间复杂度是 O(n) 。如果有多对数字的和等于输入的数字，输出任意一对即可。例如输入数组 1 、 2 、 4 、 7 、 11 、 15 和数字 15 。由于
Netty源码学习-HttpChunkAggregator-HttpRequestEncoder-HttpResponseDecoder bylijinnan java netty
今天看Netty如何实现一个Http Server org.jboss.netty.example.http.file.HttpStaticFileServerPipelineFactory： pipeline.addLast("decoder", new HttpRequestDecoder()); pipeline.addLast(&quo
java敏感词过虑-基于多叉树原理 cngolon 违禁词过虑替换违禁词敏感词过虑多叉树
基于多叉树的敏感词、关键词过滤的工具包，用于java中的敏感词过滤 1、工具包自带敏感词词库，第一次调用时读入词库，故第一次调用时间可能较长，在类加载后普通pc机上html过滤5000字在80毫秒左右，纯文本35毫秒左右。 2、如需自定义词库，将jar包考入WEB-INF工程的lib目录，在WEB-INF/classes目录下建一个 utf-8的words.dict文本文件，
多线程知识 cuishikuan 多线程
T1，T2，T3三个线程工作顺序，按照T1，T2，T3依次进行 public class T1 implements Runnable{ @Override
spring整合activemq dalan_123 java spring jms
整合spring和activemq需要搞清楚如下的东东1、ConnectionFactory分： a、spring管理连接到activemq服务器的管理ConnectionFactory也即是所谓产生到jms服务器的链接 b、真正产生到JMS服务器链接的ConnectionFactory还得
MySQL时间字段究竟使用INT还是DateTime？ dcj3sjt126com mysql
环境：Windows XPPHP Version 5.2.9MySQL Server 5.1 第一步、创建一个表date_test（非定长、int时间） CREATE TABLE `test`.`date_test` (`id` INT NOT NULL AUTO_INCREMENT ,`start_time` INT NOT NULL ,`some_content`
Parcel: unable to marshal value dcj3sjt126com marshal
在两个activity直接传递List<xxInfo>时，出现Parcel: unable to marshal value异常。在MainActivity页面（MainActivity页面向NextActivity页面传递一个List<xxInfo>）： Intent intent = new Intent(this, Next
linux进程的查看上（ps） eksliang linux ps linux ps -l linux ps aux
ps:将某个时间点的进程运行情况选取下来转载请出自出处：http://eksliang.iteye.com/admin/blogs/2119469 http://eksliang.iteye.com ps 这个命令的man page 不是很好查阅，因为很多不同的Unix都使用这儿ps来查阅进程的状态，为了要符合不同版本的需求，所以这个
为什么第三方应用能早于System的app启动 gqdy365 System
Android应用的启动顺序网上有一大堆资料可以查阅了，这里就不细述了，这里不阐述ROM启动还有bootloader，软件启动的大致流程应该是启动kernel -> 运行servicemanager 把一些native的服务用命令启动起来（包括wifi, power, rild, surfaceflinger, mediaserver等等）-> 启动Dalivk中的第一个进程Zygot
App Framework发送JSONP请求(3) hw1287789687 jsonp 跨域请求发送jsonp ajax请求越狱请求
App Framework 中如何发送JSONP请求呢? 使用jsonp,详情请参考:http://json-p.org/ 如何发送Ajax请求呢? (1)登录 /*** * 会员登录 * @param username * @param password */ var user_login=function(username,password){ // aler
发福利，整理了一份关于“资源汇总”的汇总 justjavac 资源
觉得有用的话，可以去github关注：https://github.com/justjavac/awesome-awesomeness-zh_CN 通用 free-programming-books-zh_CN 免费的计算机编程类中文书籍精彩博客集合 hacke2/hacke2.github.io#2 ResumeSample 程序员简历
用 Java 技术创建 RESTful Web 服务 macroli java 编程 Web REST
转载：http://www.ibm.com/developerworks/cn/web/wa-jaxrs/ JAX-RS (JSR-311) 【 Java API for RESTful Web Services 】是一种 Java™ API，可使 Java Restful 服务的开发变得迅速而轻松。这个 API 提供了一种基于注释的模型来描述分布式资源。注释被用来提供资源的位
CentOS6.5-x86_64位下oracle11g的安装详细步骤及注意事项超声波 oracle linux
前言：这两天项目要上线了，由我负责往服务器部署整个项目，因此首先要往服务器安装oracle，服务器本身是CentOS6.5的64位系统，安装的数据库版本是11g，在整个的安装过程中碰到很多的坑，不过最后还是通过各种途径解决并成功装上了。转别写篇博客来记录完整的安装过程以及在整个过程中的注意事项。希望对以后那些刚刚接触的菜鸟们能起到一定的帮助作用。安装过程中可能遇到的问题（注
HttpClient 4.3 设置keeplive 和 timeout 的方法 supben httpclient
ConnectionKeepAliveStrategy kaStrategy = new DefaultConnectionKeepAliveStrategy() { @Override public long getKeepAliveDuration(HttpResponse response, HttpContext context) { long keepAlive
Spring 4.2新特性-@Import注解的升级 wiselyman spring 4
3.1 @Import @Import注解在4.2之前只支持导入配置类在4.2,@Import注解支持导入普通的java类,并将其声明成一个bean 3.2 示例演示java类 package com.wisely.spring4_2.imp; public class DemoService { public void doSomethin