ric-hman

Paddle OCR文字检测（一）

本节以aie2023数据集为例，介绍PaddleOCR检测模型的训练、评估和测试。

1.数据和权重准备

①数据准备：参阅ocr_datasets。

②下载预训练模型：

首先下载预训练模型。PaddleOCR的检测模型目前支持3个backbone，分别是MobileNetV3、ResNet18_vd和ResNet50_vd。您可以根据需要使用PaddleClas中的模型替换 backbone。对应的backbone预训练权重下载链接见（https://github.com/PaddlePaddle/PaddleClas/blob/release%2F2.0/README_cn.md#resnet%E5%8F%8A%E5% 85%B6vd%E7%B3%BB%E5%88%97）。

cd PaddleOCR/
# Download the pre-trained model of MobileNetV3
wget -P ./pretrain_models/ https://paddleocr.bj.bcebos.com/pretrained/MobileNetV3_large_x0_5_pretrained.pdparams
# or, download the pre-trained model of ResNet18_vd
wget -P ./pretrain_models/ https://paddleocr.bj.bcebos.com/pretrained/ResNet18_vd_pretrained.pdparams
# or, download the pre-trained model of ResNet50_vd
wget -P ./pretrain_models/ https://paddleocr.bj.bcebos.com/pretrained/ResNet50_vd_ssld_pretrained.pdparams

2.训练

①创建训练配置文件configs/det/det_mv3_db_aie2023.yml

（本人在configs/det/det_mv3_db.yml上修改重命名为configs/det/det_mv3_db_aie2023.yml）

Global:
  use_gpu: true
  use_xpu: false
  use_mlu: false
  epoch_num: 120
  log_smooth_window: 20
  print_batch_step: 20
  save_model_dir: ./output/db_mv3_aie2023/
  save_epoch_step: 120
  # evaluation is run every 2000 iterations
  eval_batch_step: [0, 87]
  cal_metric_during_train: False
  pretrained_model: ./pretrain_models/MobileNetV3_large_x0_5_pretrained
  checkpoints:
  save_inference_dir:
  use_visualdl: False
  infer_img: ./train_data/aie2023/det/test/65_25_0197-01S-S200.bmp
  save_res_path: ./output/det_db_mv3_aie2023/predicts_db.txt

Architecture:
  model_type: det
  algorithm: DB
  Transform:
  Backbone:
    name: MobileNetV3
    scale: 0.5
    model_name: large
  Neck:
    name: DBFPN
    out_channels: 256
  Head:
    name: DBHead
    k: 50

Loss:
  name: DBLoss
  balance_loss: true
  main_loss_type: DiceLoss
  alpha: 5
  beta: 10
  ohem_ratio: 3

Optimizer:
  name: Adam
  beta1: 0.9
  beta2: 0.999
  lr:
    learning_rate: 0.00025
  regularizer:
    name: 'L2'
    factor: 0

PostProcess:
  name: DBPostProcess
  thresh: 0.3
  box_thresh: 0.6
  max_candidates: 1000
  unclip_ratio: 1.5

Metric:
  name: DetMetric
  main_indicator: hmean

Train:
  dataset:
    name: SimpleDataSet
    data_dir: ./train_data/aie2023/det/
    label_file_list:
      - ./train_data/aie2023/det/train.txt
    ratio_list: [1.0]
    transforms:
      - DecodeImage: # load image
          img_mode: BGR
          channel_first: False
      - DetLabelEncode: # Class handling label
      - IaaAugment:
          augmenter_args:
            - { 'type': Fliplr, 'args': { 'p': 0.5 } }
            - { 'type': Affine, 'args': { 'rotate': [-10, 10] } }
            - { 'type': Resize, 'args': { 'size': [0.5, 3] } }
      - EastRandomCropData:
          size: [640, 640]
          max_tries: 50
          keep_ratio: true
      - MakeBorderMap:
          shrink_ratio: 0.4
          thresh_min: 0.3
          thresh_max: 0.7
      - MakeShrinkMap:
          shrink_ratio: 0.4
          min_text_size: 8
      - NormalizeImage:
          scale: 1./255.
          mean: [0.485, 0.456, 0.406]
          std: [0.229, 0.224, 0.225]
          order: 'hwc'
      - ToCHWImage:
      - KeepKeys:
          keep_keys: ['image', 'threshold_map', 'threshold_mask', 'shrink_map', 'shrink_mask'] # the order of the dataloader list
  loader:
    shuffle: True
    drop_last: False
    batch_size_per_card: 4
    num_workers: 0
    use_shared_memory: True

Eval:
  dataset:
    name: SimpleDataSet
    data_dir: ./train_data/aie2023/det/
    label_file_list:
      - ./train_data/aie2023/det/val.txt
    transforms:
      - DecodeImage: # load image
          img_mode: BGR
          channel_first: False
      - DetLabelEncode: # Class handling label
      - DetResizeForTest:
          image_shape: [736, 1280]
      - NormalizeImage:
          scale: 1./255.
          mean: [0.485, 0.456, 0.406]
          std: [0.229, 0.224, 0.225]
          order: 'hwc'
      - ToCHWImage:
      - KeepKeys:
          keep_keys: ['image', 'shape', 'polys', 'ignore_tags']
  loader:
    shuffle: False
    drop_last: False
    batch_size_per_card: 1 # must be 1
    num_workers: 0
    use_shared_memory: True

②启动训练

如果安装了 CPU 版本，请在配置中将参数设置use_gpu为false。

python tools/train.py -c configs/det/det_mv3_db_aie2023.yml -o Global.pretrained_model=./pretrain_models/MobileNetV3_large_x0_5_pretrained

在以上指令中，使用-c选择训练使用的configs/det/det_mv3_db_aie2023.yml配置文件。配置文件的详细解释请参考config。也可以-o在不修改yml文件的情况下使用来改变训练参数。例如调整训练学习率为0.0001。

# single GPU training
python tools/train.py -c configs/det/det_mv3_db_aie2023.yml -o   \
         Global.pretrained_model=./pretrain_models/MobileNetV3_large_x0_5_pretrained  \
         Optimizer.base_lr=0.0001

# multi-GPU training
# Set the GPU ID used by the '--gpus' parameter.
python -m paddle.distributed.launch --gpus '0,1,2,3'  tools/train.py -c configs/det/configs/det/det_mv3_db_aie2023.yml -o Global.pretrained_model=./pretrain_models/MobileNetV3_large_x0_5_pretrained

# multi-Node, multi-GPU training
# Set the IPs of your nodes used by the '--ips' parameter. Set the GPU ID used by the '--gpus' parameter.
python -m paddle.distributed.launch --ips="xx.xx.xx.xx,xx.xx.xx.xx" --gpus '0,1,2,3' tools/train.py -c configs/configs/det/det_mv3_db_aie2023.yml \
     -o Global.pretrained_model=./pretrain_models/MobileNetV3_large_x0_5_pretrained

注意：对于多Node多GPU训练，需要将ips上述命令中的值替换为自己机器的地址，并且机器之间必须能够ping通。此外，它需要在我们开始训练时分别在多台机器上激活命令。查看本机IP地址的命令为ifconfig.

如果想进一步加快训练速度，可以使用自动混合精度训练。单卡训练，命令如下：

python tools/train.py -c configs/det/det_mv3_db_aie2023.yml \
     -o Global.pretrained_model=./pretrain_models/MobileNetV3_large_x0_5_pretrained \
     Global.use_amp=True Global.scale_loss=1024.0 Global.use_dynamic_loss_scaling=True

③加载训练好的模型并继续训练

如果您希望加载训练好的模型并再次继续训练，您可以将参数指定Global.checkpoints为要加载的模型路径。例如：

python tools/train.py -c configs/det/det_mv3_db_aie2023.yml -o Global.checkpoints=./your/trained/model

注意： Global.checkpoints的优先级高于Global.pretrained_model，即同时指定两个参数时，Global.checkpoints先加载指定的模型。如果指定的模型路径Global.checkpoints错误，则Global.pretrained_model加载指定的模型路径。

④用新骨干训练

待更

⑤混合精度训练和分布式训练

如果想进一步加快训练速度，可以选择混合精度训练

多机多GPU训练时，使用分布式训练

⑥知识蒸馏提高模型准确率

知识蒸馏

⑦微调

实际使用中，建议加载官方预训练模型，在自己的数据集中微调。检测模型的微调方法可以参考：模型微调教程。

注意：在下一篇文章Paddle OCR文字检测（二）中将介绍如何实施模型微调

3.评价与试验

①评价

PaddleOCR计算了三个指标来评估OCR检测任务的性能：Precision、Recall和Hmean(F-Score)。

运行以下代码计算评估指标。结果将保存在配置文件det_mv3_db_aie2023.yml中save_res_path指定的测试结果文件中。

评估时，设置后处理参数box_thresh=0.6, unclip_ratio=1.5. 如果你使用不同的数据集，不同的模型进行训练，这两个参数应该调整以获得更好的结果。

训练时的模型参数默认保存在该Global.save_model_dir目录下。在评估指标时，需要设置Global.checkpoints指向保存的参数文件。

python tools/eval.py -c configs/det/det_mv3_db_aie2023.yml  -o Global.checkpoints="{path/to/weights}/best_accuracy" PostProcess.box_thresh=0.6 PostProcess.unclip_ratio=1.5

例如：
python tools/eval.py -c configs/det/det_mv3_db_aie2023.yml  -o Global.checkpoints="output/db_mv3_aie2023/best_accuracy" PostProcess.box_thresh=0.6 PostProcess.unclip_ratio=1.5

注意：box_thresh和unclip_ratio是DB后处理需要的参数，评估EAST和SAST模型时不需要设置。

评估结果如下

②测试

在单张图片上测试检测结果：

python tools/infer_det.py -c configs/det/det_mv3_db_aie2023.yml -o Global.infer_img="./doc/imgs_en/img_10.jpg" Global.pretrained_model="./output/det_db/best_accuracy"

例如：
python tools/infer_det.py -c configs/det/det_mv3_db_aie2023.yml -o Global.infer_img="./train_data/aie2023/det/test/65_25_0197-01S-S200.bmp" Global.pretrained_model="./output/db_mv3_aie2023/best_accuracy"

单张图像测试结果如下：

测试DB模型时，调整后处理阈值：

python tools/infer_det.py -c configs/det/det_mv3_db_aie2023.yml -o Global.infer_img="./doc/imgs_en/img_10.jpg" Global.pretrained_model="./output/det_db/best_accuracy"  PostProcess.box_thresh=0.6 PostProcess.unclip_ratio=2.0 

例如：
python tools/infer_det.py -c configs/det/det_mv3_db_aie2023.yml -o Global.infer_img="./train_data/aie2023/det/test/65_25_0197-01S-S200.bmp"  Global.pretrained_model="./output/db_mv3_aie2023/best_accuracy" PostProcess.box_thresh=0.6 PostProcess.unclip_ratio=2.0

在文件夹中的所有图片上测试检测结果：

python tools/infer_det.py -c configs/det/det_mv3_db_aie2023.yml -o Global.infer_img="./doc/imgs_en/" Global.pretrained_model="./output/det_db/best_accuracy"

例如：
python tools/infer_det.py -c configs/det/det_mv3_db_aie2023.yml -o Global.infer_img="./train_data/aie2023/det/test/" Global.pretrained_model="./output/db_mv3_aie2023/best_accuracy"

文件夹中图像测试结果：

4.推理

推理模型（保存的模型paddle.jit.save）一般是模型训练完成后保存的固化模型，多用于部署中的预测。

训练过程中保存的模型是checkpoints模型，保存模型的参数，多用于恢复训练。

与检查点模型相比，推理模型会额外保存模型的结构信息。因此，由于模型结构和模型参数已经固化在推理模型文件中，更易于部署，适合与实际系统集成。

①首先，我们可以将 DB 训练模型转换为推理模型：

python tools/export_model.py -c configs/det/det_mv3_db_aie2023.yml -o Global.pretrained_model="./output/det_db/best_accuracy" Global.save_inference_dir="./output/det_db_inference/"

例如：
python tools/export_model.py -c configs/det/det_mv3_db_aie2023.yml -o Global.pretrained_model="./output/db_mv3_aie2023/best_accuracy" Global.save_inference_dir="./output/det_db_inference_aie2023/"

DB训练模型转化的结果如下：

②检测推理模型预测：

python tools/infer/predict_det.py --det_algorithm="DB" --det_model_dir="./output/det_db_inference/" --image_dir="./doc/imgs/" --use_gpu=True

例如：
python tools/infer/predict_det.py --det_algorithm="DB" --det_model_dir="./output/det_db_inference_aie2023/"  --image_dir="./train_data/aie2023/det/test/" --use_gpu=True

推理结果如下：

如果是其他检测算法，比如EAST，需要修改det_algorithm参数为EAST，默认为DB算法：

python tools/infer/predict_det.py --det_algorithm="EAST" --det_model_dir="./output/det_db_inference/" --image_dir="./doc/imgs/" --use_gpu=True
例如：
python tools/infer/predict_det.py --det_algorithm="EAST" --det_model_dir="./output/det_db_inference_aie2023/" --image_dir="./train_data/aie2023/det/test/" --use_gpu=True

5. 常见问题

Q1：训练模型和推理模型的预测结果不一致？

A : 大多数问题是由于训练模型预测时的预处理和后处理参数与推理模型预测时的预处理和后处理参数不一致造成的。以det_mv3_db_aie2023.yml配置文件训练的模型为例，训练模型和推理模型预测结果不一致问题的解决方法如下：

检查训练好的模型预处理是否与推理模型的预测预处理函数一致。在评估算法时，输入图像的大小会影响精度。为了与论文保持一致，在训练icdar15配置文件中将图片resize为[736, 1280]，但是推理模型预测时只有一组默认参数，会考虑到预测速度问题，默认情况下，图像的最长边限制为 960 以调整大小。训练模型预处理和推理模型的预处理函数位于ppocr/data/imaug/operators.py

检查训练模型的后处理是否与推理的后处理参数一致。

所以，在使用推理模型进行文字检测之前，需要将模型推理时设定的输入图像尺寸改成和模型训练时的图像尺寸一致，具体修改的参数和步骤如下：

①从det_mv3_db_aie2023.yml中可以看到模型训练时的输入图像尺寸为1280x736

②从/tools/infer/predict_det.py中可以看到模型推理时输入图像的尺寸设置是文本检测器TextDetector初始话参数args.det_limit_side_len中的值

③从/tools/infer/utility.py中可以看到args.det_limit_side_len的值默认输入图像的长边最大值为960

④所以如果模型已经按照det_mv3_db_aie2023.yml的参数训练完成了的话，可以修改推理程序中的输入图像的尺寸和训练尺寸一致，按下图修改/tools/infer/predict_det.py和/tools/infer/utility.py即可

详情请参考

Paddle ocr文本检测https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.6/doc/doc_en/detection_en.md#1-data-and-weights-preparation

npm下载canvas报错 zzzll30 npm 前端 node.js
npm下个canvas报错了，网上说的一堆方法都无效。特来记录下。canvas库说是要本地编译，需要本地的一些环境。跑canvas脚本报错。提示是需要安装python大于3.6.0的版本。根本原因是canvas下载完成后需要执行这句话node-pre-gypinstall--fallback-to-build--update-binary一般有两种解决方法第一种是下载编译好的适合自己操作系统的二进
爬虫必备scrapy-redis详解 ylfhpy 爬虫项目入门爬虫 scrapy redis python 数据库 ip代理池分布式
一、概述1.1定义Scrapy-Redis是基于强大的Python爬虫框架Scrapy开发的分布式爬虫组件。它巧妙地借助Redis数据库，实现了请求对象的持久化存储、请求去重的持久化管理以及分布式爬取功能。这使得原本在单节点运行的Scrapy爬虫能够在多个节点上并行工作，极大地提升了爬取效率和处理大规模数据的能力。1.2功能分布式爬取：Scrapy-Redis允许将爬取任务分配到多个爬虫节点上同时
python爬虫是什么架构_Python爬虫是什么?常用框架有哪些? weixin_39596090 python爬虫是什么架构
大家都知道python是一门多岗位编程语言，学习python之后可以从事的岗位有很多，python爬虫便在其中，不过很多人对python不是很了解，所以也不知道python爬虫是什么，接下来带着你的疑问小编为大家介绍一下。Python是一门非常适合开发网络爬虫的编程语言，相比于其他静态编程语言，Python抓取网页文档的接口更简洁;相比于其他动态脚本语言，Python的urllib2包提供了较为完
【Hugging Face】datasets 库：加载、处理和分享大规模数据集彬彬侠大模型 datasets Hugging Face
HuggingFaceDatasets库HuggingFace的datasets库是一个轻量级、高性能的库，用于加载、处理和分享大规模数据集，特别适用于自然语言处理（NLP）、计算机视觉（CV）和语音任务。1.为什么使用Datasets？在深度学习中，处理大规模数据集通常面临以下挑战：数据集太大，无法一次性加载到内存不同任务的数据格式不统一数据预处理和转换较慢需要快速流式加载数据datasets库
【深度学习】服务器常见命令红烧白开水。服务器运维
1、虚拟环境的安装位置先进入虚拟环境whichpython2、升序查看文件内容ls-ltr3、查看服务器主机空间使用情况df-hdf-h.4、查看本地空间使用情况du-sh./*du-sh*|sort-nr5、查找并删除进程#查找psaux#删除kill-KILLpid6、查看服务器配置lscpuuname-alsb_release-acat/etc/*release7、文件和目录操作ls：列出目
YOLOv12改进策略【注意力机制篇】| 引入MobileNetv4中的Mobile MQA，轻量化注意力模块提高模型效率（二次改进A2C2f） Limiiiing YOLOv12改进专栏 YOLOv12 计算机视觉深度学习目标检测
一、本文介绍本文记录的是基于MobileMQA模块的YOLOv12目标检测改进方法研究。MobileNetv4中的MobileMQA模块是用于模型加速，减少内存访问的模块，相比其他全局的自注意力，其不仅加强了模型对全局信息的关注，同时也显著提高了模型效率。文章目录一、本文介绍二、MobileMQA注意力原理三、MobileMQA的实现代码四、创新模块4.1改进点⭐五、添加步骤5.1修改一5.2修改
Triplet Loss原理及 Python实现 AIGC_ZY Diffusion Models python 深度学习机器学习
Tripletloss最初是谷歌在FaceNet:AUnifiedEmbeddingforFaceRecognitionandClustering论文中提出的，可以学到较好的人脸的embeddingTripletLoss是一种用于训练特征嵌入（featureembedding）的损失函数，广泛应用于人脸识别、图像检索等需要度量相似性的任务。其核心思想是通过学习将同类样本的嵌入距离拉近，不同类样本的
Python和C++计算物理光学波形化学结构数学方程亚图跨际 C/C++Python 物理 python c++物理化学数学方程数值计算
要点Python|C++代码化排序索引和计算：冒泡排序，升序排序，快速排序，索引排序，基于索引数组的排名，基于直接插入的两个键索引，两个相关数组的索引。数学计算1：数据集升序排列后，生成索引和排名。数学计算2：一定量序列排序后，生成得新索引表，并绘制原始序列。计算3：一定量序列进行冒泡排序，插入排序，快速排序，绘制一张图显示三种排序依赖性，分别定性评估小型和广泛序列的排序算法的性能。Python|
python排版word文档效率,【效率工具】用Python根据excel中数据批量生成word文档（适用劳... 孤傲雕 python排版word文档效率
【效率工具】用Python根据excel中数据批量生成word文档(适用劳【效率工具】用Python根据excel中数据批量生成word文档(适用劳动合同、通知书等应用场景)大家在工作中一定经常遇到类似的情况：1、制作劳动合同表，要从excel表格中将每个人的数据导入到docx劳动合同中，重复量很大。2、制作通知书，从excel表格中将每个人的数据分别填入到docx通知书中。3、制作XX方案，Wo
【干货来了】2016年DevExpress资源汇总（示例、视频） weixin_34357928
2019独角兽企业重金招聘Python工程师标准>>>在2016年，著名软件界面解决方案专家DevExpress进行了重大升级，EVGET围绕版本升级推出了一系列干货资源，现将2016年所有Dev示例资源和视频资源汇总于此，欢迎收藏转发点赞哦~示例Demo（仍在持续更新……）DevExpressDashboard在线演示：分行业的营收分析DevExpressDashboard在线演示：客户服务管理
python selenium兼容性_Selenium学习整理(Python) k程 python selenium兼容性
1准备软件SeleniumIDEfirebug-2.0.19.xpifirepath-0.9.7-fx.xpiFirefox_46.0.1.5966_setup.exe由于火狐浏览器高版本以后就不支持firebug,最好下载安装49版本以下的。selenium_ide-2.9.1.xpiWebDriverpipinstallseleniumchromedriver.exeIEDriverServe
pytest框架核心知识的系统复习双子测试 pytest
1.pytest介绍是什么：Python最流行的单元测试框架之一，支持复杂的功能测试和插件扩展。优点：语法简洁（用assert替代self.assertEqual）。自动发现测试用例。丰富的插件生态（如失败重试、并发执行、报告生成）。兼容unittest框架，比自带unittest框架更加简洁高效，在unittest框架迁移到pytest框架时不需要重写代码。适用场景：单元测试、接口测试、UI自动
python：字典根据key排序双子测试 python
在Python中，字典是无序的，不支持直接按照键排序。但是可以通过以下方法实现字典按照键排序：方法一：使用sorted()函数和字典的items()方法my_dict={'b':2,'c':3,'a':1}sorted_dict={k:vfork,vinsorted(my_dict.items(),key=lambdaitem:item[0])}print(sorted_dict)这种方法使用了s
Effective Python：（19）可变数量参数 earthzhang2021 开发语言 1024程序员节 python 网络算法
EffectivePython：（19）可变数量参数EffectivePython本条涉及函数的参数的数量问题，虽然大多数情况下参数的数量和顺序都是预先设计好的，但是仍然有参数可变的函数，比如C语言常用的main函数的argv，这在格式化打印函数上也很常用，所以Python也需要支持。Python函数对于可变数量的参数的支持方式，类似于unpacking用法中的通配方式，即函数参数的最后位置的参数
Python 核心语法解析：with 与 async/await_跟我一起学Python17 灏瀚星空 python 开发语言经验分享笔记
Python核心语法解析：with与async/await_跟我一起学Python17在Python的宇宙中，with语句与async/await语法成为构建现代化Python应用的基石。本文将从实际场景出发，深入剖析这两个核心语法的工作机制。您将看到with语句如何化身智能管家，通过上下文管理器实现资源的自动回收；领略async/await如何搭建异步编程的高速通道，用同步代码的书写方式达成非阻
基于 Python 对百度热搜 “Manus 推出引发科技圈震动” 的数据分析萧十一郎@ python python 百度科技
目录一、案例背景二、代码实现2.1数据收集2.2数据探索性分析2.3数据清洗2.4关键词提取与词频统计2.5情感分析（简单示例，实际可采用更复杂模型）2.6数据可视化三、主要的代码难点解析3.1数据收集3.2数据清洗-文本预处理3.3关键词提取与词频统计3.4情感分析3.5数据可视化四、可能改进的代码4.1数据收集改进4.2文本预处理改进4.3关键词提取改进4.4情感分析改进4.5可视化改进一、案
如何使用 Python+Flask+win32print 实现简易网络打印服务江梦寻 python flask 开发语言后端 pytest web3.py win32
Python实现网络打印机：Flask+win32print在工作场景中，我们可能需要一个简单的网页接口，供他人上传文档并自动打印到指定打印机。本文将演示如何使用Python+Flask+win32print库来实现这一需求。代码详见：https://github.com/poboll/webprint1.环境准备Windows10/11Python3.8+打印机（已安装并可用）Flaskpywi
Python 文档测试赔罪 Python 系统学习 python 服务器前端
目录文档测试练习小结文档测试如果你经常阅读Python的官方文档，可以看到很多文档都有示例代码。比如re模块就带了很多示例代码：>>>importre>>>m=re.search('(?>>m.group(0)'def'可以把这些示例代码在Python的交互式环境下输入并执行，结果与文档中的示例代码显示的一致。这些代码与其他说明可以写在注释中，然后，由一些工具来自动生成文档。既然这些代码本身就可以
Python Web开发（三）：HTTP请求的url路由是Dream呀 python 前端 http django 后端
本文目录：一、要实现的目标二、创建项目app1.APP介绍2.创建APP三、返回页面内容给浏览器四、url路由1.添加路由记录1.1解决ERROR:Couldnotfindaversionthatsatisfiestherequirementxxx1.2启动web服务2.路由子表`【系列好文推荐】`前言：作者简介：是Dream呀，华为云享专家、CSDN原力计划作者、Python领域优质创作者，专注
深入理解 Python 中的 copy 与 deepcopy 的使用 web安全工具库 python 开发语言
各类资料学习下载合集https://pan.quark.cn/s/8c91ccb5a474在Python中，数据的复制是一个重要的操作，尤其是在处理复杂数据结构（如列表、字典、集合等）时。copy和deepcopy是Python标准库copy模块提供的两种复制方法。它们之间有着明显的区别，理解这些区别对于避免潜在的错误和数据问题至关重要。本文将详细介绍copy和deepcopy的用法，包括代码示例
python前景和待遇-Python就业前景怎么样？薪资待遇多少 weixin_37988176
Python就业前景怎么样？薪资待遇多少？Python上手容易，入门简单Python是一门面向对象的编程语言，编译速度超快。它具有丰富和强大的库，常被称为"胶水语言”，能够把用其他语言编写的各种模块（尤其是C/C）很轻松地联结在一起。其特点在于灵活运用，因为其拥有大量第三方库，所以开发人员不必重复造轮子，就像搭积木一样，只要擅于利用这些库就可以完成绝大部分工作。如果你想选择一种语言来入门编程，那么
Python开发行业薪资多少？ Java大师兄-威哥 Python 编程 IT技术程序员 IT
大家都知道，人工智能越来越受欢迎了。而Python由于简单易用，是人工智能领域中使用最广泛的编程语言之一，它可以无缝地与数据结构和其他常用的AI算法一起使用。Python开发行业薪资多少？我们看看图片就能知道个大概。无论是国内还是国外对于编程语言的热度调查中，Python都是数得上名的。Python热度的持续升温，自然也引起了开源团队的项目。由于OSI认可的开放源码许可，程序员可以使用Python
UI自动化：Python + Selenium4.6+版本环境搭建双子测试自动化 python
以下是Python+Selenium4.12+环境搭建的详细步骤（无需手动下载浏览器驱动，利用SeleniumManager自动管理驱动）：1.安装Python1.1下载并安装Python官网下载地址：DownloadPython|Python.org安装时勾选AddPythontoPATH（自动配置环境变量）。1.2验证Python安装bash复制python--version#输出Python
python工资一般多少-Python开发的工资一般多少编程大乐趣
原标题：Python开发的工资一般多少Python开发的工资一般多少？要想知道Python开发的工资，就要先看看Python开发工程师的发展前景怎么样。Python的用武之地很多，它可读性好且开发效率很高、有着丰富的第三方库。（如GUI、API、开发框架）随着Python的流行，带动的是它的普及以及市场需求量。Python的未来薪资，究竟会朝怎样的方向发展呢？薪资的变化始终符合经济学原理：价格由供
Python就业薪资怎么样？前景如何？田野猫咪 Python 计算机 python 人工智能数据挖掘
Python是一种全栈的开发语言，你如果能学好Python，前端，后端，测试，大数据分析，爬虫等这些工作你都能胜任。那么Python现在在国内的就业薪资高吗？Python就业薪资怎么样？前景如何？对于这些问题，下面小编整理相关内容为大家详情解析，一起来了解吧~如果你也对Python感兴趣，想通过学习Python转行、做副业或者提升工作效率，我也为大家整理了一份【最新全套Python学习资料】一定对
python程序员工资高吗？ lmseo5hy python培训 python程序员
据统计数据显示，北京Python平均薪资为18860元，Python不同岗位薪资范围为：Python全栈开发工程师（10k-20K）、Python运维开发工程师（15k-20K）、Python高级开发工程师（15k-30K）、Python大数据工程师（15K-30K）、Python机器学习工程师（15k-30K）、Python架构师（20k-40k）等，相比于Java、PHP、C#等其他的编程语言
Python代码缩进及Pycharm中代码缩进 Hi~晴天大圣 Python python pycharm 缩进
1、代码缩进是编写Python代码时非常重要的部分，因为Python使用缩进来表示代码块。你可以选择使用Tabs或Spaces来进行缩进。2、在Python中，不建议将使用Tab键快捷缩进和点击使用Space（空格）进行缩进混用，虽然在很多时候Tab键为使用Space缩进4个空格的快捷方式，如Pycharm中Tab键为使用Space缩进4个空格的快捷方式：不同的编辑器或IDE对Tab和Space的
Python爬取58同城广州房源+可视化分析 R3eE9y2OeFcU40
感谢关注天善智能，走好数据之路↑↑↑欢迎关注天善智能，我们是专注于商业智能BI，人工智能AI，大数据分析与挖掘领域的垂直社区，学习，问答、求职一站式搞定！对商业智能BI、大数据分析挖掘、机器学习，python，R等数据领域感兴趣的同学加微信：tstoutiao，邀请你进入数据爱好者交流群，数据爱好者们都在这儿。消失了一段时间，这段时间在CSDN阅读了不少关于Python爬虫的文章，也学习了秦璐老师
如何用Python爬取Google新闻 2501_90631432 谷歌 python 人工智能开发语言
什么是Google新闻？Google新闻是Google推出的一项新闻聚合服务。它收集、整理和展示来自全球主要新闻网站的最新新闻报道。用户可以按关键词、主题、地区、发布来源等进行筛选，Google新闻算法会根据用户的兴趣和浏览习惯推荐个性化的新闻内容。Google新闻数据主要来自权威新闻机构、博客、政府公告等，因此它是获取全球实时信息的重要来源。你可以从Google新闻中获取哪些数据？新闻标题(ti
python 面向对象(类和对象)（详细版）帅维维 python面向对象 python 开发语言后端
学习任务1.理解面向过程编程和面向对象编程思想2.明确类和对象的关系，会独立设计和使用类3.会使用类创建对象，并添加属性4.掌握类的属性和方法5.掌握构造方法和析构方法的使用重点1.self的使用2.构造方法和析构方法3.类属性和实例属性4.方法的重载引入面向过程：先分析解决问题的步骤，使用函数把这些步骤以此实现，使用的时候需要逐个调用函数。面向对象：把解决问题的事物分为多个对象，对象具备解决问题
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul