有时有味

PaddleOCR #使用PaddleOCR进行光学字符识别 - OCR飞桨实验

引言： PaddleOCR 是一个 OCR 框架或工具包，它提供多语言实用的 OCR 工具，帮助用户在几行代码中应用和训练不同的模型。PaddleOCR 提供了一系列高质量的预训练模型。这包含三种类型的模型，使 OCR 高度准确并接近商业产品。它提供文本检测、文本方向分类器和文本识别。PaddleOCR 在其工具包中提供了多种模型，包括旗舰 PP-OCR 和最新算法，如 SRN、NRTR 等。

PaddleOCR 还根据大小提供不同的模型。

轻量级模型 ——占用更少内存、速度更快但准确性有所妥协的模型。
服务器模型（重量级）——占用更多内存但更准确但速度有所妥协的模型。

PaddleOCR 支持 80 多种语言（取决于使用的 OCR 算法）。但是旗舰级的PP-OCR提供了中英文两种语言的支持。旗舰 OCR 算法 PP-OCR 是可用的最佳 OCR 工具之一。到目前为止，它已经有PP-OCR、PP-OCRv2 和 PP-OCRv3三个版本。如前一节所述，所有这些模型都建立在 CRNN 之上，并且是超轻量级的。让我们来看看并将其应用到一些各种类型的场景中。

一、OCR环境搭建

接下来我们将实现 PaddleOCR 的 PP-OCRv3。
首先，让我们安装所需的工具包和依赖项。这些依赖项和工具将帮助我们访问 OCR 实验环境所需的所有必需文件和脚本。

Windows 下的 PIP 安装：
更多环境安装请参考官方文档：Windows 下的 PIP 安装-使用文档-PaddlePaddle深度学习平台

1.1 环境准备

1）查看你的环境
需要确认 python 的版本是否满足要求。WIN键+R打开CMD命令窗口，使用以下命令确认是 3.6/3.7/3.8/3.9/3.10

python --version

参考结果：

2）需要确认 pip 的版本是否满足要求，要求 pip 版本为 20.2.2 或更高版本

python -m pip --version

参考结果：

3）需要确认 Python 和 pip 是 64bit，并且处理器架构是 x86_64（或称作 x64、Intel 64、AMD64）架构

python -c "import platform;print(platform.architecture()[0]);print(platform.machine())"

下面的第一行输出的是”64bit”，第二行输出的是”x86_64”、”x64”或”AMD64”即可：

1.2 开始安装

如果你的计算机有 NVIDIA GPU，请在 CMD 模式中运行以下命令安装 GPU 版的 PaddlePaddle：

pip install paddlepaddle-gpu -i https://mirror.baidu.com/pypi/simple

如果你的计算机没有 NVIDIA GPU，请在 CMD 模式中运行以下命令安装 CPU 版的 PaddlePaddle（小编用的是CPU环境）

# 安装最新版本方式
pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple
# 安装指定版本方式
pip install paddlepaddle==2.4.2 -i https://pypi.tuna.tsinghua.edu.cn/simple

1.3 验证安装

安装完成后你可以使用 python 进入 python 解释器，输入import paddle ，再输入 paddle.utils.run_check()
如果出现 PaddlePaddle is installed successfully!，说明你已成功安装。

1.4 如何卸载

如需卸载或重新安装，请使用以下命令卸载 PaddlePaddle：

CPU 版本的 PaddlePaddle: python -m pip uninstall paddlepaddle
GPU 版本的 PaddlePaddle: python -m pip uninstall paddlepaddle-gpu

二、OCR便捷使用

下载 opencv 开源项目： https://github.com/spmallick/learnopencv/tree/master/Optical-Character-Recognition-using-PaddleOCR

2.1 命令行使用

PaddleOCR 源码提供了一系列测试图片，位置：.\Optical-Character-Recognition-using-PaddleOCR\PaddleOCR\doc\imgs
如果没有，点击这里下载并解压，然后在终端中切换到相应目录。
如果不使用提供的测试图片，可以将下方--image_dir参数替换为自己相应的测试图片路径。

2.1.1 中英文模型

在源码中找一张中文图片：

检测 + 方向分类器 + 识别全流程：

--use_angle_cls true设置使用方向分类器识别180度旋转文字
--use_gpu false设置不使用 GPU

paddleocr --image_dir ./doc/imgs/11.jpg --use_angle_cls true --use_gpu false

结果是一个list，每个item包含了文本框，文字和识别置信度：

查看源码可知，默认开启的是中文 ch 模式，检测（–det）默认已开启，识别（–rec）默认已开启。

img：这是ocr函数中的第一个参数。在此，传递图像数组或图像路径以执行OCR
det：以 bool 作为参数并指定是否使用检测器
rec：以 bool 作为参数并指定是否使用识别器
cls：以bool为参数，指定是否使用角度分类器

单独使用检测：设置 --rec为 false

paddleocr --image_dir ./doc/imgs/11.jpg --rec false

单独使用识别：设置 --det为 false

paddleocr --image_dir ./doc/imgs_words/ch/word_4.jpg --det false

2.1.2 多语言模型

1）英语

PaddleOCR 目前支持80个语种，可以通过修改 --lang参数进行切换，比如使用英文模型，指定 --lang=en。

paddleocr --image_dir ./doc/imgs_en/model_prod_flow_en.png --lang=en

结果是一个list，每个item包含了文本框，文字和识别置信度：

2）日语

像这样一张带有日文的图片：

CMD 执行命令：

paddleocr --image_dir ./doc/imgs/japan_1.jpg --lang=japan

如果设置的语言，在本机环境中没有对应的语言包，则会自动进行下载：

附常用的多语言简写包括：

2.2 Python脚本使用

通过 Python 脚本使用 PaddleOCR whl 包，whl 包会自动下载 ppocr 轻量级模型作为默认模型。

pip install "paddleocr>=2.0.1" # 推荐使用2.0.1+版本

对于Windows环境用户：直接通过pip安装的shapely库可能出现 [winRrror 126] 找不到指定模块的问题。建议从这里下载 shapely安装包完成安装。小编下载的版本是 Shapely-1.8.2-cp311-cp311-win_amd64.whl

备注：2.2 节点用到的测试图片皆来自于源码项目目录：Optical-Character-Recognition-using-PaddleOCR\input_images

检测 + 方向分类器 + 识别全流程，工具类代码案例（.\PaddleOCR\applications\ocr_img_util.py）：

# Importing required methods for inference and visualization.
from paddleocr import PaddleOCR, draw_ocr
# 显示结果
from PIL import Image

# Importing required libraries.
import os
import cv2
import matplotlib.pyplot as plt

# 初始化OCR，OCR会自动下载PP-OCRv3检测器、识别器和角度分类器
ocr = PaddleOCR(use_angle_cls=True)

# 指定输出路径和字体路径
out_path = './output_images'
font = './doc/fonts/simfang.ttf'



# Applying OCR
def ocr_img(img_path):
  print("OCR 图片识别地址：", img_path)

  result = ocr.ocr(img_path)
  print("OCR 图片识别结果：", result)

  # 通过使用 result = result[0] 移除外部的一维来解决 paddleocr\tools\infer\utility.py 文件中 draw_ocr 函数的 TypeError: '<' not supported between instances of 'tuple' and 'float'
  result = result[0]
  print("移除一维后图片识别结果：", result)

  # 保存可视化OCR检测识别结果
  save_ocr(img_path, out_path, result, font)



# 绘制和保存结果
def save_ocr(img_path, out_path, result, font):
  save_path = os.path.join(out_path, img_path.split('/')[-1].split('.')[0] + '-test-output.jpg')
  print("save_path:", save_path)
  
  # 函数用于从磁盘加载图像文件并将其作为NumPy数组加载到内存中。可以通过该数组进行进一步的图像处理和分析操作。
  image = cv2.imread(img_path)

  # 从输出列表中提取框、文本及其分数
  boxes = [line[0] for line in result]
  print("boxes:", boxes)

  txts = [line[1][0] for line in result]
  print("txts:", txts)

  scores = [line[1][1] for line in result]
  print("scores:", scores)

  # 使用 PaddleOCR 内置函数绘制输出
  # 可视化OCR检测识别结果
  #   参数：
  #       图像（图像|数组）：RGB图像
  #       盒子（列表）：形状为（N, 4, 2）的盒子
  #       txts(list): 文本
  #       scores(list): txxs对应的分数
  #       drop_score(float)：只有大于 drop_threshold 的分数才会被可视化
  #       font_path：用于绘制文字的字体路径
  #   返回（数组）：
  #       可视化 img
  im_show = draw_ocr(image, boxes, txts, scores, 0.5, font)
  
  # imwrite 是OpenCV库中的一个函数，用于将图像保存到文件中。它接受两个参数：文件路径和要保存的图像。
  cv2.imwrite(save_path, im_show)

  # cvtColor 是OpenCV库中的一个函数，用于颜色空间转换。
  # 它可以将一幅图像从一个颜色空间转换为另一个颜色空间，比如将彩色图像转换为灰度图像或将图像从BGR颜色空间转换为RGB颜色空间。
  img = cv2.cvtColor(im_show, cv2.COLOR_BGR2RGB)

  # 函数用于在图像窗口中显示图像。
  # 它接受一个图像作为输入，并在一个新的窗口中显示该图像。通常，它用于图像的可视化和调试，以便查看处理后的图像结果。
  plt.imshow(img)

1）收据

收据是 OCR 被广泛使用并具有大量商业用途的文档之一。它可用于提取重要信息，如账单金额、税金、买家信息等。例如，查看此图像并对其应用 OCR。

from ocr_img_util import ocr_img

# Applying OCR
img_path = './input_images/05-receipt1.jpg'
ocr_img(img_path)

结果可视化：

让我们在另一张小票图片上测试我们的 OCR。

from ocr_img_util import ocr_img

# Applying OCR
img_path = './input_images/05-receipt1.jpg'
ocr_img(img_path)

可以看出，OCR 在收据上的表现非常出色。它已经能够捕获几乎所有的详细信息，例如金额、订单、订单号等，并且与收据的数字顺序相同。因此，我们可以说 PP-OCR 在收据和类似文件上的表现相当不错。

2）身份证

身份证主要用于安全目的和识别目的。当 OCR 应用于 ID 卡时，它可用于提取姓名、代码、分支机构等信息，这些信息可用于在电子门上进行访问或将信息存储在数据库中。我们将在下图上尝试 OCR。

from ocr_img_util import ocr_img

# Applying OCR
img_path = './input_images/09-id-card.jpg'
ocr_img(img_path)

哇！！那很快而且非常准确。它检测了所有字段，如船号、日期、ID 号等，即使文本倾斜，这些也是这里的关键信息。

3）文件

文档识别一直是 OCR 的重要研究领域之一。在我们的生活中几乎每天都在使用文档。当 OCR 应用于文档时，它可用于检索重要信息、检索表单字段、分析布局、数字存储以及阅读旧手稿。所有这些任务都可以使用 OCR 轻松完成。

from ocr_img_util import ocr_img

# Applying OCR
img_path = './input_images/11-document-1.jpg'
ocr_img(img_path)

输出在检测和识别方面都非常准确。PP-OCR 能够检测文档中的所有文本字段，并且识别器在识别这些文本方面做得非常出色。识别出来的文字看起来很准确，对特殊字符和空格的检测也很准确。

我们在另一个类似的文档上实现 OCR。

from ocr_img_util import ocr_img

# Applying OCR
img_path = './input_images/13-document-2.png'
ocr_img(img_path)

此图像中的检测器遗漏了此文档图像中的一些文本。但是，无论检测器检测到什么文本，OCR 都能正确预测。从文档图像来看，我们可以说检测器和识别器不擅长处理小文本。当遇到小文本时，它会错过或错误地预测输出。

4）手写文件

我们还可以在手写文本文档上测试我们的管道。例如，我们来试试这张图片。

from ocr_img_util import ocr_img

# Applying OCR
img_path = './input_images/15-document-3.jpg'
ocr_img(img_path)

如图所见，从结果看原文，OCR 根本不准确。尽管检测器非常好，但识别器一点也不好。其背后的主要原因可能是 OCR 接受训练的数据。PP-OCR 在 MJSynth 和 SynthText 数据集上训练，这是一个合成文本数据集。这些数据集不是现实生活中的文本图像，而是计算机生成的文本图像。因此，由于训练数据集中缺少手写文本可能是 OCR 在这些类型的图像上表现不佳的一个重要因素。

5）牌照

车牌是 OCR 中最流行和最重要的用例之一，并且性能非常好。ALPR 现在用于各种商业和研究领域。已识别的车牌可用于查找任何违规行为、车辆登记、收费站等。

from ocr_img_util import ocr_img

# Applying OCR
img_path = './input_images/17-license-plate.jpg'
ocr_img(img_path)

那太精彩了！预测的边界框非常紧凑，甚至识别的文本也很准确。ALPR 也可以应用于视频源，并进行一些调整以提高准确性。

6）路标

可以应用 OCR 的最重要场景之一是路标。由于自动驾驶汽车的发展，这个应用程序变得非常重要，例如读取速度限制、停车标志等。

from ocr_img_util import ocr_img

# Applying OCR
img_path = './input_images/23-sign-board-1.jpg'
ocr_img(img_path)

那是相当准确的。OCR 能够识别所有文本，甚至包括括号等特殊字符。让我们在另一张图片上试试。

from ocr_img_util import ocr_img

# Applying OCR
img_path = './input_images/25-sign-board-2.jpg'
ocr_img(img_path)

这非常准确。通过检测每个文本字段，检测器工作得很好。OCR 在这些场景中也表现出色。我们可以肯定地说，自动驾驶汽车可以很容易地依赖这个 OCR。

7）交易卡

交易卡或收藏卡在当今从儿童到成人中非常流行，用于玩耍和交易。其中一些包含非常高的货币价值，高达数百万美元。因此，值得在这些卡片上尝试 OCR。

from ocr_img_util import ocr_img

# Applying OCR
img_path = './input_images/27-trading-card.jpg'
ocr_img(img_path)

OCR 在这方面不算太好，也不算太差。这里有几件事需要注意，OCR 预测了一些没有空格的文本，其中文本的尺寸有点小，类似于文档部分的情况。此外，检测器还没有检测到一些尺寸也非常小的文本字段。

8）曲线文字

到目前为止，我们只看到了直线上的文本，但如果文本是弯曲的呢？OCR 和文本检测器的性能如何？我们也来试试。

from ocr_img_util import ocr_img

# Applying OCR
img_path = './input_images/19-curved-text-1.jpg'
ocr_img(img_path)

虽然是一张简单的图片，但是看识别结果，只有一个英文单词，有点惊讶。再来试一张：

from ocr_img_util import ocr_img

# Applying OCR
img_path = './input_images/21-curved-text-2.jpg'
ocr_img(img_path)

好吧，如图所见，结果非常糟糕。检测器无法检测到文本字段。原因是因为训练数据。训练默认检测器的数据包含所有直线文本。即使是神经网络也应该预测弯曲的边界框，这通过使用与现在使用的相同的网络是不可能的。因此，当看到弯曲的文本时，检测器无法检测到它。PaddleOCR 提供了一个名为 SAST 的文本检测器，专门为弯曲文本创建和训练。但截至目前，PaddleOCR 并未为此管道提供 OCR。

三、实验总结

从上面的实验中，我们可以得出结论，PP-OCR 是一种非常快速且高度准确的 OCR 以及文本检测器。但它在某些情况下会失败，例如手写文本、弯曲文本和小文本，这些文本无法检测到或识别不准确。为了解决这些问题，可以在更多数据集上对 OCR 和检测器进行微调，这有助于提高准确性并在各种不同场景中获得更好的性能。

四、参考文档

opencv开源项目：https://github.com/spmallick/learnopencv/tree/master/Optical-Character-Recognition-using-PaddleOCR
opencv开放文档：https://learnopencv.com/optical-character-recognition-using-paddleocr/
paddlepaddle官方文档：https://www.paddlepaddle.org.cn/documentation/docs/zh/install/pip/windows-pip.html

系列攻略：
PaddleOCR #hello paddle: 从普通程序走向机器学习程序 - 初识机器学习
PaddleOCR #使用PaddleOCR进行光学字符识别 - OCR模型对比

力扣热题100-简单题python实现（包括输入输出）夏赞恩 python学习 leetcode 哈希算法散列表
文章目录一、数组1两数之和53最大子数组和121买卖股票的最佳时机136只出现一次的数字169多数元素283移动零448找到所有数组中消失的数字二、字符串20有效的括号一、数组1两数之和nums=[]nums=list(map(int,input().split()))target=int(input())sum=0foriinrange(len(nums)-1):forjinrange(i+1,
【前沿聚焦】机器学习的未来版图：从自动化到隐私保护的技术突破网罗开发人工智能 AI 大模型机器学习人工智能
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
def __init__(self)是什么意思_通俗的告诉你Python中 init_ 到底是什么含义？ cjz0422 python
Python是面向对象的编程语言，因此我从Class、Instance以及属性(property/attribute)的角度出发解释。_init_根据其英文意思(initialize)，用来初始化一个类(class)的新成员(instance)，它是一个constructor.当新成员被创建时，这个方程会自动被调用。举个栗子1，使用_init_方程我们创建了一个叫做“人类”(Person)的类别，
python学习-def __init__(self)理解（1）哦里哦里哦里给深度学习
python中__init__()的作用在python中创建类后，通常会创建一个init__()方法，这个方法会在创建类的实例的时候自动执行。实例1:【实例化Bob这个对象的时候，__init__()方法会自动执行】：在下面的示例中，我们在实例化Bob这个对象的时候，__init__()方法就已经自动执行了，如果不是__init__()方法，比如说eat()方法，那就只有在调用时才会执行。clas
PyQT5 键盘模拟/鼠标连点器的实现一个爱折腾的小人物 python qt 开发语言游戏程序 python 开源经验分享
近来在玩一个游戏，找不到合适的鼠标连点器，不是有广告就是功能太复杂，自己写了一个，分享出来，如果有需要的可以自行运行研究。准备工作Python版本：Python3.12.3；运行前确保pyQT5已经安装：pipinstallPyQt5程序运行界面：程序代码：通过引入单独的常量和变量文件，并为每个元素增加中文注释来实现界面语句、变量和常量的统一规划。代码：常量定义文件（constants.py）#c
【华为OD-E卷 - 字符串解密 100分（python、java、c++、js、c）】 CodeClimb 算法题华为od （A+B+C+D+E 卷）收录分享华为od python java c++javascript
【华为OD-E卷-字符串解密100分（python、java、c++、js、c）】题目给定两个字符串string1和string2。string1是一个被加扰的字符串。string1由小写英文字母（’a’~’z’）和数字字符（’0’~’9’）组成，而加扰字符串由’0’~’9’、’a’~’f’组成。string1里面可能包含0个或多个加扰子串，剩下可能有0个或多个有效子串，这些有效子串被加扰子串隔开
Python学习日记------def __init__( ):函数 Canliays 学习 python
在Python中，__init__方法是类的构造函数，用于在创建对象时进行初始化。它可以接受参数也可以不接受参数，具体的选择取决于你是否希望在创建对象时传入初始值。无参数的__init__方法无参数的__init__方法通常在类定义时使用默认值来初始化属性，而不需要在创建对象时传入任何参数。classStudent:def__init__(self):self.name="Unknown"#默认值
Python Flask教程洒脱的六边形战士加辣 python python flask 开发语言
一、前言Flask是一个用Python编写的轻量级的Web应用框架。Flask基于WSGI（WebServerGatewayInterface）和Jinja2模板引擎，旨在帮助开发者快速、简便地创建Web应用。Flask被称为"微框架"，因为它使用简单的核心，用扩展增加其他功能。1.HelloWorld以下的Flask程序会在网页输出HelloWorld：fromflaskimportFlaska
LeetCode - #195 Swift 实现打印文件中的第十行网罗开发 Swift vue.js leetcode swift
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
python windows 外部usb设备检测 myzzb python windows 后端驱动开发交互
importwin32com#测试使用KINGSTON金士顿u盘list_name=["KINGSTON"]#windows外部设备检测defdetect():"""检测windows的外部设备通过全局变量把控，用的是匹配不是相等return获取到文件列表"""wmi=win32com.client.Dispatch("WbemScripting.SWbemLocator")service=wmi
python 双端口截图数据传输显示 myzzb 网络 python 图像处理 tkinter 学习
importioimporttimeimportsocketimportpyautoguidefcapture_and_send_image():whileTrue:try:#pil_image=Image.new("RGB",(160,90),(255,255,255))##截图screenshot=pyautogui.screenshot()##缩小图片new_size=(screenshot
python里permission denied错误是什么_Python错误：PermissionError: [Errno 13] Permission denied 如何解决... weixin_39954889 denied错误是什么
相关推荐2019-12-2014:41−zabbix启动报错cannotsetresourcelimit:[13]Permissiondenied1、zabbix-server启动报错报错信息如下：1668:20191220:140823.988usingconfiguratio...02152019-12-0914:59−作者：warm3snow出处：http://www.cnblogs.com
python权限不够无法写入_解决python使用pip安装模块的权限问题 weixin_39922929 python权限不够无法写入
ubuntu16.04下默认的python和pip1.ubuntu16.04默认安装了两个版本的python,python2.7和python3.5,可以使用python-V查看版本命令行中python是2.7版本,python3是python3.5版本请注意，系统自带的python千万不能卸载！2.ubuntu默认没有装pip,我们一般用sudoapt-getinstallpip,这样安装的是p
python 只用opencv吗,python – OpenCV：使用solvePnP来确定单应性 weixin_39934296 python 只用opencv吗
在过去的几周里,我尝试学习纠正图像,并在这里的人们的帮助下,我已经设法更好地理解它.大约一个星期前,我设置了一个我想要纠正的测试示例(从上面查看图像).这很好(原始：http://sitedezign.net/original.jpg和纠正：http://sitedezign.net/rectified.jpg)功能T=cv2.getPerspectiveTransform(UV_cp,XYZ_g
opencv python视频教程-OpenCV视频操作 weixin_37988176
使用工具Python3.5，使用库numpy；opencv1.用摄像头捕获视频cv2.VideoCapture()：0为默认计算机默认摄像头，1可以更换来源；~~~importnumpyasnpimportcv2cap=cv2.VideoCapture(0)while(True):#captureframe-by-frameret,frame=cap.read()#ouroperationonth
ARC碱金属Rydberg状态计算器软件包-2.0.1 夏勇兴
本文还有配套的精品资源，点击获取简介：此标题"ARC_Alkali_Rydberg_Calculator-2.0.1-cp27-macosx_10_6_x86_64.whl"为一个特定版本的PythonWheel软件包，旨在计算碱金属原子的Rydberg状态。适用于Python2.7版本，专为macOS10.6（SnowLeopard）64位架构设计。Rydberg状态是原子物理学中的一个重要概念
OpenCV播放视频菜鸟小馒头图像识别
使用opencv播放视频很容易，即循环的顺序读取视频中的每一帧，并且能够退出循环操作。#include#include#includeusingnamespacestd;usingnamespacecv;intmain(intargc,constchar*argv[]){//insertcodehere...constchar*ImageLocation="/Users/linwang/LinMo
opencv 播放视频 smwhotjay opencv
看资料cv播放视频是用VideoCapture。结果始终打不开文件，open(0);倒是可以打开摄像头。于是抛弃他的c++类，用c接口来播放。结果ok.//打开CvCapture*capture=cvCreateFileCapture("a.avi");if(!capture){return-1;}//视频信息intcam_width=(int)cvGetCaptureProperty(captu
Pycharm报错Python error: PermissionError: [Errno 13] Permission denied: 码农界的小小学生 python
Pycharm报错Pythonerror:PermissionError:[Errno13]Permissiondenied:在pycharm中读取csv文件时，出现错误PermissionError:[Errno13]Permissiondenied:。看了大部分博客说是因为文件权限问题，或者文件被手动打开，这两个方法都试了试后，无效。解决问题的方法：配置Python编译器时将ScriptPat
机器学习&深度学习目录 UQI-LIUWJ 各专栏目录深度学习人工智能 1024程序员节
机器学习模型机器学习笔记：Transformer_刘文巾的博客-CSDN博客attention相关机器学习笔记：attention_UQI-LIUWJ的博客-CSDN博客机器学习笔记：ELMOBERT_UQI-LIUWJ的博客-CSDN博客机器学习笔记：ViT（论文AnImageIsWorth16X16Words:TransformersforImageRecognitionatScale）_UQ
关于cv2.solvePnP和cv2.solveP3P ulimate_ opencv opencv 人工智能计算机视觉
一、cv2.solvePnP()函数是OpenCV中的一种用于计算相机位姿的函数。它可以根据一组已知的二维坐标点和对应的三维坐标点，以及相机的内参和畸变系数，计算出相机的位姿（旋转和平移向量）。以下是cv2.solvePnP()函数的基本用法：cv2.solvePnP(objectPoints,imagePoints,cameraMatrix,distCoeffs[,rvec[,tvec]])参数
pymoo：Python中的多目标优化框架葛梓熙
pymoo：Python中的多目标优化框架pymoo项目地址:https://gitcode.com/gh_mirrors/pym/pymoo项目介绍pymoo是一个开源的多目标优化框架，专为Python开发者设计。它提供了最先进的单目标和多目标优化算法，以及与多目标优化相关的多种功能，如可视化和决策支持。无论你是学术研究者还是工业应用开发者，pymoo都能帮助你轻松实现复杂的多目标优化任务。项目
chatgpt赋能Python-python_pyomo atest166 ChatGpt python chatgpt 开发语言
PythonPyomo:优化问题解决利器PythonPyomo是一个开源的Python优化建模语言工具箱。它提供了一种简单灵活的方法来描述优化问题，并在可行性、线性、非线性、混合整数和二次规划等方面提供广泛的建模和求解功能。优点灵活:Pyomo可以通过对象导向编程方式来描述优化问题，而无需使用特定的语法或格式。它提供了一种比传统表格方式更灵活的方式来表示问题。可扩展:Pyomo的建模框架可以很容易
使用Python调用OpenCV中的solvePnP函数 WzisTypescript python opencv 开发语言 OpenCV
OpenCV是一个广泛使用的计算机视觉库，它提供了许多用于处理图像和视频的功能。其中一个重要的功能是解决透视投影问题，也就是通过已知的3D点和对应的2D图像点来计算相机的位姿。在OpenCV中，solvePnP函数就是用于解决这个问题的。solvePnP函数使用了一种称为Perspective-n-Point（PnP）问题的算法，它可以估计相机的旋转和平移向量，从而确定相机在3D空间中的位置。这对
python-leetcode-翻转二叉树 Joyner2018 leetcode 算法职场和发展
226.翻转二叉树-力扣（LeetCode）#Definitionforabinarytreenode.#classTreeNode:#def__init__(self,val=0,left=None,right=None):#self.val=val#self.left=left#self.right=rightclassSolution:definvertTree(self,root:Opti
python2 中使用pip2 install package_name的时候报错：AttributeError: ‘int‘ object has no attribute ‘endswith‘ 点亮~黑夜 16—各种错误和bug（你的痛我的痛痛痛痛）python
文章目录1错误说明2错误解决方式1错误说明1、在python2的环境下使用pip2install安装库包的时候报错：AttributeError:'int'objecthasnoattribute'endswith'2、具体报错信息如下(base)shl@zhihui-mint:~/tools$pip2installpyquaternionException:Traceback(mostrecen
OpenCV实现Python视频播放控制详解夏勇兴
本文还有配套的精品资源，点击获取简介：本文详细介绍了如何使用OpenCV库在Python环境中播放视频，并展示了实现视频快进、后退控制的方法。首先通过cv2.VideoCapture()函数实现基础播放，然后利用set(cv2.CAP_PROP_FPS)函数控制播放速度实现快进和慢速播放，最后结合cv2.CAP_PROP_POS_MSEC属性实现精确的快进和后退。开发者可以根据实际需求选择合适的方
CentOS7 编译安装Python3.12 topxiasz linux python
Tom更新于2024.8.201.说明CentOS7已成为历史，不过很多人还在这段是历史奋战。Python2的Python2.7.5是CentOS7默认安装的版本;Python3的Python3.6.8是CentOS7可以通过默认repo，直接用yum安装的版本。yuminstall-ypython3本文主要针对CentOS7中较高版本如3.12的编译安装。2.安装OpenSSL-1.1.1根据P
note: This error originates from a subprocess，and is likely not a problem with pip异常嚯呀怪怪怪 pip 后端 python 运维 pycharm 服务器
note:Thiserrororiginatesfromasubprocess，andislikelynotaproblemwithpip异常这个错误提示表明问题可能源自pip所调用的子进程，而不是pip本身的问题。可能的原因包括：环境问题：Python环境（如虚拟环境）没有正确配置。库或Python版本之间的冲突。权限问题，导致pip无法执行子进程。系统问题：系统依赖或工具（如gcc、make）
06-机器学习-数据预处理不会打代码呜呜呜呜机器学习机器学习人工智能
数据清洗数据清洗是数据预处理的核心步骤，旨在修正或移除数据集中的错误、不完整、重复或不一致的部分，为后续分析和建模提供可靠基础。以下是数据清洗的详细流程、方法和实战示例：一、数据清洗的核心任务问题类型表现示例影响缺失值数值型字段为空（NaN）模型无法处理缺失值，导致训练中断或偏差异常值年龄=200岁，房价=-100万扭曲统计指标（如均值），降低模型泛化性重复数据两行记录完全相同导致模型过拟合，降低
ViewController添加button按钮解析。（翻译）张亚雄 c
<div class="it610-blog-content-contain" style="font-size: 14px"></div>// ViewController.m // Reservation software // // Created by 张亚雄 on 15/6/2.
mongoDB 简单的增删改查开窍的石头 mongodb
在上一篇文章中我们已经讲了mongodb怎么安装和数据库/表的创建。在这里我们讲mongoDB的数据库操作在mongo中对于不存在的表当你用db.表名他会自动统计下边用到的user是表明，db代表的是数据库添加(insert):
log4j配置 0624chenhong log4j
1) 新建java项目 2) 导入jar包，项目右击，properties—java build path—libraries—Add External jar，加入log4j.jar包。 3) 新建一个类com.hand.Log4jTest package com.hand; import org.apache.log4j.Logger; public class
多点触摸(图片缩放为例) 不懂事的小屁孩多点触摸
多点触摸的事件跟单点是大同小异的，上个图片缩放的代码，供大家参考一下 import android.app.Activity; import android.os.Bundle; import android.view.MotionEvent; import android.view.View; import android.view.View.OnTouchListener
有关浏览器窗口宽度高度几个值的解析换个号韩国红果果 JavaScript html
1 元素的 offsetWidth 包括border padding content 整体的宽度。 clientWidth 只包括内容区 padding 不包括border。 clientLeft = offsetWidth -clientWidth 即这个元素border的值 offsetLeft 若无已定位的包裹元素
数据库产品巡礼：IBM DB2概览蓝儿唯美 db2
IBM DB2是一个支持了NoSQL功能的关系数据库管理系统，其包含了对XML，图像存储和Java脚本对象表示（JSON）的支持。DB2可被各种类型的企业使用，它提供了一个数据平台，同时支持事务和分析操作，通过提供持续的数据流来保持事务工作流和分析操作的高效性。 DB2支持的操作系统 DB2可应用于以下三个主要的平台: 工作站，DB2可在Linus、Unix、Windo
java笔记5 a-john java
控制执行流程： 1，true和false 利用条件表达式的真或假来决定执行路径。例：（a==b）。它利用条件操作符“==”来判断a值是否等于b值，返回true或false。java不允许我们将一个数字作为布尔值使用，虽然这在C和C++里是允许的。如果想在布尔测试中使用一个非布尔值，那么首先必须用一个条件表达式将其转化成布尔值，例如if(a!=0)。 2，if-els
Web开发常用手册汇总 aijuans PHP
一门技术，如果没有好的参考手册指导,很难普及大众。这其实就是为什么很多技术，非常好，却得不到普遍运用的原因。正如我们学习一门技术，过程大概是这个样子： ①我们日常工作中，遇到了问题，困难。寻找解决方案，即寻找新的技术； ②为什么要学习这门技术？这门技术是不是很好的解决了我们遇到的难题，困惑。这个问题，非常重要，我们不是为了学习技术而学习技术，而是为了更好的处理我们遇到的问题，才需要学习新的
今天帮助人解决的一个sql问题 asialee sql
今天有个人问了一个问题，如下： type AD value A
意图对象传递数据百合不是茶 android 意图Intent Bundle对象数据的传递
学习意图将数据传递给目标活动; 初学者需要好好研究的 1,将下面的代码添加到main.xml中 <?xml version="1.0" encoding="utf-8"?> <LinearLayout xmlns:android="http:/
oracle查询锁表解锁语句 bijian1013 oracle object session kill
一.查询锁定的表如下语句，都可以查询锁定的表语句一： select a.sid, a.serial#, p.spid, c.object_name, b.session_id, b.oracle_username, b.os_user_name from v$process p, v$s
mac osx 10.10 下安装 mysql 5.6 二进制文件［tar.gz］征客丶 mysql osx
场景：在 mac osx 10.10 下安装 mysql 5.6 的二进制文件。环境：mac osx 10.10、mysql 5.6 的二进制文件步骤：[所有目录请从根“/”目录开始取，以免层级弄错导致找不到目录] 1、下载 mysql 5.6 的二进制文件，下载目录下面称之为 mysql5.6SourceDir；下载地址：http://dev.mysql.com/downl
分布式系统与框架 bit1129 分布式
RPC框架 Dubbo 什么是Dubbo Dubbo是一个分布式服务框架，致力于提供高性能和透明化的RPC远程服务调用方案，以及SOA服务治理方案。其核心部分包含: 远程通讯: 提供对多种基于长连接的NIO框架抽象封装，包括多种线程模型，序列化，以及“请求-响应”模式的信息交换方式。集群容错: 提供基于接
那些令人蛋痛的专业术语白糖_ spring Web SSO IOC
spring 【控制反转(IOC)/依赖注入(DI)】：由容器控制程序之间的关系，而非传统实现中，由程序代码直接操控。这也就是所谓“控制反转”的概念所在：控制权由应用代码中转到了外部容器，控制权的转移，是所谓反转。简单的说：对象的创建又容器(比如spring容器)来执行，程序里不直接new对象。 Web 【单点登录(SSO)】：SSO的定义是在多个应用系统中，用户
《给大忙人看的java8》摘抄 braveCS java8
函数式接口：只包含一个抽象方法的接口 lambda表达式：是一段可以传递的代码你最好将一个lambda表达式想象成一个函数，而不是一个对象，并记住它可以被转换为一个函数式接口。事实上，函数式接口的转换是你在Java中使用lambda表达式能做的唯一一件事。方法引用：又是要传递给其他代码的操作已经有实现的方法了，这时可以使
编程之美-计算字符串的相似度 bylijinnan java 算法编程之美
public class StringDistance { /** * 编程之美计算字符串的相似度 * 我们定义一套操作方法来把两个不相同的字符串变得相同，具体的操作方法为： * 1.修改一个字符（如把“a”替换为“b”）; * 2.增加一个字符（如把“abdd”变为“aebdd”）; * 3.删除一个字符（如把“travelling”变为“trav
上传、下载压缩图片 chengxuyuancsdn 下载
/** * * @param uploadImage --本地路径(tomacat路径) * @param serverDir --服务器路径 * @param imageType --文件或图片类型 * 此方法可以上传文件或图片.txt,.jpg,.gif等 */ public void upload(String uploadImage,Str
bellman-ford(贝尔曼-福特)算法 comsci 算法 F#
Bellman-Ford算法(根据发明者 Richard Bellman 和 Lester Ford 命名)是求解单源最短路径问题的一种算法。单源点的最短路径问题是指：给定一个加权有向图G和源点s，对于图G中的任意一点v，求从s到v的最短路径。有时候这种算法也被称为 Moore-Bellman-Ford 算法，因为 Edward F. Moore zu 也为这个算法的发展做出了贡献。与迪科
oracle ASM中ASM_POWER_LIMIT参数 daizj ASM oracle ASM_POWER_LIMIT 磁盘平衡
ASM_POWER_LIMIT 该初始化参数用于指定ASM例程平衡磁盘所用的最大权值，其数值范围为0~11，默认值为1。该初始化参数是动态参数，可以使用ALTER SESSION或ALTER SYSTEM命令进行修改。示例如下： SQL>ALTER SESSION SET Asm_power_limit=2;
高级排序:快速排序 dieslrae 快速排序
public void quickSort(int[] array){ this.quickSort(array, 0, array.length - 1); } public void quickSort(int[] array,int left,int right){ if(right - left <= 0
C语言学习六指针_何谓变量的地址一个指针变量到底占几个字节 dcj3sjt126com C语言
# include <stdio.h> int main(void) { /* 1、一个变量的地址只用第一个字节表示 2、虽然他只使用了第一个字节表示，但是他本身指针变量类型就可以确定出他指向的指针变量占几个字节了 3、他都只存了第一个字节地址，为什么只需要存一个字节的地址，却占了4个字节，虽然只有一个字节，但是这些字节比较多，所以编号就比较大，
phpize使用方法 dcj3sjt126com PHP
phpize是用来扩展php扩展模块的，通过phpize可以建立php的外挂模块,下面介绍一个它的使用方法,需要的朋友可以参考下安装（fastcgi模式）的时候，常常有这样一句命令：代码如下: /usr/local/webserver/php/bin/phpize 一、phpize是干嘛的？ phpize是什么？ phpize是用来扩展php扩展模块的，通过phpi
Java虚拟机学习 - 对象引用强度 shuizhaosi888 JAVA虚拟机
本文原文链接：http://blog.csdn.net/java2000_wl/article/details/8090276 转载请注明出处！无论是通过计数算法判断对象的引用数量，还是通过根搜索算法判断对象引用链是否可达，判定对象是否存活都与“引用”相关。引用主要分为：强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Wea
.NET Framework 3.5 Service Pack 1（完整软件包）下载地址 happyqing .net 下载 framework
Microsoft .NET Framework 3.5 Service Pack 1（完整软件包） http://www.microsoft.com/zh-cn/download/details.aspx?id=25150 Microsoft .NET Framework 3.5 Service Pack 1 是一个累积更新，包含很多基于 .NET Framewo
JAVA定时器的使用 jingjing0907 java timer 线程定时器
1、在应用开发中，经常需要一些周期性的操作，比如每5分钟执行某一操作等。对于这样的操作最方便、高效的实现方式就是使用java.util.Timer工具类。 privatejava.util.Timer timer; timer = newTimer(true); timer.schedule( newjava.util.TimerTask() { public void run()
Webbench 流浪鱼 webbench
首页下载地址 http://home.tiscali.cz/~cz210552/webbench.html Webbench是知名的网站压力测试工具，它是由Lionbridge公司（http://www.lionbridge.com）开发。 Webbench能测试处在相同硬件上，不同服务的性能以及不同硬件上同一个服务的运行状况。webbench的标准测试可以向我们展示服务器的两项内容：每秒钟相
第11章动画效果（中） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
windows下制作bat启动脚本. sanyecao2314 java cmd 脚本 bat
java -classpath C:\dwjj\commons-dbcp.jar;C:\dwjj\commons-pool.jar;C:\dwjj\log4j-1.2.16.jar;C:\dwjj\poi-3.9-20121203.jar;C:\dwjj\sqljdbc4.jar;C:\dwjj\voucherimp.jar com.citsamex.core.startup.MainStart
Java进行RSA加解密的例子 tomcat_oracle java
加密是保证数据安全的手段之一。加密是将纯文本数据转换为难以理解的密文；解密是将密文转换回纯文本。　　数据的加解密属于密码学的范畴。通常，加密和解密都需要使用一些秘密信息，这些秘密信息叫做密钥，将纯文本转为密文或者转回的时候都要用到这些密钥。　　对称加密指的是发送者和接收者共用同一个密钥的加解密方法。　　非对称加密(又称公钥加密)指的是需要一个私有密钥一个公开密钥，两个不同的密钥的
Android_ViewStub 阿尔萨斯 ViewStub
public final class ViewStub extends View java.lang.Object android.view.View android.view.ViewStub 类摘要： ViewStub 是一个隐藏的，不占用内存空间的视图对象，它可以在运行时延迟加载布局资源文件。当 ViewSt