woshicver

Python中用于从图像中提取文本的8大OCR库

介绍

你是否曾想过你的电脑如何能够从图像中读取文字？这都要归功于一种叫做光学字符识别（Optical Character Recognition, OCR）的技术。

在Python中，有一些非常酷的库可以帮助你的电脑理解图片中的文字。从谷歌强大的Tesseract到EasyOCR时髦的深度学习，这些库能够做一些非常了不起的事情。

让我们来看看Python中的OCR库，了解这些库是如何将图像转换成可读文字的吧！

1. EasyOCR

EasyOCR以其用户友好的方法和深度学习驱动的模型简化了使用 Python 从图像中提取文本的过程。它支持多种语言，使其适用于国际应用程序。无论是印刷的还是手写的，水平还是垂直对齐，EasyOCR 都能熟练地处理各种文本样式和方向。它的效率确保了快速的性能，非常适合实时应用程序。

EasyOCR 的开源性质方便用户修改和贡献。它使用户能够根据自己的需求进行定制。它还提供了一种可靠且易于使用的方法，用于从照片中删除文本、优化文档处理、创建应用程序和提高可访问性。

安装和实施 EasyOCR 的步骤

步骤1：安装Python

首先，确保你的系统上安装了 Python。你可以从 Python 官方网站下载它并按照安装说明进行操作。

步骤2：安装 EasyOCR

安装 Python 后，打开命令行或终端并运行以下命令使用 pip 安装 EasyOCR。

pip install easyocr

步骤3：安装依赖项

EasyOCR 有一些需要安装的依赖项。不用担心；pip 会自动帮你安装这些依赖项。

步骤4：使用EasyOCR

现在 EasyOCR 已安装，你的 Python 脚本可以使用它。这是如何使用 EasyOCR 从图像中提取文本的基本说明。

import easyocr

# Create an OCR reader object
reader = easyocr.Reader(['en'])

# Read text from an image
result = reader.readtext('image.jpg')

# Print the extracted text
for detection in result:
    print(detection[1])

如果你安装了 EasyOCR，现在你可以在 Python 程序中轻松从照片中提取文本。无论你是要提高可访问性还是自动化数据输入，EasyOCR 都能让文本提取变得简单。

2. Doctr

Doctr 是一个用于文档理解和处理的 Python 库，专为机器学习和自然语言处理应用而设计。它有助于完成文档布局分析、文本提取和语义理解等任务。

Doctr 可识别文档中的文本区域、图像和表格，并提供光学字符识别以从各种格式中提取文本。它还旨在通过命名实体识别和情感分析来理解语义含义。

Doctr 可扩展、高效，适用于生产环境中的大量文档。它鼓励社区贡献，并为自定义组件提供可扩展的架构。

安装和实施 Doctr 的步骤

步骤1：安装Doctr

你可以使用 Python 的包管理器 pip 安装 Doctr。打开命令行或终端并运行以下命令。

pip install doctr

步骤2：导入必要的模块

在你的 Python 脚本或笔记本中，导入文档处理任务所需的 Doctr 模块。

例如：

from doctr.models import ocr_predictor

步骤3：加载文档

根据你的使用情况，加载要处理的文档。Doctr 支持各种文档格式，包括 PDF 和图像。

步骤4：执行文档理解任务

使用 Doctr 的功能执行文档布局分析、文本提取和语义理解等任务。例如，你可以使用 OCR 预测器从图像中提取文本：

# Load an image
image_path = 'example_image.jpg'

# Create an OCR predictor
predictor = ocr_predictor.create_predictor()

# Perform OCR on the image
result = predictor(image_path)

# Print the extracted text
print(result)

步骤 5：与你的工作流程整合

一旦你对实施感到满意，请将 Doctr 集成到你的工作流程或应用程序中，以自动执行文档处理任务并简化你的工作流程。

这些步骤将帮助你在 Python 环境中安装和使用 Doctr。以便你可以快速有效地完成与文档理解和处理相关的活动。

3. Keras-OCR

Keras-OCR 是一个 Python 库，可通过 Keras 和 TensorFlow 框架简化 OCR 任务。它提供预训练模型，对各种文本和字体样式都具有高精度。其用户友好的 API 可轻松实现。Keras-OCR 具有灵活的配置功能，允许自定义输入图像大小和目标语言等参数。其开源特性促进了协作环境，提高了生产力并将 OCR 功能集成到 Python 应用程序中。

安装和实施 Keras-OCR 的步骤

要在 Python 中实现 Keras-OCR 进行文本识别，请按照以下步骤操作：

步骤1：安装Keras-OCR

使用 pip 在你的 Python 环境中安装 Keras-OCR 库。

pip install keras-ocr

步骤2：导入必要的模块

在你的 Python 脚本或笔记本中，从 Keras-OCR 导入所需的模块。

import keras_ocr

步骤3：加载预训练模型

Keras-OCR 提供了用于文本识别的预训练模型。你可以使用pipeline.Pipeline()函数加载其中一个模型。

pipeline = keras_ocr.pipeline.Pipeline()

步骤4：进行文本识别

使用已加载的管道对图像执行文本识别。你可以将单个图像或图像列表传递给 recognize() 函数。

images = ['image1.jpg', 'image2.jpg']  # List of image file paths
predictions = pipeline.recognize(images)

这将返回每个图像的预测，包含有关检测到的文本区域和识别的文本的信息。

步骤5：显示结果

然后，你可以迭代预测以显示识别的文本并可视化文本区域：

for image, prediction in zip(images, predictions):
    keras_ocr.tools.drawAnnotations(image=image, predictions=prediction)

步骤6：集成

最后，根据需要将文本识别功能集成到你的 Python 应用程序或工作流程中。

按照以下步骤，你可以轻松地在 Python 项目中实现 Keras-OCR 进行文本识别。这些使你能够以高精度和高效率从图像中提取文本。

4. Tesseract

Tesseract 是 Google 维护的一款开源 OCR 引擎。它以出色的图像文本识别准确度而闻名。它支持 100 多种语言，可以处理各种图像类型，包括扫描文档和照片。用户可以自定义页面分割模式和语言模型等参数，以优化识别准确度。

Tesseract 鼓励社区贡献，并且易于与 Python 集成，为开发人员提供了一个简单的界面，可将 OCR 功能整合到他们的应用程序中。

安装和实施 Tesseract 的步骤

为了在 Python 中使用 Tesseract OCR，需要安装 pytesseract 库。Tesseract 引擎封装在此库中。以下是详细步骤：

步骤1：安装Tesseract

首先，你需要在系统上安装 Tesseract OCR 引擎。你可以从此处下载并安装它：https://github.com/tesseract-ocr/tesseract

步骤2：安装 pytesseract

接下来，pytesseract使用 pip 安装该库：

pip install pytesseract

步骤3：导入 pytesseract

在你的 Python 脚本或笔记本中导入 pytesseract 模块：

import pytesseract

步骤4：设置 Tesseract 路径（可选）

如果 Tesseract 未安装在默认系统路径中，则必须使用 pytesseract.pytesseract.tesseract_cmd 变量来定义 Tesseract 的位置：

pytesseract.pytesseract.tesseract_cmd = r'/path/to/tesseract'

步骤5：执行OCR

使用 image_to_string() 函数对图像执行 OCR。将图像文件路径作为参数传递：

# Perform OCR on an image
text = pytesseract.image_to_string('image.jpg')

这将从图像中提取文本并将其存储在text变量中。

步骤6：显示结果

然后你可以根据需要打印或处理提取的文本：

print(text)

按照以下说明，你可以在 Python 环境中快速集成 Tesseract OCR 以从照片中提取文本。

请记住，Tesseract 的准确性会根据多种变量而变化，包括语言、文本复杂性和图像质量。对于特定使用情况，修改参数和准备照片可以帮助提高 OCR 准确性。

5. GOCR

GOCR 是一款开源 OCR 引擎，根据 GNU 通用公共许可证创建，允许用户在各种平台上从照片中提取文本。它包括一些基本的文本识别功能，并与众多系统兼容。但它主要专注于英语，不支持其他语言。

由于缺乏积极的开发和有限的语言支持，与更现代的选项相比，它对某些应用程序的功效可能有限。

安装和实施 GOCR 的步骤

安装 GOCR 程序并利用其命令行界面 (CLI) 对照片执行光学字符识别是实施 GOCR 的第一步。以下是一般的实施方法：

步骤1：安装GOCR

根据你的操作系统，你可能能够使用包管理器（例如 Ubuntu 上的 apt 或 macOS 上的 Homebrew）安装 GOCR。或者，你可以下载源代码并手动编译。

步骤2：准备图像

准备包含要识别的文本的图像。确保图像清晰且质量足够高，以实现准确的 OCR。

步骤3：从命令行运行该库

使用 GOCR 命令行界面对图片执行 OCR。以下是在名为“image.jpg”的图片文件上运行 GOCR 的基本命令。

gocr image.jpg

它将处理图像并将识别的文本输出到终端。

步骤4：处理输出

一旦 GOCR 完成图像处理，你就可以从终端捕获输出文本并根据需要在应用程序中使用它。

请记住，与更现代的 OCR 引擎相比，此库在准确性、语言支持和易用性方面可能存在局限性。如果 GOCR 达不到标准，则必须评估你的需求并考虑其他 OCR 选项。

6. Pytesseract

Pytesseract 允许将 Google 的 Tesseract-OCR Engine 集成到 Python 程序中。它提供了一种有效的光学字符识别方法。由于其直观的界面，用户几乎不需要任何编码知识就可以从照片中提取文本。

Pytesseract 支持多种语言，包括英语、法语、西班牙语和德语，并与 Windows、macOS 和 Linux 操作系统兼容。

使用 Pytesseract ，可以处理不同字体、大小和样式的文本。开发人员可以调整 OCR 参数以最大限度地提高准确性。

此外，Pytesseract 还可以与 Python Imaging Library Pillow 交互，从而实现 OCR 过程之前的预处理。

安装和实施 Pytesseract 的步骤

安装 pytesseract 库并使用它对照片执行光学字符识别 (OCR) 是 pytesseract 的实现。以下是如何在 Python 中逐步使用 Pytesseract：

步骤1：安装Tesseract

在使用 pytesseract 之前，你需要在系统上安装 Tesseract OCR 引擎。你可以从这里下载并安装它：https://github.com/tesseract-ocr/tesseract

步骤2：安装 pytesseract

接下来，使用 pip 安装 pytesseract 库：

pip install pytesseract

步骤3：导入 pytesseract

在你的 Python 脚本或笔记本中导入 pytesseract 模块：

import pytesseract

步骤4：对图像执行OCR

使用pytesseract 中的函数image_to_string()对图像执行 OCR。

将图像文件路径作为参数传递：

# Perform OCR on an image
text = pytesseract.image_to_string('image.jpg')

这将从图像中提取文本并将其存储在text变量中。

步骤5：可选配置

你可以配置 pytesseract 以使用特定的 OCR 参数，例如语言和页面分割模式。

例如：

# Set language (default is English)
pytesseract.pytesseract.tesseract_cmd = r'/path/to/tesseract'
tessdata_dir_config = '--tessdata-dir "/usr/share/tesseract-ocr/4.00/tessdata"'
text = pytesseract.image_to_string('image.jpg', config=tessdata_dir_config)

步骤6：显示结果

最后，你可以根据需要打印或处理提取的文本：

print(text)

这些步骤将帮助你快速将 Pytesseract 集成到 Python 环境中，以便你可以使用 OCR 从照片中提取文本。请记住，许多变量（如语言、文本复杂性和图像质量）都会影响 OCR 的准确性。对于特定使用情况，修改参数和准备照片可以帮助提高 OCR 准确性。

7. OpenCV

OpenCV 由英特尔创建，并由全球开发者社区不断更新。它是计算机视觉和机器学习的重要工具。可用于各种用途，例如图像处理、对象检测、人脸识别、增强现实和机器人技术。它提供了广泛的功能和技术。

OpenCV 的 Python 接口有助于快速开发和原型设计，其跨平台兼容性保证可在多个系统上访问。

OpenCV 是计算机视觉的基础库，可与其他 Python 库（如 NumPy、SciPy 和 TensorFlow）无缝集成。这使开发人员能够在一系列领域设计创新应用程序。

安装和实施 OpenCV 的步骤

安装库并利用其功能执行不同的计算机视觉任务构成了 OpenCV 的实现。以下是如何在 Python 中使用 OpenCV 处理图像的简单说明：

步骤1：安装OpenCV

使用 pip 在你的 Python 环境中安装 OpenCV 库。

pip install opencv-python

步骤2：导入OpenCV

在你的 Python 脚本或笔记本中导入 OpenCV 库：

import cv2

步骤3：读取图像

使用cv2.imread()函数从文件读取图像：

# Read an image from file
image = cv2.imread('image.jpg')

步骤4：显示图像

使用cv2.imshow()函数在窗口中显示图像：

# Display the image in a window
cv2.imshow('Image', image)

步骤5：等待用户输入

使用 cv2.waitKey() 函数等待按键关闭窗口：

# Wait for a key press and close the window
cv2.waitKey(0)
cv2.destroyAllWindows()

步骤6：执行图像处理（可选）

你可以使用各种 OpenCV 函数执行图像处理任务，例如调整大小、裁剪、过滤等：

# Resize the image
resized_image = cv2.resize(image, (width, height))

# Convert the image to grayscale
gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

# Apply Gaussian blur to the image
blurred_image = cv2.GaussianBlur(image, (5, 5), 0)

步骤7：保存处理后的图像（可选）

使用cv2.imwrite()函数将处理后的图像保存到文件：

# Save the processed image to file
cv2.imwrite('processed_image.jpg', processed_image)

通过遵循这些步骤，你可以轻松地在 Python 环境中实现 OpenCV 来执行各种图像处理任务。OpenCV 提供了广泛的功能和能力，允许你处理图像、检测对象、跟踪运动等等。

尝试不同的函数和参数将帮助你探索 OpenCV 在计算机视觉应用中的全部潜力。

8. Amazon Textract

Amazon Textract 是 Amazon Web Services (AWS) 提供的一项机器学习服务，可高效地从文档中提取文本和数据。它使用高级算法来识别和分析结构化数据，包括文本、表格和表单。它对财务报告和发票特别有用。

Textract 可自动提取键值对和表单数据，从而简化数据输入和处理工作流程。它还提供高级文档分析功能。

Amazon Textract 与其他 AWS 服务集成，确保可扩展性、高性能和可靠性。它还为金融、医疗保健、法律和政府等各个领域的文档处理提供了安全的环境。

安装和实施 Amazon Textract 的步骤

实施 Amazon Textract 涉及使用 AWS SDK 与 Textract API 交互。

以下是在 Python 中实施 Amazon Textract 的步骤的高级概述：

步骤 1：设置 AWS 凭证

确保你已配置具有适当权限的 AWS 凭证以访问 Textract 服务。

步骤2：安装AWS SDK

使用 pip 安装适用于 Python (Boto3) 的 AWS SDK：

pip install boto3

步骤3：初始化 Textract 客户端

使用 Boto3 库和你的 AWS 凭证创建 Textract 客户端对象：

import boto3

# Initialize Textract client
textract_client = boto3.client('textract', region_name='your-region', aws_access_key_id='your-access-key-id', aws_secret_access_key='your-secret-access-key')

步骤4：处理文件

使用Textract客户端的analyze_document()方法分析文档，提取文本和数据：

# Process document
response = textract_client.analyze_document(Document={'S3Object': {'Bucket': 'your-bucket-name', 'Name': 'your-document-key'}}, FeatureTypes=['TABLES', 'FORMS'])

这将返回包含从文档中提取的文本、表格和表单的响应。

步骤5：访问提取的数据

可以从响应对象中访问提取的文本、表格和表单，并根据需要进一步处理：

# Extract text
extracted_text = response['Blocks']

# Extract tables
extracted_tables = [block for block in extracted_text if block['BlockType'] == 'TABLE']

# Extract forms
extracted_forms = [block for block in extracted_text if block['BlockType'] == 'KEY_VALUE_SET']

步骤6：处理错误和异常

实现错误处理，以优雅地处理文档处理过程中可能发生的异常和错误：

try:
    response = textract_client.analyze_document(Document={'S3Object': {'Bucket': 'your-bucket-name', 'Name': 'your-document-key'}}, FeatureTypes=['TABLES', 'FORMS'])
except Exception as e:
    print(f'Error processing document: {e}')

步骤7：进一步处理与整合

根据你的应用程序要求，你可能需要进一步处理提取的文本、表格和表单，并将其集成到你的工作流程或应用程序中。

通过遵循这些步骤，你可以在 Python 应用程序中实施 Amazon Textract，以从存储在 Amazon S3 中的文档中提取文本和数据。

请务必参考 AWS 文档以获取有关 Textract API 及其用法的详细信息。

结论

光学字符识别 (OCR) 彻底改变了计算机文本理解，支持各种应用。Python 提供了八个顶级 OCR 库，每个库都具有独特的功能。EasyOCR 易于使用，Tesseract 准确，Amazon Textract 高效。

OCR 库可满足各种需求和用例，可自动执行任务、简化工作流程并从非结构化数据中提取有价值的见解。随着机器学习和计算机视觉的进步，OCR 的未来充满创新和增强的光明前景。

☆ END ☆

如果看到这里，说明你喜欢这篇文章，请转发、点赞。微信搜索「uncle_pn」，欢迎添加小编微信「 woshicver」，每日朋友圈更新一篇高质量博文。

↓扫描二维码添加小编↓

你可能感兴趣的:(python,ocr,开发语言)

理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
python os.environ 江湖偌大 python 深度学习
os.environ['TF_CPP_MIN_LOG_LEVEL']='0'#默认值，输出所有信息os.environ['TF_CPP_MIN_LOG_LEVEL']='1'#屏蔽通知信息（INFO）os.environ['TF_CPP_MIN_LOG_LEVEL']='2'#屏蔽通知信息和警告信息（INFO\WARNING）os.environ['TF_CPP_MIN_LOG_LEVEL']='
Python中os.environ基本介绍及使用方法鹤冲天Pro #Python python 服务器开发语言
文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
python是什么意思中文-在python中%是什么意思编程大乐趣
Python中%有两种：1、数值运算：%代表取模，返回除法的余数。如：>>>7%212、%操作符（字符串格式化，stringformatting），说明如下：%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+，-，''或0。+表示右对齐。-表示左对齐。''为一个空格，表示在正数的左侧填充一个空格，从而与负数对齐。0表示使用0填
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
python八股文面试题分享及解析(1) Shawn________ python
#1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
Python快速入门 —— 第三节：类与对象孤华暗香 Python快速入门 python 开发语言
第三节：类与对象目标：了解面向对象编程的基础概念，并学会如何定义类和创建对象。内容：类与对象：定义类：class关键字。类的构造函数：__init__()。类的属性和方法。对象的创建与使用。示例：classStudent:def__init__(self,name,age,major):self.name&#
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
Python 实现图片裁剪（附代码） | Python工具剑客阿良_ALiang
前言本文提供将图片按照自定义尺寸进行裁剪的工具方法，一如既往的实用主义。环境依赖ffmpeg环境安装，可以参考我的另一篇文章：windowsffmpeg安装部署_阿良的博客-CSDN博客本文主要使用到的不是ffmpeg，而是ffprobe也在上面这篇文章中的zip包中。ffmpy安装：pipinstallffmpy-ihttps://pypi.douban.com/simple代码不废话了，上代码
【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
Python爬虫解析工具之xpath使用详解 eqa11 python 爬虫开发语言
文章目录Python爬虫解析工具之xpath使用详解一、引言二、环境准备1、插件安装2、依赖库安装三、xpath语法详解1、路径表达式2、通配符3、谓语4、常用函数四、xpath在Python代码中的使用1、文档树的创建2、使用xpath表达式3、获取元素内容和属性五、总结Python爬虫解析工具之xpath使用详解一、引言在Python爬虫开发中，数据提取是一个至关重要的环节。xpath作为一门
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
《Python数据分析实战终极指南》 xjt921122 python 数据分析开发语言
对于分析师来说，大家在学习Python数据分析的路上，多多少少都遇到过很多大坑**，有关于技能和思维的**：Excel已经没办法处理现有的数据量了，应该学Python吗？找了一大堆Python和Pandas的资料来学习，为什么自己动手就懵了？跟着比赛类公开数据分析案例练了很久，为什么当自己面对数据需求还是只会数据处理而没有分析思路？学了对比、细分、聚类分析，也会用PEST、波特五力这类分析法，为啥
Python中深拷贝与浅拷贝的区别 yuxiaoyu.
转自：http://blog.csdn.net/u014745194/article/details/70271868定义：在Python中对象的赋值其实就是对象的引用。当创建一个对象，把它赋值给另一个变量的时候，python并没有拷贝这个对象，只是拷贝了这个对象的引用而已。浅拷贝：拷贝了最外围的对象本身，内部的元素都只是拷贝了一个引用而已。也就是，把对象复制一遍，但是该对象中引用的其他对象我不复
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python编译器鹿鹿~ Python编译器 Python python 开发语言后端
嘿嘿嘿我又来了啊有些小盆友可能不知道Python其实是有编译器的，也就是PyCharm。你们可能会问到这个是干嘛的又不可以吃也不可以穿好像没有什么用，其实你还说对了这个还真的不可以吃也不可以穿，但是它用来干嘛的呢。用来编译你所打出的代码进行运行（可能这里说的有点不对但是只是个人认为）现在我们来说说PyCharm是用来干嘛的。PyCharm是一种PythonIDE，带有一整套可以帮助用户在使用Pyt
一文掌握python面向对象魔术方法（二）程序员neil python python 开发语言
接上篇：一文掌握python面向对象魔术方法（一）-CSDN博客目录六、迭代和序列化：1、__iter__(self):定义迭代器，使得类可以被for循环迭代。2、__getitem__(self,key):定义索引操作，如obj[key]。3、__setitem__(self,key,value):定义赋值操作，如obj[key]=value。4、__delitem__(self,key):定义
一文掌握python常用的list（列表）操作程序员neil python python 开发语言
目录一、创建列表1.直接创建列表：2.使用list()构造器3.使用列表推导式4.创建空列表二、访问列表元素1.列表支持通过索引访问元素，索引从0开始：2.还可以使用切片操作访问列表的一部分：三、修改列表元素四、添加元素1.append()：在末尾添加元素2.insert()：在指定位置插入元素五、删除元素1.del：删除指定位置的元素2.remove()：删除指定值的第一个匹配项3.pop()：
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
python中的深拷贝与浅拷贝 anshejd70787 python
深拷贝和浅拷贝浅拷贝的时候，修改原来的对象，浅拷贝的对象不会发生改变。1、对象的赋值对象的赋值实际上是对象之间的引用：当创建一个对象，然后将这个对象赋值给另外一个变量的时候，python并没有拷贝这个对象，而只是拷贝了这个对象的引用。当对对象做赋值或者是参数传递或者作为返回值的时候，总是传递原始对象的引用，而不是一个副本。如下所示：>>>aList=["kel","abc",123]>>>bLis
用Python实现简单的猜数字游戏程序媛了了 python 游戏 java
猜数字游戏代码：importrandomdefpythonit():a=random.randint(1,100)n=int(input("输入你猜想的数字："))whilen!=a:ifn>a:print("很遗憾，猜大了")n=int(input("请再次输入你猜想的数字："))elifna::如果玩家猜的数字n大于随机数字a，则输出"很遗憾，猜大了"，并提示玩家再次输入。elifn
用Python实现读取统计单词个数程序媛了了 python 游戏 java
完整实例代码：fromcollectionsimportCounterdefpythonit():danci={}withopen("pythonit.txt","r",encoding="utf-8")asf:foriinf:words=i.strip().split()forwordinwords:ifwordnotindanci:danci[word]=1else:danci[word]+=
springmvc 下 freemarker页面枚举的遍历输出杨白白 enum freemarker
spring mvc freemarker 中遍历枚举 1枚举类型有一个本地方法叫values（），这个方法可以直接返回枚举数组。所以可以利用这个遍历。 enum public enum BooleanEnum { TRUE(Boolean.TRUE, "是"), FALSE(Boolean.FALSE, "否");
实习简要总结 byalias 工作
来白虹不知不觉中已经一个多月了，因为项目还在需求分析及项目架构阶段，自己在这段时间都是在学习相关技术知识，现在对这段时间的工作及学习情况做一个总结：（1）工作技能方面大体分为两个阶段，Java Web 基础阶段和Java EE阶段 1）Java Web阶段在这个阶段，自己主要着重学习了 JSP, Servlet, JDBC, MySQL，这些知识的核心点都过了一遍，也
Quartz——DateIntervalTrigger触发器 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208559 一.概述 simpleTrigger 内部实现机制是通过计算间隔时间来计算下次的执行时间，这就导致他有不适合调度的定时任务。例如我们想每天的 1：00AM 执行任务，如果使用 SimpleTrigger，间隔时间就是一天。注意这里就会有一个问题，即当有 misfired 的任务并且恢复执行时，该执行时间
Unix快捷键 18289753290 unix Unix；快捷键;
复制，删除，粘贴： dd:删除光标所在的行 &nbs
获取Android设备屏幕的相关参数酷的飞上天空 android
包含屏幕的分辨率以及屏幕宽度的最大dp 高度最大dp TextView text = (TextView)findViewById(R.id.text); DisplayMetrics dm = new DisplayMetrics(); text.append("getResources().ge
要做物联网？先保护好你的数据蓝儿唯美数据
根据Beecham Research的说法，那些在行业中希望利用物联网的关键领域需要提供更好的安全性。在Beecham的物联网安全威胁图谱上，展示了那些可能产生内外部攻击并且需要通过快速发展的物联网行业加以解决的关键领域。 Beecham Research的技术主管Jon Howes说：“之所以我们目前还没有看到与物联网相关的严重安全事件，是因为目前还没有在大型客户和企业应用中进行部署，也就
Java取模（求余）运算随便小屋 java
整数之间的取模求余运算很好求，但几乎没有遇到过对负数进行取模求余，直接看下面代码： /** * * @author Logic * */ public class Test { public static void main(String[] args) { // TODO A
SQL注入介绍 aijuans sql注入
二、SQL注入范例这里我们根据用户登录页面 <form action="" > 用户名：<input type="text" name="username"><br/> 密码：<input type="password" name="passwor
优雅代码风格 aoyouzi 代码
总结了几点关于优雅代码风格的描述：代码简单：不隐藏设计者的意图，抽象干净利落，控制语句直截了当。接口清晰：类型接口表现力直白，字面表达含义，API 相互呼应以增强可测试性。依赖项少：依赖关系越少越好，依赖少证明内聚程度高，低耦合利于自动测试，便于重构。没有重复：重复代码意味着某些概念或想法没有在代码中良好的体现，及时重构消除重复。战术分层：代码分层清晰，隔离明确，
布尔数组百合不是茶 java 布尔数组
androi中提到了布尔数组; 布尔数组默认的是false, 并且只会打印false或者是true 布尔数组的例子; 根据字符数组创建布尔数组 char[] c = {'p','u','b','l','i','c'}; //根据字符数组的长度创建布尔数组的个数 boolean[] b = new bool
web.xml之welcome-file-list、error-page bijian1013 java web.xml servlet error-page
welcome-file-list 1.定义： <welcome-file-list> <welcome-file>login.jsp</welcome> </welcome-file-list> 2.作用：用来指定WEB应用首页名称。 error-page1.定义： <error-page&g
richfaces 4 fileUpload组件删除上传的文件 sunjing clear Richfaces 4 fileupload
页面代码 <h:form id="fileForm"> <rich:
技术文章备忘 bit1129 技术文章
Zookeeper http://wenku.baidu.com/view/bab171ffaef8941ea76e05b8.html http://wenku.baidu.com/link?url=8thAIwFTnPh2KL2b0p1V7XSgmF9ZEFgw4V_MkIpA9j8BX2rDQMPgK5l3wcs9oBTxeekOnm5P3BK8c6K2DWynq9nfUCkRlTt9uV
org.hibernate.hql.ast.QuerySyntaxException: unexpected token: on near line 1解决方案白糖_ Hibernate
文章摘自：http://blog.csdn.net/yangwawa19870921/article/details/7553181 在编写HQL时，可能会出现这种代码： select a.name,b.age from TableA a left join TableB b on a.id=b.id 如果这是HQL，那么这段代码就是错误的，因为HQL不支持
sqlserver按照字段内容进行排序 bozch 按照内容排序
在做项目的时候，遇到了这样的一个需求：从数据库中取出的数据集，首先要将某个数据或者多个数据按照地段内容放到前面显示，例如:从学生表中取出姓李的放到数据集的前面； select * fro
编程珠玑-第一章-位图排序 bylijinnan java 编程珠玑
import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import java.io.IOException; import java.io.Writer; import java.util.Random; public class BitMapSearch {
Java关于==和equals chenbowen00 java
关于==和equals概念其实很简单，一个是比较内存地址是否相同，一个比较的是值内容是否相同。虽然理解上不难，但是有时存在一些理解误区，如下情况： 1、 String a = "aaa"; a=="aaa"; ==> true 2、 new String("aaa")==new String("aaa
[IT与资本]软件行业需对外界投资热情保持警惕 comsci it
我还是那个看法,软件行业需要增强内生动力,尽量依靠自有资金和营业收入来进行经营,避免在资本市场上经受各种不同类型的风险,为企业自主研发核心技术和产品提供稳定,温和的外部环境... 如果我们在自己尚未掌握核心技术之前,企图依靠上市来筹集资金,然后使劲往某个领域砸钱,然
oracle 数据块结构 daizj oracle 块数据块块结构行目录
oracle 数据块是数据库存储的最小单位，一般为操作系统块的N倍。其结构为：块头－－〉空行－－〉数据，其实际为纵行结构。块的标准大小由初始化参数DB_BLOCK_SIZE指定。具有标准大小的块称为标准块（Standard Block）。块的大小和标准块的大小不同的块叫非标准块（Nonstandard Block）。同一数据库中，Oracle9i及以上版本支持同一数据库中同时使用标
github上一些觉得对自己工作有用的项目收集 dengkane github
github上一些觉得对自己工作有用的项目收集技能类 markdown语法中文说明回到顶部全文检索 elasticsearch bigdesk elasticsearch管理插件回到顶部 nosql mapdb 支持亿级别map, list, 支持事务. 可考虑做为缓存使用 C
初二上学期难记单词二 dcj3sjt126com english word
dangerous 危险的 panda 熊猫 lion 狮子 elephant 象 monkey 猴子 tiger 老虎 deer 鹿 snake 蛇 rabbit 兔子 duck 鸭 horse 马 forest 森林 fall 跌倒；落下 climb 爬；攀登 finish 完成；结束 cinema 电影院；电影 seafood 海鲜；海产食品 bank 银行
8、mysql外键(FOREIGN KEY)的简单使用 dcj3sjt126com mysql
一、基本概念 1、MySQL中“键”和“索引”的定义相同，所以外键和主键一样也是索引的一种。不同的是MySQL会自动为所有表的主键进行索引，但是外键字段必须由用户进行明确的索引。用于外键关系的字段必须在所有的参照表中进行明确地索引，InnoDB不能自动地创建索引。 2、外键可以是一对一的，一个表的记录只能与另一个表的一条记录连接，或者是一对多的，一个表的记录与另一个表的多条记录连接。 3、如
java循环标签 Foreach shuizhaosi888 标签 java循环 foreach
1. 简单的for循环 public static void main(String[] args) { for (int i = 1, y = i + 10; i < 5 && y < 12; i++, y = i * 2) { System.err.println("i=" + i + " y="
Spring Security（05）——异常信息本地化 234390216 exception Spring Security 异常信息本地化
异常信息本地化 Spring Security支持将展现给终端用户看的异常信息本地化，这些信息包括认证失败、访问被拒绝等。而对于展现给开发者看的异常信息和日志信息（如配置错误）则是不能够进行本地化的，它们是以英文硬编码在Spring Security的代码中的。在Spring-Security-core-x
DUBBO架构服务端告警Failed to send message Response javamingtingzhao 架构 DUBBO
废话不多说，警告日志如下，不知道有哪位遇到过，此异常在服务端抛出(服务器启动第一次运行会有这个警告)，后续运行没问题，找了好久真心不知道哪里错了。 WARN 2015-07-18 22:31:15,272 com.alibaba.dubbo.remoting.transport.dispatcher.ChannelEventRunnable.run(84)
JS中Date对象中几个用法 leeqq JavaScript Date 最后一天
近来工作中遇到这样的两个需求 1. 给个Date对象，找出该时间所在月的第一天和最后一天 2. 给个Date对象，找出该时间所在周的第一天和最后一天需求1中的找月第一天很简单，我记得api中有setDate方法可以使用使用setDate方法前，先看看getDate var date = new Date(); console.log(date); // Sat J
MFC中使用ado技术操作数据库你不认识的休道人 sql mfc
1.在stdafx.h中导入ado动态链接库 #import"C:\Program Files\Common Files\System\ado\msado15.dll" no_namespace rename("EOF","end")2.在CTestApp文件的InitInstance()函数中domodal之前写::CoIniti
Android Studio加速 rensanning android studio
Android Studio慢、吃内存！启动时后会立即通过Gradle来sync & build工程。（1）设置Android Studio a) 禁用插件 File -> Settings... Plugins 去掉一些没有用的插件。比如：Git Integration、GitHub、Google Cloud Testing、Google Cloud
各数据库的批量Update操作 tomcat_oracle java oracle sql mysql sqlite
MyBatis的update元素的用法与insert元素基本相同，因此本篇不打算重复了。本篇仅记录批量update操作的 sql语句，懂得SQL语句，那么MyBatis部分的操作就简单了。　　注意：下列批量更新语句都是作为一个事务整体执行，要不全部成功，要不全部回滚。 MSSQL的SQL语句　WITH R AS（　　SELECT 'John' as name, 18 as
html禁止清除input文本输入缓存 xp9802 input
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; eg: <input type="text" autocomplete="off" name

Python中用于从图像中提取文本的8大OCR库

介绍

目录

1. EasyOCR

安装和实施 EasyOCR 的步骤

步骤1：安装Python

步骤2：安装 EasyOCR

步骤3：安装依赖项

步骤4：使用EasyOCR

2. Doctr

安装和实施 Doctr 的步骤

步骤1：安装Doctr

步骤2：导入必要的模块

步骤3：加载文档

步骤4：执行文档理解任务

步骤 5：与你的工作流程整合

3. Keras-OCR

安装和实施 Keras-OCR 的步骤

步骤1：安装Keras-OCR

步骤2：导入必要的模块

步骤3：加载预训练模型

步骤4：进行文本识别

步骤5：显示结果

步骤6：集成

4. Tesseract

安装和实施 Tesseract 的步骤

步骤1：安装Tesseract

步骤2：安装 pytesseract

步骤3：导入 pytesseract

步骤4：设置 Tesseract 路径（可选）

步骤5：执行OCR

步骤6：显示结果

5. GOCR

安装和实施 GOCR 的步骤

步骤1：安装GOCR

步骤2：准备图像

步骤3：从命令行运行该库

步骤4：处理输出

6. Pytesseract

安装和实施 Pytesseract 的步骤

步骤1：安装Tesseract

步骤2：安装 pytesseract

步骤3：导入 pytesseract

步骤4：对图像执行OCR

步骤5：可选配置

步骤6：显示结果

7. OpenCV

安装和实施 OpenCV 的步骤

步骤1：安装OpenCV

步骤2：导入OpenCV

步骤3：读取图像

步骤4：显示图像

步骤5：等待用户输入

步骤6：执行图像处理（可选）

步骤7：保存处理后的图像（可选）

8. Amazon Textract

安装和实施 Amazon Textract 的步骤

步骤 1：设置 AWS 凭证

步骤2：安装AWS SDK

步骤3：初始化 Textract 客户端

步骤4：处理文件

步骤5：访问提取的数据

步骤6：处理错误和异常

步骤7：进一步处理与整合

结论

你可能感兴趣的:(python,ocr,开发语言)