有时有味

PaddleOCR #PP-OCR常见异常扫雷

异常一：ModuleNotFoundError: No module named ‘tools.infer’

实验案例： PaddleOCR #使用PaddleOCR进行光学字符识别（PP-OCR文本检测识别）
参考代码： 图片文本检测实验时，运行代码出现异常：ModuleNotFoundError: No module named ‘tools.infer’

# Importing required libraries.
import cv2
import os
import numpy as np
import sys
import re
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.image as img
import time
import numpy
 
# Importing functions and methods for OCR
from tools.infer.predict_rec import *
import tools.infer.utility as utility
from ppocr.postprocess import build_post_process
from ppocr.utils.logging import get_logger
from ppocr.utils.utility import get_image_file_list, check_and_read_gif

异常信息：

    import tools.infer.utility as utility
ModuleNotFoundError: No module named 'tools.infer'

异常原因： 这是由于 python 本来有个 tools，和 paddleocr 内部的 tools 冲突导致。可能是 paddleocr 版本问题，也可能是 python 环境问题。
解决方法：
方法1：找到 paddleocr 文件把所有导入 tools.infer 包的地方的前面加上 paddleocr. 即为 paddleocr.tools.infer
方法2：把 paddleocr/tools 下面的 infer 文件夹移动到 python 本身的 tools 里面

试过方法1，未能成功。
但按下面的方式，将当前目录添加到 python 的模块搜索路径中，可解决脚本方式出现这个异常：

# Importing required libraries.
import cv2
import os
import numpy as np
import sys
import re
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.image as img
import time
import numpy

# 获取当前脚本文件的绝对路径所在的目录路径，并将其赋值给变量 __dir__。
__dir__ = os.path.dirname(os.path.abspath(__file__))
# 将当前脚本文件的绝对路径所在的目录路径添加到Python的模块搜索路径中。
sys.path.append(__dir__)
# 将当前脚本文件的上一级目录路径添加到Python的模块搜索路径中。os.path.join(__dir__, '..') 用于获取上一级目录的路径，os.path.abspath() 用于获取绝对路径。
sys.path.insert(0, os.path.abspath(os.path.join(__dir__, '..')))

import importlib
tools = importlib.import_module('.', 'tools')
ppocr = importlib.import_module('.', 'ppocr')
 
# Importing functions and methods for OCR
from tools.infer.predict_rec import *
import tools.infer.utility as utility
from ppocr.postprocess import build_post_process
from ppocr.utils.logging import get_logger
from ppocr.utils.utility import get_image_file_list, check_and_read_gif

方法2亲测可行：
1）CMD 通过命令确认本地 python 的 tools 包位置

2）把 paddleocr/tools 下面的 infer 文件夹移动到 python 本身的 tools 文件夹中

注：场景2，CMD 方式的异常场景的原因可能各有不同，主要是因为本地安装的 paddleocr 版本各异。但主要原因可归为版本不兼容，可根据异常提示逐步补全依赖目录或文件解决，但比较繁琐。

异常二：ImportError: cannot import name ‘check_and_read_gif’ from ‘ppocr.utils.utility’

实验案例： PaddleOCR #使用PaddleOCR进行光学字符识别（PP-OCR文本检测识别）

Traceback (most recent call last):
  File "D:\Tp_Mylocal\20_Install\python-3.9.13\lib\runpy.py", line 197, in _run_module_as_main
    return _run_code(code, main_globals, None,
  File "D:\Tp_Mylocal\20_Install\python-3.9.13\lib\runpy.py", line 87, in _run_code
    exec(code, run_globals)
  File "D:\Tp_Mylocal\20_Install\python-3.9.13\Scripts\paddleocr.exe\__main__.py", line 4, in <module>
  File "D:\Tp_Mylocal\20_Install\python-3.9.13\lib\site-packages\paddleocr\__init__.py", line 14, in <module>
    from .paddleocr import *
  File "D:\Tp_Mylocal\20_Install\python-3.9.13\lib\site-packages\paddleocr\paddleocr.py", line 37, in <module>
    from tools.infer import predict_system
  File "D:\Tp_Mylocal\20_Install\python-3.9.13\lib\site-packages\tools\infer\predict_system.py", line 32, in <module>
    import tools.infer.predict_rec as predict_rec
  File "D:\Tp_Mylocal\20_Install\python-3.9.13\lib\site-packages\tools\infer\predict_rec.py", line 33, in <module>
    from ppocr.utils.utility import get_image_file_list, check_and_read_gif
ImportError: cannot import name 'check_and_read_gif' from 'ppocr.utils.utility' (D:\Tp_Mylocal\20_Install\python-3.9.13\lib\site-packages\paddleocr\ppocr\utils\utility.py)

亦或者：

Traceback (most recent call last):
  File "D:\Tp_Mylocal\20_Install\python-3.9.13\lib\runpy.py", line 197, in _run_module_as_main
    return _run_code(code, main_globals, None,
  File "D:\Tp_Mylocal\20_Install\python-3.9.13\lib\runpy.py", line 87, in _run_code
    exec(code, run_globals)
  File "D:\Tp_Mylocal\20_Install\python-3.9.13\Scripts\paddleocr.exe\__main__.py", line 4, in <module>
  File "D:\Tp_Mylocal\20_Install\python-3.9.13\lib\site-packages\paddleocr\__init__.py", line 14, in <module>
    from .paddleocr import *
  File "D:\Tp_Mylocal\20_Install\python-3.9.13\lib\site-packages\paddleocr\paddleocr.py", line 41, in <module>
    from ppocr.utils.utility import check_and_read, get_image_file_list
ImportError: cannot import name 'check_and_read' from 'ppocr.utils.utility' (D:\Tp_Mylocal\20_Install\python-3.9.13\lib\site-packages\ppocr\utils\utility.py)

异常原因： 此问题八成是你安装的 PaddleOCR 版本不兼容产生的问题，比如可能你通过下面的命令成功安装了 paddleocr、paddlepaddle

pip install paddlepaddle paddleocr

Successfully installed paddleocr-2.6.1.3 paddlepaddle-2.4.2

但通过 CMD 运行时，总是有异常说 xxx 包找不到，或者 xxx 方法引入不到。根本原因就是你执行的路径下的异常文件代码中（比如上述 path\python-3.x.xx\lib\site-packages\paddleocr\paddleocr.py）确实没有这些需要的目录或文件

解决方案：
方案1： 重新安装版本
1）使用 CMD 命令 pip uninstall paddlepaddle paddleocr 卸载 paddleocr
2）安装指定版本的 paddlepaddle

pip install paddlepaddle==2.4.2 -i https://pypi.tuna.tsinghua.edu.cn/simple

3）安装指定版本的 paddleocr

pip install paddleocr==2.5.0.3

注：如果你本地下载过 opencv、paddleocr 的源码，可通过 paddleocr.py 代码查看你应该需要安装的 paddleocr 版本号：

方案2： 补全依赖目录或文件
根据异常提示，将缺省的文件或方法从源码中拷贝到 CMD 执行环境中，逐步补全依赖目录或文件解决，但比较繁琐。
比如在 paddleocr-2.6.1.3 版本中 paddleocr.py 代码的依赖是

from ppocr.utils.utility import check_and_read, get_image_file_list

但在 ppocr.utils.utility 这个对象中提供的函数却是 check_and_read_gif，自然是会执行异常。

通过方案1或方案2操作后，可通过 paddleocr --help 校验环境是否OK。

异常三：Please use PaddlePaddle with GPU version

实验案例： PaddleOCR #使用PaddleOCR进行光学字符识别（PP-OCR文本检测识别）

D:\Ct_ iSpace\Tan\opencv\learnopencv-master\Optical-Character-Recognition-using-PaddleOCR\PaddleOCR>python ./tools/infer/predict_det.py --image_dir="./doc/imgs/00018069.jpg" --det_model_dir="./inference/ch_PP-OCRv3_rec_infer/"
E0608 16:27:13.135995 15300 analysis_config.cc:110] Please use PaddlePaddle with GPU version.

异常原因： 实验机器不支持GPU模式。
解决方案：
确保你已安装了 CPU 版本的 PaddlePaddle。
通过将 --use_gpu 参数设置为 False，您告诉 PaddleOCR 在 CPU 上运行，不使用 GPU，如：

paddleocr --image_dir ./doc/imgs/japan_2.jpg --use_angle_cls true --use_gpu false

异常四：ModuleNotFoundError: No module named ‘ppocr’

实验案例： PaddleOCR #使用PaddleOCR进行光学字符识别（PP-OCR文本检测识别）

    from ppocr.utils.logging import get_logger
ModuleNotFoundError: No module named 'ppocr'

异常信息：

    ppocr = importlib.import_module('.', 'ppocr')
  File "D:\Tp_Mylocal\20_Install\python-3.9.13\lib\importlib\__init__.py", line 127, in import_module
    return _bootstrap._gcd_import(name[level:], package, level)
  File "", line 1030, in _gcd_import
  File "", line 1007, in _find_and_load
  File "", line 984, in _find_and_load_unlocked
ModuleNotFoundError: No module named 'ppocr'

异常原因： ModuleNotFoundError: No module named ‘ppocr’ 错误表明您缺少了名为 ‘ppocr’ 的模块。这可能是由于以下原因之一导致的：

缺少依赖库： ‘ppocr’ 模块可能依赖其他库或模块。请确保您已经安装了所有必需的依赖库。您可以通过运行 pip install -r requirements.txt 命令安装项目所需的依赖库。
缺少 ‘ppocr’ 模块： 请确保 ‘ppocr’ 模块已经正确地安装在您的环境中。您可以使用 pip list 命令查看已安装的模块列表，确认 ‘ppocr’ 模块是否存在。
模块路径问题： 如果 ‘ppocr’ 模块不在默认的模块搜索路径中，您需要将其路径添加到 Python 搜索路径中。可以通过在脚本中添加以下代码来添加模块路径：

import sys
# 请确保将 /path/to/ppocr 替换为实际 'ppocr' 模块所在的路径
sys.path.append('/path/to/ppocr')

注意，请确保将 /path/to/ppocr 替换为实际 ‘ppocr’ 模块所在的路径。如果还是不行，可参考下面的解决方案：
解决方案：

# 获取当前脚本文件的绝对路径所在的目录路径，并将其赋值给变量 __dir__。
__dir__ = os.path.dirname(os.path.abspath(__file__))
# 将当前脚本文件的绝对路径所在的目录路径添加到Python的模块搜索路径中。
sys.path.append(__dir__)
# 将当前脚本文件的上一级目录路径添加到Python的模块搜索路径中。os.path.join(__dir__, '..') 用于获取上一级目录的路径，os.path.abspath() 用于获取绝对路径。
sys.path.insert(0, os.path.abspath(os.path.join(__dir__, '..')))

注：与异常一类似。

异常五：UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\xae’ in position 2: illegal multibyte sequence

实验案例： PaddleOCR #使用PaddleOCR进行光学字符识别 - OCR模型对比
异常现象： 在使用 PaddlePaddle-OCRv2 (PP-OCRv2) 进行实验时，出现异常：

[2023/06/09 19:06:19] ppocr INFO: Predicts of ../COCO-text/COCO_test\1087034.jpg:('皖S', 0.4052684009075165)
[2023/06/09 19:06:19] ppocr INFO: Predicts of ../COCO-text/COCO_test\1087141.jpg:('S AVe', 0.7147024273872375)
[2023/06/09 19:06:19] ppocr INFO: Predicts of ../COCO-text/COCO_test\1087170.jpg:('®', 0.054067403078079224)
Traceback (most recent call last):
  File "d:\Ct_ iSpace\Tan\opencv\learnopencv-master\Optical-Character-Recognition-using-PaddleOCR\PaddleOCR\applications\pp_ocr_v2.py", line 156, in <module>
    rec(utility.parse_args(), out_path, input_org, rec_model_dir, show = False)
  File "d:\Ct_ iSpace\Tan\opencv\learnopencv-master\Optical-Character-Recognition-using-PaddleOCR\PaddleOCR\applications\pp_ocr_v2.py", line 106, in rec
    f.write(str(rec_res[ino]))
UnicodeEncodeError: 'gbk' codec can't encode character '\xae' in position 2: illegal multibyte sequence

异常原因： 这个错误是由于在写入文件时遇到了无法编码的字符导致的。根据错误信息，似乎是在将结果写入文件时遇到了特殊字符 ‘\xae’，导致无法使用 ‘gbk’ 编码进行写入。

解决方案： 尝试修改文件编码方式，将其设置为支持特殊字符的编码方式，例如 encoding='utf-8' 。比如，如果这里现在是写文件遇到特殊字符异常，那么就在读文件时将特殊字符进行 UTF-8 读取。

for ino in range(len(img_list)):
    logger.info("Predicts of {}:{}".format(valid_image_file_list[ino], rec_res[ino]))
    if save:
        cv2.imwrite(os.path.join(out_path, valid_image_file_list[ino].split('/')[-1].split('.')[0] + '_rec' + '.jpg'), img_list[ino])
        with open(os.path.join(out_path, valid_image_file_list[ino].split('/')[-1].split('.')[0] + '.txt'), 'w', encoding='utf-8') as f:
            f.write(str(rec_res[ino]))

异常六：ValueError: not find model file path ./inference/rec_r50_vd_srn_train/inference.pdmodel

实验案例： PaddleOCR #使用PaddleOCR进行光学字符识别 - OCR模型对比

[2023/06/12 15:32:34] ppocr INFO: 开始 ...
yes
Traceback (most recent call last):
  File "d:\Ct_ iSpace\Tan\opencv\learnopencv-master\Optical-Character-Recognition-using-PaddleOCR\PaddleOCR\applications\pp_ocr_srn.py", line 156, in <module>
    rec(utility.parse_args(), out_path, input_org, rec_model_dir, rec_image_shape = '1, 64, 256', rec_char_type = 'en', rec_algorithm = 'SRN', show = False)
  File "d:\Ct_ iSpace\Tan\opencv\learnopencv-master\Optical-Character-Recognition-using-PaddleOCR\PaddleOCR\applications\pp_ocr_srn.py", line 68, in rec
    text_recognizer = TextRecognizer(args)
  File "d:\Ct_ iSpace\Tan\opencv\learnopencv-master\Optical-Character-Recognition-using-PaddleOCR\PaddleOCR\tools\infer\predict_rec.py", line 74, in __init__
    utility.create_predictor(args, 'rec', logger)
  File "d:\Ct_ iSpace\Tan\opencv\learnopencv-master\Optical-Character-Recognition-using-PaddleOCR\PaddleOCR\tools\infer\utility.py", line 174, in create_predictor
    raise ValueError("not find model file path {}".format(
ValueError: not find model file path ./inference/rec_r50_vd_srn_train/inference.pdmodel

异常原因： 该错误提示表明代码无法在指定路径 ./inference/rec_r50_vd_srn_train/inference.pdmodel 中找到所需的模型文件。
解决方案：
1）检查模型文件路径是否正确：确保模型文件 inference.pdmodel 存在于指定的路径 ./inference/rec_r50_vd_srn_train/ 下，并且路径名称的大小写与实际文件系统匹配。如果文件在这个目录下，那么就是相对路径不全导致找不到文件。
2）重新生成模型文件放于当前目前下。

异常七：TypeError: ‘<’ not supported between instances of ‘tuple’ and ‘float’

实验案例： PaddleOCR #使用PaddleOCR进行光学字符识别 - OCR模型对比
异常原因： OCR 图片识别结果的数据结构与源码需要解析取值的数据结构不兼容
解决方案： 移除 OCR 图片识别结果的外部一维

# 图片识别
result = ocr.ocr(img_path)
print("OCR 图片识别结果：", result)

# 通过使用 result = result[0] 移除外部的一维来解决 paddleocr\tools\infer\utility.py 文件中 draw_ocr 函数的 TypeError: '<' not supported between instances of 'tuple' and 'float'
result = result[0]
# print("移除一维后图片识别结果：", result)

# 保存可视化OCR检测识别结果
save_ocr(img_path, out_path, result, font)

注：异常现象的处理方式与异常八相反

异常八：TypeError: ‘float’ object is not subscriptable

实验案例： PaddleOCR #使用PaddleOCR进行光学字符识别 - OCR模型对比
异常原因： OCR 图片识别结果的数据结构与源码需要解析取值的数据结构不兼容

Traceback (most recent call last):
  File "d:\Ct_ iSpace\Tan\opencv\learnopencv-master\Optical-Character-Recognition-using-PaddleOCR\PaddleOCR\applications\ocr_img_apply.py", line 55, in <module>
    ocr_img(img_path)
  File "d:\Ct_ iSpace\Tan\opencv\learnopencv-master\Optical-Character-Recognition-using-PaddleOCR\PaddleOCR\applications\ocr_img_util.py", line 49, in ocr_img
    save_ocr(img_path, out_path, result, font)
  File "d:\Ct_ iSpace\Tan\opencv\learnopencv-master\Optical-Character-Recognition-using-PaddleOCR\PaddleOCR\applications\ocr_img_util.py", line 65, in save_ocr
    txts = [line[1][0] for line in result]
  File "d:\Ct_ iSpace\Tan\opencv\learnopencv-master\Optical-Character-Recognition-using-PaddleOCR\PaddleOCR\applications\ocr_img_util.py", line 65, in <listcomp>
    txts = [line[1][0] for line in result]
TypeError: 'float' object is not subscriptable

异常原因： OCR 图片识别结果的数据结构与源码需要解析取值的数据结构不兼容
解决方案： 直接使用 OCR 源码检测识别的结果进行可视化保存

def ocr_img(img_path):
  print("OCR 图片识别地址：", img_path)

  # 图片识别
  result = ocr.ocr(img_path)
  print("OCR 图片识别结果：", result)

  # 通过使用 result = result[0] 移除外部的一维来解决 paddleocr\tools\infer\utility.py 文件中 draw_ocr 函数的 TypeError: '<' not supported between instances of 'tuple' and 'float'
  # result = result[0]
  # print("移除一维后图片识别结果：", result)

  # 保存可视化OCR检测识别结果
  save_ocr(img_path, out_path, result, font)

注：异常现象的处理方式与异常六相反

异常九：AttributeError: module ‘numpy’ has no attribute ‘int’.

实验案例： PaddleOCR #使用PaddleOCR进行光学字符识别（PP-OCR文本检测识别）

Traceback (most recent call last):
  File "d:\Ct_ iSpace\Tan\opencv\learnopencv-master\Optical-Character-Recognition-using-PaddleOCR\PaddleOCR\applications\ocr_img_apply.py", line 55, in <module>
    ocr_img(img_path)
  File "d:\Ct_ iSpace\Tan\opencv\learnopencv-master\Optical-Character-Recognition-using-PaddleOCR\PaddleOCR\applications\ocr_img_util.py", line 41, in ocr_img
    result = ocr.ocr(img_path)
  File "d:\Ct_ iSpace\Tan\opencv\learnopencv-master\Optical-Character-Recognition-using-PaddleOCR\PaddleOCR\paddleocr.py", line 474, in ocr
    dt_boxes, rec_res = self.__call__(img, cls)
  File "d:\Ct_ iSpace\Tan\opencv\learnopencv-master\Optical-Character-Recognition-using-PaddleOCR\PaddleOCR\tools\infer\predict_system.py", line 69, in __call__
    dt_boxes, elapse = self.text_detector(img)
  File "d:\Ct_ iSpace\Tan\opencv\learnopencv-master\Optical-Character-Recognition-using-PaddleOCR\PaddleOCR\tools\infer\predict_det.py", line 242, in __call__
  File "d:\Ct_ iSpace\Tan\opencv\learnopencv-master\Optical-Character-Recognition-using-PaddleOCR\PaddleOCR\ppocr\postprocess\db_postprocess.py", line 188, in __call__
    boxes, scores = self.boxes_from_bitmap(pred[batch_index], mask,
  File "d:\Ct_ iSpace\Tan\opencv\learnopencv-master\Optical-Character-Recognition-using-PaddleOCR\PaddleOCR\ppocr\postprocess\db_postprocess.py", line 82, in boxes_from_bitmap
    score = self.box_score_fast(pred, points.reshape(-1, 2))
  File "d:\Ct_ iSpace\Tan\opencv\learnopencv-master\Optical-Character-Recognition-using-PaddleOCR\PaddleOCR\ppocr\postprocess\db_postprocess.py", line 140, in box_score_fast
    xmin = np.clip(np.floor(box[:, 0].min()).astype(np.int), 0, w - 1)
  File "D:\Tp_Mylocal\20_Install\python-3.9.13\lib\site-packages\numpy\__init__.py", line 305, in __getattr__
    raise AttributeError(__former_attrs__[attr])
AttributeError: module 'numpy' has no attribute 'int'.
`np.int` was a deprecated alias for the builtin `int`. To avoid this error in existing code, use `int` by itself. Doing this will not modify any behavior and is safe. When replacing `np.int`, you may wish to use e.g. `np.int64` or `np.int32` to specify the precision. If you 
wish to review your current use, check the release note link for additional information.
The aliases was originally deprecated in NumPy 1.20; for more details and guidance see the original release note at:
    https://numpy.org/devdocs/release/1.20.0-notes.html#deprecations

异常原因：
在较旧的 NumPy 版本（1.19及更早版本）中，np.int 是合法的别名。但是从 NumPy 1.20 版本开始，np.int 被弃用并引发了警告。从 NumPy 1.21 版本开始，np.int 完全被移除，不再可用。

因此，如果你使用的是 NumPy 1.20或更高版本，将 np.int 替换为 int 是推荐的做法。对于较旧的 NumPy 版本，np.int 仍然可用，但不推荐使用，建议迁移到使用 int 类型。

解决方案：

在代码中将 np.int 替换为 int。
如果代码中存在其他使用了 np.int 的地方，也需要进行相应的替换。
确保你正在使用最新版本的 NumPy 库。

可以使用以下命令升级到最新版本的 NumPy：

pip install --upgrade numpy

或者，升级到指定版本的 NumPy：

pip install numpy==1.21.1

注意：如果你的项目有其他依赖项依赖于较新的 NumPy 版本，降级 NumPy 可能会导致冲突。在执行降级操作之前，请确保你的项目不会受到这种影响，并仔细考虑可能的后果。

opencv源码参考文档： https://learnopencv.com/optical-character-recognition-using-paddleocr/

你可能感兴趣的:(OCR,机器学习,Python,ocr,python,opencv,文字识别,PaddleOCR)

ROS2使用Python开发动作通信 ct1027038527 python ROS2
1.创建接口节点cdchapt4_ws/ros2pkgcreaterobot_control_interfaces--build-typeament_cmake--destination-directorysrc--maintainer-name"joe"--maintainer-email"[email protected]"mkdir-psrc/robot_control_interfaces
Ubuntu下配置vim环境（python版本） a563562675 配置 vim
Ubuntu下配置vim环境（python版本）VundleVundle是一种vim扩展安装包管理器。有了Vundle，安装和更新包这种事情不费吹灰之力。安装Vundlegitclonehttps://github.com/gmarik/Vundle.vim.git~/.vim/bundle/Vundle.vim该命令将下载Vundle插件管理器，并将它放置在你的Vim编辑器bundles文件夹中
如何使用 Python 爬取多章节小说并保存为文本文件 BARRY_NINE python爬虫 python 开发语言
前言网络爬虫是一个非常有趣且实用的技术，尤其是在我们需要从网站上自动获取数据时。在这篇博客中，我将分享如何使用Python的requests和lxml库来编写一个简单的爬虫，从某个小说网站上爬取整本小说的章节内容，并将其保存为一个本地的文本文件。我们将介绍逐行的代码解析、爬取流程，以及如何处理特殊情况，比如爬取到最后一章时终止程序。使用的工具和库在这次项目中，我们主要用到以下几个Python库：r
使用 Python 爬虫爬取工作招聘和简历信息：全流程教程 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言信息可视化数据分析
随着互联网和大数据的快速发展，求职和招聘变得更加便利。招聘网站成为了职场求职者和企业之间的重要桥梁。通过爬取招聘网站的职位信息和求职简历数据，可以为企业招聘、人才挖掘以及求职者的职业规划提供重要数据支持。在本教程中，我们将详细介绍如何使用Python爬虫技术获取招聘网站的职位信息和求职者简历数据。包括从网站的抓取、数据解析、存储处理到分析展示等多个环节，帮助您快速掌握爬取招聘网站数据的全流程。目录
落地 dnn对象检测没学上了 dnn 人工智能神经网络
"C:\opencv\opencv\sources\samples\dnn\models.yml"下载opencv的深度模型框架，例如caffe，copyMobileNetSSD_deploy.prototxt和MobileNetSSD_deploy.caffemodel所在的位置，其中prototxt需要后面生成，这两个文件用于std::stringmodel_text_file和std::st
利用 OpenAI GPT、LangChain 和 Streamlit 创建自己的 PDF 问答系统 hj_caas 每日外文推荐 gpt langchain pdf
每日推荐一篇专注于解决实际问题的外文，精准翻译并深入解读其要点，助力读者培养实际问题解决和代码动手的能力。欢迎关注公众号原文标题：CreateYourOwnPDFQuestionAnsweringSystemwithOpenAIGPT,LangChain,andStreamlit原文地址：https://medium.com/python-in-plain-english/create-your-
利用python下载股票交易数据 weixin_30725315 python
前段时间玩Python时无意看到了获取股票交易数据的tushare模块，由于自己对股票交易挺有兴趣，加上现在又在做数据挖掘工作，故想先将股票数据下载到数据库中，以便日后分析：#导入需要用到的模块fromqueueimportQueueimportthreadingimportosimportdatetimeimporttushareastsfromsqlalchemyimportcreate_en
初五迎财神！——Python代码实现“元宝多多“，财神看了都说妙 MatpyMaster python
初五迎财神，讲究的是"抢头彩"：开市、扫穷、接元宝。祈求财运亨通、事业顺利。按照习俗，家家户户都会燃放鞭炮、点灯笼、摆设祭品，以示虔诚。下面小编基于Python，给大家安利了一款"元宝多多"小游戏，祝大家蛇年健康平安，吉祥如意。在新的一年中不断进步，永远快乐。”初五迎财神！——Python代码实现"元宝多多"，财神看了都说妙最后：小编会不定期发布相关设计内容包括但不限于如下内容:信号处理、通信仿真
【基于langchain + streamlit 完整的与文档对话RAG】放飞自我的Coder 大模型微调部署实战 langchain streamlit RAG
本地部署文档问答webdemo支持pdf支持txt支持doc/docx支持源文档索引你的点赞和收藏是我持续分享优质内容的动力哦~废话不多说直接看效果准备首先创建一个新环境（选择性）condacreate-nchatwithdocspython=3.11condaactivatechatwithdocs新建一个requirements.txt文件streamlitpython-docxPyPDF2f
基于python flask的新闻检索阅读系统完整代码可直接运行毕业设计一枚爱吃大蒜的程序员项目实战 python flask 新闻检索阅读系统新闻检索新闻阅读
项目演示：基于pythonflask的新闻检索阅读系统_哔哩哔哩_bilibili代码：#coding:utf-8fromflaskimportFlask,request,render_template,redirect,url_for,Flask,sessionfromdatetimeimporttimedeltaimportosi
毕设基于python的搜索引擎设计与实现 A毕设分享家 python 毕业设计
文章目录0简介1课题简介2系统设计实现2.1总体设计2.2搜索关键流程2.3推荐算法2.4数据流的实现3实现细节3.1系统架构3.2爬取大量网页数据3.3中文分词3.4相关度排序第1个排名算法：根据单词位置进行评分的函数第2个排名算法：根据单词频度进行评价的函数第3个排名算法：根据单词距离进行评价的函数最后0简介今天学长向大家分享一个毕业设计项目毕业设计基于python的搜索引擎设计与实现项目运行
Pyhton 单行、多行注释符号使用方法及规范 Tiger-Li python
Pyhton单行、多行注释符号使用方法及规范python中的注释有多种，有单行注释，多行注释，批量注释，中文注释也是常用的。python注释也有自己的规范，在文章中会介绍到。注释可以起到一个备注的作用，团队合作的时候，个人编写的代码经常会被多人调用，为了让别人能更容易理解代码的通途，使用注释是非常有效的。一、python单行注释符号(#)井号(#)常被用作单行注释符号，在代码中使用#时，它右边的任
【图片识别分类】批量按图片水印文字识别后根据内容分类并移至不同文件夹，基于Python和腾讯API的解决方案平安喜乐-开开心心文件操作类图片处理类文字识别水印文字在图片分类及文件夹归类根据水印文字对图片分类水印文字精准分类图片并文件夹水印文字识别在图片分类中的应用依据水印文字对图片分类运用水印文字信息完成图片分类解析图片水印文字助力图片分类
新闻媒体机构每天会收到和拍摄大量的新闻图片，这些图片上通常会有拍摄时间、地点、事件类型等水印文字信息。为了便于新闻编辑和资料存档，需要对图片进行分类管理。具体应用：分类规则设定：根据水印文字中的时间（年、月、日）、地点（城市、区域）和事件关键词（如“政治会议”“体育赛事”“自然灾害”等），对图片进行分类。例如，水印文字显示“2024年3月15日北京政治会议”的图片归类到“2024年3月-北京-政治
PythonStudy——Python 注释规范 aiyi1882 python 开发工具
注释规范：什么是注释？注释：不会被python解释器解释执行，是提供给开发者阅读代码的提示单行注释：#开头的语句多行注释：出现在文件最上方，用''''''包裹的语句Pycharm快捷键：Ctrl+/多行注释：每一个文件自上到下，只允许一对""""""内为注释部分，剩下的三引号对视为字符串。'''num=10print(num)print(num)''''''num=10print(num)prin
几行Python代码，轻松获取美股阿里巴巴的交易数据! Python资深程序员 Python Python
学Python可以干很多事情，比如爬虫，数据分析，机器学习，但是有一个非常小众的分支，不仅结合了两大高薪行业，而且还薪水非常诱人，就是量化金融岗位。目前Python已经是金融行业最低的一个门槛，几乎所有从事金融证券行业的人都要学会Python。今天给大家分享如何用Python获取美股的交易数据！Python资源共享群：626017123数据获取是数据分析的第一步，找不到可靠、真实的数据，数据分析无
python多线程、多进程和线程池编程 NickDeCodes python python 多线程多进程
python多线程、多进程和线程池编程python中的GIL在Python中，GIL或全局解释器锁（GlobalInterpreterLock）是一个在CPython解释器中实现的机制，它确保任何时候只有一个线程可以执行Python字节码。由于GIL的存在，即使在多核处理器上，使用多线程的Python程序也不能实现真正的并行执行。GIL的目的和影响目的：内存管理安全：Python使用引用计数来管理
如何在本地正确部署Dify服务写python的鑫哥 Python课堂 python Dify 本地部署 LLM 大型语言模型框架
前言本文是该专栏的第49篇，后面会持续分享python的各种干货知识，值得关注。Dify是一个开源的LLM（大型语言模型）应用开发平台，旨在为开发者提供从Agent构建到AIworkflow编排、RAG检索、模型管理等全方位的能力，从而轻松构建和运营生成式AI原生应用。在本文中，笔者将针对Dify的核心知识点以及“本地如何部署Dify”，进行详细说明。具体细节部分，笔者在正文将结合实际完整图文案例
8个建议，为啥不使用Python开发大型项目！疯狂的超级玛丽 Python基础 Python Python学习 python 开发语言 python3.11 学习 Python基础 Python学习编程
在开发者的职业生涯中，有一个特定阶段，开发者们会从为项目做贡献到掌握自己的技巧。这个阶段对有些人来说会来得早一些，有些则也会晚一些，而另一部分人则无法到达这个阶段。不过，大多数职业生涯较长的开发人员都经历过这个阶段。我将这称之为自己构建的点。如果你已经到达了那个阶段，你面对的第一个问题是：它是如何运作的？用户体验如何？架构是怎样的？数据如何流动？以及很多类似这样的问题。我在这里就不为你回答这些这些
使用 Python 爬虫获取金融市场数据（股市、汇率等） Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言数据分析
目录项目背景与目标技术栈与工具选择目标网站分析爬虫架构设计股市数据爬取汇率数据爬取爬虫优化与反爬虫策略数据存储与管理数据分析与可视化总结与展望1.项目背景与目标1.1金融市场数据的重要性金融市场数据，如股票、债券、汇率、商品期货等，广泛应用于各种分析领域，如投资策略优化、市场预测、风险评估等。在现代金融分析中，获取并处理实时、准确的金融数据至关重要。无论是个人投资者，还是机构投资者，都需要获取市场
Python基础语法：注释和代码风格（PEP 8）详解③ 邓瑞军说HelloWorld Python VSCode #Python 开发基础开发语言 python vscode
文章目录一、注释1.1单行注释1.2多行注释1.3文档字符串（docstrings）二、PEP8代码风格2.1缩进2.2每行字符数限制2.3空行2.4引号2.5空格2.6注释2.7命名约定2.8其他建议三、综合复杂示例四、结论在编写Python代码时，注释和代码风格是两个至关重要的方面。良好的注释能够帮助开发者更好地理解代码，提高代码的可读性和可维护性；遵循Python的官方代码风格指南（PEP8
04树 + 堆 + 优先队列 + 图（D1_树（D10_决策树）） Java丨成神之路 06数据结构与算法数据结构算法
目录一、引言二、算法原理三、算法实现四、知识小结一、引言决策树算法是一种常用的机器学习算法，可用于分类和回归问题。它基于特征之间的条件判断来构建一棵树，树的每个节点代表一个特征，每个叶节点代表一个类别或回归值。决策树算法具有简单、易于理解和解释的特点，且在处理大规模数据时具有较高的效率。本文将介绍决策树算法的基本原理，并提供了Java代码示例来说明其实现过程。二、算法原理决策树算法基于“分而治之”
ttkbootstrap界面美化系列之简介(一) ftzchina Python ttkbootstrap 界面美化 python
一：前言相信很多同学用Python进行界面设计第一个用到的就是Tkinter，Tkinter是Python的一个标准接口，用于创建GUI（图形用户界面）应用程序。它是Tcl/Tk的封装，Tkinter的名称来源于Tk技术工具包(ToolKit)的首字母缩写。Tkinter的历史可以追溯到1989年，当时为了让程序员能更容易地创建图形用户界面，开发了Tk工具包。Tkinter是Python语言的一部
python3.13及其新特性 Channing Lewis Python python
截至目前，Python的最新稳定版本是3.13.1，于2024年10月7日发布。该版本引入了多项新特性和改进，主要包括：全新的交互式解释器：提供多行编辑、历史记录保存和彩色提示等功能，提升了开发者的使用体验。实验性无全局解释器锁（GIL）支持：允许在自由线程模式下运行，提升多线程程序的性能。即时编译器（JIT）：引入了实验性的JIT编译器，旨在提高代码执行效率。错误消息改进：增强了错误消息的可读性
DeepSeek最简单本地部署方案 liyuanziming python
###最简单的本地部署方案为了简单地本地部署DeepSeek，以下是一步步的操作指南：####1.安装编程语言首先，选择Python或R作为编程语言。Python在数据分析中更为常见。####2.下载DeepSeek的代码库根据以下链接下载对应的代码库：-**Python**：[DeepSeekPython](https://github.com/DeepSeek/deepseek-python)
Python3.13安装和配置冯一川 Qt项目总结 python
Python3.13安装和配置一、Python的下载点击下面的下载链接，下载需要的版本。以3.13版本为例。如下图所示：3.13.0下载地址（windows）3.13.0下载地址（windows）二、安装下载完成后，双击安装文件。<
【项目分享】使用python的ttkbootstrap模块构建一个炫酷的计时器命运之光我的项目源代码集：持续更新 python 开发语言
目录前言项目背景项目展示（图片）项目实现1.安装与设置2.创建主窗口3.初始化计时器功能4.实现计时功能5.实现隐藏边框与置顶功能6.运行应用完整代码结论嗨，我是命运之光！2024，每日百字，记录时光，感谢有你一路同行。携手启航，探索未知，激发潜能，每一
【漫话机器学习系列】079.超参数调优（Hyperparameter Tuning） IT古董漫话机器学习系列专辑机器学习深度学习人工智能
超参数调优（HyperparameterTuning）是机器学习中优化模型性能的重要步骤之一。超参数是模型在训练之前设定的参数，而不是通过训练数据学习到的参数。正确地选择超参数可以显著提高模型的预测能力，反之，错误的超参数选择可能会导致过拟合、欠拟合或训练过程缓慢。1.超参数的定义超参数是控制学习过程的外部参数，不同于模型参数（例如权重和偏置），超参数不通过训练过程自动优化。常见的超参数包括：学习
【漫话机器学习系列】054.极值（Extrema） IT古董漫话机器学习系列专辑机器学习人工智能
极值（Extrema）定义极值是数学分析和优化问题中的一个核心概念，指函数在某个定义域内取得的最大值或最小值。根据极值的性质，可以将其分为两类：局部极值（LocalExtrema）：函数在某点附近的最大值或最小值。全局极值（GlobalExtrema）：函数在整个定义域内的最大值或最小值。分类局部极大值（LocalMaximum）：若在点x=a附近存在某邻域，使得对任意x在该邻域内，满足f(x)≤
Python随笔 scorecardpy笔记 Cairne493 Python学习 python 机器学习数据分析
目录scorecardpy笔记简介运行示例详细分析各函数sc.germancredit()sc.var_fillter(...)sc.split_df(...)woebin(...)woebin_ply(...)sc.perf_eva(...)sc.scorecard(...)sc.scorecard_ply(...)sc.perf_psi()问题解决matplotlib.pyplot未安装[^3
Ubuntu 24.04 LTS安装Python2失败解决 WLHG8PLUS ubuntu linux 服务器
Ubuntu24.04LTS安装Python2失败解决安装Ubuntu24.04之后，安装python2会提示：~/$sudoaptinstallpython2Readingpackagelists...DoneBuildingdependencytree...DoneReadingstateinformation...DonePackagepython2isnotavailable,butisr
jdk tomcat 环境变量配置 Array_06 java jdk tomcat
Win7 下如何配置java环境变量 1。准备jdk包，win7系统，tomcat安装包（均上网下载即可） 2。进行对jdk的安装，尽量为默认路径（但要记住啊！！以防以后配置用。。。） 3。分别配置高级环境变量。电脑-->右击属性-->高级环境变量-->环境变量。分别配置 : path &nbs
Spring调SDK包报java.lang.NoSuchFieldError错误 bijian1013 java spring
在工作中调另一个系统的SDK包，出现如下java.lang.NoSuchFieldError错误。 org.springframework.web.util.NestedServletException: Handler processing failed; nested exception is java.l
LeetCode[位运算] - #136 数组中的单一数 Cwind java 题解位运算 LeetCode Algorithm
原题链接：#136 Single Number 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现两次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：题目限定了线性的时间复杂度，同时不使用额外的空间，即要求只遍历数组一遍得出结果。由于异或运算 n XOR n = 0, n XOR 0 = n，故将数组中的每个元素进
qq登陆界面开发 15700786134 qq
今天我们来开发一个qq登陆界面，首先写一个界面程序，一个界面首先是一个Frame对象，即是一个窗体。然后在这个窗体上放置其他组件。代码如下： public class First { public void initul(){ jf=ne
Linux的程序包管理器RPM 被触发 linux
在早期我们使用源代码的方式来安装软件时，都需要先把源程序代码编译成可执行的二进制安装程序，然后进行安装。这就意味着每次安装软件都需要经过预处理-->编译-->汇编-->链接-->生成安装文件--> 安装，这个复杂而艰辛的过程。为简化安装步骤，便于广大用户的安装部署程序，程序提供商就在特定的系统上面编译好相关程序的安装文件并进行打包，提供给大家下载，我们只需要根据自己的
socket通信遇到EOFException 肆无忌惮_ EOFException
java.io.EOFException at java.io.ObjectInputStream$PeekInputStream.readFully(ObjectInputStream.java:2281) at java.io.ObjectInputStream$BlockDataInputStream.readShort(ObjectInputStream.java:
基于spring的web项目定时操作知了ing java Web
废话不多说，直接上代码，很简单配置一下项目启动就行 1，web.xml <?xml version="1.0" encoding="UTF-8"?> <web-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="h
树形结构的数据库表Schema设计矮蛋蛋 schema
原文地址： http://blog.csdn.net/MONKEY_D_MENG/article/details/6647488 程序设计过程中，我们常常用树形结构来表征某些数据的关联关系，如企业上下级部门、栏目结构、商品分类等等，通常而言，这些树状结构需要借助于数据库完成持久化。然而目前的各种基于关系的数据库，都是以二维表的形式记录存储数据信息，
maven将jar包和源码一起打包到本地仓库 alleni123 maven
http://stackoverflow.com/questions/4031987/how-to-upload-sources-to-local-maven-repository <project> ... <build> <plugins> <plugin> <groupI
java IO操作与 File 获取文件或文件夹的大小，可读，等属性！！！百合不是茶
类 File File是指文件和目录路径名的抽象表示形式。 1，何为文件：标准文件（txt doc mp3...）目录文件（文件夹）虚拟内存文件 2，File类中有可以创建文件的 createNewFile（）方法,在创建新文件的时候需要try{} catch(）{}因为可能会抛出异常；也有可以判断文件是否是一个标准文件的方法isFile();这些防抖都
Spring注入有继承关系的类（2） bijian1013 java spring
被注入类的父类有相应的属性，Spring可以直接注入相应的属性，如下所例：1.AClass类 package com.bijian.spring.test4; public class AClass { private String a; private String b; public String getA() { retu
30岁转型期你能否成为成功人士 bijian1013 成长励志
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
【Velocity四】Velocity与Java互操作 bit1129 velocity
Velocity出现的目的用于简化基于MVC的web应用开发，用于替代JSP标签技术，那么Velocity如何访问Java代码.本篇继续以Velocity三http://bit1129.iteye.com/blog/2106142中的例子为基础， POJO package com.tom.servlets; public
【Hive十一】Hive数据倾斜优化 bit1129 hive
什么是Hive数据倾斜问题操作：join,group by,count distinct 现象：任务进度长时间维持在99%（或100%），查看任务监控页面，发现只有少量（1个或几个）reduce子任务未完成；查看未完成的子任务，可以看到本地读写数据量积累非常大，通常超过10GB可以认定为发生数据倾斜。原因：key分布不均匀倾斜度衡量：平均记录数超过50w且
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua csrf
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-3.求子数组的最大和 bylijinnan java
package beautyOfCoding; public class MaxSubArraySum { /** * 3.求子数组的最大和题目描述：输入一个整形数组，数组里有正数也有负数。数组中连续的一个或多个整数组成一个子数组，每个子数组都有一个和。求所有子数组的和的最大值。要求时间复杂度为O(n)。例如输入的数组为1, -2, 3, 10, -4,
Netty源码学习-FileRegion bylijinnan java netty
今天看org.jboss.netty.example.http.file.HttpStaticFileServerHandler.java 可以直接往channel里面写入一个FileRegion对象，而不需要相应的encoder： //pipeline（没有诸如“FileRegionEncoder”的handler）： public ChannelPipeline ge
使用ZeroClipboard解决跨浏览器复制到剪贴板的问题 cngolon 跨浏览器复制到粘贴板 Zero Clipboard
Zero Clipboard的实现原理 Zero Clipboard 利用透明的Flash让其漂浮在复制按钮之上，这样其实点击的不是按钮而是 Flash ，这样将需要的内容传入Flash，再通过Flash的复制功能把传入的内容复制到剪贴板。 Zero Clipboard的安装方法首先需要下载 Zero Clipboard的压缩包，解压后把文件夹中两个文件：ZeroClipboard.js
单例模式 cuishikuan 单例模式
第一种（懒汉，线程不安全）： public class Singleton { 2 private static Singleton instance; 3 pri
spring+websocket的使用 dalan_123
一、spring配置文件 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.or
细节问题：ZEROFILL的用法范围。 dcj3sjt126com mysql
1、zerofill把月份中的一位数字比如1，2，3等加前导0 mysql> CREATE TABLE t1 (year YEAR(4), month INT(2) UNSIGNED ZEROFILL, -> day
Android开发10——Activity的跳转与传值 dcj3sjt126com Android开发
Activity跳转与传值，主要是通过Intent类，Intent的作用是激活组件和附带数据。一、Activity跳转方法一Intent intent = new Intent(A.this, B.class); startActivity(intent) 方法二Intent intent = new Intent();intent.setCla
jdbc 得到表结构、主键 eksliang jdbc 得到表结构、主键
转自博客：http://blog.csdn.net/ocean1010/article/details/7266042 假设有个con DatabaseMetaData dbmd = con.getMetaData(); rs = dbmd.getColumns(con.getCatalog(), schema, tableName, null); rs.getSt
Android 应用程序开关GPS gqdy365 android
要在应用程序中操作GPS开关需要权限： <uses-permission android:name="android.permission.WRITE_SECURE_SETTINGS" /> 但在配置文件中添加此权限之后会报错，无法再eclipse里面正常编译，怎么办？ 1、方法一：将项目放到Android源码中编译； 2、方法二：网上有人说cl
Windows上调试MapReduce zhiquanliu mapreduce
1.下载hadoop2x-eclipse-plugin https://github.com/winghc/hadoop2x-eclipse-plugin.git 把 hadoop2.6.0-eclipse-plugin.jar 放到eclipse plugin 目录中。 2.下载 hadoop2.6_x64_.zip http://dl.iteye.com/topics/download/d2b
如何看待一些知名博客推广软文的行为？ justjavac 博客
本文来自我在知乎上的一个回答：http://www.zhihu.com/question/23431810/answer/24588621 互联网上的两种典型心态：当初求种像条狗，如今撸完嫌人丑当初搜贴像条犬，如今读完嫌人软你为啥感觉不舒服呢？难道非得要作者把自己的劳动成果免费给你用，你才舒服？就如同 Google 关闭了 Gooled Reader，那是
sql优化总结 macroli sql
为了是自己对sql优化有更好的原则性，在这里做一下总结，个人原则如有不对请多多指教。谢谢！要知道一个简单的sql语句执行效率，就要有查看方式，一遍更好的进行优化。一、简单的统计语句执行时间 declare @d datetime ---定义一个datetime的变量set @d=getdate() ---获取查询语句开始前的时间select user_id
Linux Oracle中常遇到的一些问题及命令总结超声波 oracle linux
1.linux更改主机名 (1)#hostname oracledb　　　　临时修改主机名 (2) vi /etc/sysconfig/network 　　修改hostname (3) vi /etc/hosts　　　　　　　　修改IP对应的主机名 2.linux重启oracle实例及监听的各种方法（注意操作的顺序应该是先监听，后数据库实例） &nbs
hive函数大全及使用示例 superlxw1234 hadoop hive函数
具体说明及示例参见附件文档。文档目录：目录一、关系运算： 4 1. 等值比较: = 4 2. 不等值比较: <> 4 3. 小于比较: < 4 4. 小于等于比较: <= 4 5. 大于比较: > 5 6. 大于等于比较: >= 5 7. 空值判断: IS NULL 5
Spring 4.2新特性-使用@Order调整配置类加载顺序 wiselyman spring 4
4.1 @Order Spring 4.2 利用@Order控制配置类的加载顺序 4.2 演示两个演示bean package com.wisely.spring4_2.order; public class Demo1Service { } package com.wisely.spring4_2.order; public class