WHS-_-2022

CTPN的Python实现笔记一

文章目录

一、疑难代码讲解
- 1. 文本框左上角标注置信度
- - (1) `s = str(round(i[-1] * 100, 2)) + '%'`
  - (2) `cv2.putText()` 函数
  - (3) `cv2.line()`函数
- 2. 文本框进行扩展操作
- 3. 文本框进行NMS操作
- - (1) 非极大值抑制函数`def nms(dets, thresh):`
  - - a. `order = scores.argsort()[::-1]`
    - b. `xx1 = np.maximum(x1[i], x1[order[1:]])`
    - c. `inds = np.where(ovr <= thresh)[0]`
  - (2) `np.hstack()`函数
- 4. 显示图片函数
二、附录

一、疑难代码讲解

1. 文本框左上角标注置信度

 for i in text:
                s = str(round(i[-1] * 100, 2)) + '%'
                i = [int(j) for j in i]
                cv2.line(image_c, (i[0], i[1]), (i[2], i[3]), (0, 0, 255), 2)
                cv2.line(image_c, (i[0], i[1]), (i[4], i[5]), (0, 0, 255), 2)
                cv2.line(image_c, (i[6], i[7]), (i[2], i[3]), (0, 0, 255), 2)
                cv2.line(image_c, (i[4], i[5]), (i[6], i[7]), (0, 0, 255), 2)
                cv2.putText(image_c, s, (i[0]+13, i[1]+13),
                            cv2.FONT_HERSHEY_SIMPLEX,
                            1,
                            (255,0,0),
                            2,
                            cv2.LINE_AA)

(1) `s = str(round(i[-1] * 100, 2)) + '%'`

这行代码将i的最后一个元素乘以100，保留2位小数并将其转换为字符串，再在这个字符串后面加上百分号，最后将这个字符串赋给变量s。

i[-1]表示i的最后一个元素，round(i[-1] * 100, 2)表示将i的最后一个元素乘以100并保留2位小数，str(round(i[-1] * 100, 2))表示将这个数字转换为字符串，+ '%'表示在字符串后面加上百分号。

这个变量s可能在后面会被用来在图像上显示识别结果的置信度。

round()是Python内置函数，用于将一个数字四舍五入为指定小数位数的值。

语法如下：

round(number[, ndigits])

其中，number是要进行四舍五入的数字，ndigits是可选参数，表示保留小数点后几位。如果ndigits未指定，则默认为0，即返回整数。

x = round(3.1415) # 返回3
y = round(3.1415, 2) # 返回3.14

(2) `cv2.putText()` 函数

cv2.putText(image_c, s, (i[0]+13, i[1]+13),
                            cv2.FONT_HERSHEY_SIMPLEX,
                            1,
                            (255,0,0),
                            2,
                            cv2.LINE_AA)

使用cv2.putText() 函数在图像上绘制文本。其中，image_c是要绘制文本的图像，s是要绘制的文本，(i[0]+13, i[1]+13)是文本的左下角坐标，cv2.FONT_HERSHEY_SIMPLEX是字体，1是字体大小，(255,0,0)是文本颜色，2是线宽，cv2.LINE_AA是抗锯齿标志。

cv2.putText()是OpenCV库中的一个函数，用于在图像上绘制文本。

语法如下：

cv2.putText(img, text, org, fontFace, fontScale, color[, thickness[, lineType[, bottomLeftOrigin]]])

img : 要绘制文本的图像。
text : 要绘制的文本。
org : 文本左下角的坐标。
fontFace : 字体。可以是以下字体之一：cv2.FONT_HERSHEY_SIMPLEX, cv2.FONT_HERSHEY_PLAIN, cv2.FONT_HERSHEY_DUPLEX, cv2.FONT_HERSHEY_COMPLEX, cv2.FONT_HERSHEY_TRIPLEX, cv2.FONT_HERSHEY_COMPLEX_SMALL, cv2.FONT_HERSHEY_SCRIPT_SIMPLEX or cv2.FONT_HERSHEY_SCRIPT_COMPLEX
fontScale : 字体大小。
color : 文本颜色。
thickness : 文本的线宽。
lineType : 线条类型（如8邻域连接或抗锯齿）。
bottomLeftOrigin : 一个布尔值，如果为真，则坐标是文本的左下角，如果为假，则坐标是文本的左上角。

在这段代码中，cv2.putText(image_c, s, (i[0]+13, i[1]+13), cv2.FONT_HERSHEY_SIMPLEX, 1, (255,0,0), 2, cv2.LINE_AA) 函数在image_c这个图像上绘制文本s, 文本左下角坐标为(i[0]+13, i[1]+13), 字体是 cv2.FONT_HERS。

为什么我(255,0,0)画出来的文字是蓝色的？

一般来说，在OpenCV中如果使用的是 BGR 颜色空间，那么 (255,0,0) 代表的颜色是蓝色，而不是红色。

图1 轮胎图片的文本框检索

这段代码可能用于在图像中标记识别出的文本框，并在每个文本框的左上角显示识别结果的置信度，方便用户了解识别结果的可信度。

(3) `cv2.line()`函数

cv2.line()是OpenCV库中的一个函数，用于在图像上绘制直线。语法如下:

cv2.line(img, start_point, end_point, color, thickness)

img : 要绘制直线的图像。
start_point : 直线的起始坐标。
end_point : 直线的终止坐标。
color : 直线的颜色。
thickness : 直线的线宽。

在这段代码中，

cv2.line(image_c, (i[0], i[1]), (i[2], i[3]), (0, 0, 255), 2)
cv2.line(image_c, (i[0], i[1]), (i[4], i[5]), (0, 0, 255), 2)
cv2.line(image_c, (i[6], i[7]), (i[2], i[3]), (0, 0, 255), 2)
cv2.line(image_c, (i[4], i[5]), (i[6], i[7]), (0, 0, 255), 2)

这几行代码在图像image_c中绘制了四条直线, 这四条直线构成了一个矩形，线条颜色为(0, 0, 255)，线宽为2, i[0], i[1], i[2], i[3], i[4], i[5], i[6], i[7]是四个顶点坐标。

这个函数非常简单，可以在图像上绘制一条或多条直线，在图像处理中经常使用。

2. 文本框进行扩展操作

        if expand:
            for idx in range(len(text)):
                text[idx][0] = max(text[idx][0] - 10, 0)
                text[idx][2] = min(text[idx][2] + 10, w - 1)
                text[idx][4] = max(text[idx][4] - 10, 0)
                text[idx][6] = min(text[idx][6] + 10, w - 1)

这段代码中，如果 expand 变量为真，那么将对文本框进行扩展。具体来说，对于每一个文本框，通过修改文本框的四个顶点坐标来实现扩展。

这段代码中, 就是将每个文本框的X轴方向的边框扩大10个像素，以便更好地识别文本。

为什么只调整0，2，4，6？

这里只调整文本框的0，2，4，6点，是因为文本框的顶点坐标是按照顺时针顺序来存储的。通常情况下，一个文本框的顶点坐标会存储为(x1,y1,x2,y2,x3,y3,x4,y4)。

(x1,y1) 为左上角坐标

(x2,y2) 为右上角坐标

(x3,y3) 为右下角坐标

(x4,y4) 为左下角坐标

这样，0，2，4，6点就对应了文本框四个顶点的x坐标。
所以当expand为真时，通过更改文本框四个顶点的x坐标来扩大文本框，使文本框更容易被识别。

3. 文本框进行NMS操作

# nms
        select_anchor = select_anchor[keep_index]
        select_score = select_score[keep_index]
        select_score = np.reshape(select_score, (select_score.shape[0], 1))
        nmsbox = np.hstack((select_anchor, select_score))
        keep = nms(nmsbox, 0.3)
        # print(keep)
        select_anchor = select_anchor[keep]
        select_score = select_score[keep]

这段代码是进行NMS处理的一段，用了两个numpy的函数。

首先是筛选掉不符合条件的边界框：select_anchor = select_anchor[keep_index] 和 select_score = select_score[keep_index]。

接着是数组的形状变换：select_score = np.reshape(select_score, (select_score.shape[0], 1))，即将一维数组转为二维数组，使得数组每一行只有一个元素，方便后面的合并。

最后是数组的合并：nmsbox = np.hstack((select_anchor, select_score))，通过hstack函数，把选择的边界框和对应的分数合并到一个数组中，作为NMS处理的输入。

最后一步是调用NMS处理函数：keep = nms(nmsbox, 0.3)，将NMS处理的结果保留下来。

(1) 非极大值抑制函数`def nms(dets, thresh):`

def nms(dets, thresh):
    x1 = dets[:, 0]
    y1 = dets[:, 1]
    x2 = dets[:, 2]
    y2 = dets[:, 3]
    scores = dets[:, 4]

    areas = (x2 - x1 + 1) * (y2 - y1 + 1)
    order = scores.argsort()[::-1]

    keep = []
    while order.size > 0:
        i = order[0]
        keep.append(i)
        xx1 = np.maximum(x1[i], x1[order[1:]])
        yy1 = np.maximum(y1[i], y1[order[1:]])
        xx2 = np.minimum(x2[i], x2[order[1:]])
        yy2 = np.minimum(y2[i], y2[order[1:]])

        w = np.maximum(0.0, xx2 - xx1 + 1)
        h = np.maximum(0.0, yy2 - yy1 + 1)
        inter = w * h
        ovr = inter / (areas[i] + areas[order[1:]] - inter)

        inds = np.where(ovr <= thresh)[0]
        order = order[inds + 1]
    return keep

a. `order = scores.argsort()[::-1]`

order = scores.argsort()[::-1] 这一行的作用是将 scores 数组从大到小排序，并得到排序后元素的索引。

例如，如果 scores = [0.8, 0.7, 0.9, 0.6]，那么 scores.argsort() 就是 [3, 1, 0, 2]，也就是第一个元素的索引是3，第二个元素的索引是1，以此类推。

而 scores.argsort()[::-1] 就是将上述索引数组倒序，得到 [2, 0, 1, 3]。

[::-1]是什么意思?

[::-1]是列表的切片操作，代表从后往前逆向取整个列表中的元素，即将列表逆序。在这里，scores.argsort()表示将scores列表中的元素从小到大排序后得到的下标列表，[::-1]则将这个下标列表逆序，也就是将scores中从大到小排序后得到的下标。argsort是argument sort的缩写。

b. `xx1 = np.maximum(x1[i], x1[order[1:]])`

np.maximum() 函数是 Numpy 中的元素对比函数，它的作用是逐个位置判断两个数组中的元素，输出两个数组中该位置元素的最大值。

语法：

numpy.maximum(x1, x2, /, out=None, *, where=True, casting='same_kind', order='K', dtype=None, subok=True[, signature, extobj]) = <ufunc 'maximum'>

x1, x2 : array_like
输入数组，形状必须相同。
out : ndarray, None, or tuple of ndarray and None, optional
如果提供了，将结果存储在此数组中。
where : array_like, optional
可选，当计算结果时需要替换的位置。
casting : {‘no’, ‘equiv’, ‘safe’, ‘same_kind’, ‘unsafe’}, optional
可选，类型转换的方式。
order : {‘K’, ‘A’, ‘C’, ‘F’}, optional
可选，输出数组的存储方式。
dtype : data-type, optional
可选，数组元素的数据类型。

import numpy as np

a = np.array([1, 4, 2, 5, 3])
b = np.array([2, 5, 3, 1, 4])
c = np.maximum(a, b)
print(c)

# Output:
# [2 5 3 5 4]

注意两个数组有必要array_like。

c. `inds = np.where(ovr <= thresh)[0]`

Tuple 是 Python 中的一种数据结构，它是用圆括号括起来的一系列元素的集合，是不可变的，支持多种数据类型（整数、字符串、列表等）。Tuple 元素之间以逗号分隔。可以用索引访问 tuple 中的元素。

Tuple是一种不可变的序列类型，它可以保存任意多个不同类型的数据项。下面是一个关于Tuple的示例：

a = (1, 'hello', [3, 4], 5.6)

这是一个元素为整数、字符串、列表和浮点数的Tuple。

我们举例说明一下np.where()的用法

import numpy as np

a = np.array([3, 4, 5, 6, 7, 8])
indices = np.where(a > 5)

print(indices)
'''
(array([3, 4, 5], dtype=int64),)
'''

print(type(indices))
'''

'''

print(indices[0])
'''
[3 4 5]
'''

print(type(indices[1]))
#IndexError: tuple index out of range

print(type(indices[0]))
#

inds = np.where(ovr <= thresh)[0]

上述NMS代码段中，使用了np.where()[0],是因为该函数返回的是一个Tuple类型的数据，为了能够让index是标准的numpy.ndarray类型，必须要选定Tuple当中的第一个元素。

(2) `np.hstack()`函数

np.hstack()是numpy中用于水平堆叠数组的函数。它将多个数组沿着**水平方向（列方向）**堆叠在一起，形成一个新的数组。如果想在垂直方向堆叠数组，可以使用 np.vstack() 函数。

假设有两个二维数组A和B，其中A为 $3\times4$ 的数组，数组元素如下：

[[1, 2, 3, 4],
 [5, 6, 7, 8],
 [9,10,11,12]]

B为 $3\times4$ 的数组，数组元素如下：

[[13, 14, 15, 16],
 [17, 18, 19, 20],
 [21, 22, 23, 24]]

调用 np.vstack((A, B)) 后会得到一个新数组C，C为 $6\times4$ 的数组，数组元素如下：

[[ 1,  2,  3,  4],
 [ 5,  6,  7,  8],
 [ 9, 10, 11, 12],
 [13, 14, 15, 16],
 [17, 18, 19, 20],
 [21, 22, 23, 24]]

可以看出，在垂直方向上将A和B两个数组堆叠在一起得到了新数组C。

如果你使用 np.hstack((A,B)) 则会将A和B在水平方向上堆叠起来。数组C为 $3\times8$ 的数组。

数组A和B行列不对齐可以拼接吗？

A和B两个数组如果不是同一类型或者不具有相同的行列，那么np.vstack((A, B))会报错，因为在这种情况下两个数组不能够直接拼接在一起。

这里使用 np.hstack((select_anchor, select_score)) 将候选框坐标数组select_anchor和得分数组select_score沿着列方向堆叠在一起，形成一个新的数组nmsbox。nmsbox的每一行都是一个完整的框，包含了坐标和得分。

4. 显示图片函数

def dis(image):
    cv2.imshow('image', image)
    cv2.waitKey(0)
    cv2.destroyAllWindows()

cv2.waitKey(0) 是 OpenCV 中的函数，它可以等待特定的按键事件。参数 0 表示等待键盘输入，直到按下任意按键才继续执行程序。可以通过更改参数的值来控制等待的时长（单位为毫秒）。

cv2.destroyAllWindows()是OpenCV中的函数，用于关闭所有OpenCV窗口。一般用于在显示图像后，手动关闭窗口时使用。

二、附录

#-*- coding:utf-8 -*-
#'''
# Created on 18-12-11 上午10:03
#
# @Author: Greg Gao(laygin)
#'''
import os
os.environ['CUDA_VISIBLE_DEVICES'] = '0'
import cv2
import numpy as np

import torch
import torch.nn.functional as F
from detect.ctpn_model import CTPN_Model
from detect.ctpn_utils import gen_anchor, bbox_transfor_inv, clip_box, filter_bbox,nms, TextProposalConnectorOriented
from detect.ctpn_utils import resize
from detect import config

prob_thresh = 0.5
height = 720
gpu = True
if not torch.cuda.is_available():
    gpu = False
device = torch.device('cuda:0' if gpu else 'cpu')
weights = os.path.join(config.checkpoints_dir, 'CTPN.pth')
model = CTPN_Model()
model.load_state_dict(torch.load(weights, map_location=device)['model_state_dict'])
model.to(device)
model.eval()


def dis(image):
    cv2.imshow('image', image)
    cv2.waitKey(0)
    cv2.destroyAllWindows()


def get_det_boxes(image,display = True, expand = True):
    image = resize(image, height=height)
    image_r = image.copy()
    image_c = image.copy()
    h, w = image.shape[:2]
    image = image.astype(np.float32) - config.IMAGE_MEAN
    image = torch.from_numpy(image.transpose(2, 0, 1)).unsqueeze(0).float()

    with torch.no_grad():
        image = image.to(device)
        cls, regr = model(image)
        cls_prob = F.softmax(cls, dim=-1).cpu().numpy()
        regr = regr.cpu().numpy()
        anchor = gen_anchor((int(h / 16), int(w / 16)), 16)
        bbox = bbox_transfor_inv(anchor, regr)
        bbox = clip_box(bbox, [h, w])
        # print(bbox.shape)

        fg = np.where(cls_prob[0, :, 1] > prob_thresh)[0]
        # print(np.max(cls_prob[0, :, 1]))
        select_anchor = bbox[fg, :]
        select_score = cls_prob[0, fg, 1]
        select_anchor = select_anchor.astype(np.int32)
        # print(select_anchor.shape)
        keep_index = filter_bbox(select_anchor, 16)

        # nms
        select_anchor = select_anchor[keep_index]
        select_score = select_score[keep_index]
        select_score = np.reshape(select_score, (select_score.shape[0], 1))
        nmsbox = np.hstack((select_anchor, select_score))
        keep = nms(nmsbox, 0.3)

        # print(keep)
        select_anchor = select_anchor[keep]
        select_score = select_score[keep]

        # text line-
        textConn = TextProposalConnectorOriented()#定义了一个类，用于将Proposal转化为文本框
        text = textConn.get_text_lines(select_anchor, select_score, [h, w])

        # expand text
        if expand:
            for idx in range(len(text)):
                text[idx][0] = max(text[idx][0] - 10, 0)
                text[idx][2] = min(text[idx][2] + 10, w - 1)
                text[idx][4] = max(text[idx][4] - 10, 0)
                text[idx][6] = min(text[idx][6] + 10, w - 1)


        # print(text)
        if display:
            blank = np.zeros(image_c.shape,dtype=np.uint8)
            for box in select_anchor:
                pt1 = (box[0], box[1])
                pt2 = (box[2], box[3])
                blank = cv2.rectangle(blank, pt1, pt2, (50, 0, 0), -1)
            image_c = image_c+blank
            image_c[image_c>255] = 255
            for i in text:
                s = str(round(i[-1] * 100, 2)) + '%'
                i = [int(j) for j in i]
                cv2.line(image_c, (i[0], i[1]), (i[2], i[3]), (0, 0, 255), 2)
                cv2.line(image_c, (i[0], i[1]), (i[4], i[5]), (0, 0, 255), 2)
                cv2.line(image_c, (i[6], i[7]), (i[2], i[3]), (0, 0, 255), 2)
                cv2.line(image_c, (i[4], i[5]), (i[6], i[7]), (0, 0, 255), 2)
                cv2.putText(image_c, s, (i[0]+13, i[1]+13),
                            cv2.FONT_HERSHEY_SIMPLEX,
                            1,
                            (255,0,0),
                            2,
                            cv2.LINE_AA)
            # dis(image_c)
        # print(text)
        return text,image_c,image_r

if __name__ == '__main__':
    img_path = 'images/t1.png'
    image = cv2.imread(img_path)
    text,image,_ = get_det_boxes(image)
    print(text)
    dis(image)

python 利用多进程实现文件的拷贝 AI算法网奇 python宝典 python 开发语言
python利用多进程实现文件的拷贝版权声明：本文为博主原创文章，未经博主允许不得转载。https://blog.csdn.net/m0_37338590/article/details/78472103整个程序的流程可分为四步：第一步是提示用户输入要拷贝的文件夹;第二步是创建新文件夹;第三步是获取文件夹中所有文件的名字;最后一步是就是利用进程池创建进程完成复制。具体的分析在程序中都有了，不再做过
python 多线程拍照 NO1212 python 开发语言
相机为basler，logicbalser相机识别条码，进行拍照args[0]为logging的参数保证log实时传输到GUI界面调用方法:main_process(args[0]).camera_run()importsysimporterrnoimportcv2importnumpyasnpimportjsonimportloggingimportthreadingimportlogging.
python实现精确的四舍五入 mocobk
由于计算精度的问题，python无法实现真正的四舍五入round四舍五入时是遵循靠近0原则，所以-0.5和0.5进行0位四舍五入，返回的都是0round(2.135,2)-->2.13round(number[,ndigits])Returnthefloatingpointvaluenumberroundedtondigitsdigitsafterthedecimalpoint.Ifndigits
【Python】线程—GIL—asyncio 2401_84139049 程序员 python 开发语言
它们的特点和适用场景：工具特点适用场景Lock最基本的互斥锁，一次只允许一个线程访问共享资源不可重入，即同一线程再次获取会导致死锁简单的线程同步需求需要确保一段代码同一时间只能被一个线程执行RLock可重入锁，同一线程可以多次获取锁并释放允许同一线程多次调用acquire()复杂的递归线程同步需求某些情况下需要允许同一线程多次获取和释放锁Semaphore允许一定数量的线程同时访问共享资源控制并发
基于 Python/PHP/Node.js 的淘宝 API 商品数据抓取开发教程
在电商数据分析、竞品监控等场景中，抓取淘宝商品数据是常见需求。淘宝开放平台（OpenPlatform）提供了标准化的API接口，通过合法途径调用可高效获取商品信息。本文将分别基于Python、PHP、Node.js三种语言，详解淘宝API商品数据抓取的开发流程，并提供完整代码示例。一、淘宝API准备工作在开发前，需完成以下准备步骤：注册开发者账号访问注册账号并完成实名认证，创建应用（应用类型选择“
python的多线程无法并行只能并发，why？
标题python的多线程无法并行只能并发，why？python的多线程无法并行只能并发，why？在Python中，特别是使用CPython解释器时，由于存在全局解释器锁（GIL），即使在多核处理器上，只有一个线程在同一时刻可以执行Python字节码。GIL会导致CPU密集型任务的线程不能真正并行执行，即使在多核机器上。这种情况下，即使你创建多个线程，CPU也会轮流为每个线程分配执行时间。只有涉及到
图灵python从入门到实践浮点数_Python编程从入门到实践-图灵出品-pdf 巴黎巨星岬太郎
封面简介本书是一本针对所有层次的Python读者而作的Python入门书。全书分两部分：首部分介绍用Python编程所必须了解的基本概念，包括matplotlib、NumPy和Pygal等强大的Python库和工具介绍，以及列表、字典、if语句、类、文件与异常、代码测试等内容；第二部分将理论付诸实践，讲解如何开发三个项目，包括简单的Python2D游戏开发，如何利用数据生成交互式的信息图，以及创建
python从菜鸟到高手电子书下载_PYTHON从菜鸟到高手清华大学出版社逐码追风
推荐序...1前言...3本书配套资源...5第一篇Python基础知识第1章初识Python.31.1Python简介...31.2搭建Python开发环境...81.3第一个Python程序...261.4调试Python程序...261.5小结...291.6实战与练习...29第2章Python语言基础...302.1Python程序中的基本要素...302.2数字...342.3获取用户
Python从入门到高手9.1节-Python中的字典类型大神薯条老师 Python从入门到高手 python 数据分析机器学习爬虫网络爬虫深度学习
目录9.1.1理解字典类型9.1.2字典的类型名9.1.3字典的定义9.1.4字典的主要性质9.1.5好好学习，天天向上9.1.1理解字典类型在日常生活中，我们常常会接触到“字典”这种数据类型，例如一本书籍的目录结构，在目录结构中，通过查找页码，就可以快速翻到指定的页面。如果没有这样的页码，那么我们必须从书籍的第一页开始，一页一页地查找。有了页码以后，直接翻到指定的页面。在Python中，可以通过
Github 2024-06-07开源项目日报 Top10
根据GithubTrendings的统计，今日(2024-06-07统计)共有10个项目上榜。根据开发语言中项目的数量，汇总情况如下：开发语言项目数量Python项目3C++项目3JavaScript项目2JupyterNotebook项目1TypeScript项目1Vue项目1比特币核心：开源比特币软件创建周期：4919天开发语言：C++协议类型：MITLicenseStar数量：76760个F
AI原生应用领域多租户的技术架构剖析 AI天才研究院 AI-native 架构人工智能 ai
AI原生应用领域多租户技术架构深度剖析元数据框架标题：AI原生应用多租户技术架构：从隔离性到智能化的分层设计与实践关键词：AI原生应用、多租户架构、数据隔离、模型共享、云原生租户管理摘要：本文系统解析AI原生应用场景下多租户技术架构的核心设计逻辑，覆盖从数据层到模型层的全栈隔离与共享机制。通过第一性原理推导，结合云原生、机器学习生命周期管理（MLOps）等技术范式，提出包含租户上下文管理、动态资源
LangGraph 教程：初学者综合指南（1）背太阳的牧羊人 langgraph langchain langgraph
关键概念图结构LangGraph设计的核心是基于图形的应用程序工作流程表示。该图包含两个主要元素：节点-工作的构建块：LangGraph中的每个节点代表应用程序中的一个不同的工作或操作单元。这些节点本质上是封装特定任务的Python函数。此任务可能涉及多种操作，例如：与LLM直接沟通，进行文本生成、摘要或其他基于语言的任务。与外部工具和API交互以获取数据或在现实世界中执行操作。通过格式化、过滤或
Python 应用程序分发全指南：从基础到高级工具与实践面朝大海，春不暖，花不开 Python基础 python 开发语言
文章大纲引言在现代软件开发中，Python因其简洁的语法和强大的生态系统而广受欢迎。然而，将Python应用程序从开发者手中传递给最终用户并非总是简单的过程。分发Python应用程序涉及到诸多挑战，例如依赖管理、跨平台兼容性以及用户环境的多样性。如果分发不当，用户可能面临安装失败或运行错误等问题，从而影响软件的使用体验。本文将深入探讨Python应用程序分发的各种方法，从最基础的源代码分享到现代标
轻松拿捏Anaconda安装，Python开发快人一步奔跑吧邓邓子必备核心技能 python 开发语言 Anaconda 科学计算
目录一、Anaconda是什么1.1包管理与环境管理1.2预装丰富的科学计算库二、为什么选择Anaconda2.1简化依赖管理2.2避免版本冲突2.3丰富的库资源2.4适合的应用场景三、安装前准备3.1确认系统要求3.2下载安装包四、Windows系统安装步骤4.1运行安装程序4.2许可协议4.3选择安装类型4.4选择安装路径4.5高级选项4.6安装完成五、MacOS系统安装步骤5.1下载安装包5
mavlink python 彩云的笔记 linux 无人驾驶 mavlink
frompymavlinkimportmavutil#Createtheconnectionm=mavutil.mavlink_connection('udpin:0.0.0.0:14550')dir(m.mav)['_MAVLink__callbacks','_MAVLink__parse_char_legacy','_MAVLink__parse_char_native','__class__
《用上位机控制无人机：Python+MAVLink协议飞行实验》欧振芳 python
1.实验目标-通过Python编写的上位机程序，基于MAVLink协议控制无人机（如PX4/ArduPilot固件的无人机）。-实现基础飞行指令：解锁、起飞、悬停、降落。-探索MAVLink消息的构造与解析机制。2.实验环境准备硬件-无人机硬件：支持MAVLink协议的飞控（如Pixhawk系列）。-通信链路：USB直连、数传电台（3DRRadio）或WiFi（如通过UDP）。-安全环境：空旷无干
一次Python与STK12.2联合仿真
（一）软件准备：STK12.2是在某宝上花钱买的。我个人在安装软件上，更偏向于能用钱解决的就用钱解决，无论是商家远程安装还是自己按照商家的步骤安装，效率都更高，而自己从网上找免费的渠道安装软件费时费力还不一定能成功。Python是自己按照版本对应关系下载的，我使用的Python版本是3.10.9。我是在PycharmCommunityEdition2023.1.1上进行编程。（二）STK12与Py
《Python 项目 CI/CD 实战指南：从零构建自动化部署流水线》清水白石008 课程教程学习笔记开发语言 python ci/cd 自动化
《Python项目CI/CD实战指南：从零构建自动化部署流水线》一、引言：为什么Python项目需要CI/CD？在现代软件开发中，CI/CD（持续集成/持续部署）已成为不可或缺的工程实践。它不仅提升了开发效率，还显著降低了部署风险。对于Python项目而言，CI/CD的价值尤为突出：✅自动化测试确保代码质量✅快速部署加速产品迭代✅与云平台、容器技术无缝集成✅支持多版本、多环境的灵活发布Python
使用python调用STK12.2并实现霍曼转移 AndyVictory python 开发语言
使用STK的PythonAPI和Astrogator模块来创建一个简单的霍曼转移轨道场景（从近地轨道转移到地球同步轨道）:1、创建一个新的场景并添加一个卫星。2、定义卫星的初始状态（近地轨道的参数）。3、传播近地轨道。4、使用目标序列和DV1机动将卫星转移到转移椭圆轨道。5、传播转移椭圆轨道到远地点。6、使用目标序列和DV2机动将卫星转移到外部轨道（地球同步轨道）。7、传播外部轨道。8、运行任务控
python坦克大战名难取aaa python pygame 开发语言贴图
文章目录前言资源获取一、项目介绍1.pygame是什么？2.操作指南3.项目演示二、项目实现1.安装库2.引入库3.项目代码3.1主逻辑类3.2背景类3.3基类3.4坦克类3.5MyTank类3.6EnemyTank类3.7子弹类3.8爆炸类3.9墙壁类3.10水晶类3.11音乐类4.项目打包参考文档总结前言《坦克大战》，1985年由日本开发商南梦宫（Namco）开发，是第一款可以双打的红白机游戏
Python批量爬取谷歌原图，2021年最新可用版
文章目录前言一、环境配置1.安装selenium2.使用正确的谷歌浏览器驱动二、使用步骤1.加载chromedriver.exe2.设置是否开启可视化界面3.输入关键词、下载图片数、图片保存路径三、爬取效果四、完整代码前言作为一名CVer，数据集获取少不了用到数据、图片爬虫技术，谷歌作为全球最大的数据搜索网站，如何从中快速获取大量有用图片数据尤为重要，但是技术更新，很多代码大多就会失效，爬与反爬永
【Pycharm虚拟环境下载模块】阿斯达使 python
Pycharm虚拟环境下载模块优点步骤优点模块安装在虚拟环境中，不会污染全局Python，并且不同项目可以使用不同版本的模块。步骤使用cmd打开命令提示符，进入项目路径。·C:\\>D:·D:>cd\Pycharm\Rician\venv\Scriptsactivate进行激活使用pipinstall下载需要的模块通过piplist查看当前环境中已安装的模块使用deactivate退出虚拟环境
python基础项目实战-PyQt5制作俄罗斯方块春风抚微霞 python项目实战 python pygame 开发语言
之前已经使用pygame制作了一款简易的俄罗斯方块，最近学习了python的GUI编程，也就进行了实操了一下，用PyQt5制作了一下。1.俄罗斯方块的形状：S、Z、T、L、反向L、直线、方块，每个形状都由4个方块组成，方块最终都会落到屏幕底部。2.操作:左键:左移右键:右移上键:向左旋转下键:向右旋转D键:加速下落空格键:直接掉落到底部P键:暂停3.完整代码如下:#!/usr/bin/python
Python爬虫实战：批量下载小红书笔记图片的全流程技术解析 Python爬虫项目 2025年爬虫实战项目 python 爬虫笔记开发语言音视频 github
1.引言：为什么要爬取小红书笔记图片小红书作为新兴的生活方式分享平台，聚集了大量高质量原创笔记内容，涵盖时尚、美妆、旅游、美食等多领域。笔记中的图片往往是内容的核心，批量下载小红书笔记图片，有助于：内容归档与备份数据分析与用户行为研究图像识别与机器学习训练电商推广及内容再加工但小红书对内容保护做得较好，爬取难度较高，需要结合多技术手段突破。2.小红书平台特点与爬取难点动态加载与API接口多变：页面
基于Python的Google Patents专利数据爬取实战：从入门到精通 Python爬虫项目 2025年爬虫实战项目 python 开发语言爬虫 scrapy selenium
摘要本文将详细介绍如何使用Python构建一个高效的GooglePatents专利爬虫，涵盖最新技术如Playwright浏览器自动化、异步请求处理、反反爬策略等。文章包含完整的代码实现、性能优化技巧以及数据处理方法，帮助读者全面掌握专利数据采集技术。1.引言在当今知识经济时代，专利数据已成为企业技术研发、市场竞争分析的重要资源。GooglePatents作为全球最大的专利数据库之一，收录了来自全
Python游戏开发实战：打造高仿俄罗斯方块掌机坦克大战
引言在那个电子游戏刚刚兴起的年代，俄罗斯方块掌机上的坦克大战承载着无数玩家的童年记忆。简单的像素画面、紧张刺激的战斗、精准的操作反馈，这些元素构成了一个经典的游戏体验。今天，我们将用Python和pygame库来重新诠释这个经典游戏，不仅要还原其精髓，更要在技术实现上进行创新和优化。这个项目不仅仅是一个简单的游戏复刻，更是一次完整的游戏开发实践。从游戏架构设计到用户体验优化，从碰撞检测算法到动态难
Python 代码生成 LaTeX 数学公式：latexify 示例 examples
文中内容仅限技术学习与代码实践参考，市场存在不确定性，技术分析需谨慎验证，不构成任何投资建议。latexify示例本notebook提供了多个使用latexify的示例。更多细节请参阅官方文档。如有任何疑问，请在issuetracker中提出。安装latexify#运行下方示例前请先重启运行时。%pipinstalllatexify-pyCollectinglatexify-pyDownloadi
fdata = fp.read()ValueError: read of closed file 什么意思 whale fall python进阶 python
这个错误提示ValueError:readofclosedfile意味着你尝试从一个已经关闭的文件对象中读取数据。在Python中，当你打开一个文件后，文件需要保持打开状态才能进行读取或者写入操作。如果你关闭了文件（例如使用file.close()或者文件对象自动关闭），再尝试读取就会触发这个错误。要避免这个错误，可以确保在文件关闭之前读取文件，或者使用with语句来自动管理文件的打开和关闭。例如
人脸识别实战：使用Python OpenCV 和深度学习进行人脸识别(2)
先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！因此收集整理了一份《2024年最新Python全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课
22、Python 多线程编程与GIL锁机制深度解析 wolf犭良 python python 开发语言
Python多线程编程与GIL锁机制深度解析引言：多线程的意义与挑战在Python并发编程领域，多线程技术因其轻量级和易用性广受欢迎。然而全球解释器锁（GIL）的存在使得Python多线程在CPU密集型任务中表现特殊。本文将通过理论解析、代码实战和性能测试，带你全面掌握线程同步机制，深入理解GIL的工作机制，并提供绕过性能瓶颈的解决方案。一、多线程编程基础1.1线程创建方式Python通过thre
Spring4.1新特性——Spring MVC增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
mysql 性能查询优化 annan211 java sql 优化 mysql 应用服务器
1 时间到底花在哪了？ mysql在执行查询的时候需要执行一系列的子任务，这些子任务包含了整个查询周期最重要的阶段，这其中包含了大量为了检索数据列到存储引擎的调用以及调用后的数据处理，包括排序、分组等。在完成这些任务的时候，查询需要在不同的地方花费时间，包括网络、cpu计算、生成统计信息和执行计划、锁等待等。尤其是向底层存储引擎检索数据的调用操作。这些调用需要在内存操
windows系统配置 cherishLC windows
删除Hiberfil.sys ：使用命令powercfg -h off 关闭休眠功能即可： http://jingyan.baidu.com/article/f3ad7d0fc0992e09c2345b51.html 类似的还有pagefile.sys msconfig 配置启动项 shutdown 定时关机 ipconfig 查看网络配置 ipconfig /flushdns
人体的排毒时间 Array_06 工作
======================== || 人体的排毒时间是什么时候？|| ======================== 转载于： http://zhidao.baidu.com/link?url=ibaGlicVslAQhVdWWVevU4TMjhiKaNBWCpZ1NS6igCQ78EkNJZFsEjCjl3T5EdXU9SaPg04bh8MbY1bR
ZooKeeper cugfy zookeeper
Zookeeper是一个高性能，分布式的，开源分布式应用协调服务。它提供了简单原始的功能，分布式应用可以基于它实现更高级的服务，比如同步，配置管理，集群管理，名空间。它被设计为易于编程，使用文件系统目录树作为数据模型。服务端跑在java上，提供java和C的客户端API。 Zookeeper是Google的Chubby一个开源的实现，是高有效和可靠的协同工作系统，Zookeeper能够用来lea
网络爬虫的乱码处理随意而生爬虫网络
下边简单总结下关于网络爬虫的乱码处理。注意，这里不仅是中文乱码，还包括一些如日文、韩文、俄文、藏文之类的乱码处理，因为他们的解决方式是一致的，故在此统一说明。网络爬虫，有两种选择，一是选择nutch、hetriex，二是自写爬虫，两者在处理乱码时，原理是一致的，但前者处理乱码时，要看懂源码后进行修改才可以，所以要废劲一些；而后者更自由方便，可以在编码处理
Xcode常用快捷键张亚雄 xcode
一、总结的常用命令：隐藏xcode command+h 退出xcode command+q 关闭窗口 command+w 关闭所有窗口 command+option+w 关闭当前
mongoDB索引操作 adminjun mongodb 索引
一、索引基础： MongoDB的索引几乎与传统的关系型数据库一模一样，这其中也包括一些基本的优化技巧。下面是创建索引的命令： > db.test.ensureIndex({"username":1}) 可以通过下面的名称查看索引是否已经成功建立： &nbs
成都软件园实习那些话 aijuans 成都软件园实习
无聊之中，翻了一下日志，发现上一篇经历是很久以前的事了，悔过~~ 　　断断续续离开了学校快一年了，习惯了那里一天天的幼稚、成长的环境，到这里有点与世隔绝的感觉。不过还好，那是刚到这里时的想法，现在感觉在这挺好，不管怎么样，最要感谢的还是老师能给这么好的一次催化成长的机会，在这里确实看到了好多好多能想到或想不到的东西。　　都说在外面和学校相比最明显的差距就是与人相处比较困难，因为在外面每个人都
Linux下FTP服务器安装及配置 ayaoxinchao linux FTP服务器 vsftp
检测是否安装了FTP [root@localhost ~]# rpm -q vsftpd 如果未安装：package vsftpd is not installed 安装了则显示：vsftpd-2.0.5-28.el5累死的版本信息安装FTP 运行yum install vsftpd命令，如[root@localhost ~]# yum install vsf
使用mongo-java-driver获取文档id和查找文档 BigBird2012 driver
注：本文所有代码都使用的mongo-java-driver实现。在MongoDB中，一个集合（collection）在概念上就类似我们SQL数据库中的表（Table），这个集合包含了一系列文档（document）。一个DBObject对象表示我们想添加到集合（collection）中的一个文档（document），MongoDB会自动为我们创建的每个文档添加一个id，这个id在
JSONObject以及json串 bijian1013 json JSONObject
一.JAR包简介要使程序可以运行必须引入JSON-lib包，JSON-lib包同时依赖于以下的JAR包： 1.commons-lang-2.0.jar 2.commons-beanutils-1.7.0.jar 3.commons-collections-3.1.jar &n
[Zookeeper学习笔记之三]Zookeeper实例创建和会话建立的异步特性 bit1129 zookeeper
为了说明问题，看个简单的代码， import org.apache.zookeeper.*; import java.io.IOException; import java.util.concurrent.CountDownLatch; import java.util.concurrent.ThreadLocal
【Scala十二】Scala核心六：Trait bit1129 scala
Traits are a fundamental unit of code reuse in Scala. A trait encapsulates method and field definitions, which can then be reused by mixing them into classes. Unlike class inheritance, in which each c
weblogic version 10.3破解 ronin47 weblogic
版本：WebLogic Server 10.3 说明：%DOMAIN_HOME%：指WebLogic Server 域(Domain）目录例如我的做测试的域的根目录 DOMAIN_HOME=D:/Weblogic/Middleware/user_projects/domains/base_domain 1.为了保证操作安全，备份%DOMAIN_HOME%/security/Defa
求第n个斐波那契数 BrokenDreams
今天看到群友发的一个问题：写一个小程序打印第n个斐波那契数。自己试了下，搞了好久。。。基础要加强了。 &nbs
读《研磨设计模式》-代码笔记-访问者模式-Visitor bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; interface IVisitor { //第二次分派，Visitor调用Element void visitConcret
MatConvNet的excise 3改为网络配置文件形式 cherishLC matlab
MatConvNet为vlFeat作者写的matlab下的卷积神经网络工具包，可以使用GPU。主页： http://www.vlfeat.org/matconvnet/ 教程： http://www.robots.ox.ac.uk/~vgg/practicals/cnn/index.html 注意：需要下载新版的MatConvNet替换掉教程中工具包中的matconvnet： http
ZK Timeout再讨论 chenchao051 zookeeper timeout hbase
http://crazyjvm.iteye.com/blog/1693757 文中提到相关超时问题，但是又出现了一个问题，我把min和max都设置成了180000，但是仍然出现了以下的异常信息： Client session timed out, have not heard from server in 154339ms for sessionid 0x13a3f7732340003
CASE WHEN 用法介绍 daizj sql group by case when
CASE WHEN 用法介绍 1. CASE WHEN 表达式有两种形式 --简单Case函数 CASE sex WHEN '1' THEN '男' WHEN '2' THEN '女' ELSE '其他' END --Case搜索函数 CASE WHEN sex = '1' THEN
PHP技巧汇总:提高PHP性能的53个技巧 dcj3sjt126com PHP
PHP技巧汇总:提高PHP性能的53个技巧　　用单引号代替双引号来包含字符串，这样做会更快一些。因为PHP会在双引号包围的字符串中搜寻变量，　　单引号则不会，注意：只有echo能这么做，它是一种可以把多个字符串当作参数的函数译注：　　PHP手册中说echo是语言结构，不是真正的函数，故把函数加上了双引号)。　　1、如果能将类的方法定义成static，就尽量定义成static，它的速度会提升将近4倍
Yii框架中CGridView的使用方法以及详细示例 dcj3sjt126com yii
CGridView显示一个数据项的列表中的一个表。表中的每一行代表一个数据项的数据,和一个列通常代表一个属性的物品(一些列可能对应于复杂的表达式的属性或静态文本)。　　CGridView既支持排序和分页的数据项。排序和分页可以在AJAX模式或正常的页面请求。使用CGridView的一个好处是,当用户浏览器禁用JavaScript,排序和分页自动退化普通页面请求和仍然正常运行。实例代码如下：
Maven项目打包成可执行Jar文件 dyy_gusi assembly
Maven项目打包成可执行Jar文件在使用Maven完成项目以后，如果是需要打包成可执行的Jar文件，我们通过eclipse的导出很麻烦，还得指定入口文件的位置，还得说明依赖的jar包，既然都使用Maven了，很重要的一个目的就是让这些繁琐的操作简单。我们可以通过插件完成这项工作，使用assembly插件。具体使用方式如下： 1、在项目中加入插件的依赖： <plugin>
php常见错误 geeksun PHP
1. kevent() reported that connect() failed (61: Connection refused) while connecting to upstream, client: 127.0.0.1, server: localhost, request: "GET / HTTP/1.1", upstream: "fastc
修改linux的用户名 hongtoushizi linux change password
Change Linux Username 更改Linux用户名，需要修改4个系统的文件： /etc/passwd /etc/shadow /etc/group /etc/gshadow 古老/传统的方法是使用vi去直接修改，但是这有安全隐患（具体可自己搜一下），所以后来改成使用这些命令去代替： vipw vipw -s vigr vigr -s 具体的操作顺
第五章常用Lua开发库1-redis、mysql、http客户端 jinnianshilongnian nginx lua
对于开发来说需要有好的生态开发库来辅助我们快速开发，而Lua中也有大多数我们需要的第三方开发库如Redis、Memcached、Mysql、Http客户端、JSON、模板引擎等。一些常见的Lua库可以在github上搜索，https://github.com/search?utf8=%E2%9C%93&q=lua+resty。 Redis客户端 lua-resty-r
zkClient 监控机制实现 liyonghui160com zkClient 监控机制实现
直接使用zk的api实现业务功能比较繁琐。因为要处理session loss，session expire等异常，在发生这些异常后进行重连。又因为ZK的watcher是一次性的，如果要基于wather实现发布/订阅模式，还要自己包装一下，将一次性订阅包装成持久订阅。另外如果要使用抽象级别更高的功能，比如分布式锁，leader选举
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句 pda158 mysql
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句：　　方法一：SELECT table_name, column_name from information_schema.columns WHERE column_name LIKE 'Name'; 　　方法二：SELECT column_name from information_schema.colum
程序员对英语的依赖 Smile.zeng 英语程序猿
1、程序员最基本的技能，至少要能写得出代码，当我们还在为建立类的时候思考用什么单词发牢骚的时候，英语与别人的差距就直接表现出来咯。 2、程序员最起码能认识开发工具里的英语单词，不然怎么知道使用这些开发工具。 3、进阶一点，就是能读懂别人的代码，有利于我们学习人家的思路和技术。 4、写的程序至少能有一定的可读性，至少要人别人能懂吧... 以上一些问题，充分说明了英语对程序猿的重要性。骚年
Oracle学习笔记(8) 使用PLSQL编写触发器 vipbooks oracle sql 编程活动 Access
时间过得真快啊，转眼就到了Oracle学习笔记的最后个章节了，通过前面七章的学习大家应该对Oracle编程有了一定了了解了吧，这东东如果一段时间不用很快就会忘记了，所以我会把自己学习过的东西做好详细的笔记，用到的时候可以随时查找，马上上手！希望这些笔记能对大家有些帮助！这是第八章的学习笔记，学习完第七章的子程序和包之后

CTPN的Python实现笔记一

文章目录

一、疑难代码讲解

1. 文本框左上角标注置信度

(1) s = str(round(i[-1] * 100, 2)) + '%'

(2) cv2.putText() 函数

(3) cv2.line()函数

2. 文本框进行扩展操作

3. 文本框进行NMS操作

(1) 非极大值抑制函数def nms(dets, thresh):

a. order = scores.argsort()[::-1]

b. xx1 = np.maximum(x1[i], x1[order[1:]])

c. inds = np.where(ovr <= thresh)[0]

(2) np.hstack()函数