Vertira

paddle 模型与层---- 笔记（边学边练）

模型与层

模型是深度学习中的重要概念之一。模型的核心功能是将一组输入变量经过一系列计算，映射到另一组输出变量，该映射函数即代表一种深度学习算法。在Paddle框架中，模型包括以下两方面内容：

一系列层的组合用于进行映射（前向执行）
一些参数变量在训练过程中实时更新

1.1 在Paddle中定义模型与层

在Paddle中，大多数模型由一系列层组成，层是模型的基础逻辑执行单元。层中持有两方面内容：

一方面是计算所需的变量，以临时变量或参数的形式作为层的成员持有
另一方面则持有一个或多个具体的Operator来完成相应的计算。

1.1.1 模型与层
从零开始构建变量、Operator，从而组建层、模型是一个很复杂的过程，并且当中难以避免的会出现很多冗余代码，因此Paddle提供了基础数据类型 paddle.nn.Layer ，来方便你快速的实现自己的层和模型。模型和层都可以基于 paddle.nn.Layer 扩充实现，因此也可以说模型只是一种特殊的层。下面将演示如何利用 paddle.nn.Layer 建立自己的模型：

class Model(paddle.nn.Layer):

    def __init__(self):
        super(Model, self).__init__()
        self.flatten = paddle.nn.Flatten()

    def forward(self, inputs):
        y = self.flatten(inputs)
        return y

当前示例中，通过继承 paddle.nn.Layer 的方式构建了一个模型类型 Model ，模型中仅包含一个 paddle.nn.Flatten 层。模型执行时，输入变量inputs会被 paddle.nn.Flatten 层展平。

1.1.2 测试用例

x = paddle.to_tensor([[1,2,3],[4,5,6]])
print(x)

model = Model()
y = model(x)
print(y)

测试结果如下

Tensor(shape=[2, 3], dtype=int64, place=Place(gpu:0), stop_gradient=True,
       [[1, 2, 3],
        [4, 5, 6]])
W1007 17:07:41.602807 22256 gpu_context.cc:278] Please NOTE: device: 0, GPU Compute Capability: 8.6, Driver API Version: 11.6, Runtime API Version: 11.2
W1007 17:07:41.699020 22256 gpu_context.cc:306] device: 0, cuDNN Version: 8.2.
Tensor(shape=[2, 3], dtype=int64, place=Place(gpu:0), stop_gradient=True,
       [[1, 2, 3],
        [4, 5, 6]])

从输出的结果可以看出，1.print(x)，print(y)都调用0号GPU。

注意：电脑上安装的paddle是GPU版本的

2. 对比两个结果，Flatten的展平功能呢？结果怎么没有被层展平呢？

修改一下上面的类中的Flatten()

class Model(paddle.nn.Layer):

    def __init__(self):
        super(Model, self).__init__()

    def forward(self, inputs):
        y = self.Flatten(inputs)
        return y

    def Flatten(self, x):
        xx = x.numpy().flatten()
        return paddle.to_tensor(xx)

x = paddle.to_tensor([[1,2,3],[4,5,6]])
print(x)

model = Model()
y = model(x)
print(y)

重写了Flatten方法，用numpy中的Flatten功能函数实现

“xx = x.numpy().flatten()”

然后再转tensor, 因为paddle只能运行tensor，所有数据都要是tensor的格式。

看一下运行后的结果

Tensor(shape=[2, 3], dtype=int64, place=Place(gpu:0), stop_gradient=True,
       [[1, 2, 3],
        [4, 5, 6]])
Tensor(shape=[6], dtype=int64, place=Place(gpu:0), stop_gradient=True,
       [1, 2, 3, 4, 5, 6])

从tensor的输出信息可以看错，第一个是print(x),第二个是print(y),明显实现了矩阵展平的功能。

他们都调用了0号gpu

1.2 子层接口

如果想要访问或修改一个模型中定义的层，则可以调用SubLayer相关的接口

1.2.1 继承子层

以上文创建的简单模型为例, 如果想要查看模型中定义的所有子层：

1.可以通过调用 model.sublayers()接口，打印出了前述模型中持有的全部子层(这时模型中只有一个 paddle.nn.Flatten子层)。

2.而遍历 model.named_sublayers() 时，每一轮循环会拿到一组 ( 子层名称('flatten')，子层对象(paddle.nn.Flatten))的元组。

完整代码如下：

class Model(paddle.nn.Layer):

    def __init__(self):
        super(Model, self).__init__()
        self.flatten = paddle.nn.Flatten()

    def forward(self, inputs):
        y = self.flatten(inputs)
        return y


model = Model()
print(model.sublayers())

print("***************************")
for item in model.named_sublayers():
    print(item)

输出如下，用上面的两种方法实现

[Flatten()]
***************************
('flatten', Flatten())

如果增加self中的一个层次，可以看到多出了更多的层。

完整代码如下

class Model(paddle.nn.Layer):

    def __init__(self):
        super(Model, self).__init__()
        self.flatten = paddle.nn.Flatten()
        self.f1   = paddle.nn.Flatten()

    def forward(self, inputs):
        y = self.Flatten(inputs)
        return y

model = Model()
print(model.sublayers())

print("*********************")

for item in model.named_sublayers():
    print(item)

输出结果如下

[Flatten(), Flatten()]
*********************
('flatten', Flatten())
('f1', Flatten())

1.2.2 增加子层

fc = paddle.nn.Linear(10, 3)
model.add_sublayer("fc", fc)
print(model.sublayers())

通过add_sublayer()函数实现增加一个子层

完整代码

class Model(paddle.nn.Layer):

    def __init__(self):
        super(Model, self).__init__()
        self.flatten = paddle.nn.Flatten()

    def forward(self, inputs):
        y = self.flatten(inputs)
        return y

model = Model()
fc = paddle.nn.Linear(10, 3)
model.add_sublayer("fc", fc)
print(model.sublayers())

print("***************************")
for item in model.named_sublayers():
    print(item)

输出结果：

[Flatten(), Linear(in_features=10, out_features=3, dtype=float32)]
***************************
('flatten', Flatten())
('fc', Linear(in_features=10, out_features=3, dtype=float32))

Process finished with exit code 0

大家看 “***”行上面的内容就可以了。*行下面的是迭代输出层的内容。结果都是一样的

可以看到 model.add_sublayer() 向模型中添加了一个 paddle.nn.Linear 子层，这样模型中总共有 paddle.nn.Flatten 和 paddle.nn.Linear 两个子层了。

1.2.3 修改子层

通过上述方法可以往模型中添加成千上万个子层，当模型中子层数量较多时，如何高效地对所有子层进行统一修改呢？

Paddle 提供了 apply() 接口。通过这个接口，可以自定义一个函数，然后将该函数批量作用在所有子层上：

def function(layer):
    print(layer)

model.apply(function)

完整的代码如下

class Model(paddle.nn.Layer):

    def __init__(self):
        super(Model, self).__init__()
        self.flatten = paddle.nn.Flatten()

    def forward(self, inputs):
        y = self.flatten(inputs)
        return y

model = Model()


fc = paddle.nn.Linear(10, 3)
model.add_sublayer("fc", fc)
print(model.sublayers())
print("***************************")
def function(layer):
    print(layer)

model.apply(function)

大家重点关注print("***************************")这一行下面的输出

输出结果如下

[Flatten(), Linear(in_features=10, out_features=3, dtype=float32)]
***************************
Flatten()
Linear(in_features=10, out_features=3, dtype=float32)
Model(
  (flatten): Flatten()
  (fc): Linear(in_features=10, out_features=3, dtype=float32)
)

大家会发现，这个function的作用是输出层的信息。它并不属于层结构。当然你也可以根据自己的需求添加自定义函数。

当前例子中，定义了一个以layer作为参数的函数function，用来打印传入的layer信息。通过调用 model.apply() 接口，将function作用在模型的所有子层中，也因此输出信息中打印了model中所有子层的信息。

另外一个批量访问子层的接口是 children() 或者 named_children() 。这两个接口通过Iterator的方式访问每个子层：

sublayer_iter = model.children()
for sublayer in sublayer_iter:
    print(sublayer)

输出：

Flatten()
Linear(in_features=10, out_features=3, dtype=float32)

1.3 层中的变量成员
1.3.1 参数变量添加与修改
有的时候希望向网络中添加一个参数作为输入。比如在使用图像风格转换模型时，会使用参数作为输入图像，在训练过程中不断更新该图像参数，最终拿到风格转换后的图像。

这时可以通过 create_parameter() 与 add_parameter() 组合，来创建并记录参数：

class Model(paddle.nn.Layer):

    def __init__(self):
        super(Model, self).__init__()
        img = self.create_parameter([1,3,256,256])
        self.add_parameter("img", img)
        self.flatten = paddle.nn.Flatten()

    def forward(self):
        y = self.flatten(self.img)
        return y

上述例子创建并向模型中添加了一个名字为"img"的参数。随后可以直接通过调用model.img来访问该参数。

对于已经添加的参数，可以通过 parameters() 或者 named_parameters() 来访问

model = Model()
model.parameters()
print('*********************************')
for item in model.named_parameters():
    print(item)

完整的代码


import os
import random
from PIL import Image
import paddle
import numpy as np
class Model(paddle.nn.Layer):

    def __init__(self):
        super(Model, self).__init__()
        img = self.create_parameter([1, 3, 256, 256])
        self.add_parameter("img", img)
        self.flatten = paddle.nn.Flatten()

    def forward(self):
        y = self.flatten(self.img)
        return y


model = Model()
model.parameters()
print('*********************************')
for item in model.named_parameters():
    print(item)

输出结果

*********************************
('img', Parameter containing:
Tensor(shape=[1, 3, 256, 256], dtype=float32, place=Place(gpu:0), stop_gradient=False,
       [[[[ 0.00325643,  0.00255461, -0.00272588, ...,  0.00072279,
            0.00351666,  0.00107995],
          [ 0.00228817, -0.00450356,  0.00099415, ..., -0.00419101,
           -0.00114995, -0.00345563],
          [-0.00230776, -0.00335513, -0.00203175, ...,  0.00088496,
           -0.00449636,  0.00399134],
          ...,
          [ 0.00094661, -0.00471443,  0.00290659, ...,  0.00265058,
           -0.00124940, -0.00047589],
          [ 0.00168675,  0.00419965, -0.00275908, ...,  0.00343265,
            0.00299130, -0.00223703],
          [ 0.00415531,  0.00045260,  0.00318608, ...,  0.00276867,
           -0.00381224, -0.00249666]],

         [[-0.00344608, -0.00063777, -0.00464929, ...,  0.00418700,
           -0.00114783,  0.00303779],
          [ 0.00281780,  0.00415517,  0.00325592, ..., -0.00453324,
            0.00362573,  0.00342112],
          [ 0.00107392, -0.00197935,  0.00418595, ..., -0.00245356,
            0.00081301, -0.00452506],
          ...,
          [ 0.00380220, -0.00328189,  0.00261540, ...,  0.00317596,
            0.00307307,  0.00269659],
          [-0.00017473,  0.00471288, -0.00106649, ...,  0.00014306,
           -0.00251754,  0.00312610],
          [-0.00216883, -0.00461749,  0.00325944, ...,  0.00402439,
           -0.00412884,  0.00464935]],

         [[ 0.00392813, -0.00054541,  0.00432546, ...,  0.00195517,
           -0.00387182,  0.00159391],
          [ 0.00079864,  0.00041935, -0.00388202, ...,  0.00288824,
           -0.00195494, -0.00401914],
          [-0.00071680, -0.00152895, -0.00349227, ...,  0.00245612,
           -0.00156318, -0.00027233],
          ...,
          [ 0.00423688, -0.00445199,  0.00230713, ..., -0.00377530,
            0.00056901, -0.00395238],
          [-0.00262016, -0.00386400, -0.00408922, ...,  0.00300010,
            0.00113233,  0.00426760],
          [-0.00451327,  0.00095532,  0.00452803, ...,  0.00038162,
            0.00199159,  0.00332551]]]]))

Process finished with exit code 0

可以看到，model.parameters() 将模型中所有参数以数组的方式返回。

在实际的模型训练过程中，当调用反向图执行方法后，Paddle会计算出模型中每个参数的梯度并将其保存在相应的参数对象中。如果已经对该参数进行了梯度更新，或者出于一些原因不希望该梯度累加到下一轮训练，则可以调用 clear_gradients() 来清除这些梯度值。

model = Model()
out = model()
out.backward()
model.clear_gradients()

1.3.2 非参数变量的添加

参数变量往往需要参与梯度更新，但很多情况下只是需要一个临时变量甚至一个常量。比如在模型执行过程中想将一个中间变量保存下来，这时需要调用 create_tensor() 接口：

class Model(paddle.nn.Layer):

    def __init__(self):
        super(Model, self).__init__()
        self.saved_tensor = self.create_tensor(name="saved_tensor0")
        self.flatten = paddle.nn.Flatten()
        self.fc = paddle.nn.Linear(10, 100)

    def forward(self, input):
        y = self.flatten(input)
        # Save intermediate tensor
        paddle.assign(y, self.saved_tensor)
        y = self.fc(y)
        return y

model = Model()
print(model.sublayers())

运行结果

[Flatten(), Linear(in_features=10, out_features=100, dtype=float32)]

Process finished with exit code 0

这里调用 self.create_tensor() 创造了一个临时变量并将其记录在模型的 self.saved_tensor 中。在模型执行时调用 paddle.assign 用该临时变量记录变量y的数值。

1.3.3 Buffer变量的添加

Buffer的概念仅仅影响动态图向静态图的转换过程。在上一节中创建了一个临时变量用来临时存储中间变量的值。但这个临时变量在动态图向静态图转换的过程中并不会被记录在静态的计算图当中。如果希望该变量成为静态图的一部分，就需要进一步调用 register_buffers() 接口：

class Model(paddle.nn.Layer):

    def __init__(self):
        super(Model, self).__init__()
        saved_tensor = self.create_tensor(name="saved_tensor0")
        self.register_buffer("saved_tensor", saved_tensor, persistable=True)
        self.flatten = paddle.nn.Flatten()
        self.fc = paddle.nn.Linear(10, 100)

    def forward(self, input):
        y = self.flatten(input)
        # Save intermediate tensor
        paddle.assign(y, self.saved_tensor)
        y = self.fc(y)
        return y

这样在动态图转静态图时saved_tensor就会被记录到静态图中。

对于模型中已经注册的Buffer，可以通过 buffers() 或者 named_buffers() 进行访问:

model = Model()

print(model.buffers())

for item in model.named_buffers():
    print(item)

输出结果：

[Tensor(Not initialized)]
('saved_tensor', Tensor(Not initialized))

可以看到 model.buffers() 以数组形式返回了模型中注册的所有Buffer

1.4 执行层的功能

经过一系列对模型的配置，假如已经准备好了一个Paddle模型如下：

class Model(paddle.nn.Layer):

    def __init__(self):
        super(Model, self).__init__()
        self.flatten = paddle.nn.Flatten()

    def forward(self, inputs):
        y = self.flatten(inputs)
        return y

想要执行该模型，首先需要对执行模式进行设置

1.4.1 执行模式设置

模型的执行模式有两种，如果需要训练的话调用 train() ，如果只进行前向执行则调用 eval()：

x = paddle.randn([10, 1], 'float32')
model = Model()
model.eval()  # set model to eval mode
out = model(x)
model.train()  # set model to train mode
out = model(x)

1.4.2 执行函数

模式设置完成后可以直接调用执行函数。可以直接调用forward()方法进行前向执行，也可以调用 __call__() ，从而执行在 forward() 当中定义的前向计算逻辑。

class Model(paddle.nn.Layer):

    def __init__(self):
        super(Model, self).__init__()
        self.flatten = paddle.nn.Flatten()

    def forward(self, inputs):
        y = self.Flatten(inputs)
        return y

    def Flatten(self, inputs):
        return paddle.to_tensor(inputs.numpy().flatten())

model = Model()
x = paddle.randn([10, 1], 'float32')
out = model(x)
print(out)

输出：

Tensor(shape=[10], dtype=float32, place=Place(gpu:0), stop_gradient=True,
       [ 0.23584343, -0.09136827, -0.16628900,  1.35541523, -0.24900350,
        -0.12770079,  2.31148815,  0.99044156, -0.31726629,  0.71666038])

Process finished with exit code 0

这里直接调用 __call__() 方法调用模型的前向执行逻辑。

1.4.3 添加hook函数
有时希望某些变量在进入层前首先进行一些预处理，这个功能可以通过注册hook来实现。hook是一个作用于变量的自定义函数，在模型执行时调用。对于注册在层上的hook函数，可以分为pre_hook和post_hook两种。pre_hook可以对层的输入变量进行处理，用函数的返回值作为新的变量参与层的计算。post_hook则可以对层的输出变量进行处理，将层的输出进行进一步处理后，用函数的返回值作为层计算的输出。
通过 register_forward_post_hook() 接口，我们可以注册一个post_hook：

def forward_post_hook(layer, input, output):
    return 2*output

x = paddle.ones([10, 1], 'float32')
model = Model()
forward_post_hook_handle = model.flatten.register_forward_post_hook(forward_post_hook)
out = model(x)
print(out)

完整代码


import os
import random
import paddle
import numpy as np
class Model(paddle.nn.Layer):

    def __init__(self):
        super(Model, self).__init__()
        self.flatten = paddle.nn.Flatten()

    def forward(self, inputs):
        y = self.Flatten(inputs)
        return y

    def Flatten(self, inputs):
        return paddle.to_tensor(inputs.numpy().flatten())


def forward_post_hook(layer, input, output):
    return 2*output

x = paddle.ones([10, 1], 'float32')
model = Model()
forward_post_hook_handle = model.flatten.register_forward_post_hook(forward_post_hook)
out = model(x)
print(out)

输出结果

Tensor(shape=[10], dtype=float32, place=Place(gpu:0), stop_gradient=True,
       [1., 1., 1., 1., 1., 1., 1., 1., 1., 1.])

Process finished with exit code 0

1.5 保存模型参数

如果想要保存模型中参数而不存储模型本身，则可以首先调用 state_dict() 接口将模型中的参数以及永久变量存储到一个Python字典中，随后保存该字典。

model = Model()
state_dict = model.state_dict()
paddle.save( state_dict, "./paddle_dy.pdparams")

警告

D:\ProgramData\Anaconda3\envs\paddlede\lib\site-packages\paddle\framework\io.py:748: UserWarning: The input state dict is empty, no need to save.
  warnings.warn("The input state dict is empty, no need to save.")

虽然出现警告，但是模型还是保存了。第二次运行，就没有这个警告了。

欢迎点赞收藏加关注

参考：

(17条消息) Paddle网络结构中的层和模型_卓晴的博客-CSDN博客_paddle模型

你可能感兴趣的:(paddlepaddle,paddle)

「源力觉醒创作者计划」_以FastDeploy为例部署ERNIE-4.5-21B大模型全流程实践 cooldream2009 大模型基础 AI技术文心大模型 FastDeploy
目录前言1环境准备与依赖安装1.1硬件要求1.2Python环境与pip升级2下载ERNIE-4.5模型权重2.1安装HuggingFaceCLI工具2.2设置国内镜像加速（可选）2.3下载模型文件3安装FastDeploy与Paddle推理引擎3.1安装PaddlePaddle-GPU版本3.2安装FastDeploy-GPU4启动ERNIE-4.5本地服务4.1启动OpenAI兼容API服务4
【PaddleOCR】快速集成 PP-OCRv5 的 Python 实战秘籍--- 实例化 OCR 对象的 predict() 方法介绍
博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）博主粉丝群介绍：①群内初中生、
PaddleOCR 3.0全面解析：五大核心能力与实战应用指南经优英
PaddleOCR3.0全面解析：五大核心能力与实战应用指南PaddleOCRAwesomemultilingualOCRtoolkitsbasedonPaddlePaddle(practicalultralightweightOCRsystem,support80+languagesrecognition,providedataannotationandsynthesistools,suppor
python --飞浆离线ocr使用/paddleocr
依赖#python==3.7.3paddleocr==2.7.0.2paddlepaddle==2.5.2loguru==0.7.3frompaddleocrimportPaddleOCRimportcv2importnumpyasnpif__name__=='__main__':OCR=PaddleOCR(use_doc_orientation_classify=False,#检测文档方向use
【PaddleOCR】OCR文本检测与文本识别数据集整理，持续更新......
博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）博主粉丝群介绍：①群内初中生、
小数据量在paddleocrv4/5训练精度不高的原因探讨
问题：训练集有69张，验证集有48张,每张图的尺寸为2592*1396或接近这个尺寸，每张图约有50到60个目标,且每张图有较多的密集小目标，这些目标区域分别是一些文字或字母或数字。电脑配置显卡是2080ti，运行内存是32g，cpu是9700k。以上条件下，在pp-ocrv3上采用ch_pp_ocrv3_det_student.yml配置并采用ch_pp_ocrv3_det_distill_tr
paddleOCR模型的安装和使用九日卯贝 paddle ocr
paddleOCR仓库：https://github.com/PaddlePaddle/PaddleOCR?tab=readme-ov-file文档：https://paddlepaddle.github.io/PaddleOCR/main/quick_start.html#2-paddleocr环境安装python-mpipinstallpaddlepaddle-gpu==3.0.0b1-iht
文心4.5开源模型部署实践 skywalk8163 人工智能文心人工智能文心大模型开源大模型文心开源
文心4.5开源模型部署实践使用fastdeploy本地部署执行命令：python-mfastdeploy.entrypoints.openai.api_server\ --modelbaidu/ERNIE-4.5-21B-A3B-Paddle\ --port8180\ --metrics-port8181\ --engine-worker-queue-port8182\ --max-model-l
【PaddleOCR】快速集成 PP-OCRv5 的 Python 实战秘籍--- PaddleOCR实例化 OCR 对象的参数介绍云天徽上 PaddleOCR python ocr 开发语言人工智能文字识别
博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）博主粉丝群介绍：①群内初中生、
ali PaddleNLP docker 大熊程序猿 AI大模型 docker 容器运维
一、添加文件nano /root/projects/paddlenlp_similarity_server.pyfromflaskimportFlask,request,jsonifyimportpaddlefrompaddlenlpimportTaskflowimportjsonimportuuidapp=Flask(__name__)#初始化文本相似度模型similarity=Taskflow
paddlepaddle测试安装_python3.7中安装paddleocr及paddlepaddle包的多种方法瓦啦
升级pippip版本必须升级到20.0.4版本才能应用；方法一、在pycharm中对pip进行升级；方法二、通过命令进行升级python3.7-mpipinstall--upgradepip下载paddleOCR下载链接：https://github.com/PaddlePaddle/PaddleOCR打开paddleOCR文件夹中requirements.txt文件，更改文件中opencv-py
PaddleOCR不同模型和Paddle版本推理性能对比 dotNET跨平台 paddle
飞桨PaddleOCR这几年发布了从V2到V5的中英文OCR模型，Paddle推理框架也从2.X升级到3.0.0版本。本次对不同模型和推理框架的性能做些对比。测试条件：操作系统：win10X64CPU:13thGenIntel(R)Core(TM)i9-13900HF3.0GHz24核32线程CPU指令集：AVX,AVX2测试基于PaddleOCRSharp的C++版本SDK：https://gi
跨区域智能电网负荷预测：基于 PaddleFL 的创新探索暮雨哀尘人工智能智能电网 AIGC PaddleFL 数据库 python 可视化
跨区域智能电网负荷预测：基于PaddleFL的创新探索摘要：本文聚焦跨区域智能电网负荷预测，提出基于PaddleFL框架的联邦学习方法，整合多地区智能电网数据，实现数据隐私保护下的高精度预测，为电网调度优化提供依据，推动智能电网发展。一、引言在当今社会，电力作为经济发展的命脉，其稳定供应对于保障社会生活的正常运转和生产的持续进行具有不可替代的重要性。而智能电网作为现代电力系统的重要发展方向，通过集
ali docker部属paddleocr 大熊程序猿 ASP.NET Core docker 容器运维
dockerpullregistry.baidubce.com/paddlepaddle/paddle:2.6.0nano/root/projects/paddleocr_server.py========================fromflaskimportFlask,requestfromwerkzeug.utilsimportsecure_filenameimportuuidfrom
基于PaddleOCR的表格识别系统开发 pk_xz123456 仿真模型深度学习算法深度学习开发语言分类安全 cnn
基于PaddleOCR的表格识别系统开发1.项目概述本项目旨在使用PaddleOCR框架开发一个高性能的表格识别系统，能够准确识别约30种不同类型的表格结构。系统将处理2500张合成表格图像作为训练数据，并在合成测试集上进行评估。系统核心功能包括表格检测、表格结构识别和表格内容识别三部分。1.1项目背景表格是信息传递的重要载体，广泛存在于各类文档中。传统表格识别方法需要复杂的规则和模板，而基于深度
OpenVINO™2025部署PaddleOCR模型 OpenVINO 中文社区经验分享
PaddleOCR模型下载OpenVINO™2025支持直接加载paddle的模型。所以可以直接先从官网直接下载PaddleOCRv5.0的模型：文本检测模型下载地址#DownloadandunzipPP-OCRv5_server_detpre-trainedmodelhttps://paddle-model-ecology.bj.bcebos.com/paddlex/official_infer
PaddleOCR + Flask 构建 Web OCR 服务实战随风九天服务 flask 前端 ocr PaddleOCR
1、前言随着图像识别技术的发展，OCR（光学字符识别）已经成为很多应用场景中的基础能力。PaddleOCR是百度开源的一个高性能OCR工具库，支持中英文、多语言、轻量级部署等特性。而Flask是一个轻量级的PythonWeb框架，非常适合快速构建RESTfulAPI或小型Web应用。本文将带你一步步使用PaddleOCR+Flask搭建一个完整的WebOCR服务，实现图片上传→文字识别→返回结构化
开源(离线)中文语音识别ASR(语音转文本)工具整理切糕师学AI #语音识别asr与语音合成STT 语音识别人工智能深度学习
开源(离线)中文语音识别ASR(语音转文本)工具整理目录文章目录目录@[toc]openai的开源工具：whisperwhisper介绍引用ASRT语音识别项目ASRT介绍引用微软语音服务(付费)微软语音服务介绍实时语音转文本批量转录自定义语音引用PaddleSpeechPaddleSpeech介绍引用openai的开源工具：whisperwhisper介绍OpenAI在2022年9月21日开源了
Windows执行jar包琪丶琪 windows jar java
配置环境变量：命令行测试：java-version将jar包上传至指定目录，在该目录下创建运行脚本：chcp65001java-Dfile.encoding=utf-8-jarjxpaddle-admin.jarchcp65001：将当前cmd编码改为UTF-8，仅对当前cmd有效-Dfile.encoding=utf-8：指定运行jar包编码为UTF-8
百度飞桨（PaddlePaddle）案例分享：基于 PaddleOCR 的图像文字提取系统 univerbright 百度 paddlepaddle 人工智能 paddleocr 图像文字提取
一、案例背景在实际教学、办公及政务系统中，纸质材料（如手写作文、表格、试卷等）仍广泛存在。为提升信息处理效率，采用OCR（OpticalCharacterRecognition）技术将图像中的文字提取为可编辑文本已成为刚需。本项目基于开源深度学习库PaddleOCR，构建了一个轻量级的图像文字识别工具，能够自动识别图像中的中文文本，并提供置信度评估和可视化支持。该工具特别适用于作业扫描图像中的内容
paddleocr 和 pytesseract 使用记录 tnan2522 python 基础高级其他 python
paddleocr和pytesseract都是常见的ocr模块，不同的是，paddleocr是百度开源的一个ocr识别库，pytesseract基于TesseractOCR引擎封装的pythonocr库，在基础使用过程中，发现paddleocr比pytesseract要慢，而且内存占用更大，在识别中会持续缓存内存，直到占用到某个大小后，后续识别的图片才不会占用内存paddleocrimportco
C++/OpenCV 图像预处理与 PaddleOCR 结合进行高效字符识别 whoarethenext c++opencv 开发语言
C++/OpenCV图像预处理与PaddleOCR结合进行高效字符识别在许多实际应用场景中，直接从原始图片中提取文字的准确率可能不尽人意。图像中的噪声、光照不均、角度倾斜等问题都会严重干扰OCR(OpticalCharacterRecognition)引擎的识别效果。本文将详细介绍如何利用C++和强大的计算机视觉库OpenCV对图像进行预处理，然后将处理后的图像送入PaddleOCR的C++预测库
以前在服务器启动了docker，现在不需要了，为了安全，去掉docker服务@Ubuntu skywalk8163 项目实践软硬件调试 linux 运维服务器
以前在服务器启动了docker，docker里面运行了paddleserving服务器：在docker中安装paddleserving@FreeBSD（待续）_pkg-configisrequiredforbuildingpyav-CSDN博客。现在不需要这个docker服务器了，所以针对docker9292端口的映射也不需要了，为了安全，准备去掉docker。以下是问题处理记录。登录服务器，突然
PaddleSpeech 实战：开发与打包离线语音识别（ASR）命令行应用 Gyro_Zeppeliiii python 飞浆 paddlespeech
这篇指南从零开始，引导用户完成从环境搭建到最终部署一个离线语音识别工具的全过程。教程：使用PaddleSpeech和PyInstaller构建离线的批量语音转文本工具本指南将详细介绍如何利用百度的PaddleSpeech语音技术库，一步步构建一个强大的命令行工具。该工具能够批量、递归地将文件夹内的.wav音频文件转换为.txt文本文件，并最终打包成一个无需网络、无需Python环境的独立可执行文件
视觉模型部署实践：低算力平台RV1106上高效部署paddlepaddle 的PicoDet目标检测模型的技术实践位东风视觉模型部署实践 paddlepaddle 目标检测人工智能 iot 物联网嵌入式硬件
在资源受限的嵌入式设备上实现高精度、低延迟的目标检测，是当前智能摄像头、边缘计算等应用中的关键挑战。本文以Rockchip的RV1106嵌入式平台为例，结合百度开源的轻量级检测模型PicoDet，探讨如何通过模型优化与硬件加速，在有限的计算资源下实现高效的实时目标检测。目前该模型测试可以达到25fps左右一、背景介绍1.1RV1106硬件特性主频：1.2GHzArmCortex-A55CPU内存：
RV1106 图像分割基于paddleseg Linzhenghan 凌智视觉模块(RV1106)目标检测计算机视觉 opencv 人工智能
RV1106图像分割基于paddleseg图像分割1.基本知识简介1.1人像分割简介1.2人像分割常用方法2.C++API文档2.1RKNPU2Backend类2.1.1头文件2.1.2构造类函数2.1.3Initialize函数2.1.4Run函数2.1.5GetInputAttrs函数2.1.6GetOutputAttrs函数3.PP-Humanseg人像分割代码解析3.1流程图3.2核心代码
开源(离线)中文文本转语音TTS(语音合成)工具整理切糕师学AI #语音识别asr与语音合成STT 语音识别人工智能
开源(离线)中文文本转语音TTS(语音合成)工具整理目录文章目录目录PaddleSpeechVoiceVoxTensorFlowTTSttskitOpenTTSeSpeak微软TTSPaddleSpeechPaddleSpeech是一个开源的流式语音合成系统，它提供了基于FastSpeech2声学模型和HiFiGAN声码器的中文流式语音合成系统。它采用了基于规则的中文文本前端系统，对文本正则、多音
使用PaddleOCR读取pdf内容，输出txt文本只有左边一个小酒窝 Paddle pdf paddle 人工智能
使用PaddleOCR读取PDF内容并输出为TXT文本，可以通过以下步骤实现。PaddleOCR是一个基于PaddlePaddle的OCR工具，支持多种语言的文本识别。一、安装依赖确保已安装PaddleOCR和相关的依赖库。以下是代码中涉及的依赖库及其功能说明：os所属语言：Python内置标准库功能：提供操作系统相关功能，如文件路径操作、目录管理等。示例用途：在处理文件时获取路径、创建目录等。f
Python趣学篇：Pygame重现经典打砖块游戏 Code_流苏 Python星球日记 pygame python 游戏打砖块游戏
名人说：路漫漫其修远兮，吾将上下而求索。——屈原《离骚》创作者：Code_流苏(CSDN)（一个喜欢古诗词和编程的Coder）专栏介绍：《Python星球日记》目录一、游戏背景与技术选型1.打砖块游戏的传奇历史2.为什么选择Pygame？二、环境准备与项目架构1.环境搭建2.项目结构设计三、核心功能实现详解1.游戏对象设计Paddle类-玩家挡板Ball类-弹球物理引擎2.碰撞检测系统球与挡板的智
.NET 玩转 PaddleSharp：通天猿臂，AI一把抓许泽宇的技术分享 .net 人工智能
见过春晚魔术师腾云驾雾的手法没？其实写AI代码也可以做到——只要工具用得好，.NET也能玩出花！今天咱们聊聊一个超级实用、脑洞清奇的AI能量包：PaddleSharp。只要你熟悉C#、.NET，就能靠着它“调戏”PaddleInference，深度推理不求人，想下班到底早还是晚全看你的代码效率！而且，它不仅能在Windows下霸气外露，还能飞到Linux下继续骚操作，GPU、CPU、表格识别、OC
ASM系列四利用Method 组件动态注入方法逻辑 lijingyao8206 字节码技术 jvm AOP 动态代理 ASM
这篇继续结合例子来深入了解下Method组件动态变更方法字节码的实现。通过前面一篇，知道ClassVisitor 的visitMethod()方法可以返回一个MethodVisitor的实例。那么我们也基本可以知道，同ClassVisitor改变类成员一样，MethodVIsistor如果需要改变方法成员，注入逻辑，也可以
java编程思想 --内部类百合不是茶 java 内部类匿名内部类
内部类;了解外部类并能与之通信内部类写出来的代码更加整洁与优雅 1,内部类的创建内部类是创建在类中的 package com.wj.InsideClass; /* * 内部类的创建 */ public class CreateInsideClass { public CreateInsideClass(
web.xml报错 crabdave web.xml
web.xml报错 The content of element type "web-app" must match "(icon?,display- name?,description?,distributable?,context-param*,filter*,filter-mapping*,listener*,servlet*,s
泛型类的自定义麦田的设计者 java android 泛型
为什么要定义泛型类，当类中要操作的引用数据类型不确定的时候。采用泛型类，完成扩展。例如有一个学生类 Student{ Student(){ System.out.println("I'm a student....."); } } 有一个老师类
CSS清除浮动的4中方法 IT独行者 JavaScript UI css
清除浮动这个问题，做前端的应该再熟悉不过了，咱是个新人，所以还是记个笔记，做个积累，努力学习向大神靠近。CSS清除浮动的方法网上一搜，大概有N多种，用过几种，说下个人感受。 1、结尾处加空div标签 clear:both 1 2 3 4 .div 1 { background : #000080 ; border : 1px s
Cygwin使用windows的jdk 配置方法 _wy_ jdk windows cygwin
1.[vim /etc/profile] JAVA_HOME="/cgydrive/d/Java/jdk1.6.0_43" (windows下jdk路径为D:\Java\jdk1.6.0_43) PATH="$JAVA_HOME/bin:${PATH}" CLAS
linux下安装maven 无量 maven linux 安装
Linux下安装maven(转) 1.首先到Maven官网下载安装文件，目前最新版本为3.0.3，下载文件为 apache-maven-3.0.3-bin.tar.gz，下载可以使用wget命令； 2.进入下载文件夹，找到下载的文件，运行如下命令解压 tar -xvf apache-maven-2.2.1-bin.tar.gz 解压后的文件夹
tomcat的https 配置,syslog-ng配置 aichenglong tomcat http跳转到https syslong-ng配置 syslog配置
1) tomcat配置https,以及http自动跳转到https的配置 1)TOMCAT_HOME目录下生成密钥(keytool是jdk中的命令) keytool -genkey -alias tomcat -keyalg RSA -keypass changeit -storepass changeit
关于领号活动总结 alafqq 活动
关于某彩票活动的总结具体需求，每个用户进活动页面，领取一个号码，1000中的一个；活动要求 1，随机性，一定要有随机性； 2，最少中奖概率，如果注数为3200注，则最多中4注 3，效率问题，（不能每个人来都产生一个随机数，这样效率不高）； 4，支持断电（仍然从下一个开始），重启服务；（存数据库有点大材小用，因此不能存放在数据库）解决方案 1，事先产生随机数1000个，并打
java数据结构冒泡排序的遍历与排序百合不是茶 java
java的冒泡排序是一种简单的排序规则冒泡排序的原理：比较两个相邻的数，首先将最大的排在第一个，第二次比较第二个，此后一样；针对所有的元素重复以上的步骤，除了最后一个例题；将int array[]
JS检查输入框输入的是否是数字的一种校验方法 bijian1013 js
如下是JS检查输入框输入的是否是数字的一种校验方法： <form method=post target="_blank"> 数字：<input type="text" name=num onkeypress="checkNum(this.form)"><br> </form>
Test注解的两个属性：expected和timeout bijian1013 java JUnit expected timeout
JUnit4：Test文档中的解释：　　The Test annotation supports two optional parameters. 　　The first, expected, declares that a test method should throw an exception. 　　If it doesn't throw an exception or if it
[Gson二]继承关系的POJO的反序列化 bit1129 POJO
父类 package inheritance.test2; import java.util.Map; public class Model { private String field1; private String field2; private Map<String, String> infoMap
【Spark八十四】Spark零碎知识点记录 bit1129 spark
1. ShuffleMapTask的shuffle数据在什么地方记录到MapOutputTracker中的 ShuffleMapTask的runTask方法负责写数据到shuffle map文件中。当任务执行完成成功，DAGScheduler会收到通知，在DAGScheduler的handleTaskCompletion方法中完成记录到MapOutputTracker中
WAS各种脚本作用大全 ronin47 WAS 脚本
　　　http://www.ibm.com/developerworks/cn/websphere/library/samples/SampleScripts.html 　　　无意中，在WAS官网上发现的各种脚本作用，感觉很有作用，先与各位分享一下　　　获取下载这些示例 jacl 和 Jython 脚本可用于在 WebSphere Application Server 的不同版本中自
java-12.求 1+2+3+..n不能使用乘除法、 for 、 while 、 if 、 else 、 switch 、 case 等关键字以及条件判断语句 bylijinnan switch
借鉴网上的思路，用java实现： public class NoIfWhile { /** * @param args * * find x=1+2+3+....n */ public static void main(String[] args) { int n=10; int re=find(n); System.o
Netty源码学习-ObjectEncoder和ObjectDecoder bylijinnan java netty
Netty中传递对象的思路很直观： Netty中数据的传递是基于ChannelBuffer（也就是byte[]）；那把对象序列化为字节流，就可以在Netty中传递对象了相应的从ChannelBuffer恢复对象，就是反序列化的过程 Netty已经封装好ObjectEncoder和ObjectDecoder 先看ObjectEncoder ObjectEncoder是往外发送
spring 定时任务中cronExpression表达式含义 chicony cronExpression
一个cron表达式有6个必选的元素和一个可选的元素，各个元素之间是以空格分隔的，从左至右，这些元素的含义如下表所示：代表含义是否必须允许的取值范围 &nb
Nutz配置Jndi ctrain JNDI
1、使用JNDI获取指定资源： var ioc = { dao : { type :"org.nutz.dao.impl.NutDao", args : [ {jndi :"jdbc/dataSource"} ] } } 以上方法,仅需要在容器中配置好数据源,注入到NutDao即可.
解决 /bin/sh^M: bad interpreter: No such file or directory daizj shell
在Linux中执行.sh脚本，异常/bin/sh^M: bad interpreter: No such file or directory。分析：这是不同系统编码格式引起的：在windows系统中编辑的.sh文件可能有不可见字符，所以在Linux系统下执行会报以上异常信息。解决： 1）在windows下转换：利用一些编辑器如UltraEdit或EditPlus等工具
[转]for 循环为何可恨？ dcj3sjt126com 程序员读书
Java的闭包(Closure)特征最近成为了一个热门话题。一些精英正在起草一份议案，要在Java将来的版本中加入闭包特征。然而，提议中的闭包语法以及语言上的这种扩充受到了众多Java程序员的猛烈抨击。不久前，出版过数十本编程书籍的大作家Elliotte Rusty Harold发表了对Java中闭包的价值的质疑。尤其是他问道“for 循环为何可恨？”[http://ju
Android实用小技巧 dcj3sjt126com android
1、去掉所有Activity界面的标题栏　　修改AndroidManifest.xml 　　在application 标签中添加android:theme="@android:style/Theme.NoTitleBar" 2、去掉所有Activity界面的TitleBar 和StatusBar 　　修改AndroidManifes
Oracle 复习笔记之序列 eksliang Oracle 序列 sequence Oracle sequence
转载请出自出处：http://eksliang.iteye.com/blog/2098859 1.序列的作用序列是用于生成唯一、连续序号的对象一般用序列来充当数据库表的主键值 2.创建序列语法如下： create sequence s_emp start with 1 --开始值 increment by 1 --増长值 maxval
有“品”的程序员 gongmeitao 工作
完美程序员的10种品质　　完美程序员的每种品质都有一个范围，这个范围取决于具体的问题和背景。没有能解决所有问题的完美程序员（至少在我们这个星球上），并且对于特定问题，完美程序员应该具有以下品质：　　1. 才智非凡- 能够理解问题、能够用清晰可读的代码翻译并表达想法、善于分析并且逻辑思维能力强（范围：用简单方式解决复杂问题）　　
使用KeleyiSQLHelper类进行分页查询 hvt sql .net C#asp.net hovertree
本文适用于sql server单主键表或者视图进行分页查询，支持多字段排序。KeleyiSQLHelper类的最新代码请到http://hovertree.codeplex.com/SourceControl/latest下载整个解决方案源代码查看。或者直接在线查看类的代码：http://hovertree.codeplex.com/SourceControl/latest#HoverTree.D
SVG 教程（三）圆形，椭圆，直线天梯梦 svg
SVG <circle> SVG 圆形 - <circle> <circle> 标签可用来创建一个圆：下面是SVG代码： <svg xmlns="http://www.w3.org/2000/svg" version="1.1"> <circle cx="100" c
链表栈 luyulong java 数据结构
public class Node { private Object object; private Node next; public Node() { this.next = null; this.object = null; } public Object getObject() { return object; } public
基础数据结构和算法十：2-3 search tree sunwinner Algorithm 2-3 search tree
Binary search tree works well for a wide variety of applications, but they have poor worst-case performance. Now we introduce a type of binary search tree where costs are guaranteed to be loga
spring配置定时任务 stunizhengjia spring timer
最近因工作的需要，用到了spring的定时任务的功能,觉得spring还是很智能化的,只需要配置一下配置文件就可以了,在此记录一下，以便以后用到： //------------------------定时任务调用的方法------------------------------ /** * 存储过程定时器 */ publi
ITeye 8月技术图书有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的8月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 8月试读活动回顾： http://webmaster.iteye.com/blog/2102830 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《跨终端Web》 gleams：http