AI小鸭学院

跟着雨哥学AI-初识飞桨框架高层API-之全过程学习实践第一集

高层API全景图

!git clone https://gitee.com/paddlepaddle/Paddle.git --depth=1

1.MNIST数据集

先拜读下2.0的 MNIST PaddlePaddle 数据集定义，已经git了。地址 Paddle/python/paddle/vision/datasets/mnist.py

#   Copyright (c) 2020 PaddlePaddle Authors. All Rights Reserved.
#
# Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
#     http://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.

from __future__ import print_function

import os
import gzip
import struct
import numpy as np
from PIL import Image

import paddle
from paddle.io import Dataset
from paddle.dataset.common import _check_exists_and_download

__all__ = ["MNIST", "FashionMNIST"]


class MNIST(Dataset):
    """
    Implementation of `MNIST `_ dataset

    Args:
        image_path(str): path to image file, can be set None if
            :attr:`download` is True. Default None
        label_path(str): path to label file, can be set None if
            :attr:`download` is True. Default None
        mode(str): 'train' or 'test' mode. Default 'train'.
        download(bool): whether to download dataset automatically if
            :attr:`image_path` :attr:`label_path` is not set. Default True
        backend(str, optional): Specifies which type of image to be returned: 
            PIL.Image or numpy.ndarray. Should be one of {'pil', 'cv2'}. 
            If this option is not set, will get backend from ``paddle.vsion.get_image_backend`` ,
            default backend is 'pil'. Default: None.
            
    Returns:
        Dataset: MNIST Dataset.

    Examples:
        
        .. code-block:: python

            from paddle.vision.datasets import MNIST

            mnist = MNIST(mode='test')

            for i in range(len(mnist)):
                sample = mnist[i]
                print(sample[0].size, sample[1])

    """
    NAME = 'mnist'
    URL_PREFIX = 'https://dataset.bj.bcebos.com/mnist/'
    TEST_IMAGE_URL = URL_PREFIX + 't10k-images-idx3-ubyte.gz'
    TEST_IMAGE_MD5 = '9fb629c4189551a2d022fa330f9573f3'
    TEST_LABEL_URL = URL_PREFIX + 't10k-labels-idx1-ubyte.gz'
    TEST_LABEL_MD5 = 'ec29112dd5afa0611ce80d1b7f02629c'
    TRAIN_IMAGE_URL = URL_PREFIX + 'train-images-idx3-ubyte.gz'
    TRAIN_IMAGE_MD5 = 'f68b3c2dcbeaaa9fbdd348bbdeb94873'
    TRAIN_LABEL_URL = URL_PREFIX + 'train-labels-idx1-ubyte.gz'
    TRAIN_LABEL_MD5 = 'd53e105ee54ea40749a09fcbcd1e9432'

    def __init__(self,
                 image_path=None,
                 label_path=None,
                 mode='train',
                 transform=None,
                 download=True,
                 backend=None):
        assert mode.lower() in ['train', 'test'], \
                "mode should be 'train' or 'test', but got {}".format(mode)

        if backend is None:
            backend = paddle.vision.get_image_backend()
        if backend not in ['pil', 'cv2']:
            raise ValueError(
                "Expected backend are one of ['pil', 'cv2'], but got {}"
                .format(backend))
        self.backend = backend

        self.mode = mode.lower()
        self.image_path = image_path
        if self.image_path is None:
            assert download, "image_path is not set and downloading automatically is disabled"
            image_url = self.TRAIN_IMAGE_URL if mode == 'train' else self.TEST_IMAGE_URL
            image_md5 = self.TRAIN_IMAGE_MD5 if mode == 'train' else self.TEST_IMAGE_MD5
            self.image_path = _check_exists_and_download(
                image_path, image_url, image_md5, self.NAME, download)

        self.label_path = label_path
        if self.label_path is None:
            assert download, "label_path is not set and downloading automatically is disabled"
            label_url = self.TRAIN_LABEL_URL if self.mode == 'train' else self.TEST_LABEL_URL
            label_md5 = self.TRAIN_LABEL_MD5 if self.mode == 'train' else self.TEST_LABEL_MD5
            self.label_path = _check_exists_and_download(
                label_path, label_url, label_md5, self.NAME, download)

        self.transform = transform

        # read dataset into memory
        self._parse_dataset()

        self.dtype = paddle.get_default_dtype()

    def _parse_dataset(self, buffer_size=100):
        self.images = []
        self.labels = []
        with gzip.GzipFile(self.image_path, 'rb') as image_file:
            img_buf = image_file.read()
            with gzip.GzipFile(self.label_path, 'rb') as label_file:
                lab_buf = label_file.read()

                step_label = 0
                offset_img = 0
                # read from Big-endian
                # get file info from magic byte
                # image file : 16B
                magic_byte_img = '>IIII'
                magic_img, image_num, rows, cols = struct.unpack_from(
                    magic_byte_img, img_buf, offset_img)
                offset_img += struct.calcsize(magic_byte_img)

                offset_lab = 0
                # label file : 8B
                magic_byte_lab = '>II'
                magic_lab, label_num = struct.unpack_from(magic_byte_lab,
                                                          lab_buf, offset_lab)
                offset_lab += struct.calcsize(magic_byte_lab)

                while True:
                    if step_label >= label_num:
                        break
                    fmt_label = '>' + str(buffer_size) + 'B'
                    labels = struct.unpack_from(fmt_label, lab_buf, offset_lab)
                    offset_lab += struct.calcsize(fmt_label)
                    step_label += buffer_size

                    fmt_images = '>' + str(buffer_size * rows * cols) + 'B'
                    images_temp = struct.unpack_from(fmt_images, img_buf,
                                                     offset_img)
                    images = np.reshape(images_temp, (buffer_size, rows *
                                                      cols)).astype('float32')
                    offset_img += struct.calcsize(fmt_images)

                    for i in range(buffer_size):
                        self.images.append(images[i, :])
                        self.labels.append(
                            np.array([labels[i]]).astype('int64'))

    def __getitem__(self, idx):
        image, label = self.images[idx], self.labels[idx]
        image = np.reshape(image, [28, 28])

        if self.backend == 'pil':
            image = Image.fromarray(image.astype('uint8'), mode='L')

        if self.transform is not None:
            image = self.transform(image)

        if self.backend == 'pil':
            return image, label.astype('int64')

        return image.astype(self.dtype), label.astype('int64')

    def __len__(self):
        return len(self.labels)

可见数据加载中，主要用到了paddle.vision.datasets以及paddle.vision.transforms

dataset中主要实现了数据的初始化（下载，读取）、数据增强、返回数据以及数据长度等信息。

问题思考

使用了数据增强，那就是返回给训练用的数据是增强过的，但是如何把原数据也加入训练集呢？
测试集和训练集使分开的，但如果是从训练集中划分出测试集，测试集需要不需要每次都随机从训练集中抽取？

# 引入试用的包
import paddle
# transform包，用于数据增强，归一化
from paddle.vision.transforms import Compose, Normalize
from paddle.vision.datasets import MNIST
import paddle.nn as nn

Normalize

class paddle.vision.transforms.Normalize(mean=0.0, std=1.0, data_format=‘CHW’, to_rgb=False, keys=None)

图像归一化处理，支持两种方式：

1. 用统一的均值和标准差值对图像的每个通道进行归一化处理；
1. 对每个通道指定不同的均值和标准差值进行归一化处理。

output[channel] = (input[channel] - mean[channel]) / std[channel]

参数

mean (int|float|list) - 用于每个通道归一化的均值。
std (int|float|list) - 用于每个通道归一化的标准差值。
data_format (str, optional): 数据的格式，必须为 ‘HWC’ 或 ‘CHW’。默认值: ‘CHW’。
to_rgb (bool, optional) - 是否转换为 rgb 的格式。默认值：False。
keys (list[str]|tuple[str], optional) - 与 BaseTransform. 默认值: None。

返回值numpy归一化后的数组

# 数据预处理，这里用到了随机调整亮度、对比度和饱和度
transform = Normalize(mean=[127.5], std=[127.5], data_format='CHW')

# 数据加载，在训练集上应用数据预处理的操作
# 可以看到自动下载了数据集，并完成train、test数据集实例化
train_dataset = MNIST(mode='train', transform=transform)
test_dataset = MNIST(mode='test', transform=transform)

问题思考

测试集也需要数据增强吗？
此处的数据增强其实做的就是数据归一化的工作。

2.模型组网

paddle.nn.Flatten(start_axis=1, stop_axis=- 1) 该接口用于构造一个 Flatten 类的可调用对象。即展开为一维Tensor。
paddle.nn.Sequential(*layers) 顺序容器。子Layer将按构造函数参数的顺序添加到此容器中。传递给构造函数的参数可以Layers或可迭代的name Layer元组。
paddle.nn.Linear(in_features, out_features, weight_attr=None, bias_attr=None, name=None) 线性变换层 in_features, out_features输入输出单元数目
paddle.nn.Dropout(p=0.5, axis=None, mode="upscale_in_train”, name=None) Dropout是一种正则化手段，该算子根据给定的丢弃概率 p ，在训练过程中随机将一些神经元输出设置为0，通过阻止神经元节点间的相关性来减少过拟合。 p：丢弃概率，默认0.5。
paddle.nn.ReLU(name=None) ReLU激活层（Rectified Linear Unit） ReLU(x)=max(0,x)

# 模型组网
mnist = nn.Sequential(
    nn.Flatten(),
    nn.Linear(784, 512),
    nn.ReLU(),
    nn.Dropout(0.2),
    nn.Linear(512, 10)
)

3.模型封装

class paddle.Model
Model 对象是一个具备训练、测试、推理的神经网络。该对象同时支持静态图和动态图模式，通过 paddle.enable_static() 来切换。需要注意的是，该开关需要在实例化 Model 对象之前使用。输入需要使用 paddle.static.InputSpec 来定义

# 模型封装，用Model类封装
model = paddle.Model(mnist)

/opt/conda/envs/python35-paddle120-env/lib/python3.7/site-packages/paddle/distributed/parallel.py:119: UserWarning: Currently not a parallel execution environment, `paddle.distributed.init_parallel_env` will not do anything.
  "Currently not a parallel execution environment, `paddle.distributed.init_parallel_env` will not do anything."

# 或者
# inputs and labels are not required for dynamic graph.
from paddle.static import InputSpec
input = InputSpec([None, 784], 'float32', 'x')
label = InputSpec([None, 1], 'int64', 'label')

model = paddle.Model(mnist, input, label)

/opt/conda/envs/python35-paddle120-env/lib/python3.7/site-packages/paddle/distributed/parallel.py:119: UserWarning: Currently not a parallel execution environment, `paddle.distributed.init_parallel_env` will not do anything.
  "Currently not a parallel execution environment, `paddle.distributed.init_parallel_env` will not do anything."

4.模型配置

# 模型配置：为模型训练做准备，设置优化器，损失函数和精度计算方式
model.prepare(optimizer=paddle.optimizer.Adam(parameters=model.parameters()),
              loss=nn.CrossEntropyLoss(),
              metrics=paddle.metric.Accuracy())

5.模型训练

fit(train_data=None, eval_data=None, batch_size=1, epochs=1, eval_freq=1, log_freq=10, save_dir=None, save_freq=1, verbose=2, drop_last=False, shuffle=True, num_workers=0, callbacks=None)

常用参数解析

save_dir (str|None) - 保存模型的文件夹，如果不设定，将不保存模型。默认值：None。
save_freq (int) - 保存模型的频率，多少个 epoch 保存一次模型。默认值：1。
shuffle (bool) - 是否对训练数据进行洗牌。当 train_data 为 DataLoader 的实例时，该参数会被忽略。默认值：True。
drop_last (bool) - 是否丢弃训练数据中最后几个不足设定的批次大小的数据。默认值：False。
verbose (int) - 可视化的模型，必须为0，1，2。当设定为0时，不打印日志，设定为1时，使用进度条的方式打印日志，设定为2时，一行一行地打印日志。默认值：2。

# 模型训练
# model.fit(train_dataset,
#           epochs=5,
#           batch_size=64,
#           verbose=1)

# 训练配置可以据此设置
model.fit(train_dataset,
          epochs=5,
          batch_size=64,
          save_freq=10,
          save_dir="out",
          drop_last=False,
          shuffle=True,
          verbose=1)

6.模型评估

evaluate(eval_data, batch_size=1, log_freq=10, verbose=2, num_workers=0, callbacks=None):
在输入数据上，评估模型的损失函数值和评估指标

eval_data (Dataset|DataLoader) - 一个可迭代的数据源，推荐给定一个 paddle paddle.io.Dataset 或 paddle.io.Dataloader 的实例。默认值：None。
batch_size (int) - 训练数据或评估数据的批大小，当 eval_data 为 DataLoader 的实例时，该参数会被忽略。默认值：1。
log_freq (int) - 日志打印的频率，多少个 step 打印一次日志。默认值：1。
verbose (int) - 可视化的模型，必须为0，1，2。当设定为0时，不打印日志，设定为1时，使用进度条的方式打印日志，设定为2时，一行一行地打印日志。默认值：2。
num_workers (int) - 启动子进程用于读取数据的数量。当 eval_data 为 DataLoader 的实例时，该参数会被忽略。默认值：True。
callbacks (Callback|list[Callback]|None) - Callback 的一个实例或实例列表。该参数不给定时，默认会插入 ProgBarLogger 和 ModelCheckpoint 这两个实例。默认值：None。

model.evaluate(test_dataset, verbose=1)

Eval begin...
The loss value printed in the log is the current batch, and the metric is the average value of previous step.
step 10000/10000 [==============================] - loss: 5.0068e-06 - acc: 0.9725 - 2ms/step        
Eval samples: 10000





{'loss': [5.006803e-06], 'acc': 0.9725}

7.模型保存与载入

模型训练好了，不保存可怎么行呢？且看下面如何保存。

https://www.paddlepaddle.org.cn/documentation/docs/zh/2.0-rc1/guides/02_paddle2.0_develop/08_model_save_load_cn.html

paddle.Model.save
paddle.Model.load

# 保存训练模型
model.save("out_model/best", training=True)

模型载入

import paddle
import paddle.nn as nn
from paddle.static import InputSpec

device = paddle.set_device('cpu')

input = InputSpec([None, 784], 'float32', 'x')
label = InputSpec([None, 1], 'int64', 'label')

model2 = paddle.Model(nn.Sequential(
    nn.Linear(784, 200),
    nn.Tanh(),
    nn.Linear(200, 10),
    nn.Softmax()),
    input,
    label)
model.load('out_model/best')

8.模型预测

predict(test_data, batch_size=1, num_workers=0, stack_outputs=False, callbacks=None):

test_data (Dataset|DataLoader) - 一个可迭代的数据源，推荐给定一个 paddle paddle.io.Dataset 或 paddle.io.Dataloader 的实例。默认值：None。
batch_size (int) - 训练数据或评估数据的批大小，当 eval_data 为 DataLoader 的实例时，该参数会被忽略。默认值：1。
num_workers (int) - 启动子进程用于读取数据的数量。当 eval_data 为 DataLoader 的实例时，该参数会被忽略。默认值：True。
stack_outputs (bool) - 是否将输出进行堆叠。默认值：False。
callbacks (Callback|list[Callback]|None) - Callback 的一个实例或实例列表。默认值：None。

9.参阅

『跟着雨哥学AI』系列开篇：初识飞桨框架高层API
Paddle.Mode API
模型存储和载入

NLP_jieba中文分词的常用模块 Hiweir · NLP_jieba的使用自然语言处理中文分词人工智能 nlp
1.jieba分词模式（1）精确模式:把句子最精确的切分开,比较适合文本分析.默认精确模式.（2）全模式:把句子中所有可能成词的词都扫描出来,cut_all=True,缺点:速度快,不能解决歧义（3）paddle:利用百度的paddlepaddle深度学习框架.简单来说就是使用百度提供的分词模型.use_paddle=True.（4）搜索引擎模式:在精确模式的基础上,对长词再进行切分,提高召回率,
【Python】已解决：ModuleNotFoundError: No module named ‘paddle‘ 屿小夏 python paddle 开发语言
文章目录一、分析问题背景二、可能出错的原因三、错误代码示例四、正确代码示例步骤1：安装PaddlePaddle库步骤2：验证安装五、注意事项已解决：ModuleNotFoundError:Nomodulenamed‘paddle‘一、分析问题背景在使用Python进行深度学习开发时，开发者可能会选择使用PaddlePaddle作为深度学习框架。然而，有时在导入PaddlePaddle库时，可能会遇
Python包的安装 weixin_38778542 Python 包 python anaconda
只是在包装paddlepaddle包的时候，使用官方推荐的命令使用安装失败。大概看了一下，是其他的一些支持的包安装失败，要么是找不到，要么是版本问题，要么是自己网速差……自己又看不明白，或者是静不下心来仔细去查找问题，所以开了这个帖子，希望来记录一下学习Python中，在关于一些包的安装使用上的问题。同时也欢迎大家参与讨论。现在正在安装paddlepaddle以及其支持的包，主要学习https:/
震惊！PaddlePaddle竟然支持Python 3.7了！高斯纯牛奶
震惊！****PaddlePaddle****竟然支持****Python3.7****了！image这个2018，如果你还不知道这件事情，你就真的OUT了！几天之前，一条PaddlePaddle版本发布的消息，让开发者QQ群里的成员又惊又喜：PaddlePaddle支持了Python3.7。在外人看来，PaddlePaddle就像一位用情专一的“钢铁直男“，长久以来一直钟情于Python2.7，
PaddleOCR超大分辨率文本检测代码教程 LEILEI18A Python 深度学习 paddle paddleocr ppocr 超大分辨率文本检测
PaddleOCR超大分辨率文本检测代码教程目录1.前提2.PaddleOCR部署（win10下）3.解决思路和代码1.前提这是我提的issue：https://github.com/PaddlePaddle/PaddleOCR/issues/11888很多问题可以看：https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.7/doc/do
百度飞浆目标检测PPYOLOE模型在PC端、Jetson上的部署（python）代码能跑就可以百度目标检测 python 学习计算机视觉笔记
部署目标检测模型前，需要配置好paddlepaddle的环境：开始使用_飞桨-源于产业实践的开源深度学习平台(paddlepaddle.org.cn)PC端和Jetson板卡端的部署方法相同，如下（直接放置部署和测试代码）：importpaddle.inferenceimportcv2importnumpyasnpimporttimefrompaddle.inferenceimportConfig
百度飞桨教程（一）怎么这么多名字都被占了百度 paddlepaddle 人工智能
百度飞桨（paddle），是一个开源的深度学习平台百度飞桨的安装pipinstallpaddlepaddle-ihttps://mirror.baidu.com/pypi/simple手写数字识别案例我们来通过一个案例，大概了解paddle的使用importpaddleimportnumpyasnpfrompaddle.vision.transformsimportNormalizetransfo
Python，Nuitka，打包Paddle和Paddleocr，test.dist\\paddle\\fluid\\..\\libs‘；飞天小女警出击 python paddle 开发语言
Python版本3.9，Nuitka版本1.8.6，paddleocr版本2.6.1.3，paddlepaddle版本2.5.2Nuitka打包后提示报错File"C:\Users\Administrator\Desktop\XXX\XXX\test.dist\os.py",line1111,inadd_dll_directoryFileNotFoundError:[WinError2]系统找不到
ubuntu18.04+cuda11.4+nccl安装袁泽斌的学习记录 ubuntu
本文参考自，但更加详细的介绍了安装方法，避免走弯路ubuntu下安装nccl具体教程_ubuntu安装nccl-CSDN博客文章浏览阅读1w次，点赞5次，收藏12次。使用paddlepaddle框架进行多卡训练时报错：Traceback(mostrecentcalllast):File"train.py",line210,indo_train()File"train.py",line91,indo
飞桨科学计算套件PaddleScience skywalk8163 人工智能 paddlepaddle 人工智能飞桨
PaddleScience是一个基于深度学习框架PaddlePaddle开发的科学计算套件，利用深度神经网络的学习能力和PaddlePaddle框架的自动(高阶)微分机制，解决物理、化学、气象等领域的问题。支持物理机理驱动、数据驱动、数理融合三种求解方式，并提供了基础API和详尽文档供用户使用与二次开发。安装当然要先安装好飞桨PaddlePaddle，再安装PaddleSciencepipinst
TechDay公开课实录:PaddlePaddle车牌识别实战和心得 PaddleWeekly
车牌识别作为一种常见的图像识别的应用场景，已经是一个非常成熟的业务了，在传统的车牌识别中，可以使用字符分割+字符识别的方式来进行车牌识别，而深度学习兴起后，出现了很多端到端的车牌识别模型，不用分割字符，直接输入车牌图片即可识别出车牌字符。2019年1月5日百度深度学习线下技术公开课PaddlePaddleTechDay第一期演讲则邀请了百度认证布道师胡晓曼老师分享基于PaddlePaddle最新版
基于Python的paddleocr推理环境列表博观而约取,厚积而薄发 PaddlePaddle python 开发语言
基于Python的paddleocr推理环境列表，#Python==3.9.13，安装目录名不能太长#单独导入python-mpipinstallpaddlepaddle-gpu==2.6.0.post120-fhttps://www.paddlepaddle.org.cn/whl/windows/mkl/avx/stable.htmlopencv-pythonlmdbimgaugscikit-i
pip安装paddlepaddle报错ERROR: Could not install packages due to an OSError 博观而约取,厚积而薄发 PaddlePaddle pip
ERROR:CouldnotinstallpackagesduetoanOSError:[Errno2]Nosuchfileordirectory:'C:\\Users\\yang\\AppData\\Local\\Packages\\PythonSoftwareFoundation.Python.3.9_qbz5n2kfra8p0\\LocalCache\\local-packages\\Pyt
paddlepaddle 2.6版本在WSL2环境中如何使用NVIDIA显卡运行神经网络 kampoo paddlepaddle 神经网络人工智能
paddlepaddle2.6版本发布后，官网上可以使用NVIDIAcuda12.x进行机器学习了，训练神经网络的效率大为提升。因为是在wsl2环境中安装，不是纯正的linux环境，其中一些小问题需要注意。使用conda安装飞浆，wsl2中安装了cuda12.x，跟飞浆2.6兼容，按照官网指令即可：condacreate-npp2cudapython=3.11condaactivatepp2cud
概率论与数理统计实验附源码及实验报告可打包为exe 货又星概率论经验分享笔记 python 开源
Hi,I’m@货又星I’minterestedin…I’mcurrentlylearning…I’mlookingtocollaborateon…Howtoreachme…README目录（持续更新中）各种错误处理、爬虫实战及模板、百度智能云人脸识别、计算机视觉深度学习CNN图像识别与分类、PaddlePaddle自然语言处理知识图谱、GitHub、运维…WeChat：1297767084GitH
【新手必看】解决GitHub打不开问题，亲测有效货又星 github 笔记经验分享 python 开源开源软件
Hi,I’m@货又星I’minterestedin…I’mcurrentlylearning…I’mlookingtocollaborateon…Howtoreachme…README目录（持续更新中）各种错误处理、爬虫实战及模板、百度智能云人脸识别、计算机视觉深度学习CNN图像识别与分类、PaddlePaddle自然语言处理知识图谱、GitHub、运维…WeChat：1297767084GitH
使用ssh链接GitHub，附GitHub命令货又星 ssh github 运维笔记经验分享开源
Hi,I’m@货又星I’minterestedin…I’mcurrentlylearning…I’mlookingtocollaborateon…Howtoreachme…README目录（持续更新中）各种错误处理、爬虫实战及模板、百度智能云人脸识别、计算机视觉深度学习CNN图像识别与分类、PaddlePaddle自然语言处理知识图谱、GitHub、运维…WeChat：1297767084GitH
NSsimulation：使用python模拟Navier-Stokes equations（ns方程），附项目GitHub地址，亲测可用。（2023 apmcm、2024美赛）货又星 python github 开发语言笔记数学建模开源
Hi,I’m@货又星I’minterestedin…I’mcurrentlylearning…I’mlookingtocollaborateon…Howtoreachme…README目录（持续更新中）各种错误处理、爬虫实战及模板、百度智能云人脸识别、计算机视觉深度学习CNN图像识别与分类、PaddlePaddle自然语言处理知识图谱、GitHub、运维…WeChat：1297767084GitH
PaddleNLP 自然语言处理知识图谱 uie-x-base,uie-m-large,uie-m-base模型使用时，报错Out of memory error on GPU 0 gpu内存不够货又星自然语言处理语言模型人工智能运维知识图谱 nlp gpt-3
Hi,I’m@货又星I’minterestedin…I’mcurrentlylearning…️I’mlookingtocollaborateon…Howtoreachme…README目录（持续更新中）各种错误处理、爬虫实战及模板、百度智能云人脸识别、计算机视觉深度学习CNN图像识别与分类、PaddlePaddle自然语言处理知识图谱、GitHub、运维…WeChat：1297767084Git
基于PaddlePaddle2.0的蝴蝶图像识别分类 bianhuaHYQ 笔记 python 图像识别人工智能
基于PaddlePaddle2.0的蝴蝶图像识别分类——利用预训练残差网络ResNet101模型分类资源来源如下：https://aistudio.baidu.com/aistudio/education/group/info/119391.蝴蝶识别分类任务概述本项目将利用人工智能技术来对蝴蝶图像进行分类，需要能对蝴蝶的类别、属性进行细粒度的识别分类。相关研究工作者能够根据采集到的蝴蝶图片，快速识
TechDay公开课实录:PaddlePaddle车牌识别实战和心得 PaddlePaddle
车牌识别作为一种常见的图像识别的应用场景，已经是一个非常成熟的业务了，在传统的车牌识别中，可以使用字符分割+字符识别的方式来进行车牌识别，而深度学习兴起后，出现了很多端到端的车牌识别模型，不用分割字符，直接输入车牌图片即可识别出车牌字符。2019年1月5日百度深度学习线下技术公开课PaddlePaddleTechDay第一期演讲则邀请了百度认证布道师胡晓曼老师分享基于PaddlePaddle最新版
在训练过程中报显存不足该怎么办呢？- PaddlePaddle 飞桨 FAQ合集 - 训练问题5 GT_Zhang
PaddlePaddle飞桨FAQ合集-训练问题5Question：在训练过程中报显存不足该怎么办呢？Answer:训练中报显存不足是很正常的情况，你可以尝试调整BatchSize的大小，也可以更改网络模型，或者参考官方文档的显存优化部分。其实我们更推荐去使用AIStudio去训练，配备高端显卡，速度也是杠杠的。
Python OCR 之旅：PaddleOCR 与 pytesseract 比较及应用田猿笔记 python ocr 开发语言
简介：在Python技术栈中，光学字符识别（OCR）是一个非常实用的功能，它可以将图片中的文本内容提取出来。在这篇文章中，我们将比较两个常用的OCR库：PaddleOCR和pytesseract，了解它们的特点、功能以及应用场景。一、PaddleOCR介绍PaddleOCR是一个基于PaddlePaddle深度学习框架的OCR库，支持多种语言的文本识别。它的特点如下：-使用了基于深度学习的OCR模
训练版paddleOCR代码讲解修改枭玉龙 #python图像处理 python
paddleOCR下载：pipinstallpaddlepaddle-gpu==2.0.0rc0.post100-fhttps://paddlepaddle.org.cn/whl/stable.htmlLookinginlinks:https://paddlepaddle.org.cn/whl/stable.html训练det目标检测1：修改tools中的program中的要训练的参数：det和r
百度PaddleOCR字符识别推理部署（C++）枭玉龙百度 c++开发语言
1环境1.opencv（https://sourceforge.net/projects/opencvlibrary/）2.cmake（https://cmake.org/download/）3.vs2019（(https://github.com/PaddlePaddle/PaddleOCR/tree/release/2.1)4.paddleOCR项目-建议2.0(https://github.
orin nx 安装paddlespeech记录想努力的人算法语音合成人工智能
nx配置：模块版本说明CPU8核内存16GCuda版本11.4Opencv版本4.5.4Tensorrt版本5.1Cudnn版本8.6.0.166Deepstream版本6.2Python版本3.8算力100T安装paddlepaddle：去飞桨官网下载jetpack版本的：下载安装Linux推理库-PaddlePaddle深度学习平台当需要调用语速的接口时：需要安装soxbindings包，这个
飞桨自然语言处理框架 paddlenlp的 trainer 路人与大师 paddlepaddle 自然语言处理人工智能
飞桨（PaddlePaddle）的NLP库PaddleNLP中的Trainer类是一个用于训练和评估模型的简单但功能完整的循环。它被优化用于与PaddleNLP一起使用。Trainer类简化了训练过程，提供了自动的批处理、模型保存、日志记录等特性。以下是Trainer类的主要参数和功能：模型：model：可以是一个预训练的模型或一个自定义的paddle.nn.Layer。如果使用自定义模型，它需要
使用PaddleNLP识别垃圾邮件：用ELECTRA做英文邮件标题分类，英文邮件短标题的分类效果能达到92%以上以及如何使用PaddleNLP加载和微调ELECTRA模型？（附公开数据集）代码讲故事机器人智慧之心分类数据挖掘 ELECTRA PaddleNLP NLP 垃圾邮件邮件识别
使用PaddleNLP识别垃圾邮件：用ELECTRA做英文邮件标题分类，英文邮件短标题的分类效果能达到92%以上以及如何使用PaddleNLP加载和微调ELECTRA模型？（附公开数据集）要使用PaddleNLP和ELECTRA来识别垃圾邮件并做英文邮件标题分类，可以按照以下步骤进行操作：安装PaddlePaddle和PaddleNLP：首先，确保在你的环境中已经安装了PaddlePaddle和P
使用PaddleNLP识别垃圾邮件：用RoBERTa做中文邮件标题分类，模型在测试集上准确率达到98.3%以上（附公开数据集）代码讲故事机器人智慧之心分类数据挖掘 RoBERTa 垃圾邮件机器学习深度学习 PaddleNLP
使用PaddleNLP识别垃圾邮件：用RoBERTa做中文邮件标题分类，模型在测试集上准确率达到98.3%以上（附公开数据集）。要使用PaddleNLP和RoBERTa来识别垃圾邮件并做中文邮件标题分类，可以按照以下步骤进行操作：安装PaddlePaddle和PaddleNLP：首先，确保在你的环境中已经安装了PaddlePaddle和PaddleNLP。你可以根据PaddlePaddle和Pad
使用PaddleNLP识别垃圾邮件：用BERT做中文邮件内容分类，验证集准确率高达99.6%以上（附公开数据集）代码讲故事机器人智慧之心 bert 分类 PaddleNLP NLP 垃圾邮件邮件识别深度学习
使用PaddleNLP识别垃圾邮件：用BERT做中文邮件内容分类，验证集准确率高达99.6%以上（附公开数据集）。要使用PaddleNLP和BERT来识别垃圾邮件并做中文邮件内容分类，可以按照以下步骤进行操作：安装PaddlePaddle和PaddleNLP：首先，确保在你的环境中已经安装了PaddlePaddle和PaddleNLP。你可以根据PaddlePaddle和PaddleNLP的官方文
SQL的各种连接查询 xieke90 UNION ALL UNION 外连接内连接 JOIN
一、内连接概念：内连接就是使用比较运算符根据每个表共有的列的值匹配两个表中的行。内连接（join 或者inner join ） SQL语法： select * fron
java编程思想--复用类百合不是茶 java 继承代理组合 final类
复用类看着标题都不知道是什么,再加上java编程思想翻译的比价难懂,所以知道现在才看这本软件界的奇书一:组合语法:就是将对象的引用放到新类中即可代码: package com.wj.reuse; /** * * @author Administrator 组
[开源与生态系统]国产CPU的生态系统 comsci cpu
计算机要从娃娃抓起...而孩子最喜欢玩游戏.... 要让国产CPU在国内市场形成自己的生态系统和产业链,国家和企业就不能够忘记游戏这个非常关键的环节.... 投入一些资金和资源,人力和政策,让游
JVM内存区域划分Eden Space、Survivor Space、Tenured Gen，Perm Gen解释商人shang jvm内存
jvm区域总体分两类，heap区和非heap区。heap区又分：Eden Space（伊甸园）、Survivor Space(幸存者区)、Tenured Gen（老年代-养老区）。非heap区又分：Code Cache(代码缓存区)、Perm Gen（永久代）、Jvm Stack(java虚拟机栈)、Local Method Statck(本地方法栈)。 HotSpot虚拟机GC算法采用分代收
页面上调用 QQ oloz qq
<A href="tencent://message/?uin=707321921&Site=有事Q我&Menu=yes"> <img style="border:0px;" src=http://wpa.qq.com/pa?p=1:707321921:1></a>
一些问题文强chu 问题
1.eclipse 导出 doc 出现“The Javadoc command does not exist.” javadoc command 选择 jdk/bin/javadoc.exe 2.tomcate 配置 web 项目 ..... SQL:3.mysql * 必须得放前面否则 select&nbs
生活没有安全感小桔子生活孤独安全感
圈子好小，身边朋友没几个，交心的更是少之又少。在深圳，除了男朋友，没几个亲密的人。不知不觉男朋友成了唯一的依靠，毫不夸张的说，业余生活的全部。现在感情好，也很幸福的。但是说不准难免人心会变嘛，不发生什么大家都乐融融，发生什么很难处理。我想说如果不幸被分手(无论原因如何)，生活难免变化很大，在深圳，我没交心的朋友。明
php 基础语法 aichenglong php 基本语法
1 .1 php变量必须以$开头 <?php $a=” b”; echo ?> 1 .2 php基本数据库类型 Integer float/double Boolean string 1 .3 复合数据类型数组array和对象 object 1 .4 特殊数据类型 null 资源类型(resource) $co
mybatis tools 配置详解 AILIKES mybatis
MyBatis Generator中文文档 MyBatis Generator中文文档地址： http://generator.sturgeon.mopaas.com/ 该中文文档由于尽可能和原文内容一致，所以有些地方如果不熟悉，看中文版的文档的也会有一定的障碍，所以本章根据该中文文档以及实际应用，使用通俗的语言来讲解详细的配置。本文使用Markdown进行编辑，但是博客显示效
继承与多态的探讨百合不是茶 JAVA面向对象继承对象
继承 extends 多态继承是面向对象最经常使用的特征之一：继承语法是通过继承发、基类的域和方法 //继承就是从现有的类中生成一个新的类，这个新类拥有现有类的所有extends是使用继承的关键字：在A类中定义属性和方法； class A{ //定义属性 int age； //定义方法 public void go
JS的undefined与null的实例 bijian1013 JavaScript JavaScript
<form name="theform" id="theform"> </form> <script language="javascript"> var a alert(typeof(b)); //这里提示undefined if(theform.datas
TDD实践（一） bijian1013 java 敏捷 TDD
一.TDD概述 TDD：测试驱动开发，它的基本思想就是在开发功能代码之前，先编写测试代码。也就是说在明确要开发某个功能后，首先思考如何对这个功能进行测试，并完成测试代码的编写，然后编写相关的代码满足这些测试用例。然后循环进行添加其他功能，直到完全部功能的开发。
[Maven学习笔记十]Maven Profile与资源文件过滤器 bit1129 maven
什么是Maven Profile Maven Profile的含义是针对编译打包环境和编译打包目的配置定制，可以在不同的环境上选择相应的配置，例如DB信息，可以根据是为开发环境编译打包，还是为生产环境编译打包，动态的选择正确的DB配置信息 Profile的激活机制 1.Profile可以手工激活，比如在Intellij Idea的Maven Project视图中可以选择一个P
【Hive八】Hive用户自定义生成表函数(UDTF) bit1129 hive
1. 什么是UDTF UDTF，是User Defined Table-Generating Functions，一眼看上去，貌似是用户自定义生成表函数，这个生成表不应该理解为生成了一个HQL Table，貌似更应该理解为生成了类似关系表的二维行数据集 2. 如何实现UDTF 继承org.apache.hadoop.hive.ql.udf.generic
tfs restful api 加auth 2.0认计 ronin47
　　目前思考如何给tfs的ngx-tfs api增加安全性。有如下两点：　　一是基于客户端的ip设置。这个比较容易实现。　　二是基于OAuth2.0认证，这个需要lua，实现起来相对于一来说，有些难度。　　现在重点介绍第二种方法实现思路。　　前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGe
jdk环境变量配置 byalias java jdk
进行java开发，首先要安装jdk，安装了jdk后还要进行环境变量配置： 1、下载jdk（http://java.sun.com/javase/downloads/index.jsp），我下载的版本是：jdk-7u79-windows-x64.exe 2、安装jdk-7u79-windows-x64.exe 3、配置环境变量：右击"计算机"-->&quo
《代码大全》表驱动法-Table Driven Approach-2 bylijinnan java
package com.ljn.base; import java.io.BufferedReader; import java.io.FileInputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.Collections; import java.uti
SQL 数值四舍五入小数点后保留2位 chicony 四舍五入
1.round() 函数是四舍五入用，第一个参数是我们要被操作的数据，第二个参数是设置我们四舍五入之后小数点后显示几位。 2.numeric 函数的2个参数，第一个表示数据长度，第二个参数表示小数点后位数。例如：　　select cast(round(12.5,2) as numeric(5,2))
c++运算符重载 CrazyMizzz C++
一、加+，减-，乘*，除/ 的运算符重载 Rational operator*(const Rational &x) const{ return Rational(x.a * this->a); } 在这里只写乘法的，加减除的写法类似二、<<输出,>>输入的运算符重载 &nb
hive DDL语法汇总 daizj hive 修改列 DDL 修改表
hive DDL语法汇总１、对表重命名 hive> ALTER TABLE table_name RENAME TO new_table_name; 2、修改表备注 hive> ALTER TABLE table_name SET TBLPROPERTIES ('comment' = new_comm
jbox使用说明 dcj3sjt126com Web
参考网址：http://www.kudystudio.com/jbox/jbox-demo.html jBox v2.3 beta [ 点击下载] 技术交流QQGroup：172543951 100521167 [2011-11-11] jBox v2.3 正式版 - [调整&修复] IE6下有iframe或页面有active、applet控件
UISegmentedControl 开发笔记 dcj3sjt126com
// typedef NS_ENUM(NSInteger, UISegmentedControlStyle) { // UISegmentedControlStylePlain, // large plain &
Slick生成表映射文件 ekian scala
Scala添加SLICK进行数据库操作，需在sbt文件上添加slick-codegen包 "com.typesafe.slick" %% "slick-codegen" % slickVersion 因为我是连接SQL Server数据库，还需添加slick-extensions，jtds包 "com.typesa
ES-TEST gengzg test
package com.MarkNum; import java.io.IOException; import java.util.Date; import java.util.HashMap; import java.util.Map; import javax.servlet.ServletException; import javax.servlet.annotation
为何外键不再推荐使用 hugh.wang mysql DB
表的关联，是一种逻辑关系，并不需要进行物理上的“硬关联”，而且你所期望的关联，其实只是其数据上存在一定的联系而已，而这种联系实际上是在设计之初就定义好的固有逻辑。在业务代码中实现的时候，只要按照设计之初的这种固有关联逻辑来处理数据即可，并不需要在数据库层面进行“硬关联”，因为在数据库层面通过使用外键的方式进行“硬关联”，会带来很多额外的资源消耗来进行一致性和完整性校验，即使很多时候我们并不
领域驱动设计 julyflame VO DAO 设计模式 DTO po
概念： VO（View Object）：视图对象，用于展示层，它的作用是把某个指定页面（或组件）的所有数据封装起来。 DTO（Data Transfer Object）：数据传输对象，这个概念来源于J2EE的设计模式，原来的目的是为了EJB的分布式应用提供粗粒度的数据实体，以减少分布式调用的次数，从而提高分布式调用的性能和降低网络负载，但在这里，我泛指用于展示层与服务层之间的数据传输对
单例设计模式 hm4123660 java Singleton 单例设计模式懒汉式饿汉式
单例模式是一种常用的软件设计模式。在它的核心结构中只包含一个被称为单例类的特殊类。通过单例模式可以保证系统中一个类只有一个实例而且该实例易于外界访问，从而方便对实例个数的控制并节约系统源。如果希望在系统中某个类的对象只能存在一个，单例模式是最好的解决方案。 &nb
logback zhb8015 log logback
一、logback的介绍 Logback是由log4j创始人设计的又一个开源日志组件。logback当前分成三个模块：logback-core,logback- classic和logback-access。logback-core是其它两个模块的基础模块。logback-classic是log4j的一个改良版本。此外logback-class
整合Kafka到Spark Streaming——代码示例和挑战 Stark_Summer spark storm zookeeper PARALLELISM processing
作者Michael G. Noll是瑞士的一位工程师和研究员，效力于Verisign，是Verisign实验室的大规模数据分析基础设施（基础Hadoop）的技术主管。本文，Michael详细的演示了如何将Kafka整合到Spark Streaming中。期间， Michael还提到了将Kafka整合到 Spark Streaming中的一些现状，非常值得阅读，虽然有一些信息在Spark 1.2版
spring-master-slave-commondao 王新春 DAO spring dataSource slave master
互联网的web项目，都有个特点：请求的并发量高，其中请求最耗时的db操作，又是系统优化的重中之重。为此，往往搭建 db的一主多从库的数据库架构。作为web的DAO层，要保证针对主库进行写操作，对多个从库进行读操作。当然在一些请求中，为了避免主从复制的延迟导致的数据不一致性，部分的读操作也要到主库上。（这种需求一般通过业务垂直分开，比如下单业务的代码所部署的机器，读去应该也要从主库读取数

跟着雨哥学AI-初识飞桨框架高层API-之全过程学习实践第一集

高层API全景图

1.MNIST数据集

问题思考

Normalize

图像归一化处理，支持两种方式：

参数

返回值numpy归一化后的数组

问题思考

2.模型组网

3.模型封装

4.模型配置

5.模型训练

常用参数解析

6.模型评估

7.模型保存与载入

模型载入

8.模型预测

9.参阅

你可能感兴趣的:(livingbody,paddlepaddle)