只会git clone的程序员

百度飞桨（3）—— 手势识别

前言

本节学习卷积神经网络，然后使用经典的LENET-5神经网络训练手势识别。
教程地址：视屏地址

课程笔记

深度学习模型：
建模——>损失函数——>参数学习

全连接神经网络的不足：

模型不够灵活，输入图片尺寸变换时网络需要修改
模型参数太多

卷积神经网络特点：

局部连接
权值共享
降采样

LENET-5网络模型

本节主要根据这张图设计LENET5模型并编写paddle代码。

首先看下卷积函数的定义源码：

    def __init__(self,
                 num_channels,
                 num_filters,
                 filter_size,
                 stride=1,
                 padding=0,
                 dilation=1,
                 groups=None,
                 param_attr=None,
                 bias_attr=None,
                 use_cudnn=True,
                 act=None,
                 dtype='float32'):

num_channels：通道数
num_filters：卷积核数
filter_size：卷积核大小，卷积核一般是正方形的所以就一个边长参数
stride：卷积步长

卷积步长参照下图，蓝色方格每次向右移动两列或向下移动两行表示步长为2：

分析LENET-5网络的input层

Yann LeCun教授的输入是灰度的图片单通道的，大小32 × 32。所以他的输入是32 × 32 × 1，但是我们用的手势数据是彩色的三通道的，所以我们需要做一点修改并且把输入的图片resize成32 × 32 × 3，resize代码：

images = np.array([x[0].reshape(3, 32, 32) for x in data], np.float32)

分析LENET-5网络的C1层

卷积核大小：5 * 5
卷积核数目：6
卷积步长：1
输入通道数： 3

这里要注意的就是卷积核数目，一个卷积核会对应图片的一种特征，n个卷积核就能得出n个特征，n个输出的特征就是下一层的通道个数。
这里我们说了采用的是彩色图片所以我们的input是32 * 32 * 3的，也就是C1层的输入是3通道的，C1层卷积核个数是6个，卷积核尺寸是5，步长是1所以得出paddle源码：

self.c1 = Conv2D(3, 6, 5, 1)

分析LENET-5网络的S2层池化层

池化大小：2 × 2
池化步长：2

paddle源码：

self.s2 = Pool2D(pool_size=2, pool_type='max', pool_stride=2)

分析LENET-5网络的C3层

卷积核大小：5 * 5
卷积核数目：16
卷积步长：1
输入通道数：6

paddle源码：

self.c3 = Conv2D(6, 16, 5, 1)

分析LENET-5网络的S4层池化层

池化大小：2 × 2
池化步长：2

paddle源码：

self.s4 = Pool2D(pool_size=2, pool_type='max', pool_stride=2)

分析LENET-5网络的C5层

卷积核大小：5 * 5
卷积核数目：120
卷积步长：1
输入通道数：16

paddle源码：

self.c5 = Conv2D(16, 120, 5, 1)

分析LENET-5网络的F6层

全连接层输入：120
全连接层输出：84

paddle源码：

self.f6 = Linear(120, 84, act='relu')

分析LENET-5网络的OUTPUT层

全连接层输入：84
全连接层输出：0

paddle源码：

self.f7 = Linear(84, 10, act='softmax')

前向传播模型构建

    def forward(self, input):
        print("input shape : " + str(input.shape))
        x = self.c1(input)
        print("C1 : " + str(x.shape))
        x = self.s2(x)
        print("S2 : " + str(x.shape))
        x = self.c3(x)
        print("C3 : " + str(x.shape))
        x = self.s4(x)
        print("S4 : " + str(x.shape))
        x = self.c5(x)
        print("C5 : " + str(x.shape))
        x = fluid.layers.reshape(x, shape=[-1, 120])
        x = self.f6(x)
        y = self.f7(x)
        return y

重点在这里：

x = fluid.layers.reshape(x, shape=[-1, 120])

在卷积层和全连接层间有一个过度，C5层的输出是120 × 1 × 1的，相当于是一维的，所以这里做了一个reshape，reshape中的-1参数表示设置为一维，120就是输入的通道数。

训练结果

识别结果

完整训练代码

gestureTrain.py代码：

import os
import time
import random
import numpy as np
from PIL import Image
import matplotlib.pyplot as plt
import paddle
import paddle.fluid as fluid
import paddle.fluid.layers as layers
from multiprocessing import cpu_count
from paddle.fluid.dygraph import Pool2D,Conv2D
from paddle.fluid.dygraph import Linear


def makeListFile(data_path):
    # 生成图像列表
    #data_path = '/home/xmy/PycharmProjects/test/paddle/data/gesture'
    # 返回指定的文件夹包含的文件或文件夹的名字的列表。
    character_folders = os.listdir(data_path)
    # 删除存在的train_data.list和test_data.list
    if (os.path.exists('./train_data.list')):
        os.remove('./train_data.list')
    if (os.path.exists('./test_data.list')):
        os.remove('./test_data.list')

    # 遍历所有的folder
    for character_folder in character_folders:
        # 写入train_data
        with open('./train_data.list', 'a') as f_train:
            with open('./test_data.list', 'a') as f_test:
                # 遍历目录下的所有图片文件
                character_imgs = os.listdir(os.path.join(data_path, character_folder))
                # 用count图片分类
                count = 0
                for img in character_imgs:
                    # 这里是9:1的设置为训练集和测试集
                    if count % 10 == 0:
                        f_test.write(os.path.join(data_path, character_folder, img) + '\t' + character_folder + '\n')
                    else:
                        f_train.write(os.path.join(data_path, character_folder, img) + '\t' + character_folder + '\n')
                    count += 1
    print('列表已生成')


# 对图片进行预处理
def data_mapper(sample):
    img, label = sample
    img = Image.open(img)
    img = img.resize((32, 32), Image.ANTIALIAS)
    img = np.array(img).astype('float32')
    # 将读出来的rgb,rgb,rgb......转换成rrr......ggg......bbb
    img = img.transpose((2, 0, 1))
    # 对图片归一化
    img = img / 255.0
    return img, label


def data_reader(data_list_path):
    def reader():
        with open(data_list_path, 'r') as f:
            lines = f.readlines()
            for line in lines:
                img, label = line.split('\t')
                yield img, int(label)

    return paddle.reader.xmap_readers(data_mapper, reader, cpu_count(), 512)



#定义DNN网络
# class MyDNN(fluid.dygraph.Layer):
#     def __init__(self):
#         super(MyDNN,self).__init__()
#         self.hidden1 = Linear(100,100,act='tanh')
#         self.hidden2 = Linear(100,100,act='tanh')
#         self.hidden3 = Linear(100,100,act='tanh')
#         # 10是输出10类，3 × 100 × 100是做了个拉伸但是这样会跟hidden3的输出不匹配所以在前向传播的时候做了reshape
#         self.hidden4 = Linear(3*100*100,10,act='softmax')
#     def forward(self,input):
#         x = self.hidden1(input)
#         x = self.hidden2(x)
#         x = self.hidden3(x)
#         # 拉伸变换。这里搞不明白为什么要拉伸成3 × 100 × 100
#         x = fluid.layers.reshape(x,shape=[-1,3*100*100])
#         y = self.hidden4(x)
#         return y

# 定义网络
class MyLeNet(fluid.dygraph.Layer):
    def __init__(self):
        super(MyLeNet, self).__init__()
        self.c1 = Conv2D(3, 6, 5, 1)
        self.s2 = Pool2D(pool_size=2, pool_type='max', pool_stride=2)
        self.c3 = Conv2D(6, 16, 5, 1)
        self.s4 = Pool2D(pool_size=2, pool_type='max', pool_stride=2)
        self.c5 = Conv2D(16, 120, 5, 1)
        self.f6 = Linear(120, 84, act='relu')
        self.f7 = Linear(84, 10, act='softmax')


    def forward(self, input):
        print("input shape : " + str(input.shape))
        x = self.c1(input)
        print("C1 : " + str(x.shape))
        x = self.s2(x)
        print("S2 : " + str(x.shape))
        x = self.c3(x)
        print("C3 : " + str(x.shape))
        x = self.s4(x)
        print("S4 : " + str(x.shape))
        x = self.c5(x)
        print("C5 : " + str(x.shape))
        x = fluid.layers.reshape(x, shape=[-1, 120])
        # print(x.shape)
        x = self.f6(x)
        y = self.f7(x)
        return y



if __name__ == '__main__':
    data_path = '/home/xmy/PycharmProjects/test/paddle/data/gesture'
    makeListFile(data_path)

    # 用于训练的数据提供器,buf_size越大越乱序
    train_reader = paddle.batch(reader=paddle.reader.shuffle(reader=data_reader('./train_data.list'), buf_size=256),
                                batch_size=32)
    # 用于测试的数据提供器
    test_reader = paddle.batch(reader=data_reader('./test_data.list'), batch_size=32)

    # 用动态图进行训练
    with fluid.dygraph.guard():
        model = MyLeNet()  # 模型实例化
        model.train()  # 训练模式
        opt = fluid.optimizer.SGDOptimizer(learning_rate=0.01,
                                           parameter_list=model.parameters())  # 优化器选用SGD随机梯度下降，学习率为0.001.

        epochs_num = 50  # 迭代次数

        for pass_num in range(epochs_num):

            for batch_id, data in enumerate(train_reader()):
                # 将图片大小处理成3 * 32 × 32的为了与lenet相同
                images = np.array([x[0].reshape(3, 32, 32) for x in data], np.float32)

                labels = np.array([x[1] for x in data]).astype('int64')
                # 给labels升维度
                labels = labels[:, np.newaxis]
                # print(images.shape)
                image = fluid.dygraph.to_variable(images)
                label = fluid.dygraph.to_variable(labels)
                predict = model(image)  # 预测
                # print(predict)
                loss = fluid.layers.cross_entropy(predict, label)
                avg_loss = fluid.layers.mean(loss)  # 获取loss值

                acc = fluid.layers.accuracy(predict, label)  # 计算精度

                if batch_id != 0 and batch_id % 50 == 0:
                    print("train_pass:{},batch_id:{},train_loss:{},train_acc:{}".format(pass_num, batch_id,
                                                                                        avg_loss.numpy(), acc.numpy()))

                avg_loss.backward()
                opt.minimize(avg_loss)
                model.clear_gradients()

        fluid.save_dygraph(model.state_dict(), 'MyLeNet')  # 保存模型

    # 模型校验
    with fluid.dygraph.guard():
        accs = []
        model_dict, _ = fluid.load_dygraph('MyLeNet')
        model = MyLeNet()
        model.load_dict(model_dict)  # 加载模型参数
        model.eval()  # 训练模式
        for batch_id, data in enumerate(test_reader()):  # 测试集
            images = np.array([x[0].reshape(3, 32, 32) for x in data], np.float32)
            labels = np.array([x[1] for x in data]).astype('int64')
            labels = labels[:, np.newaxis]

            image = fluid.dygraph.to_variable(images)
            label = fluid.dygraph.to_variable(labels)

            predict = model(image)
            acc = fluid.layers.accuracy(predict, label)
            accs.append(acc.numpy()[0])
            avg_acc = np.mean(accs)
        print(avg_acc)

完整模型使用代码

gestureRecongnition.py

import numpy as np
from PIL import Image
import paddle.fluid as fluid
import cv2
from gestureTrain import MyLeNet

#读取预测图像，进行预测
def load_image(path):
    img = Image.open(path)
    img = img.resize((32, 32), Image.ANTIALIAS)
    img = np.array(img).astype('float32')
    img = img.transpose((2, 0, 1))
    img = img/255.0
    print(img.shape)
    return img

#构建预测动态图过程
with fluid.dygraph.guard():
    infer_path = '/home/xmy/PycharmProjects/test/paddle/proj1_gestureRecongnize/手势.JPG'
    model=MyLeNet()#模型实例化
    model_dict,_=fluid.load_dygraph('/home/xmy/PycharmProjects/test/paddle/proj1_gestureRecongnize/MyLeNet')
    model.load_dict(model_dict)#加载模型参数
    model.eval()#评估模式
    infer_img = load_image(infer_path)
    infer_img=np.array(infer_img).astype('float32')
    infer_img=infer_img[np.newaxis,:, : ,:]
    infer_img = fluid.dygraph.to_variable(infer_img)
    result=model(infer_img)
    cv2.imshow("手势",cv2.imread(infer_path))
    print(np.argmax(result.numpy()))
    cv2.waitKey(1000)

完整工程和数据集下载

csdn下载链接

你可能感兴趣的:(百度飞桨)

百度飞桨paddle安装包括CUDA,cuDNN,opencv的安装小甲学长 opencv 百度 paddlepaddle
conda创建新环境这部分代码均在AnacondaPrompt中写，要求已有Anaconda第一步：创建condacreate--nameyourEnvpython=3.6–name：也可以缩写为【-n】，【yourEnv】是新创建的虚拟环境的名字，创建完，可以装anaconda的目录下找到envs/yourEnv目录python=2.7：是python的版本号。也可以指定为【python=3.6
百度飞桨教程（一）怎么这么多名字都被占了百度 paddlepaddle 人工智能
百度飞桨（paddle），是一个开源的深度学习平台百度飞桨的安装pipinstallpaddlepaddle-ihttps://mirror.baidu.com/pypi/simple手写数字识别案例我们来通过一个案例，大概了解paddle的使用importpaddleimportnumpyasnpfrompaddle.vision.transformsimportNormalizetransfo
《深入浅出多模态》：智能文档处理多模态大模型总结 GoAI 深入浅出多模态深度学习多模态大模型人工智能计算机视觉 nlp
✨专栏介绍：本作者推出全新系列《深入浅出多模态》专栏，具体章节如导图所示（导图后续更新），将分别从各个多模态模型的概念、经典模型、创新点、论文综述、发展方向、数据集等各种角度展开详细介绍，欢迎大家关注。作者主页:GoAI|公众号:GoAI的学习小屋|交流群:704932595|个人简介：掘金签约作者、百度飞桨PPDE、领航团团长、开源特训营导师、CSDN、阿里云社区人工智能领域博客专家、新星计划计
《深入浅出OCR》实战：基于PGNet的端到端识别 GoAI 深入浅出OCR 深度学习计算机视觉 ocr 人工智能深度学习端到端识别
✨专栏介绍：经过几个月的精心筹备，本作者推出全新系列《深入浅出OCR》专栏，对标最全OCR教程，具体章节如导图所示，将分别从OCR技术发展、方向、概念、算法、论文、数据集等各种角度展开详细介绍。个人主页:GoAI|公众号:GoAI的学习小屋|交流群:704932595|个人简介：掘金签约作者、百度飞桨PPDE、领航团团长、开源特训营导师、CSDN、阿里云社区人工智能领域博客专家、新星计划计算机视觉
深度学习实验-3d医学图像分割桶的奇妙冒险深度学习 3d 人工智能
实验四基于nnU-Net模型的3D医学图像分割实验一、实验介绍腹部多器官分割一直是医学图像分析领域最活跃的研究领域之一，其作为一项基础技术，在支持疾病诊断，治疗规划等计算机辅助技术发挥着重要作用。近年来，基于深度学习的方法在该领域中获得了巨大成功。本实验数据集为多模态腹部分割数据集（AMOS），一个大规模，多样性的，收集自真实临床场景下的腹部多器官分割基准数据。本实验在百度飞桨平台上采用nnU-N
Paddle入门实战系列（五）：渔船牌照识别 GoAI 深入浅出OCR 计算机视觉人工智能新星计划 paddle OCR
〖2023·新星计划·第四季〗开启，计算机视觉方向火爆报名中1️⃣活动时间：4月3日-4月30日2️⃣活动报名地址：http://t.csdn.cn/VeEVA‍作者简介：CSDN、阿里云人工智能领域博客专家，新星计划计算机视觉导师，百度飞桨PPDE，专注大数据与AI知识分享。✨公众号：GoAI的学习小屋，免费分享书籍、简历、导图等，更有交流群分享宝藏资料，关注公众号回复“加群”或➡️
首个！百度飞桨会客厅落地广州，打通AI应用落地的“最后一公里” 飞桨PaddlePaddle 人工智能百度 paddlepaddle
2023年，在大模型的浪潮下，各行各业使用AI技术的门槛被进一步降低，为AI技术创新广泛赋能产业发展提供了基础。百度依托全栈式的AI技术产品优势，推动AI产业人才培养，建设繁荣技术生态，加速AI技术在产业的规模应用。广州是国家人工智能创新应用先导区，百度AI技术生态已累计服务广州企业7747家，重点服务433家、技术伙伴23家，为广州市人工智能技术型企业提供源源不断的技术赋能支持和应用人才支持。为
重磅发布！基于百度飞桨的《人工智能基础及应用》书籍正式上线飞桨PaddlePaddle 精品课程名师共建人工智能百度 paddlepaddle
科技日新月异的今天，人工智能已经成为引领未来的核心驱动力。为了帮助大家更好地深入理解人工智能的理论和技术，为未来发展做好准备，百度飞桨教材编写组联合北京交通大学王方石教授、北京邮电大学杨煜清特聘副研究员共同撰写推出了《人工智能基础及应用》这本书籍，同时配套48学时的教学资源，包括教学大纲、教学课件、习题及答案、程序源码等，涵盖人工智能的理论与应用，可作为本科生“人工智能”导论或通识课程的入门教材。
百度飞桨文心生态成果最新披露：开发者达1070万模型数超86万飞桨PaddlePaddle 热门活动百度 paddlepaddle 人工智能深度学习 WAVE SUMMIT
12月28日，由深度学习技术及应用国家工程研究中心主办的WAVESUMMIT+深度学习开发者大会2023在北京召开。百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰现场公布了飞桨文心五载十届最新生态成果，文心一言最新用户规模破1亿，截至12月底，飞桨平台开发者数量达1070万。百度首席技术官王海峰文心一言用户规模破1亿飞桨开发者数达1070万据了解，百度自2019年起深耕预训练模型研发
“不缺钱，只缺人” ，同传翻译的那些事儿飞桨PaddlePaddle 人工智能编程语言深度学习自然语言处理 nlp
点击左上方蓝字关注我们项目简介“手把手带你学NLP”是基于飞桨PaddleNLP的系列实战项目。本系列由百度多位资深工程师精心打造，提供了从词向量、预训练语言模型，到信息抽取、情感分析、文本问答、结构化数据问答、文本翻译、机器同传、对话系统等实践项目的全流程讲解，旨在帮助开发者更全面清晰地掌握百度飞桨框架在NLP领域的用法，并能够举一反三、灵活使用飞桨框架和PaddleNLP进行NLP深度学习实践
关于生成式语言大模型的一些工程思考 paddlenlp & chatglm & llama 路人与大师 llama
生成式语言大模型，随着chatgpt的爆火，市场上涌现出一批高质量的生成式语言大模型的项目。近期百度飞桨自然语言处理项目paddlenlp发布了2.6版本。更新了以下特性：全面支持主流开源大模型Bloom,ChatGLM,GLM,Llama,OPT的训练和推理；TrainerAPI新增张量训练能力,简单配置即可开启分布式训练；新增低参数微调能力PEFT,助力大模型高效微调。其中chatglm与ll
12月28日，每日信息差信息差Pro 信息差Pro 百度人工智能 harmonyos 制造大数据
以下是2023年12月28日的7条信息差第一、百度飞桨文心生态成果最新披露：开发者达1070万，模型数超86万第二、全球首款钠电车型交付：江铃汽车搭载孚能科技钠电池，续航251公里。据孚能科技方面介绍，江铃易至EV3（青春版）251km版本是孚能科技与江铃集团新能源汽车合作的首款钠离子电池纯电A00级车型，可满足年轻一代日常上班代步、跨城出行等多样性场景需求第三、小米发布超级电机V8s，雷军介绍，
计算机视觉方向面试题总结（一）：目标检测篇 GoAI 计算机视觉CV 目标检测计算机视觉目标检测深度学习人工智能 pytorch
‍作者简介：CSDN、阿里云人工智能领域博客专家，新星计划计算机视觉导师，百度飞桨PPDE，专注大数据与AI知识分享。✨公众号：GoAI的学习小屋，免费分享书籍、简历、导图等，更有交流群分享宝藏资料，关注公众号回复“加群”或➡️链接加群。专栏推荐：➡️点击访问《计算机视觉》总结目标检测、图像分类、分割OCR、等方向资料。➡️点击访问《深入浅出OCR》:对标全网最全OCR教程，含理论与实战总结。以上
百度飞桨文心生态成果最新披露：开发者达1070万模型数超86万橙子_ 程序人生百度 paddlepaddle 人工智能文心一言
12月28日，由深度学习技术及应用国家工程研究中心主办的WAVESUMMIT+深度学习开发者大会2023在北京召开。百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰现场公布了飞桨文心五载十届最新生态成果，文心一言最新用户规模破1亿，截至12月底，飞桨平台开发者数量达1070万。百度首席技术官王海峰文心一言用户规模破1亿飞桨开发者数达1070万据了解，百度自2019年起深耕预训练模型研发
紫光展锐T820与百度飞桨完成I级兼容性测试助推端侧AI融合创新紫光展锐官方人工智能百度 paddlepaddle
近日，紫光展锐高性能5GSoCT820与百度飞桨完成I级兼容性测试（基于PaddleLite工具）。测试结果显示，双方兼容性表现良好，整体运行稳定。这是紫光展锐加入百度“硬件生态共创计划”后的阶段性成果。本次I级兼容性测试完成了计算机视觉技术领域3个模型的验证，经过双方联合严格测试，紫光展锐T820在MobileNet-V1、ResNet50、SSD-MobileNet-V1模型上的精度、速度等各
【ScienceAI Weekly】DeepMind最新研究再登Nature；我国首个自研地球系统模型开源；谷歌推出医疗保健模型 HyperAI超神经 ScienceAI 人工智能开源人工智能
AIforScience的新成果、新动态、新视角抢先看——*DeepMind最新研究FunSearch登Nature*谷歌推出医疗保健行业模型MedLM*晶泰科技冲刺港交所，AI+机器人赋能AIforScience*GHDDI与微软研究院科学智能中心达成合作*用于地震学处理分析的AI工具开源*我国首个自主研发的地球系统模型宣布开源*百度飞桨螺旋桨团队构建蛋白质-小分子对接构象预测模型HelixDo
智慧零售技术探秘：关键技术与开源资源，助力智能化零售革新 virtaitech gpu 人工智能大数据
智慧零售是一种基于先进技术的零售业态，通过整合物联网、大数据分析、人工智能等技术，实现零售过程的智能化管理并提升消费者体验。实现智慧零售的关键技术包括商品的自动识别与分类、商品的自动结算等等。为了实现商品的自动识别与分类，需要借助先进的图像识别技术。本文将介绍一些开源库和数据集，这些资源有助于研究者和开发者在智慧零售领域进行相关工作。PaddleClasPaddleClas是由百度飞桨开发的一个图
深度学习产业落地速度新支点：飞桨&英特尔®至强®共同助力AI加速飞桨PaddlePaddle 百度大数据人工智能 java 机器学习
引言深度学习技术是推动人工智能时代发展的强大引擎，通过对文字、图形、声音和多媒体等数据的分析和推理推动产业向智能化迈进。然而，大多数深度学习模型使用32位浮点精度（FP32)构建，其复杂度高，模型参数量大的特点，限制了其在一些场景和设备上进行部署，特别是在移动嵌入式设备上部署的可能性。针对上述需求，百度飞桨开源深度学习平台结合第三代英特尔®至强®可扩展处理器，通过完善的模型压缩方案和量化加速技术，
紫光展锐T820与飞桨完成I级兼容性测试助推端侧AI融合创新飞桨PaddlePaddle 硬件生态人工智能程序员硬件生态机器学习
近日，紫光展锐高性能5GSoCT820与百度飞桨完成I级兼容性测试（基于PaddleLite工具）。测试结果显示，双方兼容性表现良好，整体运行稳定。这是紫光展锐加入百度“硬件生态共创计划”后的阶段性成果。本次I级兼容性测试完成了计算机视觉技术领域3个模型的验证，经过双方联合严格测试，紫光展锐T820在MobileNet-V1、ResNet50、SSD-MobileNet-V1模型上的精度、速度等各
动手学深度学习——Anaconda、pytorch、paddle安装(cpu版本) Audery867 深度学习深度学习 pytorch paddle python 机器学习
之前出了个Windows下的深度学习安装，但在继续学习的过程中发现，沐神的一些代码跑不起来，这里又提供pytorch和paddle的安装，各位用pytorch或者百度飞桨paddlepaddle来学习深度学习也是可以的。安装Anaconda1.打开Anaconda链接，下载，时间较久2.下载完成，开始安装3.安装路径可以随意，不过推荐使用默认安装路径，next虽说下面要勾选添加环境变量的选项，我这
【小沐学Python】Python实现TTS文本转语音（speech、pyttsx3、百度AI）爱看书的小沐 Python AI python 人工智能语音识别 tts 文本转语音百度飞桨实时音视频
文章目录1、简介2、Windows语音2.1简介2.2安装2.3代码3、pyttsx33.1简介3.2安装3.3代码4、ggts4.1简介4.2安装4.3代码5、SAPI6、SpeechLib7、百度AI8、百度飞桨结语1、简介TTS(TextToSpeech)译为从文本到语音，TTS是人工智能AI的一个模组，是人机对话的一部分，即让机器能够说话。TTS是语音合成技术应用的一种，首先采集语音波形，
人工智能-语音识别技术paddlespeech的搭建和使用没刮胡子 python 飞桨paddle 人工智能AI 人工智能语音识别 paddlepaddle paddlespeech python
PaddleSpeech介绍PaddleSpeech是百度飞桨（PaddlePaddle）开源深度学习平台的其中一个项目，它基于飞桨的语音方向模型库，用于语音和音频中的各种关键任务的开发，包含大量基于深度学习前沿和有影响力的模型。PaddleSpeech支持语音识别、语音翻译（英译中）、语音合成、标点恢复等应用示例。安装paddlespeechPaddleSpeech快速安装方式有两种，一种是pi
百度飞桨领航团零基础Python速成营编程巩固 dream.becoming Python学习笔记 paddle 百度飞桨 python
百度飞桨领航团零基础Python速成营编程巩固目录第一天问题1问题2问题3问题4问题5第二天问题1问题2问题3问题4问题5第三天问题1问题2问题3问题4问题5第一天问题1编写一个程序，查找所有此类数字，这些数字可以被7整除，但不能是5的倍数，介于2000和3200之间（均包括在内）。所获得的数字应以逗号分隔的顺序打印在一行上。自己尝试：#提示：考虑使用range（#begin，#end）方法num
C# Onnx 百度飞桨开源PP-YOLOE-Plus目标检测天天代码码天天 C#人工智能实践 paddlepaddle 人工智能计算机视觉 opencv c#目标检测机器学习
目录效果模型信息项目代码下载C#Onnx百度飞桨开源PP-YOLOE-Plus目标检测效果模型信息Inputs-------------------------name：imagetensor：Float[1,3,640,640]name：scale_factortensor：Float[1,2]---------------------------------------------------
【人工智能Ⅰ】实验4：贝叶斯分类 MorleyOlsen 人工智能人工智能分类数据挖掘贝叶斯
实验4贝叶斯分类一、实验目的1.了解并学习机器学习相关库的使用。2.熟悉贝叶斯分类原理和方法，并对MNIST数据集进行分类。二、实验内容1.使用贝叶斯方法对mnist或mnistvariation数据集进行分类，并计算准确率。数据集从网上下载（如百度飞桨平台）。2.改变算法参数，观察对识别准确率的影响。三、实验环境平台JupyterNotebook(anaconda3)Python版本python
机器学习笔记 - 基于百度飞桨PaddleSeg的人体分割模型以及TensorRT部署说明坐望云起深度学习从入门到精通 OpenCV从入门到精通 paddlepaddle 人工智能分割模型人体识别深度学习百度飞桨
一、简述虽然SegmentAnything用于图像分割的通用大模型看起来很酷（飞桨也提供分割一切的模型），但是个人感觉落地应用的时候心里还是更倾向于飞桨这种场景式的，因为需要用到一些人体分割的需求，所以这里主要是对飞桨高性能图像分割开发套件进行了解和使用，但是暂时不训练，因为搞数据集挺费劲。PaddleSeg内置45+模型算法及140+预训练模型。最新发布HumanSeglite模型超轻量级人像分
越学越有趣：『手把手带你学NLP』系列项目02 ——语义相似度计算的那些事儿... 飞桨PaddlePaddle 百度 python 人工智能深度学习编程语言
点击左上方蓝字关注我们课程简介“手把手带你学NLP”是基于飞桨PaddleNLP的系列实战项目。本系列由百度多位资深工程师精心打造，提供了从词向量、预训练语言模型，到信息抽取、情感分析、文本问答、结构化数据问答、文本翻译、机器同传、对话系统等实践项目的全流程讲解，旨在帮助开发者更全面清晰地掌握百度飞桨框架在NLP领域的用法，并能够举一反三、灵活使用飞桨框架和PaddleNLP进行NLP深度学习实践
越学越有趣：『手把手带你学NLP』系列项目05 ——文本情感分析的那些事儿飞桨PaddlePaddle python 人工智能深度学习机器学习自然语言处理
点击左上方蓝字关注我们课程简介“手把手带你学NLP”是基于飞桨PaddleNLP的系列实战项目。本系列由百度多位资深工程师精心打造，提供了从词向量、预训练语言模型，到信息抽取、情感分析、文本问答、结构化数据问答、文本翻译、机器同传、对话系统等实践项目的全流程讲解，旨在帮助开发者更全面清晰地掌握百度飞桨框架在NLP领域的用法，并能够举一反三、灵活使用飞桨框架和PaddleNLP进行NLP深度学习实践
深度强化学习-策略梯度算法深入理解 indigo love 深度强化学习算法机器学习强化学习人工智能
1引言在深度强化学习-策略梯度算法推导博文中，采用了两种方法推导策略梯度算法，并给出了Reinforce算法的伪代码。可能会有小伙伴对策略梯度算法的形式比较疑惑，本文就带领大家剖析其中的原理，深入理解策略梯度算法的公式。本文主要参考了百度飞桨的视频PolicyGradient算法有兴趣的小伙伴可以看看，我觉得讲的非常透彻。2手写数字识别我们先来看一下手写数字识别案列，采用LeNet网络，其输入为一
一文看懂国产最大深度学习平台上新，国内率先加持量子机器学习喜欢打酱油的老鸟人工智能
金磊发自凹非寺量子位报道|公众号QbitAI四年时间，累计开发者数量超190万，发布模型超23万，服务企业数量8.4万。这就是国产最大深度学习开源平台——百度飞桨——在WAVESUMMIT2020中，百度首席技术官王海峰，提交的最新高分成绩单。但国产第一大深度学习平台飞桨，却不满足于此。随着“新基建”给中国“产业智能化”带来的新动力，飞桨再次迎来高光时刻，秀出更强肌肉——升级、迭代，还在继续。王海
异常的核心类Throwable 无量 java 源码异常处理 exception
java异常的核心是Throwable，其他的如Error和Exception都是继承的这个类里面有个核心参数是detailMessage，记录异常信息，getMessage核心方法，获取这个参数的值，我们可以自己定义自己的异常类，去继承这个Exception就可以了，方法基本上，用父类的构造方法就OK，所以这么看异常是不是很easy package com.natsu;
mongoDB 游标（cursor）实现分页迭代开窍的石头 mongodb
上篇中我们讲了mongoDB 中的查询函数，现在我们讲mongo中如何做分页查询如何声明一个游标 var mycursor = db.user.find({_id:{$lte:5}}); 迭代显示游标数
MySQL数据库INNODB 表损坏修复处理过程 0624chenhong tomcat mysql
最近mysql数据库经常死掉，用命令net stop mysql命令也无法停掉，关闭Tomcat的时候，出现Waiting for N instance(s) to be deallocated 信息。查了下，大概就是程序没有对数据库连接释放，导致Connection泄露了。因为用的是开元集成的平台，内部程序也不可能一下子给改掉的，就验证一下咯。启动Tomcat,用户登录系统，用netstat -
剖析如何与设计人员沟通不懂事的小屁孩工作
最近做图烦死了，不停的改图，改图……。烦，倒不是因为改，而是反反复复的改，人都会死。很多需求人员不知该如何与设计人员沟通，不明白如何使设计人员知道他所要的效果，结果只能是沟通变成了扯淡，改图变成了应付。那应该如何与设计人员沟通呢？我认为设计人员与需求人员先天就存在语言障碍。对一个合格的设计人员来说，整天玩的都是点、线、面、配色，哪种构图看起来协调；哪种配色看起来合理心里跟明镜似的，
qq空间刷评论工具换个号韩国红果果 JavaScript
var a=document.getElementsByClassName('textinput'); var b=[]; for(var m=0;m<a.length;m++){ if(a[m].getAttribute('placeholder')!=null) b.push(a[m]) } var l
S2SH整合之session 灵静志远 spring AOP struts session
错误信息： Caused by: org.springframework.beans.factory.BeanCreationException: Error creating bean with name 'cartService': Scope 'session' is not active for the current thread; consider defining a scoped
xmp标签 a-john 标签
今天在处理数据的显示上遇到一个问题： var html = '<li><div class="pl-nr"><span class="user-name">' + user + '</span>' + text + '</div></li>'; ulComme
Ajax的常用技巧（2）---实现Web页面中的级联菜单 aijuans Ajax
在网络上显示数据，往往只显示数据中的一部分信息，如文章标题，产品名称等。如果浏览器要查看所有信息，只需点击相关链接即可。在web技术中，可以采用级联菜单完成上述操作。根据用户的选择，动态展开，并显示出对应选项子菜单的内容。在传统的web实现方式中，一般是在页面初始化时动态获取到服务端数据库中对应的所有子菜单中的信息，放置到页面中对应的位置，然后再结合CSS层叠样式表动态控制对应子菜单的显示或者隐
天-安-门，好高 atongyeye 情感
我是85后，北漂一族，之前房租1100，因为租房合同到期，再续，房租就要涨150。最近网上新闻，地铁也要涨价。算了一下，涨价之后，每次坐地铁由原来2块变成6块。仅坐地铁费用，一个月就要涨200。内心苦痛。晚上躺在床上一个人想了很久，很久。我生在农
android 动画百合不是茶 android 透明度平移缩放旋转
android的动画有两种 tween动画和Frame动画 tween动画;,透明度,缩放,旋转,平移效果 Animation 动画 AlphaAnimation 渐变透明度 RotateAnimation 画面旋转 ScaleAnimation 渐变尺寸缩放 TranslateAnimation 位置移动 Animation
查看本机网络信息的cmd脚本 bijian1013 cmd
@echo 您的用户名是：%USERDOMAIN%\%username%>"%userprofile%\网络参数.txt" @echo 您的机器名是：%COMPUTERNAME%>>"%userprofile%\网络参数.txt" @echo ___________________>>"%userprofile%\
plsql 清除登录过的用户征客丶 plsql
tools---preferences----logon history---history 把你想要删除的删除 -------------------------------------------------------------------- 若有其他凝问或文中有错误，请及时向我指出，我好及时改正，同时也让我们一起进步。 email ： binary_spac
【Pig一】Pig入门 bit1129 pig
Pig安装 1.下载pig wget http://mirror.bit.edu.cn/apache/pig/pig-0.14.0/pig-0.14.0.tar.gz 2. 解压配置环境变量如果Pig使用Map/Reduce模式，那么需要在环境变量中，配置HADOOP_HOME环境变量 expor
Java 线程同步几种方式 BlueSkator volatile synchronized ThredLocal ReenTranLock Concurrent
为何要使用同步？ java允许多线程并发控制，当多个线程同时操作一个可共享的资源变量时（如数据的增删改查），将会导致数据不准确，相互之间产生冲突，因此加入同步锁以避免在该线程没有完成操作之前，被其他线程的调用，从而保证了该变量的唯一性和准确性。 1.同步方法&
StringUtils判断字符串是否为空的方法（转帖） BreakingBad null StringUtils “”
转帖地址：http://www.cnblogs.com/shangxiaofei/p/4313111.html public static boolean isEmpty(String str) 　　判断某字符串是否为空，为空的标准是 str== null 或 str.length()== 0
编程之美-分层遍历二叉树 bylijinnan java 数据结构算法编程之美
import java.util.ArrayList; import java.util.LinkedList; import java.util.List; public class LevelTraverseBinaryTree { /** * 编程之美分层遍历二叉树 * 之前已经用队列实现过二叉树的层次遍历，但这次要求输出换行，因此要
jquery取值和ajax提交复习记录 chengxuyuancsdn jquery取值 ajax提交
// 取值 // alert($("input[name='username']").val()); // alert($("input[name='password']").val()); // alert($("input[name='sex']:checked").val()); // alert($("
推荐国产工作流引擎嵌入式公式语法解析器-IK Expression comsci java 应用服务器工作 Excel 嵌入式
这个开源软件包是国内的一位高手自行研制开发的，正如他所说的一样，我觉得它可以使一个工作流引擎上一个台阶。。。。。。欢迎大家使用，并提出意见和建议。。。 ----------转帖--------------------------------------------------- IK Expression是一个开源的（OpenSource），可扩展的（Extensible），基于java语言
关于系统中使用多个PropertyPlaceholderConfigurer的配置及PropertyOverrideConfigurer daizj spring
1、PropertyPlaceholderConfigurer Spring中PropertyPlaceholderConfigurer这个类，它是用来解析Java Properties属性文件值，并提供在spring配置期间替换使用属性值。接下来让我们逐渐的深入其配置。基本的使用方法是：(1) <bean id="propertyConfigurerForWZ&q
二叉树:二叉搜索树 dieslrae 二叉树
所谓二叉树,就是一个节点最多只能有两个子节点,而二叉搜索树就是一个经典并简单的二叉树.规则是一个节点的左子节点一定比自己小,右子节点一定大于等于自己(当然也可以反过来).在树基本平衡的时候插入,搜索和删除速度都很快,时间复杂度为O(logN).但是,如果插入的是有序的数据,那效率就会变成O(N),在这个时候,树其实变成了一个链表. tree代码:
C语言字符串函数大全 dcj3sjt126com c function
C语言字符串函数大全函数名: stpcpy 功能: 拷贝一个字符串到另一个用法: char *stpcpy(char *destin, char *source); 程序例: #include <stdio.h> #include <string.h> int main
友盟统计页面技巧 dcj3sjt126com 技巧
在基类调用就可以了, 基类ViewController示例代码 -(void)viewWillAppear:(BOOL)animated { [super viewWillAppear:animated]; [MobClick beginLogPageView:[NSString stringWithFormat:@"%@",self.class]];
window下在同一台机器上安装多个版本jdk，修改环境变量不生效问题处理办法 flyvszhb java jdk
window下在同一台机器上安装多个版本jdk，修改环境变量不生效问题处理办法本机已经安装了jdk1.7，而比较早期的项目需要依赖jdk1.6，于是同时在本机安装了jdk1.6和jdk1.7. 安装jdk1.6前，执行java -version得到 C:\Users\liuxiang2>java -version java version "1.7.0_21&quo
Java在创建子类对象的同时会不会创建父类对象 happyqing java 创建子类对象父类对象
1.在thingking in java 的第四版第六章中明确的说了，子类对象中封装了父类对象， 2."When you create an object of the derived class, it contains within it a subobject of the base class. This subobject is the sam
跟我学spring3 目录贴及电子书下载 jinnianshilongnian spring
一、《跟我学spring3》电子书下载地址：《跟我学spring3》（1-7 和 8-13） http://jinnianshilongnian.iteye.com/blog/pdf 跟我学spring3系列 word原版下载二、源代码下载最新依
第12章 Ajax（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BI and EIM 4.0 at a glance blueoxygen BO
http://www.sap.com/corporate-en/press.epx?PressID=14787 有机会研究下EIM家族的两个新产品~~~~ New features of the 4.0 releases of BI and EIM solutions include: Real-time in-memory computing –
Java线程中yield与join方法的区别 tomcat_oracle java
长期以来，多线程问题颇为受到面试官的青睐。虽然我个人认为我们当中很少有人能真正获得机会开发复杂的多线程应用(在过去的七年中，我得到了一个机会)，但是理解多线程对增加你的信心很有用。之前，我讨论了一个wait()和sleep()方法区别的问题，这一次，我将会讨论join()和yield()方法的区别。坦白的说，实际上我并没有用过其中任何一个方法，所以，如果你感觉有不恰当的地方，请提出讨论。 &nb
android Manifest.xml选项阿尔萨斯 Manifest
结构继承关系 public final class Manifest extends Objectjava.lang.Objectandroid.Manifest 内部类 class Manifest.permission权限 class Manifest.permission_group权限组构造函数 public Manifest () 详细 androi
Oracle实现类split函数的方 zhaoshijie oracle
关键字：Oracle实现类split函数的方项目里需要保存结构数据，批量传到后他进行保存，为了减小数据量，子集拼装的格式，使用存储过程进行保存。保存的过程中需要对数据解析。但是oracle没有Java中split类似的函数。从网上找了一个，也补全了一下。 CREATE OR REPLACE TYPE t_split_100 IS TABLE OF VARCHAR2(100); cr

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他