一:什么是PaddleHub?
PaddleHub是一个深度学习模型开发工具。它基于飞桨领先的核心框架,提供了飞桨生态下的高质量预训练模型,涵盖了图像分类、目标检测、词法分析、语义模型、情感分析、视频分类、图像生成、图像分割、文本审核、关键点检测等主流模型,方便用户不用花费大量精力从头开始训练一个模型。
其主要特性包括: 1. 丰富的预训练模型; 2. 模型即软件; 3. Fine-tone API。
二:PaddleHub Api的全景
数据集Dataset:PaddleHub提供多种NLP任务和CV任务的数据集,用户也可以在自定义数据集上完成Fine-tune
数据预处理Reader:PaddleHub的数据预处理模块Reader对常见的NLP和CV任务进行了抽象。
预训练模型Module:Module代表了一个预训练模型。
优化策略Strategy:在PaddleHub中,Strategy类封装了一系列适用于迁移学习的Fine-tune策略。Strategy包含了对预训练参数使用什么学习率变化策略,使用哪种类型的优化器,使用什么类型的正则化等。
运行配置 RunConfig:在PaddleHub中,RunConfig代表了在对Task进行Fine-tune时的运行配置。包括运行的epoch次数、batch的大小、是否使用GPU训练等。
迁移任务Task:PaddleHub预置了常见任务的Task。Task代表了一个Fine-tune的任务。任务中包含了执行该任务相关的Program、数据Reader、运行配置等内容。每种Task都有自己特有的应用场景以及提供了对应的度量指标,用于适应用户的不同需求。预置的任务类型包括图像分类、文本分类、序列分类和多标签分类各类任务。
三:PaddleHub支持功能
(1)口罩人脸检测与分类。通过飞桨预训练模型管理与迁移学习工具PadddleHub已经提供的预训练模型(pyramidbox_lite_mobile_mask/pyramidbox_lite_server_mask),实现一键检测人们是否佩戴口罩的应用 。该模型可以有效检测在密集人流区域中携带和未携戴口罩的所有人脸,同时判断该者是否佩戴口罩,目前已在众多场景中落地应用。
(2)图像分割,该PaddleHub Module使用百度自建数据集进行训练,可用于人像分割,支持任意大小的图片输入。
四:我的想法
通过对PaddleHub的基础了解,作为一个广泛开发使用的工具,我对于基于PaddleHub的文字识别与应用非常感兴趣。