百度BML&飞桨训练营(一)平台以及框架整体介绍

百度BML、飞桨训练营(一)平台以及框架整体介绍

BML简介

文章相关内容资料已经取得百度BML允许,仅用与交流学习,请不要用于商业传播。

BML按照最简单的定义来说,就是一个平台,一个提供既定模型和算力资源的平台。如果平时自己不想配显卡,如果不是很懂代码却想开发机器学习模型也用这个。包括CV、NLP、数据等场景的模型都有,提供大量的傻瓜式操作以及全智能标注的渠道,让人工智能变得触手可及。

(BML 全功能AI开发平台是一个面向企业和个人开发者的机器学习集成开发环境,为经典机器学习和深度学习提供了从数据处理、模型训练、模型管理到模型推理的全生命周期管理服务,帮助用户更快的构建、训练和部署模型。
BML基于Jupyter提供了在线的交互式开发环境。Notebook不但免去了用户准备开发环境的过程,而且可以帮助用户轻松的实现数据集、代码以及模型的管理。

-BML官网文档:https://ai.baidu.com/ai-doc/BML/Ekhvg0smz

百度BML&飞桨训练营(一)平台以及框架整体介绍_第1张图片

直接上手之有手就行

最开始的入门是最简单的,可以参考一下B站官方的参考视频,十分钟内即可入门。

https://www.bilibili.com/video/BV1LU4y1G7de/

数据中使用的数据集可以下面链接下载
https://pan.baidu.com/s/1GBJi2MVSNTon0HuaQ2RhXw 密码: kgqd

接下来的内容如果看完上面三分钟视频就可以自动跳过,没看也可以跳过,因为实在是太基础了。后面自然就会,没必要看太浪费时间了。

基本概念

数据集:通过导入操作可以将BML中已创建的数据集下载到Notebook的data目录中。

类型:为简化用户开发,平台根据用户选择的不同类型预置了不同的示例代码,只需简单进行数据集适配,即可进行模型训练。

模型:用户可以将Notebook中产生的模型文件进行保存,并版本进行管理。在Notebook中保存模型可以生成新的模型版本。

代码库:用于保存Notebook中除data以外的工作空间中的内容。代码库也通过版本管理,在保存模型时可以将生成模型的代码保存为新版本的代码库。在启动Notebook时可以使用指定版本的代码库来对Notebook的工作空间进行初始化。

基本流程

使用Notebook创建模型的流程如下所示:
百度BML&飞桨训练营(一)平台以及框架整体介绍_第2张图片

说明:当前“通用”Notebook暂不支持配置模型与校验模型功能。

Notebook类型及支持的开发语言和AI框架
Notebook支持如下几种类型:

图像分类-单图单标签、图像分类-单图多标签、物体检测
语言:
Python3.7
Python2.7
框架:
PaddlePaddle 1.8.4
PaddlePaddle 1.7.1
PaddlePaddle 1.6.2
PaddlePaddle 1.5.1
数据集:可以导入相应类型的数据集
通用
语言:
Python3.7
框架:
PaddlePaddle 2.0.0
PaddlePaddle 1.8.4
PyTorch 1.7.1
PyTorch 1.5.1
TensorFlow 1.13.2
TensorFlow 2.3.0
Sklearn 0.23.2-Xgboost 1.3.1
Blackhole 0.3.2
数据集:可以导入所有类型的数据集

创建并启动Notebook

在BML中,Notebook支持多种语言以及不同的AI框架,且可灵活切换。

创建Notebook
BML提供了多种Notebook类型,每种类型都支持多语言及多框架。

在BML左侧导航栏中单击“Notebook”。
在“Notebook”页面单击“新建”,在弹出框中填写详细信息,示例如下:
百度BML&飞桨训练营(一)平台以及框架整体介绍_第3张图片

完成项目信息填写后单击“创建项目”,完成Notbeook创建。
配置并启动Notebook实例
Notebook运行在Docker容器中,用户可以在启动Notebook前配置适合自己的代码执行环境。

配置Notebook环境。
单击“配置”,在弹出框中完成开发环境以及规格的配置,如下所示:
百度BML&飞桨训练营(一)平台以及框架整体介绍_第4张图片

完成配置后,单击“确认并启动”。
Notebook启动过程中需要完成资源的申请以及实例创建,请耐心等待。
等待Notebook启动后,单击“打开”,页面跳转到Notebook,如下所示:

百度BML&飞桨训练营(一)平台以及框架整体介绍_第5张图片

文件夹:对应Notebook运行环境的“/home/work”目录,各预置的文件夹作用如下:
PretrainedModel:用于存储用户训练好的模型文件,可以将该文件夹下的模型文件保存为不同的模型版本。
data:用户导入的数据集保存在该文件夹下。
demo:该文件夹下保存了示例代码。
代码片段库:包含平台预置的公共代码片段库,支持用户直接进行复用。同时用户也可将自己的代码片段保存下来。
包管理:预置了常用的200+的Python安装包,包含PaddlePaddle、transformer等安装包。
正在运行的终端和内核:监测正在运行的终端和内核。
目录:显示相关目录。
环境信息:用于查看环境和配置。
数据集:用于导入用户已在EasyDL专业版中已创建的数据集。
生成代码版本:可生成并保存代码版本,进行版本管理。
生成模型版本:可生成并保存模型版本,进行版本管理。
资源监控:用于查看资源和配置

到此就可以在平台使用notebook了

但是补充一下,平台的模型跑出来后可以部署到硬件设备上,这个后面有需求可以跟着B站官方视频来操作,部署到自己的硬件设备、服务器上。

这是当天的直播链接,可以找到那时候的回播。
http://live.bilibili.com/21689802

你可能感兴趣的:(百度BML基础技术合集,百度,paddlepaddle,人工智能)