CANN提供了AIPP和DVPP两种处理图像/视频数据的方式,AIPP和DVPP可以分开使用也可以组合使用,两者功能有部分重叠。
AIPP(Artificial Intelligence Pre-Processing)人工智能预处理,在AI Core上完成数据预处理,主要功能包括改变图像尺寸(抠图、填充等)、色域转换(转换图像格式)、减均值/乘系数(改变图像像素)等。AIPP有静态和动态两种模式。
**静态AIPP及在模型转换时就配置AIPP参数,后续不再修改。**我们创建一个配置文件来设置静态AIPP的功能。
配置文件aipp.cfg示例:
aipp_op {
aipp_mode: static //设置为静态模式
input_format:YUV420SP_U8
src_image_size_w: 320
src_image_size_h: 240
crop: true //抠图操作
load_start_pos_w: 10
load_start_pos_h: 20
crop_size_w: 50
crop_size_h: 60
padding: true //填充操作
left_padding_size: 20
right_padding_sizeL: 15
top_padding_size: 20
bottom_padding_size: 15
padding_value: 0
csc_switch: true //色域转换
matrix_r0c0:298
matrix_r0c1:0
matrix_r0c2:409
matrix_r1c0:298
matrix_r1c1:-100
matrix_r1c2:-208
matrix_r2c0:298
matrix_r2c1:516
matrix_r2c2:0
input_bias_0:16
input_bias_1:128
input_bias_2:128
//归一化配置
mean_chn_0:104
mean_chn_1:117
mean_chn_2:123
}
上述配置文件的配置方法有模板可寻,具体参数设置可参考官方文档:
配置文件模板-AIPP使能-高级功能-ATC模型转换-推理应用开发-6.3.RC1.alpha002-CANN社区版-文档首页-昇腾社区 (hiascend.com)
使用方法:在使用ATC命令时,通过设置–insert_op_conf参数来加载AIPP配置文件
atc \
--model=resnet50.onnx \
--framework=5 \
--output=resnet50 \
--input_format=NCHW \
--soc_version=Ascend310 \
--input_op_conf=aipp.cfg //设置AIPP配置文件
动态AIPP及开始不设置AIPP参数,而在推理代码中使用ACL接口来动态设置AIPP的参数。
在使用时,我们依旧需要在使用ATC命令时配置AIPP的配置文件。但动态AIPP的配置文件十分简单,如下:
aipp_op
{
aipp_mode: dynamic //设置为动态模式
max_src_image_size: 752640 # 输入图像最大的size,参数必填
}
我们使用ACL接口来设置AIPP参数,示例代码如下:
aclmdlAIPP *aippDynamicSet = aclmdlCreateAIPP(batchNumber);
ret = aclmdlSetAIPPSrcImageSize(aippDynamicSet, 256, 224);
ret = aclmdlSetAIPPInputFormat(aippDynamicSet, ACL_YUV420SP_U8);
ret = aclmdlSetAIPPCscParams(aippDynamicSet, 1, 256, 443, 0, 256, -86, -178, 256, 0, 350, 0, 0, 0, 0, 128, 128);
ret = aclmdlSetAIPPRbuvSwapSwitch(aippDynamicSet, 0);
ret = aclmdlSetAIPPDtcPixelMean(aippDynamicSet, 0, 0, 0, 0, 0);
ret = aclmdlSetAIPPDtcPixelMin(aippDynamicSet, 0, 0, 0, 0, 0);
ret = aclmdlSetAIPPPixelVarReci(aippDynamicSet, 1.0, 1.0, 1.0, 1.0, 0);
ret = aclmdlSetAIPPCropParams(aippDynamicSet, 1, 2, 2, 224, 224, 0);
ret = aclmdlSetInputAIPP(modelId_, input_, index, aippDynamicSet);
ret = aclmdlDestroyAIPP(aippDynamicSet);
我们可以看到各个函数的函数名与静态配置时的参数基本一致,具体功能与参数可查阅官方文档,这里不做赘述。
总结一下,AIPP的功能主要为抠图填充、色域转换、归一化。
DVPP(Digital Vision Pre-Processing)是昇腾AI处理器内置的图像处理单元(硬件),通过AscendCL媒体数据处理接口提供强大的媒体处理硬加速能力。
主要提供的功能有视频编解码、JPEG编解码、PNG解码和预处理VPC(Digital Vision Pre-Processing)图片处理(抠图、缩放、格式转换)。
功能如下:
DVPP有V1和V2两个版本,V2接口支持更多的功能。使用方法为ACL接口调用,具体函数与参数请查阅官方文档:
接口调用流程-VPC图片处理典型功能-媒体数据处理V2-图像/视频/音频数据处理-应用开发(C&C++)-推理应用开发-6.3.RC1.alpha002-CANN社区版-文档首页-昇腾社区 (hiascend.com)
AIPP和DVPP可以分开独立使用,也可以组合使用,组合使用情况下,一般先使用DVPP对图片或者视频进行解码、抠图、缩放等操作,然后再使用AIPP对DVPP处理后的图片进行格式、色域等转换,使输入符合模型的要求。