前言
H264视频编码技术诞生于2003年,至今已有十余载,技术相当成熟,它的优势在于有高的视频的压缩率,利用帧间和帧内预测(Estimation)、变换(Transform)和反变换、量化(Quantization)和反量化、环路滤波(Loop Filter)、熵编码(Entropy Coding)等视频编码技术,可以实现高质量、低码率的视频流编码。H.264提供了网络抽象层NALU(Network Abstraction Layer)概念对编码出来的视频码流进一步格式封装,使得H.264的文件能容易地在不同网络上传输,以达到低带宽占用、低播放延时的目的。相信在未来几年H.264仍是视频编码的主流技术,尽管在2013年提出了H.265新一代视频编码技术,但是H265的压缩率仅仅提高40%,复杂程度却提升%50以上,这对硬件性能提出新的要求。本文讲述如何在海思HI35xx平台上实现H.264解码。
背景知识
先来弄清楚视频格式和视频编码的相互关系,视频格式可以理解为一个容器,它将编码器生成的多媒体内容(视频,音频,字幕,章节信息等)混合封装在一起的标准,这样就能很好处理视频、音频、字幕的播放同步问题,常见的视频格式有mp4、avi、flv、rmvb、mkv等等。视频编码属于后处理技术,它其实是非必须的,但是从摄像机采集出来的数据十分庞大,不适合网络传输和存储,故需要对视频进行编码压缩,以达到低码率、高成像质量的目的,常见的视频编码技术有h.263,h.264,mpeg-4。接下来我们了解一下海思HIMPP平台解码的概念,HIMPP平台音视频编解码架构遵循下图所示的数据处理流程。H264解码实例走的是HARD DISK->VDEC->VPSS->VO->显示器的流程,这个流程一定要熟悉牢记,代码实现都是围绕这条主线来编写的。
H264解码实例
实例源码很简单,先来了解一下实现H.264解码实例的几个函数,以达到了解实例源码大概构造组成,然后再对每个函数进行具体分析。
/*
**函数描述:linux标准信号捕捉函数
**函数功用:接收Ctrl+C信号,用来退出程序,并销毁HIMPP调用
*/
HI_VOID SAMPLE_VDEC_HandleSig(HI_S32 signo)
{
......
}
/*
**函数描述:用于音视频文件读写推流
**函数功用:用fread等文件操作函数读取音视频文件,并解析后推送HIMPP进行解码
*/
int SAMPLE_COMM_VDEC_H264_SendStream( VdecThreadParam *pArgs)
{
......
}
}
/*
**函数描述:HIMPP系统初始化
**函数功用:配置HIMPP系统的各项参数以满足对目标进行编解码
*/
HI_S32 HI_S32 SAMPLE_VDEC_VdhH264(char *filename)
{
......
}
/*
**主函数
*/
int main(int argc, char *argv[])
{
......
}
下面重点讲解SAMPLE_VDEC_VdhH264(char*filename)这个函数,它是H264解码样例的重点函数。HIMPP系统的API函数是海思提供的SDK开发包,调用它相关的接口,在编译时必须将其提供的相应库文件进行包含编译。下面结合样例程序讲述如何使用HIMPP提供的API实现自己的业务逻辑。H.264视频解码实例走的是HARDDISK->VDEC->VPSS->VO->显示器的处理流程,这个过程可以细分为八大步骤,这八大步骤在其他类型的音视频编解码样例也类似,可以说这八大步骤是使用海思HIMPP API的灵魂。下面简单介绍这个八大步骤的内容:
Step1:初始化HIMPP SYS和通用VB缓冲,包括设置缓冲区的大小,缓冲区块的数目。需要注意的是,在设置通用VB参数之前,必须确保HIMPP系统已经退出,否则设置失败。
Step2:设置通用缓冲区的公共缓冲池属性。
Step3:配置解码器,包括指定解码类型,这里是H.264解码样例,当然选PT_H264啦,然后指定视频大小、解码优先级等等。然后创建解码通道,并是能加收解码流。
Step4:配置VPSS参数,VPSS是对VDEC解码后的流进行处理,如裁剪、降噪等,MPEG解码实例从简单应用出发,仅仅按默认的方式配置VPSS。
Step5:配置VO参数,这一步也很关键,因为它指定了画面输出,包括常见的HDMI和VGA,主要是配置输出显示,图层属性设置、输出位置等信息。
Step6:绑定VDEC与VPSS,实现H264解码流程。
Step7:绑定VPSS与VO,实现H264解码流程。
Step8:推送视频流数据,这一步需要文件读写配合使用,对于H264一般做法是先从NALU层中找到视频I帧,然后将I帧推流至VDEC,紧接下来就按帧推送就好了,该注意的是H264解码必须先推送I帧,否则会视频会花屏。
/*
**函数功能:HIMPP系统初始化及配置
**HARDDISK->VDEC->VPSS->VO->显示器的处理流程
*/
HARDDISK->VDEC->VPSS->VO->显示器的处理流程
HI_S32 SAMPLE_VDEC_VdhH264(char *filename)
{
VB_CONF_S stVbConf, stModVbConf;
HI_S32 i, s32Ret = HI_SUCCESS;
VdecThreadParam pstVdecSend;
SIZE_S stSize;
VO_PUB_ATTR_S stVoPubAttr;
VO_VIDEO_LAYER_ATTR_S stVoLayerAttr;
stSize.u32Width = HD_WIDTH;
stSize.u32Height = HD_HEIGHT;
/************************************************
step1: HIMPP系统初始化以及通用视频缓冲池配置
*************************************************/
MPP_SYS_CONF_S stSysConf = {0};
memset(&stVbConf,0,sizeof(stVbConf));
stSize.u32Width = HD_WIDTH; //指定宽度
stSize.u32Height = HD_HEIGHT; //指定高度
stVbConf.u32MaxPoolCnt = 1; //指定最大缓冲池数量,我们只创建一路H264解码
stVbConf.astCommPool[0].u32BlkSize = (stSize.u32Width * stSize.u32Height* 4) >> 1; //指定缓冲池大小,经验值一般为分辨率的1.5倍左右,这里取2倍
stVbConf.astCommPool[0].u32BlkCnt = 3;
memset(stVbConf.astCommPool[0].acMmzName,0,sizeof(stVbConf.astCommPool[0].acMmzName));
HI_MPI_SYS_Exit(); //设置前先去初始换HIMPP调用
for(i=0;i<22;i++)
{
HI_MPI_VB_ExitModCommPool(i);
}
for(i=0; i<256; i++)
{
HI_MPI_VB_DestroyPool(i);
}
HI_MPI_VB_Exit();
s32Ret = HI_MPI_VB_SetConf(&stVbConf);//配置缓冲池
if (HI_SUCCESS != s32Ret)
{
hidebug("HI_MPI_VB_SetConf failed!\n");
return HI_FAILURE;
}
s32Ret = HI_MPI_VB_Init();//缓冲池初始化
if (HI_SUCCESS != s32Ret)
{
hidebug("HI_MPI_VB_Init failed!\n");
return HI_FAILURE;
}
stSysConf.u32AlignWidth = 16;
/*set config of mpp system*/
s32Ret = HI_MPI_SYS_SetConf(&stSysConf);//HIMPP配置
if (HI_SUCCESS != s32Ret)
{
hidebug("HI_MPI_SYS_SetConf failed!\n");
return HI_FAILURE;
}
s32Ret = HI_MPI_SYS_Init(); //HIMPP系统初始化
if (HI_SUCCESS != s32Ret)
{
hidebug("HI_MPI_SYS_Init failed!\n");
return HI_FAILURE;
}
/************************************************
step2: 系统缓冲池模块初始化配置
*************************************************/
memset(&stModVbConf, 0, sizeof(VB_CONF_S));
stModVbConf.u32MaxPoolCnt = 2;
stModVbConf.astCommPool[0].u32BlkSize = (stSize.u32Width * stSize.u32Height* 4) >> 1;;
stModVbConf.astCommPool[0].u32BlkCnt = 5;
stModVbConf.astCommPool[1].u32BlkSize = (stSize.u32Width * stSize.u32Height* 4) >> 1;;
stModVbConf.astCommPool[1].u32BlkCnt = 5;
HI_MPI_VB_ExitModCommPool(VB_UID_VDEC);
HI_MPI_VB_SetModPoolConf(VB_UID_VDEC, &stModVbConf);
HI_MPI_VB_InitModCommPool(VB_UID_VDEC);
/************************************************
step3: 解码器配置及初始化
*************************************************/
VDEC_CHN_ATTR_S stVdecChnAttr;
stVdecChnAttr.enType = PT_H264; //创建H264类型的解码器
stVdecChnAttr.u32BufSize = 3 * stSize.u32Width * stSize.u32Height;//指定解码缓冲区大小
stVdecChnAttr.u32Priority = 5; //设置解码优先级
stVdecChnAttr.u32PicWidth = stSize.u32Width; //解码宽高
stVdecChnAttr.u32PicHeight =stSize.u32Height;
stVdecChnAttr.stVdecVideoAttr.enMode = VIDEO_MODE_FRAME; //帧式解码模式
stVdecChnAttr.stVdecVideoAttr.u32RefFrameNum = 2;
stVdecChnAttr.stVdecVideoAttr.bTemporalMvpEnable = 0;
HI_MPI_VDEC_SetChnVBCnt(0, 10);
HI_MPI_VDEC_CreateChn(0, &stVdecChnAttr);
HI_MPI_VDEC_StartRecvStream(0);
/************************************************
step4: VPSS配置及初始化
*************************************************/
VPSS_GRP_PARAM_S stVpssParam = {0};
VPSS_CHN_ATTR_S stChnAttr = {0};
VPSS_GRP_ATTR_S stVpssGrpAttr;
stVpssGrpAttr.enDieMode = VPSS_DIE_MODE_NODIE;
stVpssGrpAttr.bIeEn = HI_FALSE;
stVpssGrpAttr.bDciEn = HI_TRUE;
stVpssGrpAttr.bNrEn = HI_FALSE;
stVpssGrpAttr.bHistEn = HI_FALSE;
stVpssGrpAttr.bEsEn = HI_FALSE;
stVpssGrpAttr.enPixFmt = PIXEL_FORMAT_YUV_SEMIPLANAR_420;//解码像素格式YUV420
stVpssGrpAttr.u32MaxW = stSize.u32Width;
stVpssGrpAttr.u32MaxH = stSize.u32Height;
/*** create vpss group ***/
s32Ret = HI_MPI_VPSS_CreateGrp(0, &stVpssGrpAttr);//创建VPSS Group,在HI3536平台一个Group有4个VPSS Channel
if (s32Ret != HI_SUCCESS)
{
hidebug("HI_MPI_VPSS_CreateGrp failed!\n");
return HI_FAILURE;
}
/*** set vpss param ***/
s32Ret = HI_MPI_VPSS_GetGrpParam(0, &stVpssParam);//设置VPSS Group属性
if(s32Ret != HI_SUCCESS)
{
hidebug("HI_MPI_VPSS_GetGrpParam failed!\n");
return HI_FAILURE;
}
stVpssParam.u32IeStrength = 0;
s32Ret = HI_MPI_VPSS_SetGrpParam(0, &stVpssParam);
if(s32Ret != HI_SUCCESS)
{
hidebug("HI_MPI_VPSS_GetGrpParam failed!\n");
return HI_FAILURE;
}
/*** enable vpss chn, with frame ***/
/* Set Vpss Chn attr */
stChnAttr.bSpEn = HI_FALSE;
stChnAttr.bUVInvert = HI_FALSE;
stChnAttr.bBorderEn = HI_TRUE;
stChnAttr.stBorder.u32Color = 0xffffff;//背景色为黑色
stChnAttr.stBorder.u32LeftWidth = 2;
stChnAttr.stBorder.u32RightWidth = 2;
stChnAttr.stBorder.u32TopWidth = 2;
stChnAttr.stBorder.u32BottomWidth = 2;
s32Ret = HI_MPI_VPSS_SetChnAttr(0, 0, &stChnAttr);
if(s32Ret != HI_SUCCESS)
{
hidebug("HI_MPI_VPSS_SetChnAttr failed!\n");
return HI_FAILURE;
}
s32Ret = HI_MPI_VPSS_EnableChn(0, 0);//由于只有一路H264解码,故只用Group0 及 Channel 0
if(s32Ret != HI_SUCCESS)
{
hidebug("HI_MPI_VPSS_EnableChn failed!\n");
return HI_FAILURE;
}
/*** start vpss group ***/
s32Ret = HI_MPI_VPSS_StartGrp(0);
if(s32Ret != HI_SUCCESS)
{
hidebug("HI_MPI_VPSS_StartGrp failed!\n");
return HI_FAILURE;
}
/************************************************
step5: 配置VO及初始化VO
*************************************************/
VO_CHN_ATTR_S stChnAttr1;
stVoPubAttr.enIntfSync = VO_OUTPUT_1080P60;//VO输出模式为1080p 60帧,普通显示器的输出
stVoPubAttr.enIntfType = VO_INTF_VGA | VO_INTF_HDMI;//启用VGA及HDMI输出
s32Ret = HI_MPI_VO_SetPubAttr(0, &stVoPubAttr);
if(s32Ret != HI_SUCCESS)
{
hidebug("HI_MPI_VO_SetPubAttr failed!\n");
return HI_FAILURE;
}
s32Ret = HI_MPI_VO_Enable(0);
if (s32Ret != HI_SUCCESS)
{
hidebug("HI_MPI_VO_Enable failed!\n");
return HI_FAILURE;
}
//设置VO Layer显示配置,如显示位置,大小,像素类型
stVoLayerAttr.u32DispFrmRt = 60;
stVoLayerAttr.stDispRect.u32Width = 1920;
stVoLayerAttr.stDispRect.u32Height = 1080;
stVoLayerAttr.stImageSize.u32Width = stVoLayerAttr.stDispRect.u32Width;
stVoLayerAttr.stImageSize.u32Height = stVoLayerAttr.stDispRect.u32Height;
stVoLayerAttr.bClusterMode = HI_FALSE;
stVoLayerAttr.bDoubleFrame = HI_FALSE;
stVoLayerAttr.enPixFormat = PIXEL_FORMAT_YUV_SEMIPLANAR_420;
s32Ret = HI_MPI_VO_SetVideoLayerAttr(0, &stVoLayerAttr);
if(s32Ret != HI_SUCCESS)
{
hidebug("HI_MPI_VO_SetVideoLayerAttr failed!\n");
return HI_FAILURE;
}
s32Ret = HI_MPI_VO_EnableVideoLayer(0);
if (s32Ret != HI_SUCCESS)
{
hidebug("HI_MPI_VO_EnableVideoLayer failed!\n");
return HI_FAILURE;
}
/*
if (HI_SUCCESS != SAMPLE_COMM_VO_HdmiStart(stVoPubAttr.enIntfSync))
{
hidebug("Start SAMPLE_COMM_VO_HdmiStart failed!\n");
}
*/
//设置VO Channel显示位置,大小
stChnAttr1.stRect.s32X = 0;
stChnAttr1.stRect.s32Y = 0;
stChnAttr1.stRect.u32Width = 1920;
stChnAttr1.stRect.u32Height = 1080;
stChnAttr1.u32Priority = 0;
stChnAttr1.bDeflicker = HI_FALSE;
s32Ret = HI_MPI_VO_SetChnAttr(0, 0, &stChnAttr1);
if (s32Ret != HI_SUCCESS)
{
hidebug("failed with %#x!\n", s32Ret);
}
s32Ret = HI_MPI_VO_EnableChn(0,0);
if (s32Ret != HI_SUCCESS)
{
hidebug("failed with %#x!\n", s32Ret);
}
/************************************************
step6: 解码器绑定VPSS
*************************************************/
MPP_CHN_S stSrcChn;
MPP_CHN_S stDestChn;
stSrcChn.enModId = HI_ID_VDEC;
stSrcChn.s32DevId = 0;
stSrcChn.s32ChnId = 0;
stDestChn.enModId = HI_ID_VPSS;
stDestChn.s32DevId = 0;
stDestChn.s32ChnId = 0;
s32Ret = HI_MPI_SYS_Bind(&stSrcChn, &stDestChn);
if(s32Ret != HI_SUCCESS)
{
hidebug("HI_MPI_SYS_Bind failed!\n");
return HI_FAILURE;
}
/************************************************
step7: VPSS绑定VO
*************************************************/
stSrcChn.enModId = HI_ID_VPSS;
stSrcChn.s32DevId = 0;
stSrcChn.s32ChnId = 0;
stDestChn.enModId = HI_ID_VOU;
stDestChn.s32DevId = 0;
stDestChn.s32ChnId = 0;
s32Ret = HI_MPI_SYS_Bind(&stSrcChn, &stDestChn);
if(s32Ret != HI_SUCCESS)
{
hidebug("HI_MPI_SYS_Bind failed!\n");
return HI_FAILURE;
}
/************************************************
step8: 发送解码流,推送H264流至VDEC
*************************************************/
sprintf(pstVdecSend.cFileName,filename);
pstVdecSend.s32MilliSec = 0;
pstVdecSend.s32ChnId = 0;
pstVdecSend.s32IntervalTime = 1;
pstVdecSend.u64PtsInit = 0;
pstVdecSend.u64PtsIncrease = 0;
pstVdecSend.eCtrlSinal = VDEC_CTRL_START;
pstVdecSend.bLoopSend = HI_TRUE;
pstVdecSend.bManuSend = HI_FALSE;
pstVdecSend.enType = PT_H264;
pstVdecSend.s32MinBufSize = (stVdecChnAttr.u32PicWidth *stVdecChnAttr.u32PicHeight * 3)>>1;
pstVdecSend.s32StreamMode = VIDEO_MODE_FRAME;
SAMPLE_COMM_VDEC_H264_SendStream(&pstVdecSend);
return s32Ret;
}
int main(int argc, char *argv[])
{
if(argc != 2)
{
printf("Usage: h264 filename\n");
exit(0);
}
signal(SIGINT, SAMPLE_VDEC_HandleSig);
signal(SIGTERM, SAMPLE_VDEC_HandleSig);
SAMPLE_VDEC_VdhH264(argv[1]);
return 0;
}
H264的NALU
这里讲一下H264编码的NALU基础知识,NAL全称Network Abstract Layer, 即网络抽象层。如何从NAL里面找到我们需要的帧呢,原来实际的H264数据帧中,往往在帧前面带有00 00 00 01 或 00 00 01分隔符,来标识一帧的起始位置。以00 00 00 01分割之后的下一个字节就是NALU类型,将其转为二进制数据后,解读顺序为从左往右算,第一位为禁止位,值为1表示语法出错;第2~3位为参考级别;第4~8为是NAL单元类型。常见的NALU的类型有序列参数集SPS,它的NAL单元类型值为0x67,即0000 0001 0110 0111;图像参数集PPS,它的NAL单元类型值为0x68,即0000 00010110 1000;IDR图像中的片(I帧) ,它的NAL单元类型值为0x65,即0000 0001 0110 0101。所以判断是否为I帧的算法为: (NALU类型 & 0001 1111)= 5,即NALU类型 & 1F= 5,比如0x65 & 1F = 5。结合H264推流的代码看一下,这段代码的通过读取H.264文件到一个缓冲区,然后对缓冲区进行数据处理,判断I帧的起始位置。
//解析H264文件的I帧信息
else if ( (pstVdecThreadParam->s32StreamMode==VIDEO_MODE_FRAME) && (pstVdecThreadParam->enType == PT_H264) )
{
bFindStart = HI_FALSE;
bFindEnd = HI_FALSE;
fseek(fpStrm, s32UsedBytes, SEEK_SET);
s32ReadLen = fread(pu8Buf, 1, pstVdecThreadParam->s32MinBufSize, fpStrm);
if (s32ReadLen == 0)
{
if (pstVdecThreadParam->bLoopSend)
{
s32UsedBytes = 0;
fseek(fpStrm, 0, SEEK_SET);
s32ReadLen = fread(pu8Buf, 1, pstVdecThreadParam->s32MinBufSize, fpStrm);
}
else
{
break;
}
}
for (i=0; i
{
int tmp = pu8Buf[i+3] & 0x1F; //判断I帧
if ( pu8Buf[i] == 0 && pu8Buf[i+1] == 0 && pu8Buf[i+2] == 1 &&
(
((tmp == 5 || tmp == 1) && ((pu8Buf[i+4]&0x80) == 0x80)) ||
(tmp == 20 && (pu8Buf[i+7]&0x80) == 0x80)
)
)
{
bFindStart = HI_TRUE;
i += 8;
break;
}
}
for (; i
{
int tmp = pu8Buf[i+3] & 0x1F;//判断I帧
if ( pu8Buf[i ] == 0 && pu8Buf[i+1] == 0 && pu8Buf[i+2] == 1 &&
(
tmp == 15 || tmp == 7 || tmp == 8 || tmp == 6 ||
((tmp == 5 || tmp == 1) && ((pu8Buf[i+4]&0x80) == 0x80)) ||
(tmp == 20 && (pu8Buf[i+7]&0x80) == 0x80)
)
)
{
bFindEnd = HI_TRUE;
break;
}
}
if(i > 0) s32ReadLen = i;
if (bFindStart == HI_FALSE)
{
printf("SAMPLE_TEST: chn %d can not find start code!s32ReadLen %d, s32UsedBytes %d. \n",
pstVdecThreadParam->s32ChnId, s32ReadLen, s32UsedBytes);
}
else if (bFindEnd == HI_FALSE)
{
s32ReadLen = i+8;
}
}
总结
H.264解码实例参考了海思提供的样例及库,程序源码及相关库文件请点击这里,修改不同的编译链工具,即可在不同HI35XX系列平台运行,整个H.264解码实例提供了最简单的解码实现方式,当然还可以实现快进播放、暂停播放等常用的视频播放控制逻辑,这需要读者进一步摸索。