初识HEVC/H.265

这一年来,公司不断地打算上H.265。但似乎支持H.265码编的芯片不多,但业内不断宣扬,我们也要跟上时代。趁休息,就去了解了解相关的东西,以免被问到回答不上来。

一、标准

HEVC,是“High efficiency video coding ”的简称,也叫H.265。很多年前就开搞了,到2013年终于出了1.0版本。到目前为止,一共发布了3个版本。最新为2015年4月的3.0版本。不同版本个别语法有一点点不同,但整体上框架没变。比如1.0版本的VPS前面的字段为vps_reserved_three_2bits,占用2比特。而在后续版本该字段分别为vps_base_layer_internal_flag和vps_base_layer_available_flag,分别占用1比特。类似的还有很多。

网上很多文章使用1.0版本的语法,建议在学习时把3个版本的标准文档都下载。

HEVC/H.265学习大本营地址:https://hevc.hhi.fraunhofer.de/。这个网站上有标准下载地址、相关论文,以及HEVC测试模型HM代码。

标准下载地址:http://www.itu.int/rec/T-REC-H.265/en

关于H.265的分析工具,网络有不少,但都是收费的,而且价格还不菲。试用版本要么只能用几天,要么只能看视频前20帧。不过对于初步了解H.265似乎足够了。

CodecVisa工具下载:http://www.codecian.com/

H265VideoESViewer工具下载:http://www.jongbel.com/manual-analysis/hevch-265-video-es-viewer/

网络上有很多讲解和分析的文章,此处不展开。

二、测试模型HM

HM代码下载:https://hevc.hhi.fraunhofer.de/svn/svn_HEVCSoftware/tags/。似乎该网站没有提供压缩包下载,只能使用svn下载。目前最新版本16.6。如果下载整个SVN,占用空间将会很大,因此只需下载自己想研究的版本即可。另外要说明一点,不同版本对应的HEVC标准版本不同。如果标准使用最新的,HM代码也建议使用最新的。

HM可以在linux或windows编译,说实话,跟踪代码及调试,还是windows方便。我安装的是VS2010,双击\build\HM_vc10.sln即可进行编译。生成文件位于:\bin\vc10\Win32\Debug。该目录有几个exe文件:

解码器:TAppDecoder.exe
编码器:TAppEncoder.exe

编码使用示例:
1、YUV原始序列:suzie_qcif.yuv
2、从\cfg目录拿拷贝encoder_intra_main.cfg文件。
3、新建YUV配置文件suzie_qcif.cfg,内容:
#======== File I/O ===============
InputFile                     : suzie_qcif.yuv
InputBitDepth                 : 8           # Input bitdepth
FrameRate                     : 30          # Frame Rate per second
FrameSkip                     : 0           # Number of frames to be skipped in input
SourceWidth                   : 176        # Input  frame width
SourceHeight                  : 144         # Input  frame height
FramesToBeEncoded             : 50         # 编码50帧

在cmd命令行输入:
TAppEncoder.exe -c encoder_intra_main.cfg -c suzie_qcif.cfg

之后便会生成HEVC码流文件str.bin。

下面再介绍一下编码参数。
在cfg目录下有很多encoder_xx.cfg文件,这些文件就是重要参数的配置文件,比如profile、GOP大小、QP,等。
BitstreamFile:输出码流文件,上面示例encoder_intra_main.cfg文件使用的就是默认值str.bin。
InputFile:输入文件,上面示例是另建文件配置。
SourceWidth、SourceHeight:输入源文件的宽、高
InputBitDepth:输入位深,常见YUV一般为8位。
InternalBitDepth:编码器使用的位深。等同于输出位深OutputBitDepth。
FrameRate:帧率
FramesToBeEncoded:编码帧数,注意,当profile为main-still-pictur,必须为1
Profile:指定码流的profile。取值有:main main10 main-still-picture main-RExt, high-throughput-RExt, main-SCC,等等。
Level:指定码流的level。取值:none、1, 2, 2.1, 3, 3.1, 4, 4.1, 5, 5.1, 5.2, 6, 6.1, 6.2, 8.5。
Tier:指定码流的tier,只有main或high。
IntraPeriod:I帧间隔
GOPSize:GOP大小
注意:IntraPeriod和GOPSize这两个参数有点复杂,一些都选1,即都是I帧,如果不是,还要设置一些参数,例子见encoder_lowdelay_main_rext.cfg。
QP:指定量化参数。默认为30,HEVC范围为0~51。值越大,压缩越好,文件体积越小,但质量越差。

李迟 2015.9.6




你可能感兴趣的:(视频/图像学习)