叶广明_微信ye_guangming

x264里的2pass指的是什么意思? x264源代码分析2.encode()

A:x264里的2pass指的是什么意思?另外stat是什么意思, 比如有个参数--stats Filename for 2 pass stats [/"%s/"]/n", defaults->rc.psz_stat_out );
stats在这是什么意思?

2pass是2次编码的意思，stats是统计文档的名称，记录了1pass中的信息.2次编码就相当于2次转换这么做虽然转换时间会漫长，但压出的片子会有更好的画质，画面细节更好，而且体积会更小

2-pass主要是针对非实时的视频编码（如文件）来说的，通俗的说就是需要二次编码，第一次编码是先对整个文件进行扫描，记录一些统计信息，第二次编码时根据前面记录的统计信息再进行编码，这样的好处是可以提高编码的质量。

A:那个达人能简单说说x264中 rc 部分 1pass 和 2pass的思路？

就此问题在 x264 开发邮件列表里问过。没有得到一个明确的结论。
我看代码的过程中，首先关注的是 1pass ，得到的一点经验大概可以这样描述：
首先 x264 中将 QP 通过一个确定的公式变换为 QScale 。其主要就是针对于 QS 作分析和控制/约束变化的。
x264 的码率控制接口是以帧为单位的，而支持的宏块级变化只到宏块行。
编码一个宏块行之前调用接口函数以得到欲使用的 QP 。
它预测某个 gomb (宏块组) 的耗费码流的大小，利用在漏桶模型上，以之权衡 QP 是否需要改变并如何进行改变。
预测的时候是使用两种预测求平均的方法，见 predict_row_size() 函数。
它的预测方程一个比较引起混淆的是它对历史数据有个衰减的过程。
而且，这些衰减概念，应用在不同地方所用的几个方程上。
它的 RC 核心函数是 rate_estimate_qscale() 。
其中一个 QS 的推导是一个需要解析的输入表达式字符串，也因此在内部实现了一个表达式解析器，也许会产生一点晦涩感。
一时就想到这些。

E. 然后进入x264_encoder_encode( h, &nal, &i_nal, pic )函数,该函数定义在/Enc/encoder.c中.

开始进入比较复杂的地方了.

这个函数前面有一段注释(如下):

****************************************************************************

* x264_encoder_encode:

* XXX: i_poc : is the poc of the current given picture

* i_frame : is the number of the frame being coded

* ex: type frame poc

* I 0 2*0//poc是实际的帧的位置.

* P 1 2*3//frame是编码的顺序.

* B 2 2*1

* B 3 2*2

* P 4 2*6

* B 5 2*4

* B 6 2*5

****************************************************************************/

要搞清poc和frame的区别.

假设一个视频序列如下:

I B B P B B P

我们编码是按I P B B P B B的顺序,这就是frame的编号.

而我们视频序列的播放序号是POC的序号,这里是乘以了2.

函数中先定义了如下三个参数:

int i_nal_type;

nal存放的数据类型, 可以是sps,pps等多种.

int i_nal_ref_idc;

nal的优先级,nal重要性的标志位.

前面两个参数虽然简单,但如果不参照标准,也不容易理解,所以标准中的句法表是很重要的,可以说是最关键的.

int i_slice_type;

slice的类型,在x264中我的感觉好像一帧只有一个slice.如果确定了帧的类型,slice的类型也就确定了.

我们来看看编码器是如何区分读入的一帧是I帧,P帧,或者B帧,这个过程需要好好理解.

还以I B B P B B P为例.

if( h->i_frame % (h->param.i_iframe * h->param.i_idrframe) == 0 ){

确定这是立即刷新片.

}

这里很好理解.

但到了if( h->param.i_bframe > 0 )//可以B帧编码时.

就有问题了.

注意我们编完I帧后碰到了一个B帧,这时我们先不对它进编码.而是采用frame = x264_encoder_frame_put_from_picture( h, h->frame_next, pic )函数将这个B帧放进h->frame_next中.

好,这里出现了h->frame_next,在h中同时定义了下面几个帧数组用以实现帧的管理.

x264_frame_t *bframe_current[X264_BFRAME_MAX]; /* store the sequence of b frame being encoded */

x264_frame_t *frame_next[X264_BFRAME_MAX+1]; /* store the next sequence of frames to be encoded *///搞清意义,下一个帧,而不一定是B帧.

x264_frame_t *frame_unused[X264_BFRAME_MAX+1]; /* store unused frames */

注意区分这3个数组.

同时还有下面4个函数(定义在/ENCODER/encoder.c中).

x264_encoder_frame_put_from_picture();

x264_encoder_frame_put();

x264_encoder_frame_get();

x264_frame_copy_picture();

这3个数组和4个函数可以说完成了整个帧的类型的判定问题.这个里面if ,else语句较多,容易使人迷惑.但我们只要把握下面一个观点就可以看清实质:在不对P帧进行编码之前,我们不对B帧进行编码,只是把B帧放进缓冲区(就是前面提到的数组).

比如视频序列:I B B P B B P

先确立第一个帧的类型,然后进行编码.然后是2个B帧,我们把它放进缓冲区数组.然后是P帧,我们可以判定它的类型并进行编码.同时,我们将缓冲区的B帧放进h->bframe_current[i],不过这时P帧前的两个B帧并没有编码.当读到P帧后面的第一个B帧时,我们实际上才将h->bframe_current数组中的第一个B帧编码,也就是将在I帧后面的第一个B帧(说成P帧前面的第一个B帧容易误解J)编码.

依此类推,把握好上面4个函数的调用流程和指针操作的用法,就可以将帧的类型判定这个问题搞明白了.

F. 然后是速率控制(先不说这个,因为它对编码的流程影响不大),看看建立参考帧列表的操作,也就是

x264_reference_build_list( h, h->fdec->i_poc ); (定义在/ENCODER/encoder.c中).

光看这个函数是不行的,它是和后面的这个函数(如下)一起配合工作的.

if( i_nal_ref_idc != NAL_PRIORITY_DISPOSABLE )//B帧时.

{

x264_reference_update( h );

}

If条件是判断当前帧是否是B帧,如果是的话就不更新参考列表,因为B帧本来就不能作为参考帧嘛!如果是I帧或P帧的话,我们就更新参考帧列表.

我们看到了一个for循环,两个do—while循环.这是实现的关键,具体看代码,不好用语言说明白.

G. 进入另一个复杂的领域:写slice的操作,刚开使挺简单,如我下面的注释.

/* ---------------------- Write the bitstream -------------------------- */

/* Init bitstream context */

h->out.i_nal = 0;//out的声明在bs.h中.

bs_init( &h->out.bs, h->out.p_bitstream, h->out.i_bitstream );//空出8位.

/* Write SPS and PPS */

if( i_nal_type == NAL_SLICE_IDR )//不是每次都要写SPS and PPS,只有碰见立即刷新片时才写.

{

/* generate sequence parameters */

x264_nal_start( h, NAL_SPS, NAL_PRIORITY_HIGHEST );

x264_sps_write( &h->out.bs, h->sps );

x264_nal_end( h );

/* generate picture parameters */

x264_nal_start( h, NAL_PPS, NAL_PRIORITY_HIGHEST );

x264_pps_write( &h->out.bs, h->pps );

x264_nal_end( h );

}

不过看下面那个函数(就进入了复杂的领域).

H. x264_slice_write()(定义在/ENCODER/encoder.c中),这里面是编码的最主要部分,下面仔细分析.

前面不说,看下面这个循环,它是采用for循环对一帧图像的所有块依次进行编码.

for( mb_xy = 0, i_skip = 0; mb_xy < h->sps->i_mb_width * h->sps->i_mb_height; mb_xy++ )//h->sps->i_mb_width指的是从宽度上说有多少个宏快.对于宽度也就是288 / 16 = 18

{

const int i_mb_y = mb_xy / h->sps->i_mb_width;

const int i_mb_x = mb_xy % h->sps->i_mb_width;//这两个变量是定义宏块的位置.而不是指宏块中元素的位置.

/* load cache */

x264_macroblock_cache_load( h, i_mb_x, i_mb_y );//是把当前宏块的up宏块和left宏块的intra4x4_pred_mode，non_zero_count加载进来，放到一个数组里面，这个数组用来直接得到当前宏块的左侧和上面宏块的相关值.要想得到当前块的预测值，要先知道上面，左面的预测值，它的目的是替代getneighbour函数.

/* analyse parameters

* Slice I: choose I_4x4 or I_16x16 mode

* Slice P: choose between using P mode or intra (4x4 or 16x16)

* */

TIMER_START( i_mtime_analyse );

x264_macroblock_analyse( h );//定义在analyse.h中.

TIMER_STOP( i_mtime_analyse );

/* encode this macrobock -> be carefull it can change the mb type to P_SKIP if needed */

TIMER_START( i_mtime_encode );

x264_macroblock_encode( h );//定义在Enc/encoder.c中.

TIMER_STOP( i_mtime_encode );

截止到这就已经完成编码的主要过程了,后面就是熵编码的过程了(我也没看到那,但认为前面才是编码的主要过程).下面对这个过程进行分析.

A. x264_macroblock_cache_load( h, i_mb_x, i_mb_y );它是将要编码的宏块的周围的宏块的值读进来, 要想得到当前块的预测值，要先知道上面，左面的预测值，它的作用相当于jm93中的getneighbour函数.

B. 进入x264_macroblock_analyse( h )函数(定义在/Enc/analyse.c中,这里涉及到了函数指针数组,需要好好复习,个人认为这也是x264代码最为复杂的一个地方了).既然已经将该宏块周围的宏块的值读了出来,我们就可以对该宏块进行分析了(其实主要就是通过计算sad值分析是否要将16*16的宏块进行分割和采用哪种分割方式合适).

看似很复杂,但我们只要把握一个东西就有利于理解了:

举个生活中的例子来说:

如果你有2元钱,你可以去买2袋1元钱的瓜子,也可以买一袋2元钱的瓜子,如果2袋1元钱的瓜子数量加起来比1袋2元钱的瓜子数量多,你肯定会买2袋1元的.反之你会去买那2元1袋的.

具体来说,对于一个16*16的块,

如果它是I帧的块,我们可以将它分割成16个4*4的块,如果这16个块的sad加起来小于按16*16的方式计算出来的sad值,我们就将这个16*16的块分成16个4*4的块进行编码(在计算每个4*4的块的最小sad值时已经知道它采用何种编码方式最佳了),否则采用16*16的方式编码(同样我们也已知道对它采用哪种编码方式最为合适了.

如果它是P帧或B帧的块,同样是循环套循环,但更为复杂了,可以看我在analyse.c中的注释.

这里还要注意的是提到了

x264_predict_t predict_16x16[4+3];

typedef void (*x264_predict_t)( uint8_t *src, int i_stride );

这是函数指针数组,有很多对它的调用.

C. 退出x264_macroblock_analyse( h )函数,进入x264_macroblock_encode( )函数(定义在/ENCODER/macroblock.c中).

我拿宏块类型为I_16*16为例.

if( h->mb.i_type == I_16x16 )

{

const int i_mode = h->mb.i_intra16x16_pred_mode;

/* do the right prediction */

h->predict_16x16[i_mode]( h->mb.pic.p_fdec[0], h->mb.pic.i_fdec[0] );//这两个参数的关系.

//涉及到x264_predict_t(函数指针数组),声明在core/predict.h中,core/predict.c里有不同定义.

/* encode the 16x16 macroblock */

x264_mb_encode_i16x16( h, i_qscale );//

/* fix the pred mode value */

… }

我们看到h->predict_16x16[i_mode]( h->mb.pic.p_fdec[0], h->mb.pic.i_fdec[0] );只调用了一次,这是因为在x264_macroblock_analyse( )中我们已经确定了采用4种方式中的哪种最合适.而在x264_macroblock_analyse( )中判定一个块是否为I_16*16,我们调用了四次.这是因为当时我们需要拿最小的sad值进行比较.

继续,是x264_mb_encode_i16x16( h, i_qscale )函数(定义在/ENCODER/macroblock.c中).在这个函数中我们就可以看到量化,zig-扫描等函数了,这些都是直来直去的,需要的只是我们的细心和对数学知识的掌握了

c) 到这里还没完,我们接着看

void x264_macroblock_encode( x264_t *h ){

…….前面省略.

执行到下面这条语句,看看下面是干啥的.

/* encode chroma */

i_qscale = i_chroma_qp_table[x264_clip3( i_qscale + h->pps->i_chroma_qp_index_offset, 0, 51 )];

if( IS_INTRA( h->mb.i_type ) )

{

const int i_mode = h->mb.i_chroma_pred_mode;

/* do the right prediction */

h->predict_8x8[i_mode]( h->mb.pic.p_fdec[1], h->mb.pic.i_fdec[1] );

h->predict_8x8[i_mode]( h->mb.pic.p_fdec[2], h->mb.pic.i_fdec[2] );

/* fix the pred mode value */

h->mb.i_chroma_pred_mode = x264_mb_pred_mode8x8_fix[i_mode];

}

/* encode the 8x8 blocks */

x264_mb_encode_8x8( h, !IS_INTRA( h->mb.i_type ), i_qscale );//对色度块进行编码了.

到这我们可以看到原来我们在这前面是对宏块中的亮度系数进行了编码,我们到上面那个函数才开始对色度系数进行编码.进入x264_mb_encode_8x8()函数看到for循环里面有个2可以证明是对2个色度系数进行编码,想法没错.

那下面这些又是干啥的呢?它们是计算cbp系数看需要对残差(包括ac,dc)中的哪个系数进行传输的.

/* Calculate the Luma/Chroma patern and non_zero_count */

if( h->mb.i_type == I_16x16 )

{

h->mb.i_cbp_luma = 0x00;

for( i = 0; i < 16; i++ )

{

const int nz = array_non_zero_count( h->dct.block[i].residual_ac, 15 );

h->mb.cache.non_zero_count[x264_scan8[i]] = nz;

if( nz > 0 )

{

h->mb.i_cbp_luma = 0x0f;

}

else

{

h->mb.i_cbp_luma = 0x00;

for( i = 0; i < 16; i++ )

{

const int nz = array_non_zero_count( h->dct.block[i].luma4x4, 16 );//统计非0个数.

h->mb.cache.non_zero_count[x264_scan8[i]] = nz;

if( nz > 0 )

{

h->mb.i_cbp_luma |= 1 << (i/4);// %16的意义.

}

/* Calculate the chroma patern *///色度的cbp有3种方式.

h->mb.i_cbp_chroma = 0x00;

for( i = 0; i < 8; i++ )

{

const int nz = array_non_zero_count( h->dct.block[16+i].residual_ac, 15 );

h->mb.cache.non_zero_count[x264_scan8[16+i]] = nz;

if( nz > 0 )

{

h->mb.i_cbp_chroma = 0x02; /* dc+ac (we can't do only ac) */

}

if( h->mb.i_cbp_chroma == 0x00 &&

( array_non_zero_count( h->dct.chroma_dc[0], 4 ) > 0 || array_non_zero_count( h->dct.chroma_dc[1], 4 ) ) > 0 )

{

h->mb.i_cbp_chroma = 0x01; /* dc only */

}

if( h->param.b_cabac )

{

if( h->mb.i_type == I_16x16 && array_non_zero_count( h->dct.luma16x16_dc, 16 ) > 0 )

i_cbp_dc = 0x01;

else

i_cbp_dc = 0x00;

if( array_non_zero_count( h->dct.chroma_dc[0], 4 ) > 0 )

i_cbp_dc |= 0x02;

if( array_non_zero_count( h->dct.chroma_dc[1], 4 ) > 0 )

i_cbp_dc |= 0x04;

}

/* store cbp */

h->mb.cbp[h->mb.i_mb_xy] = (i_cbp_dc << 8) | (h->mb.i_cbp_chroma << 4) | h->mb.i_cbp_luma;

到这,基本上x264_macroblock_encode( h )(定义在Enc/encoder.c)基本上就分析完了.剩下的就是熵编码的部分了.以后的部分更需要的应该是耐心和数学知识吧,相对前面来说应该简单些.

l 总结:

1. 我对代码的理解应该还算比较深入,把代码的主线已经分析了出来,对代码中几个最难理解的地方(最难理解的地方就是帧的类型的判定,参考帧是如何管理的,一个16*16的块是采用到底需不需要分割,分割的话分成什么大小的,子块又采用何种预测方式,这些实际上就是整个编码的主线.)基本上已经明白,但有些过分复杂的函数的实现(或者涉及数学知识较多的地方)还有待深入研究,但我相信沿着这条主线应该能够继续深入下去,自己需要的是更多的时间和耐心. 自己需要的是更多的时间和耐心,争取以后能写出更详细更准确的流程分析,并尽量思考能改进的地方.

2.层次性,就像网络的7层结构一样,每一帧图像也可以分成很多层,只有对每层的语法结构(具体来说就是各个结构体中变量的意思)有了很好的理解,才有可能真正认清代码,这需要对标准认真研习.比如说量化参数,就在3个地方有定义,不读标准根本不会明白意思.

3. 很多过分复杂的东西不容易在本文中表达出来(比如说预测部分),只有通过自己的钻研才能真正悟到,直觉也很重要,还有就是信心了.看这种程序的收获就好像是真地肉眼看到了原子那样.

4.由于代码过分复杂,对某些函数的实现过程还没能彻底理解,比如说x264_macroblock_cache_load()函数的具体实现过程,我只是知道它的功能,实现过程还有待认真理解.dct变换是如何实现的,是如何计算残差的等等,这些都需要很多功夫,当然这里也需要大家的共同学习和交流.实现分工阅读不同代码部分并进行交流,才有可能对代码做到彻底的理解.

你可能感兴趣的:(h264)

【教程】如何使用 MYScrcpy，一行Python代码获取Android设备屏幕/摄像头 H264/H265 原始视频流 Me2sY MYScrcpy python android 开发语言智能手机扩展屏应用开发开源测试工具
MYScrcpy1.5.8Github/Gitee1.5.8版本新增获取原始视频流（H264/H265）方法，供小伙伴们在需要原生H264/H265串流时使用要求MYScrcpy>1.5.8pipinstall-Umysc安卓设备开启调试模式，安卓版本>5（摄像头需>11）H265需安卓设备支持H265编码步骤MYScrcpy从设计之初，就是想为小伙伴们打造一款好用易上手的工具包，所以使用起来也非
H265码流结构 C有点难。嵌入式音视频音视频实时音视频
H264码流结构https://blog.csdn.net/weixin_45993872/article/details/141689242（1）H265/HEVC介绍H265也成为HEVC，是在H264基础上的一种全新的视频编码技术，H265继承了H264的NALU和RBSP等标准，具有更高的压缩比1：200，而H264只有1:100（2）H265的用处：随着视频画质的提高，2k、4k甚至是8
rk3588音视频硬件编解码介绍三十度角阳光的问候音视频
目录ffmpegrk3588系列芯片编程方法最终的输出结果ffmpeg示例程序ffmpeg音视频处理中通常是用ffmpeg进行软件音视频编解码aac/h264编码，但其运行速度过慢消耗cpu占用率。因此需要寻找音视频硬件编解码方法。rk3588系列芯片自带音视频硬件编解码框架ffmedia或者mpp，其内部原理是配合内部硬件rga内存，把音视频数据读入内部rga内存中进行Mpp硬件编解码计算，包括
TROS DataFlow - USB Camera & mipi Sensor - rtsp WuChao_JMUer 地平线RDK X3系列板卡 RDK X3 ROS2
TROSDataFlow-USBCamera&mipiSensor-rtsp使用TROS的功能，通过USB或者mipi摄像头得到MJPEG数据，推理YOLOv5节点，得到目标检测结果，通过ros_rtsp将nv12数据变成标准的H264/H265码流推出。DataFlow示意图mipiUSBH264/H265推流展示编译ros_rtsp_server系统版本2.1.0,sudoaptupdate有
JAVA实现H264视频流推送到RTSP、RTMP服务----JavaCV 燎原君 java java 视频
前提：1.准备好rtsp、rtmp服务2.准备好视频流接收程序目录POM依赖配置关键代码原理说明POM依赖配置org.bytedecojavacv1.4.4org.bytedeco.javacpp-presets*org.bytedeco.javacpp-presetsffmpeg4.1-1.4.4org.bytedeco.javacpp-presetsffmpeg4.1-1.4.4${javac
利用javacv实现视频转h264 daqinzl 流媒体 ffmpeg 视频音频视频转换 h264 javacv ffmpeg
网上找到的一个实用的视频转换工具类，可将视频转为h264编码（方便在浏览器下播放视频）。importorg.bytedeco.ffmpeg.avcodec.AVCodecParameters;importorg.bytedeco.ffmpeg.avformat.AVFormatContext;importorg.bytedeco.ffmpeg.avformat.AVStream;importorg
html 文件转换成mp4视频,ffmpeg将mov文件转换为mp4的HTML5视频标签IE9 海棠之花 html 文件转换成mp4视频
对于ffmpeg：ffmpeg-i{input}.mov-vcodech264-acodecaac-strict-2{output}.mp4您还可以添加-q：v/-q：a参数以指定视频的质量。你也可以使用Handbrake这是比ffmpeg更简单的编码器。对于HandBrake：handbrakecli-i{input}.mov-ex264-Efacc-o{output}.mp4编辑：我找到了解决
python3.x使用cxfreeze将.p打包成.exe weixin_30596343 python 开发工具
之前写了一个使用ffplay批量查看格式为h264的图片，每次抽帧后都要打开pycharm编译器来运行程序，然后才能正常查看图片，或者在其他没有安装python环境的电脑中运行，很不方便。为此，在网上找了些方法，发现也是说的一知半解的。因此，自己通过实践记录python3.x下怎么样把.py文件打包成.exe可执行文件，这样就可以直接修改文件内的图片个数就可以双击.exe程序来查看图片了。一、.p
GB28181 —— 4、C++编写GB28181设备端，完成将.h264文件读取转发至GB28181服务并可播放（附源码）信必诺 GB28181 GB28181 eXosip2 Qt h264
效果源码说明主要功能模拟设备端，完成注册、注销、心跳等，完成读取.h264文件实时转ps格式后封包rtp进行推送给服务端播放。源码/****@remark:ps头的封装,里面的具体数据的填写已经占位，可以参考标准*@param:pData[in]填充ps头数据的地址*s64Src[in]时间戳*@return:0success,othersfailed*/intgb28181_mak
FFmpeg-- c++实现：音频流aac和视频流h264封装八月的雨季997 FFmpeg ffmpeg c++音视频
文章目录流程api核心代码muxer.hmuxer.cppaac和h264封装为视频流，封装为c++的Muxter类流程分配视频文件上下文intInit(constchar*url);创建流，赋值给视频的音频流和视频流intAddStream(AVCodecContext*codec_ctx);写视频流的headintSendHeader();写视频流的packet，需要转换packet的pts和
AE、PR视频压缩导出mp4、mov格式插件：AfterCodecs1.6.1汉化破解版 zhishijike 软件 ae压缩视频大小 ae插件 pr压缩视频大小视频剪辑软件
AE、PR视频压缩导出插件AfterCodecs，优点是导出的视频小而快，而且保持优质的清晰度。插件支持CC2015以上版本（CC2015-CC2019）1.6.1版本更新后能够支持5.1声道环绕音等高品质音频输出，而且还支持视频导出的时候可以直接调用LUTS滤镜效果，给视频添加滤镜效果输出。修正H264低分辨率项目文件（pro/aep格式）重新导入到Adobe软件的色彩偏移。可以以环绕音WYZX
FFmepg-- H264格式八月的雨季最後的冰吻 FFmpeg ffmpeg
文章目录H264IPB帧NALU结构H264封装模式1annexb模式2MP4模式写H264文件H264视频编解码协议，为MPEG-4AVC或AVCIPB帧I帧：可独立解码P帧：前向预测编码帧，参考I帧或者P帧B帧：双向预测帧，参考I帧,P帧压缩率：B>P>INALU结构H.264原始码流由一个接一个的NALU组成⼀个原始的H.264NALU单元通常由[StartCode][NALUHeader]
H264简介王丰博编解码音视频音频编码解码
H264简介（未完待续）0、提前说明写这篇文章的时候，准备不足。越写发现自己的知识面越不成体系，总结之，这几年的根基打的不牢。截止写提说明的时候，该博客中体现的主要是一些基础概念和简单的过程，考虑到本文介绍的概念及编码过程仍适合部分初学者阅读，最终决定还是将该文章内容发出来。博哥深知自己功底不足，于是向行业人请教，他们推荐读以下两本书，好让自己重新回炉，若是有相关好的资料和图书欢迎推荐。这这里送上
H264和H265区别我想要变强大数据视频编解码
很多小伙伴应该都听过H.265和H.264这两种编码，也了解专业术语的解释。包括电视机都会标注支持H.265格式4K视频编码，视频监控系统也会标注支持H.265。但是在没有用过的情况下，很难说真的已经知道两者的区别了，那么H.265和H.264这两种编码究竟有什么区别呢？让我们一起来看看吧！H.264是视频编码专家组提出的压缩视频编码标准。H.264标准包括：访问单元分割符、附加增强信息、基本图像
Android硬编、硬解h264 璃云曦
项目工程demo地址https://github.com/liluojun/PlayVideodemo包含硬编解h264、libyuv裁剪图像、opengles渲染yuv数据、ffmpeg解码裸h264数据等功能，故仅供参考测试。硬编码首先设置编码器MediaFormatmediaFormat=MediaFormat.createVideoFormat("video/avc",width,heig
赛事班1 孔颢博
1.树莓派1.指令树莓派代码作用ls显示当前文件夹内所有文件cd+空格+文件名打开当前文件cd..退出当前文件raspistill-o'(文件名）.jpg'拍摄照片pwd查看当前文件地址raspivid-o'(文件名).h264'拍摄影片sudo获得管理员权限rm-rf+文件名删除当前文件rm-rf+x（文件名）*删除名称含x的所有文件rm-rf*清空文件夹sudoapt-getinstallx（
H264相关定义解释梦龙居士
ProfileAProfileisasetofalgorithmictools,representingaparticulartradeoffofperformanceandresourceconsumption,supportingtherequirementsofaparticularsetofapplications.Applicationswhichrequiresimilartradeo
音视频封装格式、编码格式【零声教育】音视频开发进阶音视频开发程序员编程 ffmpeg 音视频人工智能编码格式封装格式
常见的AVI、RMVB、MKV、ASF、WMV、MP4、3GP、FLV等文件其实只能算是一种封装标准。一个完整的视频文件是由音频和视频2部分组成的。H264、Xvid等就是视频编码格式，MP3、AAC等就是音频编码格式。例如：将一个Xvid视频编码文件和一个MP3音频编码文件按AVI封装标准封装以后，就得到一个AVI后缀的视频文件，这个就是我们常见的AVI视频文件了。由于很多种视频编码文件、音频编
视频处理学习笔记1：YUYV422、NV12和h264 hongel110 视频处理学习笔记音视频 YUYV422 NV12 ffmpeg
最近因为工作关系在恶补视频相关知识点，在此做一记录便于日后复习。以下均是个人学习经验总结，可能存在错误和坑，欢迎大佬指教。工作中用到的是YUYV422存储格式。存储的就是裸流YUYV422格式文件。YUYV422是两个像素点共用一个UV分量，每个像素点2byte，两个像素点也就是Y00U00Y01V00，4byte，也就是Y、U、V每个分量各1byte。存储结构大致如下：Y00U00Y01V00Y
x264 码率控制原理 DogDaoDao #x264 H264 x264 视频编解码码率控制 VBV MBtree AQmode
介绍码率控制不属于H264编码标准中的模块，在H.264视频编码标准中仅仅规定了编码后比特流的句法结构和解码器的结构，而对于编码器的结构和实现模式没有具体的规定。然而无论编码器的结构如何，相应的视频编码的控制都是编码器实现的核心问题。码率控制的重点就是确定与速率相关的量化参数QP（QuantizationParameter）。文档说明来自x264源码项目中doc/ratecontrol.txt中说
如何实现低延时直播——支持多终端H5播放的超低延时直播解决方案纪要大飞飞鱼流媒体应用视频直播技术 VR直播技术低延时直播 H5低延时直播云游戏低延时直播低延时实时监控 200毫秒低延时直播
笔者在互联网公司从事视频通信工作多年，从MPEG-1、MPEG-2到MPEG-4，再到今天的H264/AVC、H265/HEVC流行时代，研发了几代产品，虽然在每个阶段一直能满足用户的需求，但随着宽带的普及，4G、5G的飞速发展，视频通信行业的需求从以前追求视频清晰度的提高到现在转变为追求视频传输的实时性的需求了，尤其是云游戏行业，更是要求视频实时性在端到端延时低于200ms（毫秒），因此研发视频
freeswitch之h264视频通话问题浪游东戴河 freeSwitch freeswitch h264 mod_h26x 视频 INVITE
安装freeswitch后，使用账号A给账号B发起视频通话（h264编码）请求，发现B收到的呼叫是音频通话，这是由于freeswitch没有启用h26x模块的原因。一、修改配置将mod_h26x一行的注释去掉，重启freeswitchconf/autoload_configs/modules.conf.xml二、报文分析2.1修改配置前A发给服务器INVITEINVITEsip:1002@19
h264 码流格式简述 baoyu45585 c++音视频 c语言 ffmpeg h.264
h264码流格式简述(Annex-B格式)1nalunitstream(NetworkAbstractionLayerUnitStream)h.264编码器把原始的yuv图像文件编码成码流文件，生成的码流文件称为NAL单元流(NALunitStream)，NALUstream由一个个NALU(nal单元)组成(https://www.cnblogs.com/TaigaCon/p/5215448.h
ffmpeg将yuv文件编码为mp4 3c1b8ae8346c
上一遍文件是将mp4的视频流数据解码，并且写入yuv的数据文件中，这篇文章是一个逆向操作，既将yuv数据文件编码为一个mp4文件1.主要函数的调用流程avformat_alloc_output_context2根据文件名创建视频封装上下文对象avio_open打开视频文件avcodec_find_encoder查找编码器，我们使用的是h264,参数就是AV_CODEC_ID_H264avcodec
h.264与h.263的区别计算机内卷的N天 h.264
H264标准的主要特点如下：更高的编码效率：同H.263等标准的特率效率相比，能够平均节省大于50%的码率。高质量的视频画面：H.264能够在低码率情况下提供高质量的视频图像，在较低带宽上提供高质量的图像传输是H.264的应用亮点。提高网络适应能力：H.264可以工作在实时通信应用（如视频会议）低延时模式下，也可以工作在没有延时的视频存储或视频流服务器中。采用混合编码结构：同H.263相同，H.2
WebRTC支持H264笔记逆风了我 WebRTC p2p webrtc 音视频
环境Ubuntu16.04版本WebRTCm841、修改代码vithird_party/ffmpeg/chromium/config/Chromium/linux/x64/libavcodec/parser_list.cstaticconstAVCodecParser*constparser_list[]={&ff_flac_parser,&ff_mpegaudio_parser,&ff_opus
FFMPEG解码错误：No start code is found，Error splitting the input into NAL units.解决办法。逆风了我 FFmpeg 音视频
错误[h264@000001549d341740]Nostartcodeisfound.[h264@000001549d341740]ErrorsplittingtheinputintoNALunits.方法添加avcodec_parameters_to_context(vctx,ifmt->streams[video_index]->codecpar);
通过大疆PSDK，将第三方摄像头的视频流推到M300遥控器显示 HeroYDHY PSDK 大疆开发摄像头
1.首先确保跑通了大疆官方的demo，demo功能是可以将本地h264的视频文件推到遥控器显示。2.将264格式设置为普通264（默认为大疆264），更改demo里的代码如下//returnCode=DjiPayloadCamera_SetVideoStreamType(DJI_CAMERA_VIDEO_STREAM_TYPE_H264_DJI_FORMAT);returnCode=DjiPayl
基于Gstreamer和大疆OSDK4.0视频h264接口推流 Maybach刚 GStreamer
背景为了实现无人机视频实时推流和图像处理，首先要完成视频编解码，大疆的视频接口实在是坑太多了！参考了很多大神的文章，大多都是解码本地文件或者直接从服务器拉流，不能实现我想要的实时动态流解码，搞了半个月终于能实时解码了，希望我的研究结果能帮助更多人。主流视频压缩格式是h264(IDR编码)，相关教程很多，而GDR编码相关的内容几乎没有，没法以字节流提取nalu的方式解码；直接采样飞机视频保存为本地文
Camera2+OpenGL ES+MediaCodec+AudioRecord实现录制音视频写入H264 SEI数据海螺姑娘的小魏 Android 音视频
记录一下学习过程，得到一个需求是基于Camera2+OpenGLES+MediaCodec+AudioRecord实现录制音视频。需求：在每一帧视频数据中，写入SEI额外数据，方便后期解码时获得每一帧中的自定义数据。点击录制功能后，录制的是前N秒至后N秒这段时间的音视频，保存的文件都按照60s进行保存。写在前面，整个学习过程涉及到以下内容，可以快速检索是否有想要的内容MediaCodec的使用，采
java Illegal overloaded getter method with ambiguous type for propert的解决 zwllxs java jdk
好久不来iteye,今天又来看看，哈哈,今天碰到在编码时，反射中会抛出 Illegal overloaded getter method with ambiguous type for propert这么个东东，从字面意思看，是反射在获取getter时迷惑了，然后回想起java在boolean值在生成getter时，分别有is和getter，也许我们的反射对象中就有is开头的方法迷惑了jdk，
IT人应当知道的10个行业小内幕 beijingjava 工作互联网
10. 虽然IT业的薪酬比其他很多行业要好，但有公司因此视你为其“佣人”。　　尽管IT人士的薪水没有互联网泡沫之前要好，但和其他行业人士比较，IT人的薪资还算好点。在接下的几十年中，科技在商业和社会发展中所占分量会一直增加，所以我们完全有理由相信，IT专业人才的需求量也不会减少。　　然而，正因为IT人士的薪水普遍较高，所以有些公司认为给了你这么多钱，就把你看成是公司的“佣人”，拥有你的支配
java 实现自定义链表 CrazyMizzz java 数据结构
1.链表结构链表是链式的结构 2.链表的组成链表是由头节点，中间节点和尾节点组成节点是由两个部分组成： 1.数据域 2.引用域 3.链表的实现 &nbs
web项目发布到服务器后图片过一会儿消失麦田的设计者 struts2 上传图片永久保存
作为一名学习了android和j2ee的程序员，我们必须要意识到，客服端和服务器端的交互是很有必要的，比如你用eclipse写了一个web工程，并且发布到了服务器（tomcat）上，这时你在webapps目录下看到了你发布的web工程，你可以打开电脑的浏览器输入http://localhost:8080/工程/路径访问里面的资源。但是，有时你会突然的发现之前用struts2上传的图片
CodeIgniter框架Cart类 name 不能设置中文的解决方法 IT独行者 CodeIgniter Cart 框架　
今天试用了一下CodeIgniter的Cart类时遇到了个小问题，发现当name的值为中文时，就写入不了session。在这里特别提醒一下。在CI手册里也有说明，如下： $data = array( 'id' => 'sku_123ABC', 'qty' => 1, '
linux回收站 _wy_ linux 回收站
今天一不小心在ubuntu下把一个文件移动到了回收站，我并不想删，手误了。我急忙到Nautilus下的回收站中准备恢复它，但是里面居然什么都没有。后来我发现这是由于我删文件的地方不在HOME所在的分区，而是在另一个独立的Linux分区下，这是我专门用于开发的分区。而我删除的东东在分区根目录下的.Trash-1000/file目录下，相关的删除信息（删除时间和文件所在
jquery回到页面顶端知了ing html jquery css
html代码： <h1 id="anchor">页面标题</h1> <div id="container">页面内容</div> <p><a href="#anchor" class="topLink">回到顶端</a><
B树、B-树、B+树、B*树矮蛋蛋 B树
原文地址： http://www.cnblogs.com/oldhorse/archive/2009/11/16/1604009.html B树即二叉搜索树： 1.所有非叶子结点至多拥有两个儿子（Left和Right）； &nb
数据库连接池 alafqq 数据库连接池
http://www.cnblogs.com/xdp-gacl/p/4002804.html @Anthor:孤傲苍狼数据库连接池用MySQLv5版本的数据库驱动没有问题，使用MySQLv6和Oracle的数据库驱动时候报如下错误： java.lang.ClassCastException: $Proxy0 cannot be cast to java.sql.Connec
java泛型百合不是茶 java泛型
泛型在Java SE 1.5之前，没有泛型的情况的下，通过对类型Object的引用来实现参数的“任意化”，任意化的缺点就是要实行强制转换，这种强制转换可能会带来不安全的隐患泛型的特点：消除强制转换确保类型安全向后兼容简单泛型的定义：泛型：就是在类中将其模糊化，在创建对象的时候再具体定义 class fan
javascript闭包[两个小测试例子] bijian1013 JavaScript JavaScript
一.程序一 <script> var name = "The Window"; var Object_a = { 　　name : "My Object", 　　getNameFunc : function(){ var that = this; 　　　　return function(){ 　　　　
探索JUnit4扩展：假设机制（Assumption） bijian1013 java Assumption JUnit 单元测试
一.假设机制（Assumption）概述理想情况下，写测试用例的开发人员可以明确的知道所有导致他们所写的测试用例不通过的地方，但是有的时候，这些导致测试用例不通过的地方并不是很容易的被发现，可能隐藏得很深，从而导致开发人员在写测试用例时很难预测到这些因素，而且往往这些因素并不是开发人员当初设计测试用例时真正目的，
【Gson四】范型POJO的反序列化 bit1129 POJO
在下面这个例子中，POJO(Data类)是一个范型类，在Tests中，指定范型类为PieceData，POJO初始化完成后，通过 String str = new Gson().toJson(data); 得到范型化的POJO序列化得到的JSON串，然后将这个JSON串反序列化为POJO import com.google.gson.Gson; import java.
【Spark八十五】Spark Streaming分析结果落地到MySQL bit1129 Stream
几点总结： 1. DStream.foreachRDD是一个Output Operation，类似于RDD的action，会触发Job的提交。DStream.foreachRDD是数据落地很常用的方法 2. 获取MySQL Connection的操作应该放在foreachRDD的参数（是一个RDD[T]=>Unit的函数类型)，这样，当foreachRDD方法在每个Worker上执行时，
NGINX + LUA实现复杂的控制 ronin47 nginx lua
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-递归判断数组是否升序 bylijinnan java
public class IsAccendListRecursive { /*递归判断数组是否升序 * if a Integer array is ascending,return true * use recursion */ public static void main(String[] args){ IsAccendListRecursiv
Netty源码学习-DefaultChannelPipeline2 bylijinnan java netty
Netty3的API http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/ChannelPipeline.html 里面提到ChannelPipeline的一个“pitfall”：如果ChannelPipeline只有一个handler（假设为handlerA）且希望用另一handler（假设为handlerB）来
Java工具之JPS chinrui java
JPS使用熟悉Linux的朋友们都知道，Linux下有一个常用的命令叫做ps（Process Status)，是用来查看Linux环境下进程信息的。同样的，在Java Virtual Machine里面也提供了类似的工具供广大Java开发人员使用，它就是jps（Java Process Status)，它可以用来
window.print分页打印 ctrain window
function init() { var tt = document.getElementById("tt"); var childNodes = tt.childNodes[0].childNodes; var level = 0; for (var i = 0; i < childNodes.length; i++) {
安装hadoop时执行jps命令Error occurred during initialization of VM daizj jdk hadoop jps
在安装hadoop时，执行JPS出现下面错误 [slave16][email protected]:/tmp/hsperfdata_hdfs# jps Error occurred during initialization of VM java.lang.Error: Properties init: Could not determine current working
PHP开发大型项目的一点经验 dcj3sjt126com PHP 重构
一、变量最好是把所有的变量存储在一个数组中，这样在程序的开发中可以带来很多的方便，特别是当程序很大的时候。变量的命名就当适合自己的习惯，不管是用拼音还是英语，至少应当有一定的意义，以便适合记忆。变量的命名尽量规范化，不要与PHP中的关键字相冲突。二、函数 PHP自带了很多函数，这给我们程序的编写带来了很多的方便。当然，在大型程序中我们往往自己要定义许多个函数，几十
android笔记之--向网络发送GET/POST请求参数 dcj3sjt126com android
使用GET方法发送请求 private static boolean sendGETRequest (String path, Map<String, String> params) throws Exception{ //发送地http://192.168.100.91:8080/videoServi
linux复习笔记之bash shell (3) 通配符 eksliang linux 通配符 linux通配符
转载请出自出处： http://eksliang.iteye.com/blog/2104387 在bash的操作环境中有一个非常有用的功能，那就是通配符。下面列出一些常用的通配符，如下表所示符号意义 * 万用字符，代表0个到无穷个任意字符 ? 万用字符，代表一定有一个任意字符 [] 代表一定有一个在中括号内的字符。例如：[abcd]代表一定有一个字符，可能是a、b、c
Android关于短信加密 gqdy365 android
关于Android短信加密功能，我初步了解的如下（只在Android应用层试验）： 1、因为Android有短信收发接口，可以调用接口完成短信收发；发送过程：APP（基于短信应用修改）接受用户输入号码、内容——>APP对短信内容加密——>调用短信发送方法Sm
asp.net在网站根目录下创建文件夹 hvt .net C#hovertree asp.net Web Forms
假设要在asp.net网站的根目录下建立文件夹hovertree,C#代码如下： string m_keleyiFolderName = Server.MapPath("/hovertree"); if (Directory.Exists(m_keleyiFolderName)) { //文件夹已经存在 return; } else { try { D
一个合格的程序员应该读过哪些书 justjavac 程序员书籍
编者按：2008年8月4日，StackOverflow 网友 Bert F 发帖提问：哪本最具影响力的书，是每个程序员都应该读的？ “如果能时光倒流，回到过去，作为一个开发人员，你可以告诉自己在职业生涯初期应该读一本，你会选择哪本书呢？我希望这个书单列表内容丰富，可以涵盖很多东西。” 很多程序员响应，他们在推荐时也写下自己的评语。以前就有国内网友介绍这个程序员书单，不过都是推荐数
单实例实践跑龙套_az 单例
1、内部类 public class Singleton { private static class SingletonHolder { public static Singleton singleton = new Singleton(); } public Singleton getRes
PO VO BEAN 理解 q137681467 VO DTO po
PO：全称是 persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。 BO：全称是 business object:业务对象主要作用是把业务逻辑封装为一个对象。这个对
战胜惰性，暗自努力金笛子努力
偶然看到一句很贴近生活的话：“别人都在你看不到的地方暗自努力，在你看得到的地方，他们也和你一样显得吊儿郎当，和你一样会抱怨，而只有你自己相信这些都是真的，最后也只有你一人继续不思进取。”很多句子总在不经意中就会戳中一部分人的软肋，我想我们每个人的周围总是有那么些表现得“吊儿郎当”的存在，是否你就真的相信他们如此不思进取，而开始放松了对自己的要求随波逐流呢？我有个朋友是搞技术的，平时嘻嘻哈哈，以
NDK/JNI二维数组多维数组传递 wenzongliang 二维数组 jni NDK
多维数组和对象数组一样处理，例如二维数组里的每个元素还是一个数组用jArray表示，直到数组变为一维的，且里面元素为基本类型，去获得一维数组指针。给大家提供个例子。已经测试通过。 Java_cn_wzl_FiveChessView_checkWin( JNIEnv* env,jobject thiz,jobjectArray qizidata) { jint i,j; int s

x264里的2pass指的是什么意思? x264源代码分析2.encode()

A:x264里的2pass指的是什么意思?另外stat是什么意思, 比如有个参数--stats Filename for 2 pass stats [/"%s/"]/n", defaults->rc.psz_stat_out );stats在这是什么意思?

2pass是2次编码的意思，stats是统计文档的名称，记录了1pass中的信息.2次编码就相当于2次转换这么做虽然转换时间会漫长，但压出的片子会有更好的画质，画面细节更好，而且体积会更小

A:那个达人能简单说说x264中 rc 部分 1pass 和 2pass的思路？

你可能感兴趣的:(h264)

A:x264里的2pass指的是什么意思?另外stat是什么意思, 比如有个参数--stats Filename for 2 pass stats [/"%s/"]/n", defaults->rc.psz_stat_out );
stats在这是什么意思?