Marelin

x264编解码代码分析

（1） x264_param_default( x264_param_t *param )

作用：对编码器进行参数设定

cqm:量化表相关信息

csp：

量化表相关信息里的memset( param->cqm_4iy, 16, 16 );

memset( param->cqm_4ic, 16, 16 );

memset( param->cqm_4py, 16, 16 );

memset( param->cqm_4pc, 16, 16 );

memset( param->cqm_8iy, 16, 64 );

memset( param->cqm_8py, 16, 64 );

（2）static int Parse( int argc, char **argv, x264_param_t *param, cli_opt_t *opt ) 初始化

1． getopt_long(nargc, nargv, options, long_options, idx) 得到入口地址的向量与方式的选则

2． getopt_internal(nargc, nargv, options) 解析入口地址向量

（3） static int Encode( x264_param_t *param, cli_opt_t *opt )

/* Create a copy of param */ h->param=param

/* VUI */vui信息主要包括帧率、图像尺寸等信息

/* Init x264_t */

x264_sps_init( h->sps, 0, &h->param );序列图像集

x264_pps_init( h->pps, 0, &h->param, h->sps);图像参数集

/* Init frames. */ 初始化并开辟帧空间

/* init mb cache */ 对前一宏块的信息保存，因为是初始化，所以作为第一个宏块的参考，后面会有x264_macroblock_cache_load( h, i_mb_x, i_mb_y );它是将要编码的宏块的周围的宏块的值读进来, 要想得到当前块的预测值，要先知道上面，左面的预测值

/* init cabac adaptive model */

/* init CPU functions */ 初始化cpu对各种分块的参数设定

/* rate control */

1． x264_t *x264_encoder_open ( x264_param_t *param ) 这个函数是对不正确的参数进行修改,并对各结构体参数和cabac编码,预测等需要的参数进行初始化

2、p_read_frame( &pic, opt->hin, i_frame + opt->i_seek, param->i_width, param->i_height )

读取一帧，并把这帧设为prev

3. i_file += Encode_frame( h, opt->hout, &pic );进入核心码层

核心编码层的总流程图：（x264.c）

1． x264_encoder_encode( h, &nal, &i_nal, pic, &pic_out )对帧进行编码

2． i_size = x264_nal_encode( data, &i_data, 1, &nal[i] ) 网络打包编码

3． i_file += p_write_nalu( hout, data, i_size ) 把网络包写入到输出文件中去

4．返回，对下一帧进行编码

下面一页是详细的流程图：

一．帧内详细流程图：

（1）． x264_encoder_encode( h, &nal, &i_nal, pic, &pic_out )对帧进行编码

1． /* 1: Copy the picture to a frame and move it to a buffer */

x264_frame_t*fenc=x264_frame_get( h->frames.unused );

x264_frame_copy_picture( h, fenc, pic_in );

fenc->i_frame = h->frames.i_input++;

x264_frame_put( h->frames.next, fenc );

x264_frame_init_lowres( h->param.cpu, fenc );//里面包含低象素的扩展,很多for循环，应该是抽头计算和半精度象素的扩展，要认真看

（2）． 264_slicetype_decide( h );对slice类型的判定，里面也要看一下

（3）． while( IS_X264_TYPE_B( h->frames.next[bframes]->i_type ) )

bframes++;

x264_frame_put(h->frames.current,x264_frame_get( &h->frames.next[bframes] ) );这主要是因为B帧必须等后面的非B帧编码结束后才能编码，所以把暂时不编的一系列B帧存入队列中，一直到非B帧才取出进行编码，之后再进行前面的B帧编码

do_encode:

（4）．建立list0 & list1.我感觉

x264_reference_build_list( h, h->fdec->i_poc, i_slice_type );

比特率控制初始化

x264_ratecontrol_start(h, i_slice_type, h->fenc->i_qpplus1 );

（5）．创建slice的头部数据

x264_slice_init( h, i_nal_type, i_slice_type, i_global_qp );

（6） i_frame_size = x264_slices_write( h );这是编码的关键了

1. x264_slice_header_write(&h->out.bs,&h->sh,h->i_nal_ref_idc ); /* Slice header */

2. 一些初始化工作

3. for(mb_xy=h->sh.i_first_mb, i_skip = 0; mb_xy < h->sh.i_last_mb; mb_xy++ )对一个slice中每个宏块进行循环遍历编码，其中const int i_mb_y = mb_xy / h->sps->i_mb_width;和const int i_mb_x = mb_xy % h->sps->i_mb_width;是对宏块位置在slice中的x,y坐标的定位，这个for语句几乎覆盖了整个x264_slices_write（）函数

4. x264_macroblock_cache_load( h, i_mb_x, i_mb_y ); 它是将要编码的宏块的周围的宏块的值读进来, 要想得到当前块的预测值，要先知道上面，左面的预测值！

5. *****x264_macroblock_analyse( h );重点。通过一系列的SAD算出最优化方案，例如把I帧16×16的宏块分成16个4×4分别计算SAD和与原16×16SAD比较我感觉，在下面一层再详细分析。

a. x264_mb_analyse_intra( h, &analysis, COST_MAX );我感觉是在一个16×16的SAD,4个8×8的SAD和，16个4×4SAD和中选出最优方式进行，可能我的理解不对，里面的x264_mb_encode_i4x4( h, idx, a->i_qp );i8×8几个函数的跟踪有问题，跟得我都找不到，要仔细看（现在又能跟到了）

这边好像如果是直流分量在这里就进行量化ZIGZAG扫描了，不用等到x264_macroblock_encode( h )再完成了

b. x264_analyse_update_cache( h, &analysis ); 有对色度块的模式选择的计算，好像也有更新信息以为下次的预测作为参考

6. x264_macroblock_encode( h );

a. 判断宏块的类型

b. 根据判断的类型进行DCT，量化，ZIGZAG,并记录当前的模式为下次编码宏块（亚宏块）做参考

ZIGZAG的实现不明白（原来ZIGZAG有宏定义，在上面，现在明白了），反量化和IDCT的过程跟不进去，应该是汇编了！函数如下：（ I 4×4 中 x264_mb_encode_i4x4( h, i, i_qp );）

x264_mb_dequant_4x4( dct4x4, h->dequant4_mf[CQM_4IY], i_qscale );

h->dctf.add4x4_idct( p_dst, i_stride, dct4x4 );

还有，这个函数跟踪不进去，应该是重构图像的反变换吧

h->dctf.add4x4_idct( p_dst, i_stride, dct4x4 );

h->mb.cache.intra4x4_pred_mode[x264_scan8[i]]=x264_mb_pred_mode4x4_fix(i_mode);这个值到底是怎么根据前面的模式改变的，可能是上面两个函数没能更进去所以模糊

c. 对色度块进行编码，QP限制在0－51之间，选定预测模式（DC的话值全为128）

x264_mb_encode_8x8_chroma( h, !IS_INTRA( h->mb.i_type ), i_qp );里面对两个色度信号分别编码，与亮度信号类似

d. 求亮度和色度的cbp，完全不明白是怎么求的，需要解决！现在有点明白，每个比特代表子块是不是全为0，但还没有全部明白，色度块cbp中0x02表示有AC,DC 0x01表示只有DC，

e．利用CBP判断要不要SKIP.,里面还关系到向量预测，明天好好看一下。其中

h->mb.qp[h->mb.i_mb_xy] = h->mb.i_last_qp;这个为读下一个 qp的保存，不然解码端是读不出下一个 qp的,

关于CBP的理解还存在问题，他的8位比特各个代表的意思还不是十分明确，反正是对DC,AC的编码的选择。185页有介绍（新一代视频压缩标准毕厚杰）

7. 选用CABAC还是CAVLC

CABAC的原理实现没仔细看

8. x264_macroblock_cache_save( h );保存以为下次的预测作为参考

9. 一些收尾工作，为下次宏块作准备（看的比较粗）

x264基于经验和感觉的码率控制策略收藏

前提:

1 high-complexity or high-motion scenes,细节将不会很明显,此时高qp也是浪费

2 where motion compensation works well,在景物边沿的失真,只需在一帧中去掉,以后就都不会有.在这里投入有限的bits可以获得最好的图像质量性价比

3 已经编码一frame,可以预测其他qp下所需bit数.预测距离越远越不精确

4随着frame重要性降低,他们只配用更大的qp,i ,p ,参考b ,disposable b.依次降低

5H.264支持1frame内不同mb使用不同qp,x264不支持,而由rc返回统一qp。但有那个功能函数存在那个函数仅精确到每一行mb变一次qp

所以rc策略如下:

2pass:

step1 1pass编码,由qp推断某qp下framesize *0.6符合目标frame size的限制,得到这个qp

step2 修改qp 以满足requested total size(total是指整个Gop的大小,分段先编一边再一边)

step3 encode根据实际大小值修正预测的qp,并额外增加short-term compensation,针对开始和结束部分没有很多bits余地的位置.

1pass: abr (average bit rate )

step1 用半尺寸快速运动估计和SATD residuals 替换1st pass中相关部分,获得预测

step2 用之前的样本估计scale

step3 Overflow compensation 和2pass相似限制filesize 牺牲图像质量

1pass,:constant bitrate (VBV compliant)!!!

VBV是指: Video Buffer Verifier

The Video Buffer Verifier (VBV) is a model hypothetical decoder buffer that will not overflow or underflow when fed a conforming MPEG bit stream. 包含2个因素.size和造成的delay

step1 same as abr

step2 Scaling factor is based on a local average (dependent on VBV buffer size) instead of all past frames

step3 stricter Overflow compensation , additional term to hard limit the QPs if the VBV is near empty. no hard limit is done for a full VBV这里更加严格的空限制，防止没有bits可以送出，破坏了cbr的传输

1pass, constant ratefactor: Constant Rate Factor (or Constant Quality)

(1) Same as ABR.

(2) The scaling factor is a constant based on the --crf argument.

(3) No overflow compensation is done.

ratefactor是指:

constant quantizer:

QPs are simply based on frame type.

RC中的蛋鸡悖论：为了计算当前帧中宏块的

RDO，需利用已定qp确定当前帧或宏块的cost预测每个宏块的mode mv ref等.

ratecontrol是在确定mode mv ref后决定qp,在此之前qp不能获得。

于是rdo与rc不知道先做哪个了.

x264命令行参数解释收藏

本文对应的是x264命令行模式，VFW方式也用相同的参数，不过是图形界面，可以自己找对应的英文。

使用格式：x264 默认选项 -o 输出文件输入文件 [长x宽]

输入支持格式：RAW/y4m/avi/avs(编译时可选)

输出支持格式：264/mkv/mp4(编译时可选)

x264的许多参数可以有-/--两种输入法，笔者也不知道为什么。以下等价参数用“参

数1/参数2 <必需数值格式>”表示，参数尾部()内为个人推荐。

-h/--help 帮助

帧类型选项：

-I/--keyint <整数> 最大IDR帧间距，默认250

-i/--min-keyint <整数> 最小IDR帧间距，默认25

--scenecut <整数> 画面动态变化限，当超出此值时插入I帧，默认40

-b/--bframes <整数> 在IP帧之间可插入的B帧数量最大值，范围0~16，默认0

--no-b-adapt 关闭自适应B帧判定(-b设为1时可用，其他不推荐)

--b-bias <整数> 控制插入B帧判定，范围-100~+100，越高越容易插入B帧，默认0

--b-pyramid 允许B帧做参考帧

--no-cabac 关闭内容自适应二进制算术编码(CABAC，高效率的熵编码)(会

提高速度，但严重影响质量)

-r/--ref <整数> 最大参考帧数，范围0~16，默认1

--nf 关闭环路滤波(一种除马赛克算法)

-f/--filter <alpha:beta>设置环路滤波的AlphaC和Beta的参数，范围-6-6，默认都为0

码率控制选项：

-q/--qp <整数> 固定量化模式并设置使用的量化值，范围0~51，0为无损压缩，默认26

-B/--bitrate <整数> 设置平均码率

--crf <整数> 质量模式，量化值动态可变(目前不太成熟，质量不如设置固定量化值)

--qpmin <整数> 设置最小量化值，范围0~51，默认10

--qpmax <整数> 设置最大量化值，范围0~51，默认51

--qpstep <整数> 设置相邻帧之间的量化值差，范围0~50，默认4

--ratetol <小数> 平均码率模式下，瞬时码率可以偏离的倍数，范围0.1~100.0，默认1.

--vbv-maxrate <整数> 平均码率模式下，最大瞬时码率，默认0(与-B设置相同)

--vbv-bufsize <整数> 码率控制缓冲区的大小，单位kbit，默认0

--vbv-init <小数> 码率控制缓冲区数据保留的最大数据量与缓冲区大小之比，范围0~1.

0，默认0.9

--ipratio <小数> I帧和P帧之间的量化系数，默认1.40

--pbratio <小数> P帧和B帧之间的量化系数，默认1.30

--色度-qp-offset <整数> 色度和亮度之间的量化差，范围-12~+12，默认0

-p/--pass <1|2|3> 多次压缩码率控制

1：第一次压缩，创建统计文件

2：按建立的统计文件压缩并输出，不覆盖统计文件，

3：按建立的统计文件压缩，优化统计文件

--stats <字符串> 统计文件的名称，默认"x264_2pass.log"

--rceq <字符串> 速率控制公式，默认"blurCplx^(1-qComp)"

--qcomp <小数> 线性量化控制，0.0为固定码率，1.0为固定量化值，默认0.6，只用于2-

pass和质量模式

--cplxblur <小数> 根据相邻帧平滑量化值比例的最大值，范围0~99.9，默认20.0，只用

于2-pass和质量模式

--qblur <小数> 对统计文件结果平滑量化值比例的最大值,范围0~99.9，默认0.5，只用于

2-pass

--zones <z0>/<z1>/… 分段量化，格式为：<开始帧>,<结束帧>,<选项>，可选项为：q=<

整数>(量化值)或b=<小数>(码率倍数)

分析选项：

-A/--analyse <字符串> 动态块划分方法，默认"p8x8,b8x8,i8x8,i4x4"。可选项：p8x8/

p4x4/b8x8/i8x8/i4x4；none/all(p4x4需要p8x8. i8x8需要--8x8dct)

--direct <字符串> 动态预测方式，默认"spatial"。可选项：none/spatial/temp

oral/auto

-w/--weightb 允许B帧加权预测(可以减少相邻B帧质量低的影响)

--me <字符串> 对全像素块动态预测搜索的方式，默认"hex"，可选项：

dia：菱形搜索，半径1 (快)

hex：正六边形搜索，半径2

umh：可变半径六边形搜索

esa：全面搜索(很慢，而且效果与umh几乎相同)

--merange <整数> --me为umh/esa时的搜索半径，最大64，默认16

-m/--subme <整数> 动态预测和分区方式，可选项1~7，默认5(与压缩质量和时间关系密切

，1是7速度的四倍以上)

1：用全像素块进行动态搜索，对每个块再用快速模式进行四分之一像素块精确搜索

2：用半像素块进行动态搜索，对每个块再用快速模式进行四分之一像素块精确搜索

3：用半像素块进行动态搜索，对每个块再用质量模式进行四分之一像素块精确搜索

4：用快速模式进行四分之一像素块精确搜索

5：用质量模式进行四分之一像素块精确搜索

6：进行I、P帧像素块的速率失真最优化(rdo)

7：进行I、P帧运动矢量及块内部的速率失真最优化(质量最好)

--b-rdo B帧也进行rdo，需要--subme在6以上

--mixed-refs 可以在一帧内使用不同参考帧

--no-chroma-me 不进行色度的动态预测

--bime 可以平均B帧参考块的运动矢量

-8/--8x8dct 可以使用8x8的离散余弦变换(DCT)

-t/--trellis <整数> Trellis量化，对每个8x8的块寻找合适的量化值，需要CABAC，

默认0

0：关闭

1：只在最后编码时使用

2：一直使用

--no-fast-pskip 关闭快速P帧跳过检测

--no-dct-decimate 关闭P帧联合编码(可以增加细节，但也会增大体积)

--nr <整数> 噪声去除，范围0~100000，默认0

--cqm <字符串> 设置外部量化矩阵格式，默认"flat"，可选项：jvt/flat

--cqmfile <字符串> 读取JM格式的外部量化矩阵文件，自动忽略其他--cqm*选项

--cqm4 <list> 设置4x4的量化矩阵，用逗号分开，范围1~255的16个整数

--cqm8 <list> 设置8x8的量化矩阵，用逗号分开，范围1~255的64个整数

--cqm4i/--cqm4p/--cqm8i/--cqm8p 设置I、P帧不同的量化矩阵

--cqm4iy/--cqm4ic/--cqm4py/--cqm4pc 设置亮度、色度不同的量化矩阵

视频标准化选项：

这些选项与编码无关，不过如果要用mp4之类的播放器，可以设置，风险自担

--sar width:height 设置长宽比

--overscan <字符串> 过扫描线，默认"undef"(不设置)，可选项：show(观看)/crop(去除

)

--videoformat <字符串> 视频格式，默认"undef"，可选项：component/pal/ntsc/secam

/mac/undef

--fullrange <字符串> Specify full range samples setting，默认"off"，可选项：

off/on(我也不明白这是干什么的，请高手指点)

--colorprim <字符串> 原始色度格式，默认"undef"，可选项：undef/bt709/bt470m/

bt470bg，smpte170m/smpte240m/film

--transfer <字符串> 转换方式，默认"undef"，可选项：undef/bt709/bt470m/bt47

0bg/linear,log100/log316/smpte170m/smpte240m

--colormatrix <字符串> 色度矩阵设置，默认"undef",undef/bt709/fcc/bt470bg,smpt

e170m/smpte240m/GBR/YCgCo

--chromaloc <整数> 色度样本指定，范围0~5，默认0

输入、输出选项：

--level <字符串> 设定等级(as defined by Annex A)(不明白，请高手指点)

--fps <小数> 设定帧率

--seek <整数> 设定起始帧

--frames <整数> 最大编码帧数

-o/--output 指定输出文件

--threads <整数> 编码线程(使用分片技术)

--thread-input 在编码线程中运行Avisynth

--no-asm 关闭全部CPU优化指令

--no-psnr 关闭PSNR计算

--quiet 安静模式

-v/--verbose 显示每一个帧的信息

--progress 显示编码进程

--visualize 显示运动矢量

--sps-id <整数> 设置SPS和PPS的ID值，默认0

--aud 使用数据单元定义符号

x264中重要结构体说明收藏

首先解释一下cli_opt_t的这个_t代表结构图可能是type的意思。同时还有很多i_ b_等作为前缀的变量，其中的I_表示int类型的变量 b表示bool类型的。依次类推。

正式进入主题。

typedef struct {

int b_progress;

int i_seek;

hnd_t hin;

hnd_t hout;

FILE *qpfile;

} cli_opt_t;

此结构体是记录一些与编码关系较小的设置信息的opt=option。结构体内部的变量都可以通过读取main()的参数获得。也就是argv。

b_progress表示一个bool类型的变量，看参数帮助也就是x264--help你会知道，他是用来控制是否显示编码进度的一个东西。取值为0,1.

I_seek 整数类型表示开始从哪一帧编码。因为不一定从这个文件的第一帧开始编码，这是可以控制的。

Hnd_t(hnd=handle)是一个空指针， void *在C语言里空指针是有几个特性的，他是一个一般化指针，可以指向任何一种类型，但却不能解引用，需要解引用的时候，需要进行强制转换。采用空指针的策略，应该是为了声明变量的简便和统一。

Hin 指向输入yuv文件的指针。

Hout 指向编码过后生成的文件的指针。

Qpfile 是一个指向文件类型的指针，他是文本文件，其每一行的格式是framenum frametype QP

用于强制指定某些帧或者全部帧的帧类型和QP(quant param量化参数)的值。

x264_param_default( &param );

这部分设置编码参数的缺省值

附结构体param中部分变量的意义：

param->i_csp = X264_CSP_I420; // 设置输入的视频采样的格式

param->vui.i_sar_width = 0; //VUI:video usability information

param->i_fps_num = 10; //帧率

param->i_fps_den = 1; //用两个整型的数的比值，来表示帧率

/* Encoder parameters */

param->i_frame_reference = 1; //参考帧的最大帧数。

param->i_bframe = 0; //两个参考帧之间的B帧数目。

param->b_deblocking_filter = 1; //去块效应相关

param->b_cabac = 0; //cabac的开关

param->i_cabac_init_idc = -1;

param->rc.b_cbr = 1; //constant bitrate 恒定码率控制模式

param->rc.i_bitrate = 0; //默认的码率

param->rc.i_rc_buffer_size = 0; //buffer的大小

param->rc.i_rc_init_buffer = 0; //

param->rc.i_rc_sens = 100; ///* rate control sensitivity

param->rc.i_rc_method = X264_RC_NONE; //码率控制，CQP（恒定质量）、//CRF（恒定码率）、ABR（平均码率）

param->rc.i_qp_constant = 26; //qp的初始值，最大最小的qp值，

param->rc.i_qp_min = 10; //最小的qp值

param->rc.i_qp_max = 51; //最大的qp值

param->rc.i_qp_step = 4; //qp[步长step。

param->rc.f_ip_factor = 1.4; //ip--i帧p帧的qp的差值

param->rc.f_pb_factor = 1.3; //pb--p帧b帧的qp的差值

/* Log */ //整个param的一个log文件

/*analyse */

param->analyse.intra = X264_ANALYSE_I4x4 | X264_ANALYSE_I8x8; //桢内分析

param->analyse.inter = X264_ANALYSE_I4x4 | X264_ANALYSE_I8x8 |X264_ANALYSE_PSUB16x16 | X264_ANALYSE_BSUB16x16; //桢间分析

param->analyse.i_direct_mv_pred = X264_DIRECT_PRED_SPATIAL; //预测模式

param->analyse.i_me_method = X264_ME_HEX; //运动估计模式

param->analyse.i_me_range = 16; //运动估计范围

param->analyse.i_subpel_refine = 5;

param->analyse.b_chroma_me = 1;

param->analyse.i_mv_range_thread = -1;

param->analyse.i_mv_range = -1; // set from level_idc

param->analyse.i_direct_8x8_inference = -1; // set from level_idc

param->analyse.i_chroma_qp_offset = 0;

param->analyse.b_fast_pskip = 1;

param->analyse.b_dct_decimate = 1;

param->analyse.i_luma_deadzone[0] = 21;

param->analyse.i_luma_deadzone[1] = 11;

param->analyse.b_psnr = 1;

param->analyse.b_ssim = 1;

param->i_cqm_preset = X264_CQM_FLAT; //自定义量化矩阵(CQM),初始化量化模式为flat

typedef struct

{

/* In: force picture type (if not auto)

* If x264 encoding parameters are violated in the forcing of picture types,

* x264 will correct the input picture type and log a warning.

* The quality of frametype decisions may suffer if a great deal of fine-grained

* mixing of auto and forced frametypes is done.

* Out: type of the picture encoded */

int i_type;

/* In: force quantizer for > 0 */

int i_qpplus1;

/* In: user pts, Out: pts of encoded picture (user)*/

int64_t i_pts;

/* In: raw data */

x264_image_t img;

} x264_picture_t;

具体的含义理解参考了read_frame_yuv（）x264_picture_alloc（）；

I_type 指明被编码图像的类型，有X264_TYPE_AUTO X264_TYPE_IDR X264_TYPE_I X264_TYPE_P X264_TYPE_BREF X264_TYPE_B可供选择，初始化为AUTO，说明由x264在编码过程中自行控制。

I_qpplus1 ：此参数减1代表当前画面的量化参数值。

I_pts ：program time stamp 程序时间戳，指示这幅画面编码的时间戳。

Img :存放真正一副图像的原始数据。

typedef struct

{

int i_csp;

int i_plane;

int i_stride[4];

uint8_t *plane[4];

} x264_image_t;

Csp: color space parameter 色彩空间参数 X264只支持I420

i_Plane 代表色彩空间的个数。一般为3，YUV，初始化为

x264常用options整理收藏

x264源码解析

2009年11月12日星期四 22:44

http://hi.baidu.com/mingjiang_apple/blog/item/aed41f08efb10b3ae82488eb.html

x264源码解析（01）

由main函数进入参数设置后开始Encode函数。。。这里只把Encode函数体解析下，借鉴了很多网上资源（即使不全是自己原话也是亲手打字上去的哦^_^），感谢网友。

代码似懂非懂的注释了下，尽当资源存储吧吧，暂且发到博客大家讨论批评。

static int Encode( x264_param_t *param, cli_opt_t *opt )

{

x264_t *h; //还不知道干啥的，这个结构也很烦，不压x264_param_t

x264_picture_t pic; //一帧的结构体，色度存储

int i_frame, i_frame_total;

int64_t i_start, i_end; //用来计算时间

int64_t i_file;

int i_frame_size;

int i_update_interval;

char buf[200];

opt->b_progress &= param->i_log_level < X264_LOG_DEBUG;

i_frame_total = p_get_frame_total( opt->hin );

i_frame_total -= opt->i_seek;

if( ( i_frame_total == 0 || param->i_frame_total < i_frame_total )

&& param->i_frame_total > 0 )

i_frame_total = param->i_frame_total;

param->i_frame_total = i_frame_total;

//上面这段代码是实现，计算文件中的总共的帧数，并根据输入的参数初始帧的位置，

//对i_frame_total做出修正，i_frame_total -= opt->i_seek，然后再根据param->i_frame_total，

//对i_frame_total做出进一步的修正。

//总体来说，就是对参数设置中的进行编码的帧数的总数进行修正和计算。

i_update_interval = i_frame_total ? x264_clip3( i_frame_total / 1000, 1, 10 ) : 10;

if( ( h = x264_encoder_open( param ) ) == NULL )//关键函数：x264_encoder_open( param ) 根据参数要求对encoder进行一系列的初始化，例如分配内存，值的初始化等。

{

…… ……（略）

}

if( p_set_outfile_param( opt->hout, param ) )//关键函数：p_set_outfile_param() 设置输出文件格式

{

…… ……（略）

}

/* Create a new pic */

//关键函数：x264_picture_alloc() 按照色度空间分配内存，并返回内存的首地址作为指针

if( x264_picture_alloc( &pic, X264_CSP_I420, param->i_width, param->i_height ) < 0 )

{

…… ……（略）

}

//关键函数：x264_mdate() 用于编码用时的计算，设定起始时间

i_start = x264_mdate();

/* Encode frames */

for( i_frame = 0, i_file = 0; b_ctrl_c == 0 && (i_frame < i_frame_total || i_frame_total == 0); )

{

//p_read_frame() 按照h->hin提供的输入文件的地址，读入图像的内容到&pic提供的存储区的首地址

if( p_read_frame( &pic, opt->hin, i_frame + opt->i_seek ) )

break;

pic.i_pts = (int64_t)i_frame * param->i_fps_den;

if( opt->qpfile )

parse_qpfile( opt, &pic, i_frame + opt->i_seek );//parse_qpfile() 为从指定的文件中读入qp的值留下的接口，qpfile为文件的首地址

else

{

/* Do not force any parameters */

pic.i_type = X264_TYPE_AUTO;

pic.i_qpplus1 = 0;// 参数减1代表当前画面的量化参数值

}

i_frame_size = Encode_frame( h, opt->hout, &pic );//************核心程序

…… ……（略）

/* update status line (up to 1000 times per input file) */

//用于显示整个编码过程的进度

if( opt->b_progress && i_frame % i_update_interval == 0 )

{

int64_t i_elapsed = x264_mdate() - i_start;//编码使用的时间计算

//帧率的计算

double fps = i_elapsed > 0 ? i_frame * 1000000. / i_elapsed : 0;

double bitrate = (double) i_file * 8 * param->i_fps_num / ( (double) param->i_fps_den * i_frame * 1000 );

…… ……（略）

SetConsoleTitle( buf );

fflush( stderr ); // needed in windows

}

…… ………………

// 后边的除了清理工作，其他的还不知道。

return 0;

}

1、x264学习笔记(9)--x264中16x16运动搜索过程

函数实现是函数 static void x264_mb_analyse_inter_p16x16( x264_t *h, x264_mb_analysis_t *a )

1、大循环是参考帧的循环，从最近的一个参考帧开始搜索，一直到最远的一个参考帧；
2、调用x264_mb_predict_mv_16x16函数，以上、右上、左块运动矢量的中值m.mvp作为候
选运动矢量。
3、调用x264_mb_predict_mv_ref16x16函数，寻找其它候选运动矢量。这些候选者包括：
空间相邻的左、左上、上、右上块的MV；第0个参考帧中的当前块、右边块、下边快运动矢
量乘以时间差权重。
4、调用x264_me_search_ref进行运动搜索。搜索时先从所有候选运动矢量中选出最佳的起
点，然后使用小钻石法、六边形法、UMH或者全搜索搜索出最佳的整像素位置。
5、x264_me_search_ref调用refine_subpel进行1/2和1/4运动搜索。两者都使用小钻石法
。
6、搜索出最佳运动矢量后，如果当前是最近一个参考帧，而且最佳SA(T)D小与检测门限，
则尝试对其进行P_SKIP编码。
7、保存搜索结果。

2、x264学习笔记(10)---分像素的运动估计总结

得到分像素的值函数是下面两个函数，对照着

(1) static uint8_t *get_ref( uint8_t *src[4], int i_src_stride,

uint8_t *dst, int * i_dst_stride,

int mvx,int mvy,

int i_width, int i_height )

{

int qpel_idx = ((mvy&3)<<2) + (mvx&3); //取出运动矢量的分像素部分。

int offset = (mvy>>2)*i_src_stride + (mvx>>2); //偏移到所选的整像素点

uint8_t *src1 = src[hpel_ref0[qpel_idx]] + offset + ((mvy&3) == 3) * i_src_stride;

/*src1和src2都分别指向的是1/2像素块，关键是这个hpel_ref0[qpel_idx]和hpel_ref1[qpel_idx]，下面将详细介绍。

注意一点就是参考帧定义了uint8_t *p_fref[2][32][4+2]; /* last: lN, lH, lV, lHV, cU, cV */

这里面的 4+2 的这个2代表色度，而这个4分别代表整像素，在整像素水平右边的1/2像素，在整像素垂直下面的1/2像素和整像素右下角的1/2像素。1/2像素的值已经在前面函数里面插值存好了，只要调用就可以了，而如果要进行1/4像素估计，要临时插值。现在这个函数 get_ref 中，src[0]、src[1]、src[2]、src[3]这传进来的就是分别是 lN, lH, lV, lHV

if( qpel_idx & 5 ) /* qpel interpolation needed */

{

uint8_t *src2 = src[hpel_ref1[qpel_idx]] + offset + ((mvx&3) == 3);

pixel_avg( dst, *i_dst_stride, src1, i_src_stride,

src2, i_src_stride, i_width, i_height );//1/4搜索时需要临时插值函数

return dst;

}

else

{

*i_dst_stride = i_src_stride;

return src1;

}

按照毕厚杰的《新一代视频压缩编码标准——H.264/AVC》关于运动矢量那一节的介绍。看图6.22

那四个像素点，G为整像素点 b、h、i分别是lH, lV, lHV，也就是水平，垂直和对角线的值。

G b

h i

对应为

src[0] src[1]

src[2] src[3]

现在看这两个数组

static const int hpel_ref0[16] = {0,1,1,1,0,1,1,1,2,3,3,3,0,1,1,1};

static const int hpel_ref1[16] = {0,0,0,0,2,2,3,2,2,2,3,2,2,2,3,2};

也按像素的平面图画出来的话

src[hpel_ref0[qpel_idx]]为

0 1 1 1

2 3 3 3

0 1 1 1

src[hpel_ref1[qpel_idx]]为

0 0 0 0

2 2 3 2

这上面的数字 0、1、2、3分别代表整像素、水平1/2像素值、垂直1/2像素值和对角线1/2像素值，也就是毕厚杰书中的 G、b、h、I 。这里要注意src[hpel_ref0[qpel_idx]]最后一行的 0 1 1 1 和src[hpel_ref1[qpel_idx]]最右边一列0 2 2 2不是当前的整像素0的1/2像素，而分别是其下面和右边一个整像素的对应的1/2像素值，因为 ((mvy&3) == 3) * i_src_stride 和((mvx&3) == 3)。

为什么要这么来排，是因为要根据1/4像素是通过1/2像素线性插值的公式来的，具体看下面这个函数。

(2) static inline void pixel_avg( uint8_t *dst, int i_dst_stride,

uint8_t *src1, int i_src1_stride,

uint8_t *src2, int i_src2_stride,

int i_width, int i_height )

{ //1/4搜索时需要临时插值函数

int x, y;

for( y = 0; y < i_height; y++ )

{

for( x = 0; x < i_width; x++ )

{

dst[x] = ( src1[x] + src2[x] + 1 ) >> 1; //利用相邻半像素和两个像素取平均插值

}

dst += i_dst_stride;

src1 += i_src1_stride;

src2 += i_src2_stride;

}

} 不过最后我有个疑问，那就是1/4插值后,应该原来的1/2 值保持不变的.但是分析发现,这个 b 、h、 i 这三个1/2像素中，h和i是不变的，不过 b会发生变化. 个人觉得 static const int hpel_ref1[16] = {0,0,0,0,2,2,3,2,2,2,3,2,2,2,3,2};如果改为 static const int hpel_ref1[16] = {0,0,1,0,2,2,3,2,2,2,3,2,2,2,3,2};则 b也不会发生变化. 所以这里打个问号?

3、x264学习笔记(11）---关于运动矢量MV不传输的问题

昨天看到H.264乐园群里面有人在讨论运动矢量MV不用传输的问题，就去看了下x264源代码，作个总结

编码端：运动估计搜索得到的运动矢量MV是不需要传送的，需要传送的是MVD，MVD即运动矢量MV(运动估计得到)和运动矢量的预测矢量MVP(预测得到)的差值。

MVD = MV - MVP

解码端：通过预测得到MVP，将传输过来的MVD和MVP相加得到 MV = MVD + MVP，然后用这个MV去参考帧中获取预测象素值，最后把这个预测值和残差加一起, 作为重构像素值

x264中把这个过程放在了熵编码阶段，在这个函数里 x264_macroblock_write_cabac

MVD并保存下来以备传输的函数如下：

static inline void x264_cabac_mb_mvd( x264_t *h, x264_cabac_t *cb, int i_list, int idx, int width, int height )

{

int mvp[2];

int mdx, mdy;

/* Calculate mvd */

x264_mb_predict_mv( h, i_list, idx, width, mvp ); //预测MVP

mdx = h->mb.cache.mv[i_list][x264_scan8[idx]][0] - mvp[0]; //计算MVD

mdy = h->mb.cache.mv[i_list][x264_scan8[idx]][1] - mvp[1];

/* encode */

x264_cabac_mb_mvd_cpn( h, cb, i_list, idx, 0, mdx ); //编码

x264_cabac_mb_mvd_cpn( h, cb, i_list, idx, 1, mdy );

/* save value */

x264_macroblock_cache_mvd( h, block_idx_x[idx], block_idx_y[idx], width, height, i_list, mdx, mdy ); // 保存MVD

}

4、firstime

MV预测过程详解（附图）

===========第一步：确定相邻块===========

MV 预测以宏块分割（或亚宏块分割，如果宏块存在亚分割）为单位，同一个宏块分割（或亚宏块分割）内所有 4*4 块 MV 预测值相同。以每个宏块分割（或亚宏块分割）的左上角像素 pixel1 和右上角像素 pixel2 为参考点来确定相邻块则：

pixel1 左侧相邻像素所在 4*4 块为当前宏块分割（或亚宏块分割）的相邻块 A

pixel1 上方相邻像素所在 4*4 块为当前宏块分割（或亚宏块分割）的相邻块 B

pixel2 右上对角线像素所在 4*4 块为当前宏块分割（或亚宏块分割）的相邻块 C

pixel1 左上对角线像素所在 4*4 块为当前宏块分割（或亚宏块分割）的相邻块 D

图片附件: MV预测示意图.JPG (2006-9-29 11:14 AM, 85.25 K)

以最复杂的 8*8 宏块分割类型为例（此时只存在亚宏块分割），分析如下：

假设图中黑色框表示宏块、每个绿色框表示一个 4*4 块、每个红色框表示一个 8*8 块。当前宏块的宏块分割模式为 8*8（如图中红色线），其亚宏块分割模式分别为：第一个 8*8 块为 8*8，第二个 8*8 块为 4*4（如图中蓝色线），第三个 8*8 块为 4*8（如图中蓝色线），第四个 8*8 块为 8*4（如图中蓝色线）。则按照上述方法来确定相邻块的方法如下：

第一个预测对象为第一个 8*8 块，以其左上角像素 pixel1 和右上角像素 pixel2 为参考点，则：A 为 7 号 4*4 块，B 为 2 号 4*4 块，C 为 4 号 4*4 块，D 为 1 号 4*4 块。9、14、15 与 8 具有相同 MV 预测值

第二个预测对象为第二个 8*8 块的第一个 4*4 块，即 10 号块，以其左上角像素 pixel1 和右上角像素 pixel2 为参考点，则：A 为 9 号4*4块，B 为 4 号4*4块，C 为 5 号 4*4 块， D 为 3 号 4*4 块

第三个预测对象为第二个 8*8 块的第二个 4*4 块，即 11 号块，以其左上角像素 pixel1 和右上角像素 pixel2 为参考点，则：A 为 10 号4*4块，B 为 5 号4*4块，C 为 6 号 4*4 块，D 为 4 号 4*4 块

第四个预测对象为第二个 8*8 块的第三个 4*4 块，即 16 号块，以其左上角像素 pixel1 和右上角像素 pixel2 为参考点，则：A 为 15 号4*4块，B 为 10 号4*4块，C 为 11 号 4*4 块，D 为 9 号 4*4 块

第五个预测对象为第二个 8*8 块的第四个 4*4 块，即 17 号块，以其左上角像素 pixel1 和右上角像素 pixel2 为参考点，则：A 为 16 号4*4块，B 为 11 号4*4块，C 为 12 号 4*4 块，D 为 10 号 4*4 块

第六个预测对象为第三个 8*8 块的第一个 4*8 块，以其左上角像素 pixel1 和右上角像素 pixel2 为参考点，则：A 为 19 号 4*4 块，B 为 14 号 4*4 块，C 为 15 号 4*4 块，D 为 13 号 4*4 块。26 与 20 具有相同 MV 预测值

第七个预测对象为第三个 8*8 块的第二个 4*8 块，以其左上角像素 pixel1 和右上角像素 pixel2 为参考点，则：A 为 20 号 4*4 块，B 为 15 号 4*4 块，C 为 16 号 4*4 块，D 为 14 号 4*4 块。27 与 21 具有相同 MV 预测值

第八个预测对象为第四个 8*8 块的第一个 8*4 块，以其左上角像素 pixel1 和右上角像素 pixel2 为参考点，则：A 为 21 号 4*4 块，B 为 16 号 4*4 块，C 为 18 号 4*4 块，D 为 15 号 4*4 块。23 与 22 具有相同 MV 预测值

第九个预测对象为第四个 8*8 块的第二个 8*4 块，以其左上角像素 pixel1 和右上角像素 pixel2 为参考点，则：A 为 27 号 4*4 块，B 为 22 号 4*4 块，C 为 24 号 4*4 块，D 为 21 号 4*4 块。29 与 28 具有相同 MV 预测值

===========第二步：确定 A、B、C 的可用性===========

根据 A、B、C 所在宏块是否存在或者是否允许参与预测来判断。如果 C 不可用，采用 D 代替 C

===========第三步：预测 MV ===========

1、如果 A、B、C 三个参考块中只有一个与当前预测对象为同一参考帧，则选取该参考块的 MV 作为最终 MV 预测值

2、当前宏块是否为 8*16 或者 16*8 分割：

（1）、如果当前宏块为 8*16 分割类型：

对于左边 8*16 分割，如果 A 与当前分割为同一参考帧，则采用 A 的 MV 为该分割的最终 MV 预测值

对于右边 8*16 分割，如果 C 与当前分割为同一参考帧，则采用 C 的 MV 为该分割的最终 MV 预测值

（2）、如果当前宏块为 16*8 分割类型：

对于上边 16*8 分割，如果 B 与当前分割为同一参考帧，则采用 B 的 MV 为该分割的最终 MV 预测值

对于下边 16*8 分割，如果 A 与当前分割为同一参考帧，则采用 A 的 MV 为该分割的最终 MV 预测值

3、其余情况并且 B、C 中有一个可用或者两者都可用，则采用中值预测（取 A、B、C 三者中MV的中值为最终 MV 预测值）

4、其余情况并且 B、C 皆不可用，则采用 A 的 MV 为最终 MV 预测值

【注】：1、宏块分割时的相邻块确定方法与第一步所述过程雷同：16*16 相当于 8*8，8*16、16*8 分别相当于 4*8、8*4

2、对于不可用的相邻块，其 MV 仍然可能参与 MV 预测，但其值为 0。例如：A 不可用，B、C 可用，则最终可能仍然是在 A、B、C 中取中值，但此时 A 的 MV 为 0；

3、对于不可用的相邻块，其参考帧索引被设置为 -1，即必然与当前预测对象非同一参考帧；

4、可以验证：同时满足第三步的第一、第二两种情况时，按第一种情况计算 MV 预测值与按第二种情况计算 MV 预测值等效；

5、该预测过程即为标准 8.4.1.3 小节的内容，在 JM86 中对应的代码为 SetMotionVectorPredictor 函数；

6、MBAFF 情况下的相邻块均指对应位置（co-locate）块。

常规选项设置
　　在常规选项栏中的参数设置及含义如下：
　　输出路径：设置最后生成的MP4-AVC所在的目录。
　　建议:设置到的分区有较大的剩余空间
　　保持文件夹结构：减少文件碎片。
　　建议:勾选
　　在视频选项栏中的参数设置及含义如下：
　　模式：设置转换视频时所采用的编码方式。可选项：
　　1.Bitrate-based固定比特率；
　　2.Quality-based动态比特率，基于质量模式，文件大小不可控；
　　3.Two-Pass转换两遍
　　4.Three-Pass转换三遍。
　　建议:选择Quality-based
　　滑条:设置转换时使用的比特率（Bitrate-based、Two-Pass、Three-Pass，范围0Kbps－20000Kbps）及原来视屏质量的百分比（Quality-based范围1－100），数值越大质量越好，文件越大。其中在Quality-based模式下数值调整到100（--crf 0）为无损压缩，且文件大小不能预测。
　　建议:在Quality-based模式下设置为52
　　转换视频流：设置MediaCoder对视频进行编码时的参数。只有勾选了该项后，才会启用编码器对原始视频进行编码。
　　建议:勾选
　　格式编码设置
　　格式：设置转换后临时的视屏文件（未与音频文件封装之前）的格式。可选项：XviD、H.264、MPEG1、MPEG2、MPEG4、Theora、Flash Video、Dirac Video、Windows Media Video、RealMedia、H.263、H.263+、H.261、MS-MPEG4-V2、DV Video、Motion JPEG、Lossless JPEG、Huffyuv、
　　Snow、AMV、Raw Video
　　建议:选择H.264
　　（注意：格式的选择会影响下面容器的选择，不是所有的格式都能封装到一个容器中的！由于我们是转MP4-AVC的所以格式选择H.264!）
　　容器：最后进行封装时使用的容器，如XXXX.AVI就是使用的AVI作为容器。可选项：Default、AVI、MP4、Matroska、MPEG1、MPEG2、MPEG2-TS、Flash Video、ASF、3GP、3GP2、MOV、MJPEG、RealMedia、DV Forma、OGG、NUT、PMP、Raw Stream
　　建议:选择MP4 java强烈推荐：Matroska （MKV）
　　（注意：很多转换任务一开始就报有关容器的错误，是因为混流软件对转换后的音频文件或视频文件无法混流所致.具体MediaCoder的混流器能封装什么格式的视频文件和音频文件，请参考其他有关资料！）
　　复制视屏流：当勾选参数时，MediaCoder不会对原始视频进行转换，而是直接无损提取。
　　建议:不勾选
　　（注意：只有勾选转换视频流时，复制视频流的设置才会有效！）
　　来源：设置MediaCoder对原视屏解码时所使用的解码方式。可选项：Bypass、MPlayer、MEncoder、FFmpeg、WM Decoder、JM Decoder、AviSynth、File Stream
　　建议:勾选自动选择
　　（注意：只有不勾选自动选择时才能选择以上解码方式，不正确的选择会导致文件转换失败！）
　　编码器：设置MediaCoder对视屏编码时所使用的编码器。可选项：MEncoder、FFmpeg、x264、JM Encoder、XviD、Theora Encoder、Dirac、WM Encoder、VFW Encoder、AMV Encoder、Stream Dumper、Frame Dumper、x264 Remote
　　建议:选择x264
　　（注意：只有不勾选自动选择后才能选择以上编码器。不正确选择会导致转换失败.要转换MP4-AVC则必须选择x264以防转换失败！）
　　右边选区点击x264选项栏进行视频质量的设置
　　规格：压缩时使用规格模式。可选项：Auto、Baseline、Main、High
　　建议:选择Main 现在的MP4如艾诺v6000HDV 可以用High
　　（注意：需要在PSP上播放的MP4-AVC必须选择Main，否则PSP无法播放！）
　　级别：--Level:表示编、解码等级
　　（注意：无论是转480x272的MP4-AVC，还是720x480的MP4-AVC建议选择Level3.0，防止PSP无法播放！）
　　参考帧数：--ref：最大参考帧数，范围0－16。该参数对质量和压缩比都有提高。
　　建议:设置大于1
　　Ｂ帧数：--bframes：在I帧与P帧之间可插入B帧数量的最大值，范围0－16。
　　建议:设置大于1
　　运动估算模式
　　运动估算模式：--me:对全像素块动态预测搜索的方式，可选项：
　　Diamond:菱形搜索，搜索半径为1；
　　Hexagonal:正六边形搜索，搜索半径为2；
　　Uneven Multi-Hexagon:可变半径六边形搜索；
　　Exhaustive:全面搜索；
　　Hadamard Exhaustive:用Hadamard方式进行全面搜索，比Exhaustive更慢。
　　建议:选择Uneven Multi-Hexagon
　　（注意：建议设为Uneven Multi-Hexagon；Exhaustive和Hadamard Exhaustive实在太慢了，而且画面质量提高极不明显。除非你不怕浪费时间且追求高质量画面的骨灰级玩家并且很相信自己机器配置那么就选Hadamard Exhaustive吧！）。
　　子像素质量优化：--subme:动态预测和分区方式，可选项1－9
　　1：用全像素块进行动态搜索，对每个块再用快速模式进行四分之一像素块精确搜索
　　2：用半像素块进行动态搜索，对每个块再用快速模式进行四分之一像素块精确搜索
　　3：用半像素块进行动态搜索，对每个块再用质量模式进行四分之一像素块精确搜索
　　4：用快速模式进行四分之一像素块精确搜索
　　5：用质量模式进行四分之一像素块精确搜索
　　6：进行I、P帧像素块的速率失真最优化(rdo)
　　7：进行全部帧像素块的速率失真最优化
　　8：进行I、P帧运动矢量及块内部的速率失真最优化
　　9：进行全部帧运动矢量及块内部的速率失真最优化
　　建议:选择7
　　（注意：该选项选择的数值越大画面质量越好，而编码的速度越慢！）
　　运动估算半径：--merange:当运动估算模式选项中选择Uneven Multi-Hexagon或Exhaustive时的搜索半径，最大64。
　　建议:设置为16

帧的相关设置
　　2.x264的参数设置
　　点击高级进行有关x264编码器的高级参数设置
　　（注意：当要更改参数时，选中该参数后在对话框左下角进行参数选择更改，如果是数值型的参数在填入参数数值后点击对话框左下角的Apply进行保存，每改一个数值型参数都要点击Apply保存。非数值型参数则不用点击任何按钮即可保存。右下角Revert为恢复默认值。没有说明的只需保持默认即可！）
　　Bitstream profile：压缩时使用规格模式。可选项：Auto、Baseline、Main、High建议:选择Main
　　（注意：需要在PSP上播放的MP4-AVC必须选择Main，否则PSP无法播放！）
　　Bitstream level：--Level:表示编、解码等级
　　（注意：无论是转480x272的MP4-AVC，还是720x480的MP4-AVC建议该参数选择为30，防止PSP无法播放！）
　　P frame Quantitizer：--qp:固定量化模式并设置使用的量化值。
　　Maximum interval between IDR-frames：--keyint:最大IDR帧间距。一般来说压制动画时，可以增大该值。
　　默认值:250
　　Minimum interval between IDR-frames：--min-keyint:最小IDR帧间距。一般来说压制动画时，可以减小该值。
　　默认值:25
　　Frames used as predictors in B and P frames：--ref：最大参考帧数，范围0－16。该参数对质量和压缩比都有提高。
　　建议:大于1
　　（注意：数值越高速度越慢！）
　　Maximum B frames between I and P frames：--bframes：在I帧与P帧之间可插入B帧数量的最大值，范围0－16。
　　建议:大于1
　　（注意：数值越高速度越慢！）
　　Adaptive B-frame decision method：--b-adapt:自适应B帧判定模式。0：关闭；1：快速；2：优化。下拉菜单中：0-Off为：关闭，1-Fast为：快速，2-Optimal为：优化。默认值为：1-Fast。
　　建议:选择2-Optimal
　　（注意：当该选项选择为2时， Number of B-frames参数设置较高时，编码速度会下降!）。
　　B-frames used as for predicting：--b-pyramid:允许B帧做参考帧。
　　建议:选择No
　　Alpha parameter of deblocking filter：设置环路滤波的AlphaC的参数，范围-6－6。
　　默认值:0
　　Beta parameter of deblocking filter：设置环路滤波的Beta的参数，范围-6－6。
　　默认值:0
　　（注意：Alpha parameter of deblocking filter和Beta parameter of deblocking filter在X264中的参数为--deblock 0:0前一个0对应Alpha parameter of deblocking filter的参数值，后一个0对应Beta parameter of deblocking filter的参数值！）
　　熵编码与缓冲
　　Use CABAC：内容自适应二进制算术编码，高效率的熵编码。关闭该参数时会严重降低画面质量，但是能提高编码速度。（当不勾选该项时该参数显示为：--no-cabac）。
　　默认值:选择Yes
　　Minimum quantizer：--qpmin:设置最小量化值，范围0－51。
　　默认值:10
　　Maximum quantizer：--qpmax:设置最大量化值，范围0－51。
　　默认值:51
　　Quantizer step：--qpstep:设置相邻帧之间的量化值差，范围0－50。
　　默认值:4
　　Maximum local bitrate：--vbv-maxrate:平均码率模式下，最大瞬时码率 (与-B设置相同)。
　　默认值:0
　　(注意：该参数的取值与在ABR编码模式下的Bitrate（码率）保持一致！)
　　Averaging period for maximum local bitrate：--vbv-bufsize:码率控制缓冲区的大小，单位kbit。
　　默认值:0
　　Initial buffer occupancy：--vbv-init:码率控制缓冲区数据保留的最大数据量与冲区大小之比，范围0－1.0。
　　默认值:0.9
　　Quantizer compression percentage：--qcomp:线性量化控制，0.0为固定码率，1.0为固定量化值，只能用于二次压缩和基于质量的压缩模式。
　　默认值:60
　　Direct macroblocks prediction：--direct:动态预测方式。可选项：None、Spatial、Temporal、Auto。
　　默认值:Temporal。
　　建议:选择Auto
　　Use weighted prediction for B-frames：--weightb:允许B帧加权预测,可以减少相邻B帧质量低的影响，对质量和压缩比都有提高，且对速度影响极少。
　　建议:选择Yes
　　（注意：要使该参数生效需要让Maximum B frames between I and P frames设置大于1！）
　　Enable all macroblock type：动态块划分方法，在Level较低时允许使用包括8x8、4x8、4x4划分方法。
　　建议:选择Yes
　　(注意：如果要使用这些划分方法，需要Subpel refinement quality设置大于等于5！)
　　Adaptive spatial transform size：允许动态划分方法在4x4和8x8DCT之间自动选择，并且允许使用i8x8动态划分方法。
　　建议:选择Yes
　　（注意：如果选择No那么只是用4x4DCT动态预测！）
　　动态预测与分区
　　Fullpixel motion estimation algorithm：--me:对全像素块动态预测搜索的方式，可选项：
　　Diamond:菱形搜索，搜索半径为1；
　　Hexagonal:正六边形搜索，搜索半径为2；
　　Uneven Multi-Hexagon:可变半径六边形搜索；
　　Exhaustive:全面搜索；
　　Hadamard Exhaustive:用Hadamard方式进行全面搜索，比Exhaustive更慢。
　　建议:选择Uneven Multi-Hexagon
　　（注意：建议设为Uneven Multi-Hexagon；Exhaustive和Hadamard Exhaustive实在太慢了，而且质量提高极不明显。除非你不怕浪费时间且追求高质量画面的骨灰级玩家并且很相信自己机器配置，那么就选Hadamard Exhaustive吧！）
　　Motion search radius：--merange:Fullpixel motion estimation algorithm选择为Uneven Multi-Hexagon或Exhaustive时的搜索半径，最大64。
　　默认值:16
　　Ignore chroma in motion estimation：不进行色度的动态预测。
　　建议:选择No
　　(注意：当选则Yes时该参数显示为：--no-chroma-me！)
　　Subpel refinement quality：--subme：动态预测和分区方式，可选项1－9
　　1：用全像素块进行动态搜索，对每个块再用快速模式进行四分之一像素块精确搜索
　　2：用半像素块进行动态搜索，对每个块再用快速模式进行四分之一像素块精确搜索
　　3：用半像素块进行动态搜索，对每个块再用质量模式进行四分之一像素块精确搜索
　　4：用快速模式进行四分之一像素块精确搜索
　　5：用质量模式进行四分之一像素块精确搜索
　　6：进行I、P帧像素块的速率失真最优化(rdo)
　　7：进行全部帧像素块的速率失真最优化
　　8：进行I、P帧运动矢量及块内部的速率失真最优化
　　9：进行全部帧运动矢量及块内部的速率失真最优化
　　建议:设置为7
　　（注意：该选项选择的数值越大画面质量越好速度越慢！）

Psy算法与量化值
　　Psychovisual optimization strength for RDO：--psy-rd 0:0:在rdo中使用Psy算法（一种心理视觉模型）。
　　默认值:1.0
　　建议:0
　　（注意：这个参数对应--psy-rd 0:0中前面的数值！当Subpel refinement quality参数大于等于6时才能使用该这个参数。该参数会影响到Chroma Qp Offset参数。当设置该数设置为1.0时Chroma Qp Offset会自动设置为-2；当该参数设置为0时Chroma Qp Offset会自动设置为0！）
　　Psychovisual optimization strength for Trellis：--psy-rd 0:0sy-Trellis量化，可提高细节，但会大幅提高码率。
　　默认值:0.0。
　　（注意：该参数需要Subpel refinement quality参数大于等于6且Trellis参数大于等于1才能使用。这个参数对应--psy-rd 0:0中后面的数值！）
　　Mixed reference frame：--mixed-refs:可以在一帧内使用不同参考帧。该参数能提高画面质量，但对速度影响较大。
　　默认值:不勾选
　　建议:勾选
　　Rate-distortion optimal quantization（trellis）：--trellis:Trellis量化，对每个8x8的块寻找合适的量化值，需要勾选CABAC才能使用该参数。可选项：
　　Disabled:关闭（0）；
　　Enabled only for the final encode:只在最后编码时使用（1）；
　　Enabled during all mode decision:一直使用（2）。
　　默认值:0
　　建议:开启该参数
　　（注意:该参数能提画面高质量，配置较低的电脑且对画面质量没有要求的用户可以选择Enabled only for the final encode，配置较高的电脑且对画面质量有要求的用户可以选择Enabled during all mode decision；画面质量：Enabled only for the final encode比Enabled during all mode decision差！编码速度：Enabled only for the final encode比Enabled during all mode decision快！）
　　量化模式等设置
　　How AQ distribures bits：--aq-mode:自适应量化模式，可以在1帧中不同宏块间重新分配量化值，能提高暗部细节，但会提高码率。不能在固定量化模式（Const.Quantizer模式）中使用。0:关闭；1:开启。可选项：
　　Disabled:关闭（0）；
　　Variance:AQ开启（1）。
　　默认值:Variance AQ（1）
　　Reduce blocking and blurring in flat and texture areas：--aq-strength:AQ强度，减小低细节宏块的量化值。可选项：Weak、Normal、Strong。
　　默认值:Normal
　　Intra luma quantization deadzone：--deadzone-intra:设置intra模式下，亮度死区量化值，范围0－32。
　　默认值:11
　　Inter luma quantization deadzone：--deadzone-inter:设置inter模式下，亮度死区量化值，范围0－32；
　　默认值:21
　　Performs early skip detection in P-frames：关闭P帧快速跳过的检测。
　　默认值:Yes
　　建议:勾选No
　　（注意:勾选No后视屏参数中显示为：--no-fast-pskip！）
　　Eliminate DCT blocks with small coefficient：关闭P帧联合编码。关闭该项后可以增加细节，但也会增大体积。
　　默认值:Yes
　　建议:勾选No
　　（注意:勾选No后视屏参数中显示为：--no-dct-decimate！）
　　Noise reduction：--nr:噪声去除，范围0－100000。
　　默认值:0
　　Interlaced video content：--interlaced:启用纯交错模式。用于隔行扫描的源。
　　默认值:No
　　Global header：在基于码率的编码模式下 SPS和PPS只会在开头出现一次。许多播放器（如索尼的PSP）需要使用这一功能.默认会让PPS在每个阶段重复检测。
　　默认值:No
　　Use access unit delimiters：--aud:使用数据定义符号。
　　默认值:No
　　Enable picture timing data：允许画面启用定时数据。
　　默认值:No
　　Set SPS and PPS id number：--sps-id:设置SPS和PPS的ID值。
　　默认值:0
　　JM-compatible custom quant matrices file：--cqmfile:读取JM格式的外部量化矩阵文件。
　　默认值:空
　　（注意:如果设置了该选项x264会自动忽略其他--cqm选项）
　　编码线程与加速
　　Threads：--threads:编码线程，使用多线程技术。多核CPU可以选择自己的CPU核数加快编码速度。
　　默认值:0(自动)
　　Non-deterministic：--non-deterministic:非确定性。可以稍微减少多线程的开销。
　　默认值:Yes
　　Crop overscan setting：--overscan:过扫描线。可选项：
　　Undefined:不设置
　　Show:观看
　　Crop:去除
　　默认值:Undefined(不设置)
　　Video format：--videoformat:视频格式，有点像播放制式。
　　可选项：Component、Pal、Ntsc、Secam、Mac、Undefined.
　　默认值:Undefined
　　Full range samples setting：--fullrange:指定颜色全范围样本设置。
　　默认值:No
　　Color Primaries：--colorprim:原始色度格式。
　　默认值:空
　　Transfer characteristics：--transfer:转换方式。
　　默认值:空
　　Color matrix setting：--colormatrix:色度矩阵设置.
　　默认值:空
　　Chroma sample location：--chromaloc:色度样本指定，范围0－5。
　　默认值:0
　　（注意：以上画有波浪线的参数关系到MP4播放器能否正常播放，强烈列建议如果使用是MP4播放器不要设置以上画波浪线的参数，默认即可！）
　　Turbo Mode：在多次编码时通过降低Subpel refinement quality参数和Frames used as predictors in B and P frames参数从而加速第一次编码的速度。
　　可选项：
　　Disabled:禁止使用加速功能。
　　Reduce subq：保持Subpel refinement quality参数为用户设置参数不变，降低Frames used as predictors in B and P frames参数为1。
　　Reduce subq and frameref to 1:将Subpel refinement quality参数和Frames used as predictors in B and P frames参数都降低为1.
　　默认值:Reduce subq and frameref to 1
　　（注意：码速度Reduce subq and frameref to 1的编码速度大于Reduce subq大于Disabled；编码质量Disabled优于Reduce subq优于Reduce subq and frameref to 1！）
　　在音频选项栏中的参数设置及含义如下：
　　转换音频流：对原始音频进行编码。只有勾选该项后，才会启用编码器对原始音频进行编码。
　　建议:勾选
　　（注意：当转换音频流不勾选时，MediaCoder所转换的MP4-AVC是没有声音的！）

音频解码方式
　　来源：设置MediaCoder对原视频的音频解码时所使用的解码方式。可选项：Default、MPlayer、Mencoder、FFmpeg、Winamp Input Plugins、AviSynth、Lame MP3 Decoder、FLAC Decoder、WavPack Decoder、APE Decoder、Waveform File、Waveform Composer、CD Audio
　　建议:勾选自动选择
　　（注意：只有不勾选自动选择时才能选择以上解码方式，不正确的选择会导致文件转换失败！）
　　编码器：设置MediaCoder对视频的音频编码时所使用的编码器。可选项：Lame MP3、Vorbis、Nero Encoder、FAAC、CT AAC+、3GPP AAC+、Windows Media Audio、Helix MP3、Fraunhofer IIS MP3、MusePack、Speex、AMR、Ffmpeg、MEncoder、WavPack、FLAC、APE、TTA、ALS、OptimFROG、lossyWAV、Waveform、Stream Dumper、Generic CLI
　　建议:选择Nero Encoder
　　（注意：Fraunhofer IIS MP3和 AMR是没有安装的，用户如有需要，点击弹出的对话框中的确定后在自动弹出的网页中下载安装编码器。其他编码器中有少部分不能进行参数调整。要转换MP4-AVC建议选择Nero Encoder以防转换失败！）
　　复制音频流：当勾选参数时，MediaCoder不会对原始音频进行转换，而是直接无损提取。
　　建议:不勾选
　　（注意：只有勾选转换音频流时，复制音频流的设置才会有效！）
　　右边选区点击Nero Encoder选项栏进行音频质量的设置
　　规格：设置编码时所采用的编码规范。可选项：Auto、LC-AAC、HE-AAC、HE-AAC V2
　　建议:选择Auto
　　码率模式：设置MediaCoder对音屏编码时采用的编码方式。可选项：
　　1.Target Quality动态编码率（VBR）；
　　2.Target Bitrate平均编码率（ABR）；
　　3.CBR固定编码率（CBR）；
　　建议:选择Target Quality
　　码率/质量：设置音频编码器的的编码质量。当编码模式选择Target Bitrate或CBR时，范围8－320，数值越大音质越好，编码后的文件越大；当编码模式选择Target Quality时，范围0－100，数值越大音质越好。
　　建议:编码模式选择Target Quality时调整到60
　　(注意：选用Target Quality转换的音频文件的大小不可预测！)
　　Hint Track：增加音频索引。
　　建议:不勾选
　　音轨ID：当视频文件有多个音轨时（不是多个声道），可以选取不同的音轨。
　　建议:默认
　　外部文件：当转换时需要采用别的音频文件配音时，可以在添加需要转换的视频文件后，勾选该项并进行其他音频文件的选择。
　　建议:一般情况下不勾选
　　（注意：只有添加视频文件后才能启用该选项的设置！）
　　音轨模式选择
　　双音轨模式：当原视频文件包含两条音轨时，可将这两条音轨同时转换并封装。
　　建议:不勾选
　　分辨率：勾选该项后可以调整MP4-AVC的分辨率，由于PSP的最佳分辨率为480x272所以我们就设置为480x272即可。如果要转720x480的MP4-AVC请参照下面画面裁剪中加黑边的教程，或参照AVS脚本编写教程来加黑边，两者任选其一。
　　画面裁剪：默认：Disabled
　　双击Video Filters出现子选项后，先双击Scaling将Enable选项设置为true（左下角选择Yes）然后在Width（宽）和Height（高）中输入调整后的分辨率；
　　然后双击Expanding将Enable选项设置为true（左下角选择Yes）然后在Width（宽）和Height（高）中输入加黑边后的最终分辨率；
　　不使用黑边功能时将Expanding的Enable选项设置为false（左下角选择No）即可。
　　图中设置的实际含义：将画面调整为704x480再在左右两边各加8像素黑边（（720-704）÷2），变为720x480输出。
　　去除黑边：点击裁剪器在弹出的窗口中的模式中选择Auto Detect即可自动除去黑边。点击完成即可。
　　（注意：如果在使用AVS时，已经在脚本写入裁剪信息，那么以上裁剪设置忽略！）
　　帧率：调整MP4-AVC的帧率，不勾选则会采用原视频的帧率。
　　建议:不勾选
　　（注意:如果非要更改帧率，选择的帧率应该小于或等于原始文件的帧率，如果发现改变帧率后MP4-AVC的声音与画面不同步，那么就不要勾选该项！）
　　宽高比：设置转换后的视频文件的宽高比。
　　建议:不勾选
　　画面旋转：设置MP4-AVC播放时的画面方向。
　　默认值:不勾选
　　效果：可以实时显示正在编码的画面。
　　默认值:勾选
　　（注意:转换过程中效果画面不流畅、没有声音是正常现象。如果效果画面为一片漆黑，说明视频转换出错，请检查设置的参数是否正确！）
　　在声音选项栏中的参数设置及含义如下：
　　声道：设置转换后音频的声道数。可选项：Original、Mono（Left）、Mono（Right）、Stereo、4Channels、4.1Channels、5.1Channels
　　建议:选择Stereo
　　（注意：选择多声道会导致转换失败，因为音频选项中的来源如果选择自动，那么会优先使用Mencoder，Mencoder不支持多声道输出，且PSP不支持多声道MP4-AVC的播放！如果需要保留多声道，请在音频选项中的来源手动选择其他解码器，如MPlayer等！）
　　声道映射：勾选后可以将左声道映射到右声道，这样就可以将单声道转为立体声。
　　建议：根据自己的需要进行设置
　　（例如：影片在播放时同时有国语和其他语言时，可以将国语声道映射到非国语声道，这样转换后的MP4-AVC的声道依然会是立体声且为国语发声.）
　　输出声道数：设置映射后音频的声道数。
　　建议：如开启声道映射功能后选择2
　　音量：调整转换后声音过大或过小的问题。范围-200dB－60dB。该参数根据自己的实际情况及需要自行调整，声音过大就调整到0dB以下，相反，声音过小就调整到0dB以上。0dB是不进行任何调整。
　　音量自平衡：当无法把握音量参数时使用的选项。可选项：
　　Disabled：不使用；
　　Mode1：自动增大音量；
　　Mode2：自动减少音量；
　　建议：选择Disabled

你可能感兴趣的:(h.264,编解码)

如何实现视频数据的PES打包和传输？音视频牛哥软件开发音视频 ps打包数据 ps rtp ps H.264 gb28181 ps 大牛直播SDK
实现视频的PES（PacketizedElementaryStream）打包和传输涉及多个步骤，主要包括视频数据的编码、PES打包、以及通过网络协议的传输。以下是大概的实现思路：一、视频数据编码原始视频数据获取：获取需要传输的原始视频数据，这些数据可能来自摄像头、文件或其他视频源。视频编码：使用视频编码器（如H.264、H.265等）对原始视频数据进行编码，生成编码后的视频码流（ES，Elemen
freeswitch模块的介绍系列【codecs】【mod_ilbc】黄宝良 freeswitch 学习 linux 视频编解码音视频
ffreeswitch模块的介绍系列【编解码】【mod_ilbc】mod_ilbc文章目录ffreeswitch模块的介绍系列【编解码】【mod_ilbc】一、mod_ilbc是什么？二、使用步骤1.引入模块环境2.安装mod_ilbc模块2.FS导入模块总结一、mod_ilbc是什么？“mod_ilbc”是freeswitch忠低比特率编解码器（iLBC）模块，通常在电信和互联网协议语音（VoI
zobovision随谈H.265/HEVC编码FPGA实现（一） zobovision 视频图像编解码FPGA IP fpga开发视频编解码
zobovision随谈H.265/HEVC编码FPGA实现（一）H.265/HEVC出来已有10年，但市场应用难言巅峰，正如古董级的H.264现在仍然大行其道，H.265的全面应用仍有待市场发酵，至少在硬件产品端应用，值得期待。一来H.265相对H.264而言，压缩技术确实要先进不少，不管是理论上还是实际效果方面；二是H.265相对后来者H.266/VVC等而言，实用性更强，性价比更高，产品端的
8B10B编解码及FPGA实现 weixin_34309435
概述在使用ALTERA的高速串行接口时，GXB模块里硬件实现了8B10B编码，用户只是“傻瓜”式的使用，笔者也一直没有弄清楚。网上搜索了一些学习资料，结合参考文献希望能够对其进行消化。另外，ALTERA现在已经提供8B10BIP，用户可以直接使用，不过有时候为了代码可移植性需要自己写代码实现8B10B编解码，笔者希望在这方面也做些实践。8B10B编码概念基本概念网上可以轻易找到答案，简单的说就是将
音视频编解码技术（二）：AAC 音频编码技术音视频开发老马音视频开发流媒体服务器 Android音视频开发视频编解码音视频网络协议实时音视频网络
一、AAC编码概述AAC是高级音频编码（AdvancedAudioCoding）的缩写，出现于1997年，最初是基于MPEG-2的音频编码技术，目的是取代MP3格式。2000年，MPEG-4标准出台，AAC重新集成了其它技术包括SBR或PS特性，目前AAC可以定义为⼀种由MPEG-4标准定义的有损音频压缩格式二、AAC编码规格简述AAC共有9种规格，以适应不同的场合的需要：MPEG-2AACLC低
视频的容器格式和编码格式详解半桶水专家音视频音视频
视频的容器格式和编码格式是视频文件的两个核心概念，它们相互关联但具有不同的功能。以下是详细的解释：1.容器格式(ContainerFormat)容器格式，又称封装格式，指的是视频文件的外壳或容器，它用于封装视频、音频、字幕、元数据（如标题、章节信息等）等各种流媒体内容。容器格式本质上决定了文件的扩展名。常见的容器格式：MP4：支持多种编解码器，广泛用于互联网和移动设备。MKV：支持多轨音频、字幕，
OpenHarmony 5.0 纯血鸿蒙系统 ejinxian harmonyos 华为
OpenHarmony-v5.0-Beta1版本已于2024-06-20发布。OpenHarmony5.0Beta1版本标准系统能力持续完善，ArkUI完善了组件通过CAPI调用的能力；应用框架细化了生命周期管理能力，完善了应用拉起、跳转的能力；分布式软总线连接能力和规格进一步增强；媒体完善了框架能力、视频编解码能力、音视频的应用能力，媒体库丰富了使用场景，提供更好的使用体验。OpenHarmon
MT6769处理器规格参数_MTK联发科平台方案定制新移科技安卓核心板安卓开发板 MTK平台安卓手机主板 MTK联发科安卓主板定制 MT6769 4G核心板
MT6769安卓核心板具有集成的蓝牙、FM、WLAN和GPS模块，是一个高度集成的基带平台，结合了调制解调器和应用处理子系统，以支持LTE/LTE-A和C2K智能手机应用。该芯片集成了两个工作频率高达2.0GHz的ARM®Cortex-A75内核、六个工作频率高达1.70GHz的ARM®Cortex-A55内核和强大的多标准视频编解码器。此外，还包括一组广泛的接口和连接外围设备，用于连接相机、触摸
MTK6983/MT6983天玑9000芯片详细性能参数_MTK联发科5G方案定制新移科技 MTK平台 MTK方案安卓手机主板 MTK联发科安卓主板定制手机芯片天玑9000
联发科MT6983旗舰5G移动平台处理器集成了蓝牙、FM、WLAN和GPS模块，是一个高度集成的基带平台，集成了调制解调器和应用处理子系统，可支持LTE/LTE-A/NR和C2K智能手机应用。该芯片集成了四个Arm®Matterhorn(ELP)内核、四个Arm®Klein内核和强大的多标准视频编解码器。此外，还包括一组广泛的接口和连接外围设备，用于连接相机、触摸屏显示器和UFS/MMC/SD卡。
HTML5 ＜video＞常用属性、时间、方法及基础使用说明 Wu Youlu java 前端 javascript
简介HTML元素用于在文档中嵌入媒体播放器，用于支持文档内的视频播放。标签也可用于播放音频，但播放音频用更加适合。元素支持三种视频格式：MP4,WebM,和Ogg:MP4=带有H.264视频编码和AAC音频编码的MPEG4文件WebM=带有VP8视频编码和Vorbis音频编码的WebM文件Ogg=带有Theora视频编码和Vorbis音频编码的Ogg文件基础写法Yourbrowserdoesnot
FFMepg av_lockmgr_register 980205 ffmpeg
FFMpeg多路h.264视频用多线程播放有关问题怎么解决FFMpeg多路h.264视频用多线程播放问题如何解决本帖最后由x6wang于2014-10-1014:50:37编辑panfeng_87网友曾经发布过下列问题：“我用类接口的方式封装了ffmpeg，想的是每一个类的实例解码一路视频。类的其他部分没有对公共变量/全局变量的使用，但目前就是不知道ffmpeg中是否使用了一些全局资源或是相关的东
http请求特殊字符转码一阵可爱风
Java使用URLEncoder.encode和URLDecoder.decode编解码(utf-8)中文及特殊字符1、URLEncoder.encode和URLDecoder.decodeURL只能使用英文字母、阿拉伯数字和某些标点符号，不能使用其他文字和符号，即只有字母和数字[0-9a-zA-Z]、一些特殊符号$-_.+!*'()[不包括双引号]、以及某些保留字（空格转换为+），才可以不经过编
apache Mina分析小结（1(1) 2401_85125308 apache
IoAcceptoracceptor=newSocketAcceptor();IoServiceConfigconfig=acceptor.getDefaultConfig();//配置数据的编解码器config.getFilterChain().addLast("codec",newProtocolCodecFilter(newObjectSerializationCodecFactory())
rk3588音视频硬件编解码介绍三十度角阳光的问候音视频
目录ffmpegrk3588系列芯片编程方法最终的输出结果ffmpeg示例程序ffmpeg音视频处理中通常是用ffmpeg进行软件音视频编解码aac/h264编码，但其运行速度过慢消耗cpu占用率。因此需要寻找音视频硬件编解码方法。rk3588系列芯片自带音视频硬件编解码框架ffmedia或者mpp，其内部原理是配合内部硬件rga内存，把音视频数据读入内部rga内存中进行Mpp硬件编解码计算，包括
ffmpeg命令详解 weixin_42178492 java 基础工作相关经验集锦
ffmpeg命令详解(转)FFmpeg是一套可以用来记录、转换数字音频、视频，并能将其转化为流的开源计算机程序。采用LGPL或GPL许可证。它提供了录制、转换以及流化音视频的完整解决方案。它包含了非常先进的音频/视频编解码库libavcodec，为了保证高可移植性和编解码质量，libavcodec里很多code都是从头开发的。[百度百科]ffmpeg使用语法ffmpeg使用语法：ffmpeg[[o
播放此视频需要新的编解码器什么意思？解决方法来了爱分享的李同学音视频
播放此视频需要新的编解码器编解码器允许应用读取并播放不同文件。可以从MicrosoftStore下载该编解码器还要￥7.00解决方法：链接：https://pan.baidu.com/s/1ZmXNQHn_iAnmAtD6nBE06w?pwd=csvv提取码：csvv直接下载安装来自设备制造商的HEVC扩展就可以解决啦
通俗易懂地解析G711编解码流程与实现(二） Crazy learner 音频基础 g711 语音识别人工智能
目录G711编码的基础概念A律编码vs.μ律编码编解码的实际操作4.实际项目中的应用总结G711编码标准是一个专门用于语音信号压缩的技术。它通过对语音信号进行压缩，减少数据的大小，从而更有效地传输语音。这篇文章将通过简单易懂的方式，带你深入理解G711编解码的流程与实现。G711编码的基础概念要理解G711编码，首先要知道为什么要进行编码。在语音通信中，原始语音信号是以线性PCM（脉冲编码调制）形
javacv从入门到精通——第三章：基本使用 ayou_llf javacv java opencv 语音识别音视频视频编解码
了解javacv的基本结构JavaCV的基本结构如下：JavaCV核心类：JavaCV核心类是JavaCV库的核心，它包括了JavaCV的所有功能和特性，可以用来进行计算机视觉和人工智能任务的开发和实现。JavaCV核心类的主要功能包括：视频捕获、视频编解码、图像处理、人脸检测、特征提取等。基本数据类型：JavaCV库支持多种基本数据类型，包括整数、浮点数、布尔类型等，这些基本数据类型是进行计算机
FFmpeg源码解析系列（一）目录和编译头快撑不住了 FFmpeg 源码解析 ffmpeg 音视频视频编解码实时音视频图像处理
引言当我们欣赏一部电影、观看一段视频或者享受一首音乐时，很少有人会停下来思考这一切是如何呈现在我们眼前的。然而，在每一帧的画面、每一秒的声音背后，有着一个不可思议的技术世界这个充满音视频的世界的核心之一，就是FFmpeg。FFmpeg是一个强大而复杂的多媒体处理工具，它为视频和音频编解码、流媒体传输、格式转换等提供了优秀的解决方案。在这个系列博客中，我们将深入探讨FFmpeg源码，解析它的工作原理
HLS点播实现（H.264和AAC码流）辉辉岁月
前言VideoToolbox硬编码H.264使用AudioToolbox编码AAC使用AudioToolbox播放AAC在前面我们介绍了从麦克风采集声音并用AudioToolbox编码成AAC码流和从摄像头采集图像并用VideoToolbox编码成H.264码流，这次我们不使用VideoToolbox和AudioToolbox播放音视频，而是把这两个格式的文件打包成TS流，并用通过HLS协议在浏览
PCM、PCMA和PCMU之间区别与转换 yaoao214 音频编码
一、三者优缺点1.PCM优点：压缩比小(CD音质>400kbps)，编解码延时短缺点:声音质量一般2.PCMA优点：语音质量优缺点：占用的带宽较高3.PCMU优点：语音质量优（PCMU>PCMA）缺点：占用的带宽较高二、相互转换获取原始录音字节流数据并转换成相应音频格式编码的字节数据PCM转PCMAstaticbytelinear2alaw(shortpcm_val){shortmask;shor
高版本Chrome网页直接播放海康威视大华RTSP流方案，不需服务器转码转流，支持H.265、H.264及2K/4K高清视频 bubailai Chrome RTSP chrome rtsp vue.js 前端
近期公司在做一个智慧城市项目，需要在高版本Chrome网页播放海康威视、大华、或者华为摄像头RTSP流，于是在网上开始找对应的解决方案，没想到网上各种转码转流方案纷繁复杂，找到一款稳定商用满足需求的很难！目前网上有两种所谓无插件方案，即后端转码前端播放的方法和后端转流前端转码的方案，虽然无插件播放方案能够播放出画面，但是往往延迟很高，基本上都在数秒之久，在一些对延迟敏感的场合客户要求毫秒级延迟，显
MT6762_联发科MTK6762安卓核心板规格参数深圳智物通讯 MT6762 MTK6762 安卓核心板
MTK6762核心板是一款集成了蓝牙、fm、wlan和gps模块的高度集成基带平台，为LTE/LTE-A和C2K智能手机应用程序提供支持。该安卓核心板集成了ARMCortex-A53处理器，工作频率可达2.0GHz，并且还集成了功能强大的多标准视频编解码器。除此之外，它还提供了一系列广泛的接口，可以连接外围设备，包括摄像头、触摸屏显示器和mmc/sd卡等。MTK6762安卓核心板是一款高性能低功耗
使用OpenCV库来捕获摄像头视频流，并按指定格式保存不是浮云笙基础常见知识 opencv 计算机视觉
今天我们来使用OpenCV库来捕获摄像头视频流，并将其保存为AVI格式的视频文件，代码的主要功能包括：初始化摄像头捕获对象。设置视频编解码器和输出文件路径。循环读取视频帧，处理并保存到文件中。显示处理后的视频帧。按下'q'键退出程序。释放资源并关闭所有窗口。运行环境需要安装OpenCV库，可以通过pipinstallopencv-python安装。下面这份代码的保存视频的格式是AVIimportn
R7RS标准之重要特性及用法实例(三十九) Android系统攻城狮 R7RS标准重要特性
简介：CSDN博客专家，专注Android/Linux系统，分享多mic语音方案、音视频、编解码等技术，与大家一起成长！新书发布：《Android系统多媒体进阶实战》优质专栏：Audio工程师进阶系列【原创干货持续更新中……】优质专栏：多媒体系统工程师系列【原创干货持续更新中……】优质视频课程：AAOS车载系统+AOSP14系统攻城狮入门视频实战课人生格言：人生从来没有捷径，只有行动才是治疗恐惧和
高效的PNG编码与解码库LodePNG 工头阿乐图像处理图像处理
图像编解码文章目录图像编解码高效的PNG编码与解码库技术分析应用场景高效的PNG编码与解码库是由LouisvanderVeer开发的一个开源C++库，用于处理PNG（PortableNetworkGraphics）图像文件。它提供了无损PNG图片的编码和解码功能，并以简单、高效和高度灵活的设计而受到开发者们的欢迎。这篇文章将深入介绍LodePNG的技术特性、应用场景以及它的优势。官网：https:
FFmpeg和SDL的关系星海逐愿随笔 ffmpeg
SDL（SimpleDirectMediaLayer）和FFmpeg是两个在多媒体开发中常用的开源库，但它们各自的功能和用途有所不同，通常一起使用以实现完整的多媒体处理和播放解决方案。1.FFmpeg的作用FFmpeg是一个强大的多媒体框架，用于录制、转换和流式传输音视频。它包含了大量的音视频编解码器和格式支持，可以处理几乎所有已知的多媒体格式。FFmpeg主要用于：视频解码和编码：将视频文件解码
6、Python入门——文件操作记得多吃点 Python基础 python 开发语言
操作文件前言一、读文件1.文件的路径写法2.读文件的函数1.按长度读取文件2.按行读取文件3.读取文件中的中文二、写文件三、复制文件1.拷贝文件2.备份文件3.借助OS模块实现文件备份四、拓展语法（with-open）五、补充编解码总结前言内存中存放的数据在计算机关机后就会消失。要长久保存数据，就要使用硬盘、光盘、U盘等设备。为了便于数据的管理和检索，引入了文件的概念。在日常生活中，文件操作主要包
部署到Heroku时，UnicodeDecodeError：utf-8；#39；编解码器无法解码位置0中的字节0xff 潮易 python 机器人
当您在部署Python应用程序到Heroku时遇到UnicodeDecodeError：utf-8编解码器无法解码位置0中的字节0xff错误，这通常是因为您的应用程序在读取或写入文件时使用了不支持的编码格式。为了解决这个问题，您可以按照以下步骤操作：1.确认您的代码中处理文件时的编码方式。默认情况下，Python可能会使用系统的默认编码（如'ascii'或'utf-8'），但是如果您的数据是以其他
【论文解读】Macroblock Level Rate Control for Low Delay H.264/AVC based Video Communication Codec Conductor 论文解读 #x264 h.264 x264 音视频码率控制视频编解码 AVC
级别：IEEE时间：2015作者：MinGao等机构：哈尔滨工业大学下载：MacroblockLevelRateControlforLowDelayH.264/AVCbasedVideoCommunication摘要算法目的：提出了一种针对低延迟H.264/AVC视频通信的宏块（MB）级别速率控制算法。算法基础：基于ρ域速率模型，该模型涉及量化后零变换系数的百分比（ρ）。关键技术：使用指数模型来描
312个免费高速HTTP代理IP（能隐藏自己真实IP地址） yangshangchuan 高速免费 superword HTTP代理
124.88.67.20:843 190.36.223.93:8080 117.147.221.38:8123 122.228.92.103:3128 183.247.211.159:8123 124.88.67.35:81 112.18.51.167:8123 218.28.96.39:3128 49.94.160.198:3128 183.20
pull解析和json编码百合不是茶 android pull解析 json
n.json文件: [{name:java,lan:c++,age:17},{name:android,lan:java,age:8}] pull.xml文件 <?xml version="1.0" encoding="utf-8"?> <stu> <name>java
[能源与矿产]石油与地球生态系统 comsci 能源
按照苏联的科学界的说法,石油并非是远古的生物残骸的演变产物,而是一种可以由某些特殊地质结构和物理条件生产出来的东西,也就是说,石油是可以自增长的.... 那么我们做一个猜想: 石油好像是地球的体液,我们地球具有自动产生石油的某种机制,只要我们不过量开采石油,并保护好
类与对象浅谈沐刃青蛟 java 基础
类，字面理解，便是同一种事物的总称，比如人类，是对世界上所有人的一个总称。而对象，便是类的具体化，实例化，是一个具体事物，比如张飞这个人，就是人类的一个对象。但要注意的是：张飞这个人是对象，而不是张飞，张飞只是他这个人的名字，是他的属性而已。而一个类中包含了属性和方法这两兄弟，他们分别用来描述对象的行为和性质（感觉应该是
新站开始被收录后，我们应该做什么？ IT独行者 PHP seo
新站开始被收录后，我们应该做什么？百度终于开始收录自己的网站了，作为站长，你是不是觉得那一刻很有成就感呢，同时，你是不是又很茫然，不知道下一步该做什么了？至少我当初就是这样，在这里和大家一份分享一下新站收录后，我们要做哪些工作。至于如何让百度快速收录自己的网站，可以参考我之前的帖子《新站让百
oracle 连接碰到的问题文强chu oracle
Unable to find a java Virtual Machine－－安装64位版Oracle11gR2后无法启动SQLDeveloper的解决方案作者：草根IT网来源：未知人气：813标签：导读：安装64位版Oracle11gR2后发现启动SQLDeveloper时弹出配置java.exe的路径，找到Oracle自带java.exe后产生的路径“C:\app\用户名\prod
Swing中按ctrl键同时移动鼠标拖动组件（类中多借口共享同一数据）小桔子 java 继承 swing 接口监听
都知道java中类只能单继承，但可以实现多个接口，但我发现实现多个接口之后，多个接口却不能共享同一个数据，应用开发中想实现：当用户按着ctrl键时，可以用鼠标点击拖动组件，比如说文本框。编写一个监听实现KeyListener,NouseListener,MouseMotionListener三个接口，重写方法。定义一个全局变量boolea
linux常用的命令 aichenglong linux 常用命令
1 startx切换到图形化界面 2 man命令:查看帮助信息 man 需要查看的命令,man命令提供了大量的帮助信息,一般可以分成4个部分 name:对命令的简单说明 synopsis:命令的使用格式说明 description:命令的详细说明信息 options:命令的各项说明 3 date:显示时间语法：date [OPTION]... [+FORMAT]
eclipse内存优化 AILIKES java eclipse jvm jdk
一基本说明在JVM中，总体上分2块内存区,默认空余堆内存小于 40%时，JVM就会增大堆直到-Xmx的最大限制；空余堆内存大于70%时，JVM会减少堆直到-Xms的最小限制。 1)堆内存(Heap memory):堆是运行时数据区域，所有类实例和数组的内存均从此处分配,是Java代码可及的内存，是留给开发人
关键字的使用探讨百合不是茶关键字
//关键字的使用探讨/*访问关键词private 只能在本类中访问public 只能在本工程中访问protected 只能在包中和子类中访问默认的只能在包中访问*//*final 类方法变量 final 类不能被继承 final 方法不能被子类覆盖，但可以继承 final 变量只能有一次赋值，赋值后不能改变 final 不能用来修饰构造方法*///this()
JS中定义对象的几种方式 bijian1013 js
1. 基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)： <html> <head> <title>基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)</title> </head> <script> var obj = new Object();
表驱动法实例 bijian1013 java 表驱动法 TDD
获得月的天数是典型的直接访问驱动表方式的实例，下面我们来展示一下： MonthDaysTest.java package com.study.test; import org.junit.Assert; import org.junit.Test; import com.study.MonthDays; public class MonthDaysTest { @T
LInux启停重启常用服务器的脚本 bit1129 linux
启动，停止和重启常用服务器的Bash脚本，对于每个服务器，需要根据实际的安装路径做相应的修改 #! /bin/bash Servers=(Apache2, Nginx, Resin, Tomcat, Couchbase, SVN, ActiveMQ, Mongo); Ops=(Start, Stop, Restart); currentDir=$(pwd); echo
【HBase六】REST操作HBase bit1129 hbase
HBase提供了REST风格的服务方便查看HBase集群的信息，以及执行增删改查操作 1. 启动和停止HBase REST 服务 1.1 启动REST服务前台启动（默认端口号8080） [hadoop@hadoop bin]$ ./hbase rest start 后台启动 hbase-daemon.sh start rest 启动时指定
大话zabbix 3.0设计假设 ronin47
What’s new in Zabbix 2.0? 去年开始使用Zabbix的时候，是1.8.X的版本，今年Zabbix已经跨入了2.0的时代。看了2.0的release notes，和performance相关的有下面几个： :: Performance improvements::Trigger related da
http错误码大全 byalias http协议 javaweb
响应码由三位十进制数字组成，它们出现在由HTTP服务器发送的响应的第一行。响应码分五种类型，由它们的第一位数字表示： 1）1xx：信息，请求收到，继续处理 2）2xx：成功，行为被成功地接受、理解和采纳 3）3xx：重定向，为了完成请求，必须进一步执行的动作 4）4xx：客户端错误，请求包含语法错误或者请求无法实现 5）5xx：服务器错误，服务器不能实现一种明显无效的请求
J2EE设计模式-Intercepting Filter bylijinnan java 设计模式数据结构
Intercepting Filter类似于职责链模式有两种实现其中一种是Filter之间没有联系，全部Filter都存放在FilterChain中，由FilterChain来有序或无序地把把所有Filter调用一遍。没有用到链表这种数据结构。示例如下： package com.ljn.filter.custom; import java.util.ArrayList;
修改jboss端口 chicony jboss
修改jboss端口 %JBOSS_HOME%\server\{服务实例名}\conf\bindingservice.beans\META-INF\bindings-jboss-beans.xml 中找到 <!-- The ports-default bindings are obtained by taking the base bindin
c++ 用类模版实现数组类 CrazyMizzz C++
最近c++学到数组类，写了代码将他实现，基本具有vector类的功能 #include<iostream> #include<string> #include<cassert> using namespace std; template<class T> class Array { public: //构造函数
hadoop dfs.datanode.du.reserved 预留空间配置方法 daizj hadoop 预留空间
对于datanode配置预留空间的方法为：在hdfs-site.xml添加如下配置 <property> <name>dfs.datanode.du.reserved</name> <value>10737418240</value>
mysql远程访问的设置 dcj3sjt126com mysql 防火墙
第一步: 激活网络设置你需要编辑mysql配置文件my.cnf. 通常状况，my.cnf放置于在以下目录： /etc/mysql/my.cnf (Debian linux) /etc/my.cnf （Red Hat Linux/Fedora Linux) /var/db/mysql/my.cnf (FreeBSD) 然后用vi编辑my.cnf，修改内容从以下行： [mysqld] 你所需要: 1
ios 使用特定的popToViewController返回到相应的Controller dcj3sjt126com controller
1、取navigationCtroller中的Controllers NSArray * ctrlArray = self.navigationController.viewControllers; 2、取出后，执行， [self.navigationController popToViewController:[ctrlArray objectAtIndex:0] animated:YES
Linux正则表达式和通配符的区别 eksliang 正则表达式通配符和正则表达式的区别通配符
转载请出自出处：http://eksliang.iteye.com/blog/1976579 首先得明白二者是截然不同的通配符只能用在shell命令中,用来处理字符串的的匹配。判断一个命令是否为bash shell(linux 默认的shell)的内置命令 type -t commad 返回结果含义 file 表示为外部命令 alias 表示该
Ubuntu Mysql Install and CONF gengzg Install
http://www.navicat.com.cn/download/navicat-for-mysql Step1: 下载Navicat ，网址：http://www.navicat.com/en/download/download.html Step2：进入下载目录，解压压缩包：tar -zxvf navicat11_mysql_en.tar.gz
批处理，删除文件bat huqiji windows dos
@echo off ::演示：删除指定路径下指定天数之前（以文件名中包含的日期字符串为准）的文件。 ::如果演示结果无误，把del前面的echo去掉，即可实现真正删除。 ::本例假设文件名中包含的日期字符串（比如：bak-2009-12-25.log） rem 指定待删除文件的存放路径 set SrcDir=C:/Test/BatHome rem 指定天数 set DaysAgo=1
跨浏览器兼容的HTML5视频音频播放器天梯梦 html5
HTML5的video和audio标签是用来在网页中加入视频和音频的标签，在支持html5的浏览器中不需要预先加载Adobe Flash浏览器插件就能轻松快速的播放视频和音频文件。而html5media.js可以在不支持html5的浏览器上使video和audio标签生效。 How to enable <video> and <audio> tags in
Bundle自定义数据传递 hm4123660 android Serializable 自定义数据传递 Bundle Parcelable
我们都知道Bundle可能过put****()方法添加各种基本类型的数据，Intent也可以通过putExtras(Bundle)将数据添加进去，然后通过startActivity()跳到下一下Activity的时候就把数据也传到下一个Activity了。如传递一个字符串到下一个Activity 把数据放到Intent
C＃：异步编程和线程的使用（.NET 4.5 ） powertoolsteam .net 线程 C#异步编程
异步编程和线程处理是并发或并行编程非常重要的功能特征。为了实现异步编程，可使用线程也可以不用。将异步与线程同时讲，将有助于我们更好的理解它们的特征。本文中涉及关键知识点 1. 异步编程 2. 线程的使用 3. 基于任务的异步模式 4. 并行编程 5. 总结异步编程什么是异步操作？异步操作是指某些操作能够独立运行，不依赖主流程或主其他处理流程。通常情况下，C＃程序
spark 查看 job history 日志 Stark_Summer 日志 spark history job
SPARK_HOME/conf 下: spark-defaults.conf 增加如下内容 spark.eventLog.enabled true spark.eventLog.dir hdfs://master:8020/var/log/spark spark.eventLog.compress true spark-env.sh 增加如下内容 export SP
SSH框架搭建 wangxiukai2015eye spring Hibernate struts
MyEclipse搭建SSH框架 Struts Spring Hibernate 1、new一个web project。 2、右键项目，为项目添加Struts支持。选择Struts2 Core Libraries -<MyEclipes-Library> 点击Finish。src目录下多了struts