原始代码:
T264_macroblock_write_cavlc_P(T264_t *t) // 在 DM642 中 不可以 实现 -03 优化
{ // 只能实现 -01 优化
int i;
// case MB_16x16
eg_write_ue(t->bs, MB_16x16);
eg_write_se(t->bs, t->mb->mvd[0][0]); // 直接调用不利于编译器优化
eg_write_se(t->bs, t->mb->mvd[0][1]);
。。。。。。。
}
改进后的代码:
T264_macroblock_write_cavlc_P(T264_t *t) // 在 DM642 中 可以 实现 -03 优化
{
int i;
int mvdx,mvdy;
mvdx = t->mb->mvd[0][0];// 将数据下载到本地变量,有利于编译器优化,加速度
mvdy = t->mb->mvd[0][1];
// case MB_16x16
eg_write_ue(t->bs, MB_16x16);
eg_write_se(t->bs, mvdx);
eg_write_se(t->bs, mvdy);
。。。。。。。
}
注意:
如果在一个函数中需要定义一个很大的结构体,而在程序中只访问该结构体的少数几个成员变量(该变量基本数据类型),这时候可以定义少数几个变量(该变量基本数据类型)来代替结构体。这样可以便于程序实现 寄存器 优化,因为对结构体是无法实现寄存器优化的。
typedef struct // T264_vector_t 是一个很大的结构体
{
int16_t refno;
int16_t x;
int16_t y;
。。。。。。。。。
。。。。。。。。。
} T264_vector_t;
原始代码:
T264_encode_inter_uv(_RW T264_t* t,uint8_t * search_u,uint8_t * search_v)
{
T264_vector_t vec; // T264_vector_t 是一个很大的结构体
vec = t->mb->vec[0];
。。。。。。。。
。。。。。。。。
}
改进后的代码:
T264_encode_inter_uv(_RW T264_t* t,uint8_t * search_u,uint8_t * search_v)
{
// T264_vector_t vec; // T264_vector_t 是一个很大的结构体
int16_t vec_x; // 用整型变量代替结构体变量,便于编译器实现寄存器优化
int16_t vec_y;
// vec = t->mb->vec[0];
vec_x = t->mb->vec[0].x;
vec_y = t->mb->vec[0].y;
。。。。。。。。
。。。。。。。。
}