Compressed Video Action Recognition待续

视 频 分 成 内 部 编 码 帧 I − f r a m e s 和 预 测 帧 P − f r a m e s , 以 及 0 个 或 者 多 个 双 向 帧 B − f r a m e s 视频分成内部编码帧I-frames和预测帧P-frames,以及0个或者多个双向帧B-frames IframesPframes,0Bframes
内 部 编 码 帧 I − f r a m e s 是 正 常 的 图 片 , P − f r a m e s 是 和 上 一 帧 有 关 系 的 , 但 是 只 解 码 两 帧 之 间 的 变 化 的 , 这 个 变 化 就 叫 运 动 向 量 , 是 代 表 t 时 间 内 原 帧 到 目 的 帧 之 间 的 像 素 块 的 移 动 , 用 T ( t ) 表 示 。 内部编码帧I-frames 是正常的图片,P-frames是和上一帧有关系的,但是只解码两帧之间的变化的,这个变化就叫运动向量,是代表t时间内原帧到目的帧之间的像素块的移动,用T(t)表示。 IframesPframestT(t)
Δ ( t ) 代 表 原 图 和 预 测 图 之 间 的 区 别 , 称 之 为 残 差 区 别 , 这 样 重 建 P 帧 的 式 子 为 \Delta^{(t)}代表原图和预测图之间的区别,称之为残差区别,这样重建P帧的式子为 Δ(t)P
I i ( t ) = I i − T i ( t ) t − 1 + Δ i ( t ) , i 为 像 素 , I ( t ) 代 表 时 间 t 的 R G B 图 像 , I_i^{(t)}=I_{i-T_i^{(t)}}^{t-1}+\Delta_i^{(t)},i为像素,I^{(t)}代表时间t的RGB图像, Ii(t)=IiTi(t)t1+Δi(t),iI(t)tRGB

你可能感兴趣的:(Compressed Video Action Recognition待续)