音视频学习基础篇1-音视频基础概念

一、视频是什么?

动画书不知道大家小时候是否玩过一种动画小人书,连续翻动的时候,小人书的画面就会变成一个动画,类似现在的gif格式图片。本来是一本静态的小人书,通过翻动以后,就会变成一个有趣的小动画,如果画面够多,翻动速度够快的话,这其实就是一个小视频。而视频的原理正是如此,由于人类眼睛的特殊结构,画面快速切换时,画面会有残留,感觉起来就是连贯的动作。所以,视频就是由一系列图片构成的。

视频帧

帧,是视频的一个基本概念,表示一张画面,如上面的翻页动画书中的一页,就是一帧。一个视频就是由许许多多帧组成的。

码率

码率,即视频文件在单位时间内使用的数据流量,也叫做码流率,单位为 kb/s。码率越大说明单位时间内的取样率越大,数据精度就越高。比如说一帧原来需要10000位来代表,现在只需要用300,其实就是一个像素压缩技术把码率变小

帧率

帧率,即单位时间内帧的数量,单位为:帧/秒 或fps(frames per second)。如动画书中,一秒内包含多少张图片,图片越多,画面越顺滑,过渡越自然。帧率的一般以下几个典型值:24/25 fps:1秒 24/25 帧,一般的电影帧率。30/60 fps:1秒 30/60 帧,游戏的帧率,30帧可以接受,60帧会感觉更加流畅逼真。85 fps以上人眼基本无法察觉出来了,所以更高的帧率在视频里没有太大意义。

综上结论,可以理解为 码率代表清晰度,帧率代表流畅度

分辨率

分辨率可以理解为视频或者图片的大小

市面上常见的就是720p,1080p,2k,4k

720p指的是1280*720   横向1280个像素  和 竖向720个像素组成

1080p指的是1920*1080

2k通常指的是2560*1440

4k通常指的是4090*2440  但是有其他的分辨率标准


色彩空间这里我们只讲常用到的两种色彩空间。

RGB

RGB的颜色模式应该是我们最熟悉的一种,在现在的电子设备中应用广泛。通过R G B三种基础色,可以混合出所有的颜色 

YUV

这里着重讲一下YUV,这种色彩空间并不是我们熟悉的。这是一种亮度与色度分离的色彩格式。早期的电视都是黑白的,即只有亮度值,即Y。有了彩色电视以后,加入了UV两种色度,形成现在的YUV,也叫YCbCr。Y:亮度,就是灰度值。除了表示亮度信号外,还含有较多的绿色通道量。U:蓝色通道与亮度的差值。V:红色通道与亮度的差值。

采用YUV有什么优势呢?

人眼对亮度敏感,对色度不敏感,因此减少部分UV的数据量,人眼却无法感知出来,这样可以通过压缩UV的分辨率,在不影响观感的前提下,减小视频的体积。

RGB和YUV的换算

Y = 0.299R + 0.587G + 0.114B 

U = -0.147R - 0.289G + 0.436B

V = 0.615R - 0.515G - 0.100B

R = Y + 1.14V

G = Y - 0.39U - 0.58V

B = Y + 2.03U 

二、音频是什么?

音频数据的承载方式最常用的是脉冲编码调制,即PCM。

在自然界中,声音是连续不断的,是一种模拟信号,那怎样才能把声音保存下来呢?那就是把声音数字化,即转换为数字信号。 

我们知道声音是一种波,有自己的振幅和频率,那么要保存声音,就要保存声音在各个时间点上的振幅。

采样的频率 

每秒钟采样点的个数,常用的采样频率:

22000 (22kHz)  无线广播

44100 (44kHz) CD音质

48000 (48kHz) 数字电视,DVD

96000 (96kHz) 蓝光,高清DVD

192000 (192kHz) 蓝光,高清DVD

采样精度(位深)

每个样本点的大小,常用的精度: 8bit,16bit,24bit

通道数

单声道,双声道,四声道,5.1声道

比特率 

比特率 = 采样频率 * 采样精度 * 通道数  单位:bps

你可能感兴趣的:(音视频学习基础篇1-音视频基础概念)