知乎Live:计算机视觉从入门到放肆(对自己不理解的知识点进行了补充)

知乎Live:计算机视觉从入门到放肆(对自己不理解的知识点进行了补充)_第1张图片
知乎Live:计算机视觉从入门到放肆(对自己不理解的知识点进行了补充)_第2张图片
知乎Live:计算机视觉从入门到放肆(对自己不理解的知识点进行了补充)_第3张图片
知乎Live:计算机视觉从入门到放肆(对自己不理解的知识点进行了补充)_第4张图片
知乎Live:计算机视觉从入门到放肆(对自己不理解的知识点进行了补充)_第5张图片
知乎Live:计算机视觉从入门到放肆(对自己不理解的知识点进行了补充)_第6张图片
上图基础概念解析:

图像深度:

图像深度是指存储每个像素所用的位数,也用于度量图像的色彩分辨率.图像深度确定彩色图像的每个像素可能有的颜色数,或者确定灰度图像的每个像素可能有的灰度级数.它决定了彩色图像中可出现的最多颜色数,或灰度图像中的最大灰度等级.比如一幅单色图像,若每个象素有8位,则最大灰度数目为2的8次方,即256.一幅彩色图像RGB3个分量的象素位数分别为4,4,2,则最大颜色数目为2的4+4+2次方,即1024,就是说像素的深度为10位,每个像素可以是1024种颜色中的一种.

例如:一幅画的尺寸是1024*768,深度为16,则它的数据量为1.5M。

计算如下:1024*768*16bit=(1024*768*16)/8字节=[(1024*768*16)/8]/1024KB={[(1024*768*16)/8]/1024}/1024MB。

通道数:

一幅完整的图像,红色绿色蓝色三个通道缺一不可。即使图像中看起来没有蓝色,只能说蓝色光的亮度均为0或者各像素值的红色和绿色通道不全为0,但不能说没有蓝色通道存在。

"存在、亮度为零"和"不存在"是两个不同的概念。

图像压缩格式:


知乎Live:计算机视觉从入门到放肆(对自己不理解的知识点进行了补充)_第7张图片

图像颜色模式:

(转自:http://blog.sina.com.cn/s/blog_54573df10101bjpd.html)
在进行图形图像处理时,色彩模式以建立好的描述和重现色彩的模型为基础,每一种模式都有它自己的特点和适用范围,用户可以按照制作要求来确定色彩模式,并且可以根据需要在不同的色彩模式之间转换。下面,介绍一些常用的色彩模式的概念。

  1. RGB色彩模式

自然界中绝大部分的可见光谱可以用红、绿和蓝三色光按不同比例和强度的混合来表示。RGB分别代表着3种颜色:R代表红色,G代表绿色、B代表蓝色。RGB模型也称为加色模型,如图5所示。RGB模型通常用于光照、视频和屏幕图像编辑。

  RGB色彩模式使用RGB模型为图像中每一个像素的RGB分量分配一个0~255范围内

  的强度值。例如:纯红色R值为255,G值为0,B值为0;灰色的R、G、B三个值相等(除了0和255);白色的R、G、B都为255;黑色的R、G、B都为0。RGB图像只使用三种颜色,就可以使它们按照不同的比例混合,在屏幕上重现16581375种颜色。

  2. CMYK色彩模式

  CMYK色彩模式以打印油墨在纸张上的光线吸收特性为基础,图像中每个像素都是由靛青(C)、品红(M)、黄(Y)和黑(K)色按照不同的比例合成。每个像素的每种印刷油墨会被分配一个百分比值,最亮(高光)的颜色分配较低的印刷油墨颜色百分比值,较暗(暗调)的颜色分配较高的百分比值。例如,明亮的红色可能会包含2%青色、93%洋红、90%黄色和0%黑色。在 CMYK 图像中,当所有4种分量的值都是0%时,就会产生纯白色。CMYK色彩模式的图像中包含四个通道,如图6所示。我们所看见的图形是由这4个通道合成的效果。

  在制作用于印刷色打印的图像时,要使用CMYK色彩模式。RGB色彩模式的图像转换成CMYK色彩模式的图像会产生分色。如果您使用的图像素材为RGB色彩模式,最好在编辑完成后再转换为CMYK色彩模式。

  3. HSB色彩模式

HSB色彩模式是根据日常生活中人眼的视觉特征而制定的一套色彩模式,最接近于人类对色彩辨认的思考方式。HSB色彩模式以色相(H)、饱和度(S)和亮度(B)描述颜色的基本特征。

  色相指从物体反射或透过物体传播的颜色。在0到360度的标准色轮上,色相是按位置计量的。在通常的使用中,色相由颜色名称标识,比如红、橙或绿色。

  饱和度是指颜色的强度或纯度,用色相中灰色成分所占的比例来表示,0%为纯灰色,100%为完全饱和。在标准色轮上,从中心位置到边缘位置的饱和度是递增的。

  亮度是指颜色的相对明暗程度,通常将0%定义为黑色,100%定义为白色。

  HSB色彩模式比前面介绍的两种色彩模式更容易理解。但由于设备的限制,在计算机屏幕上显示时,要转换为RGB模式,作为打印输出时,要转换为CMYK模式。这在一定程度上限制了HSB模式的使用。

  4. Lab色彩模式

Lab色彩模式由光度分量(L)和两个色度分量组成,这两个分量即a分量(从绿到红)和b分量(从蓝到黄),如图8所示。Lab色彩模式与设备无关,不管使用什么设备(如显示器、打印机或扫描仪)创建或输出图像,这种色彩模式产生的颜色都保持一致。

  Lab色彩模式通常用于处理Photo CD(照片光盘)图像、单独编辑图像中的亮度和颜色值、在不同系统间转移图像以及打印到PostScript(R)Level 2和Level 3打印机。

  5. Indexed Color(索引)色彩模式

  索引色彩模式最多使用256种颜色,当您将图像转换为索引色彩模式时,通常会构建一个调色板存放并索引图像中的颜色。如果原图像中的一种颜色没有出现在调色板中,程序会选取已有颜色中最相近的颜色或使用已有颜色模拟该种颜色。

  在索引色彩模式下,通过限制调色板中颜色的数目可以减小文件大小,同时保持视觉上的品质不变。在网页中常常需要使用索引模式的图像。

  6. Bitmap(位图)色彩模式

  位图模式的图像只有黑色与白色两种像素组成,每一个像素用“位”来表示。“位”只有两种状态:0表示有点,1表示无点。位图模式主要用于早期不能识别颜色和灰度的设备。如果需要表示灰度,则需要通过点的抖动来模拟。

  位图模式通常用于文字识别,如果扫描需要使用OCR(光学文字识别)技术识别的图像文件,须将图像转化为位图模式。

  7. Grayscale(灰度)色彩模式

  灰度模式最多使用256级灰度来表现图像,图像中的每个像素有一个0(黑色)到255(白色)之间的亮度值。灰度值也可以用黑色油墨覆盖的百分比来表示(0%表示白色,100%表示黑色)。

  在将彩色图像转换灰度模式的图像时,会扔掉原图像中所有的色彩信息。与位图模式相比,灰度模式能够更好地表现高品质的图像效果。

  需要注意的是,尽管一些图像处理软件允许您将一个灰度模式的图像重新转换为彩色模式的图像,但转换后不可能将原先丢失的颜色恢复,您只能为图像重新上色。所以,在将彩色模式的图像转换为灰度模式的图像时,应尽量保留备份文件。

ALL-I和IPB编码方式:

ALL-I和IPB指的是编码方式,画面凭肉眼是很难看出差别的。

我们知道,视频是由一帧帧图像组成,最理想的状态是每一帧都记录着最高的画面信息量,但是这种“完整”的记录方式得到的数据量是异常庞大的,要想适应主流的传输带宽和储存容量就必需想办法把数据量压缩,同时又要减少画面质量的牺牲,这时候ALL-I和IPB两类压缩编码方式就应运而生了。

ALL-I称为帧内压缩,属于只针对每一帧图像来压缩的方式,就像我们用PS处理图片时,可以在不影响画面效果的同时把图片体积压缩小,ALL-L也是类似的。ALL-I在压缩时并不考虑帧与帧之间的关系,只老老实实的单独处理每一帧图像。

IPB称为帧间压缩,属于针对帧与帧之间有关系的部分进行压缩的方式。在视频中帧与帧之间有关系的部分其实指的是多帧画面上相同的和不相同的部分,比如一段视频,如果背景没有变化,只有中间的人在动,那么这段视频中相同的画面部分就是背景的区域,不同的部分就是动来动去的人,IPB在压缩这段视频时只在关键帧记录完整画面,而过渡帧则只记录变化的内容,这样可很大程度压缩视频的体积。

从压缩体积的效果来看,IPB生成的视频体积要更小,更适合节省空间的储存。但是由于很多帧数据都并不完整,解码时需要重新插值生成,这在一定程度上增加了CPU工作量,并且生成的帧并不一定完全与原始画面相同。当然,由于视频是一直流动播放的,微小的差别肉眼很难看出。

而ALL-I由于每一帧都老老实实记录了下来,即使每帧都做了压缩,其总数据量还是相对较大的。当然,这种方式也保留了画面的原始性,在信息的还原上更可靠一些。

分辨率:

        图像分辨率是指单位图像线性尺寸中所包含的像素数目,通常以像素/英寸(ppi)为计量单位.打印尺寸相同的两幅图像,高分辨率的图像比低分辨率的图像所包含的像素多.例如:打印尺寸为1×1平方英寸的图像,如果分辨率为72 ppi,包含的像素数目为5184(72×72=5184).如果分辨率为300ppi,图像中包含的像素数目则为90000.高分辨率的图像在单位区域内使用更多的像素表示,打印时它们能够比低分辨率的图像重现更详细和更精细的颜色转变。

        要确定使用的图像分辨率,应考虑图像最终发布的媒介。如果制作的图像用于计算机屏幕显示,图像分辨率只需满足典型的显示器分辨率(72 ppi或96ppi)即可。如果图像用于打印输出,那么必须使用的高分辨率(150 ppi或300ppi),低分辨率的图像打印输出会出现明显的颗粒和锯齿边缘。

        需要注意的是,如果原始图像的分辨率较低,由于图像中包含的原始像素的数目不能改变,因此,简单地提高图像分辨率不会提高图像品质。

码率:

比特率是指每秒传送的比特(bit)数。单位为 bps(Bit Per Second),比特率越高,传送数据速度越快。声音中的比特率是指将模拟声音信号转换成数字声音信号后,单位时间内的二进制数据量,是间接衡量音频质量的一个指标。 视频中的比特率(码率)原理与声音中的相同,都是指由模拟信号转换为数字信号后,单位时间内的二进制数据量。

清晰度:

(注:关于清晰度有不同的定义)
清晰度与分辨率(还包括分辨力、解析度、解像度等几个词语)有着本质的区别,它们所指的具体内容本来就不一样。具体说来,清晰度是指人眼宏观看到的图像的清晰程度,是由系统和设备的客观性能的综合结果造成的人们对最终图像的主观感觉。(虽然是主观感觉,但不像主观听音评价那样不能用一个客观标准来计量,清晰度这种主观感觉是可以进行定量测试的,即可以用黑白相间的线条的粗细来衡量,并有标准的测试方法和测试图,其测量数据有明确的单位,即电视线TVL)。

知乎Live:计算机视觉从入门到放肆(对自己不理解的知识点进行了补充)_第8张图片
知乎Live:计算机视觉从入门到放肆(对自己不理解的知识点进行了补充)_第9张图片
知乎Live:计算机视觉从入门到放肆(对自己不理解的知识点进行了补充)_第10张图片
知乎Live:计算机视觉从入门到放肆(对自己不理解的知识点进行了补充)_第11张图片
知乎Live:计算机视觉从入门到放肆(对自己不理解的知识点进行了补充)_第12张图片
知乎Live:计算机视觉从入门到放肆(对自己不理解的知识点进行了补充)_第13张图片
知乎Live:计算机视觉从入门到放肆(对自己不理解的知识点进行了补充)_第14张图片
知乎Live:计算机视觉从入门到放肆(对自己不理解的知识点进行了补充)_第15张图片
知乎Live:计算机视觉从入门到放肆(对自己不理解的知识点进行了补充)_第16张图片
知乎Live:计算机视觉从入门到放肆(对自己不理解的知识点进行了补充)_第17张图片
知乎Live:计算机视觉从入门到放肆(对自己不理解的知识点进行了补充)_第18张图片
知乎Live:计算机视觉从入门到放肆(对自己不理解的知识点进行了补充)_第19张图片
知乎Live:计算机视觉从入门到放肆(对自己不理解的知识点进行了补充)_第20张图片

https://www.zhihu.com/lives/848170558016356352?utm_source=qq&utm_medium=social&utm_oi=656629876598116352

(感兴趣的朋友可以去知乎听本次live:)

你可能感兴趣的:(知乎Live:计算机视觉从入门到放肆(对自己不理解的知识点进行了补充))