图像隐写分析是一个比较小众的研究领域,因此好多概念和知识很难从网上寻求到答案。本文将尽量总结一些不容易查到的隐写分析概念和知识(总结的难免有错误,发现的还请不吝赐教[email protected])。
再次表示对武大师兄的无私帮助的衷心感谢!(内容未整理)
1,噪声相关问题
JPEG图像的噪声(包括本身噪声、图像细节和隐写噪声)是集中在高频部分,但是由于量化的原因,图像的高频部分的统计特性在隐写前后差异很小,而隐写分析特征是讲究区分性的,所以特征一般考虑DCT系数的中低频部分,因为这部分系数在隐写前后的差异较大。
另外,要弄清楚用high-pass filter来增强信噪比中的“信噪比”是什么,对于隐写分析来说,信噪比中的“信”是隐写噪声,“噪”是图像本身内容。在图像处理领域,信噪比的概念刚好相反,这里的“信”是图像本身内容,“噪”是与图像内容无关的噪声。fridrich的好几篇文章都强调了这个概念,其中一篇是SPAM那篇,可以看一下。
high-pass filter得到的是隐写噪声,可以用来研究隐写前后的统计变换,所以不能用Low-pass filter(得到是图像本身内容)。对这个概念搞混淆是因为,high-pass filter和Low-pass filter是图像处理的感念,把它们直接用在隐写分析里,与隐写分析中的“信噪比”不容易区分。
2,嵌入率相关问题
学长给的很形象的例子:
1),一个JPEG图像有10000个非0的AC系数,大小是50KB;
如果嵌入1000个比特,那么相对嵌入率是1000/10000=0.1=10%;
50KB=50*8*1024=409600比特,则绝对嵌入率是1000/409600=0.0024=0.24%
2),如果每个DCT系数上最多嵌入一个bit的话,嵌入率(bpnzac)=(嵌入的bit)/(载体总的DCT系数-值为0的DCT系数-DC系数)
3),一些衡量嵌入率的单位:
bpp,全称 bit per pixel,表示每像素嵌入比特数,例如,0.5表示每像素嵌入的bit数为0.5。用在空域隐写上( spatial domain steganographic algorithms);
bpc,全称bit per non zero dct coefficient ,表示每个非0DCT嵌入的bit数。用在频域上(一般为DCT域dct domain)
3,svm
隐写分析中最常用的方法:特征+分类器;而分类器用的最多的便是SVM,但是学了SVM会知道,svm有线性和非线性两种,那什么时候用线性核,什么时候用非线性核呢?一般,特征的维数大于样本的数量选择线性核,特征的维数小于样本的数量时候选用非线性核(常用RBF核);