压缩传感技术是一种抽象的数学概念,而不是具体的操作方案,它可以应用到成像以外的许多领域。以下只是其中几个例子:
磁共振成像(MRI):在医学上,磁共振的工作原理是做许多次(但次数仍是有限的)测量(基本上就是对人体图像进行离散拉东变换(也叫X光变换)),再对数据进行加工来生成图像(在这里就是人体内水的密度分布图像)。由于测量次数必须很多,整个过程对患者来说太过漫长。压缩传感技术可以显著减少测量次数,加快成像(甚至有可能做到实时成像,也就是核磁共振的视频而非静态图像)。此外我们还可以以测量次数换图像质量,用与原来一样的测量次数可以得到好得多的图像分辨率。
天文学:许多天文现象(如脉冲星)具有多种频率震荡特性,使其在频域上是高度稀疏也就是可压缩的。压缩传感技术将使我们能够在时域内测量这些现象(即记录望远镜数据)并能够精确重建原始信号,即使原始数据不完整或者干扰严重(原因可能是天气不佳,上机时间不够,或者就是因为地球自传使我们得不到全时序的数据)。
线性编码:压缩传感技术提供了一个简单的方法,让多个传送者可以将其信号带纠错地合并传送,这样即使输出信号的一大部分丢失或毁坏,仍然可以恢复出原始信号。例如,可以用任意一种线性编码把1000比特信息编码进一个3000比特的流;那么,即使其中300位被(恶意)毁坏,原始信息也能完全无损失地完美重建。这是因为压缩传感技术可以把破坏动作本身看作一个稀疏的信号(只集中在3000比特中的300位)。
压缩感知(compressed sensing)。所谓压缩感知,最核心的概念在于试图从原理上降低对一个信号进行测量的成本。比如说,一个信号包含一千个数据,那么按照传统的信号处理理论,至少需要做一千次测量才能完整的复原这个信号。这就相当于是说,需要有一千个方程才能精确地解出一千个未知数来。但是压缩感知的想法是假定信号具有某种特点(比如文中所描述得在小波域上系数稀疏的特点),那么就可以只做三百次测量就完整地复原这个信号(这就相当于只通过三百个方程解出一千个未知数)。可想而知,这件事情包含了许多重要的数学理论和广泛的应用前景,因此在最近三四年里吸引了大量注意力,得到了非常蓬勃的发展。陶哲轩本身是这个领域的奠基人之一(可以参考《陶哲轩:长大的神童》一文),因此这篇文章的权威性毋庸讳言。另外,这也是比较少见的由一流数学家直接撰写的关于自己前沿工作的普及性文章。需要说明的是,这篇文章是虽然是写给非数学专业的读者,但是也并不好懂,也许具有一些理工科背景会更容易理解一些。
压缩感知(Compressed sensing),也被称为压缩采样或稀疏采样,是一种利用稀疏的或可压缩的信号进行信号重建的技术。这一方法至少已经存在了四十年,由于David Donoho、Emmanuel Candes、Justin Romberg和陶哲轩的工作,最近这个领域有了长足的发展。
压缩传感基础理论
Emmanuel Candès, Compressive sampling. (Int. Congress of Mathematics, 3, pp. 1433-1452, Madrid, Spain, 2006)
Richard Baraniuk, Compressive sensing. (IEEE Signal Processing Magazine, 24(4), pp. 118-121, July 2007)
Emmanuel Candès and Michael Wakin, An introduction to compressive sampling. (IEEE Signal Processing Magazine, 25(2), pp. 21 - 30, March 2008) [High-resolution version]
Justin Romberg, Imaging via compressive sampling. (IEEE Signal Processing Magazine, 25(2), pp. 14 - 20, March 2008)
压缩感知重构算法
Joel Tropp and Anna Gilbert, Signal recovery from random measurements via orthogonal matching pursuit. (IEEE Trans. on Information Theory, 53(12) pp. 4655-4666, December 2007)
David Donoho and Yaakov Tsaig, Fast solution of ell-1-norm minimization problems when the solution may be sparse. (Stanford University Department of Statistics Technical Report 2006-18, 2006)
Mário A. T. Figueiredo, Robert D. Nowak, and Stephen J. Wright, Gradient projection for sparse reconstruction: Application to compressed sensing and other inverse problems. (IEEE Journal of Selected Topics in Signal Processing: Special Issue on Convex Optimization Methods for Signal Processing, 1(4), pp. 586-598, 2007)
Karen Egiazarian, Alessandro Foi, and Vladimir Katkovnik, Compressed sensing image reconstruction via recursive spatially adaptive filtering. (Preprint, 2007)
压缩感知(Compressive Sensing)与结构化稀疏性(Structured Sparsity)2009-07-17 10:45在处理研究方法的一般与特殊性关系中,不仅要强调一般理论方法对特殊研究活动的指导作用,也需要注重特殊研究活动对一般理论的补充、丰富和发展作用。一般性和特殊性的螺旋式发展过程是科学研究的普遍规律。压缩传感是基于信号的一般稀疏性建立的信息获取或信号采样理论。将其用于特殊信号的压缩传感,就需要考虑信号特有的结构化稀疏性。已有的研究结果表明,具有结构化稀疏性的压缩传感能获得更好的压缩性能。人体的运动行为无论是在空域还是时域上都有自己特殊的稀疏约束,无疑是我们值得探讨的问题。
压缩信号的稀疏性在压缩传感中的角色与传统采样理论中的Nyquist采样频率类似,是实现压缩重构的必要条件之一(注:另一个条件是压缩投影与稀疏表示基阵的非相干条件,随机压缩投影普遍满足这一约束条件,所以可以认定是自然满足的条件)。具体而言,为了重构N维K水平稀疏的压缩信号,需要的压缩测量(采样)数目理论上不低于O(Klog(N/K)),即正比于稀疏水平,通常需要2K以上的压缩测量。考虑最极端的例子,知道K个非零值的位置,那么压缩测量的数目就只需要K了,即达到了压缩感理论可能的下界。更一般地,若从先验知识获得非零值位于若干个K维子空间,且子空间的数目远远低于平凡的(N,K)组合数,那么压缩测量的数目可以约减到K+C的水平,无疑这是对一般压缩传感性能的提升。回到运动目标检测与跟踪的问题,由RST实现的空间胞元分割数目可对应N,运动目标形成的热辐射源占有K个胞元(依赖于观测粒度,取决于透镜的焦距和视场的空间尺度),这K个胞元在空域上必将满足特定的约束,这种约束在时域上也会遵从某种可预测的规律变化,形成稀疏性的特有结构和模型。利用好稀疏性的结构特性,可以有效减少感知单元中需要的热释电感受器数目,理论价值和实践意义都是十分重要的。
为了利用这些稀疏性的结构特征,需要对目前我们设计的体系结构进行重新的审视,以便减少热释电红外感受器的数目,形成更为紧凑的感知单元,适应大型监测网络环境的部署要求。
压缩感知(CS)理论是在已知信号具有稀疏性或可压缩性的条件下.对信号数据进行采集、编解码的新理论.主要阐述了CS理论框架以及信号稀疏表示、CS编解码模型,并举例说明基于压缩感知理论的编解码理论在一维信号、二维图像处理上的应用.
稀疏表示和压缩感知有何异同?
压缩感知中对于矩阵本身的约束很多,为了保证算法收敛到最稀疏的解,比如众多的RIP约束就是为了保证l1最小优化算法收敛到l0最小的解。
如果单单从表示的角度来看,我们并不一定要求最稀疏的解是唯一的。从这个角度来看,cs与稀疏表示还是存在很大的不同的。不知各位有何见解!
这个问题,我个人认为是没有必要认为他不同的。而且,这和国外一些证明有关。
首先稀疏信号和压缩传感是同一个问题的,稀疏信号可以看成,对于一个信号,如何用最稀疏的基表示。这是已知原始信号。还有一种形式就是,已知一个不完全的结果。比如,损坏了什么的原因,我们知道了在基下变换的结果,那么是否可以恢复原始信号?答案是在原始信号稀疏情况下,在满足一定条件下,是可以恢复的。这两个问题都是可以用l0范数表示的。压缩传感可以说是结合这两种过程,先采样,后重建。但是由于这两个过程是对应的。所以也是一个L0问题。
对于这种问题,国外都是喜欢提出一种算法,或者是理论。证明在这种情况下。是可以实现的。也就是所提出的理论=》解决问题。但是,是不是这个问题就只能这样解呢?这可能还需要一些理论证明吧。所以有人说,等距约束是充分但不是必要条件吧。(听别的同学说有的文章有这样的观点)。
的确压缩传感不是最稀疏的表示,对于稀疏为K的信号,使用L0范数其实要K+1个就可以表示了。使用L1范数的用a*K。因为解L0范数难度太大。这样看压缩传感是考虑了开始的表示和最后的重建提出的。即可以降低数据,又可以实现比较快的算法(L1范数最小)重建。
但是,我个人认为从稀疏信号理解这个问题是比较好的。如果你可以找到一种L0范数,比较好的重建算法的话。那么就绝对比现在理论好。从根源理解问题绝对比理解部分深刻。同时,现在的压缩传感很多都抛弃了L0范数。难道L0范数真的不值得我们去留恋吗??
稀疏信号解的问题可以扩散到好多问题的,比如:《A Unified Approach to Sparse Signal Processing》介绍的。不仅仅是压缩感知一方面的。
就我个人的理解,CS是建立在一个信号可以在某个基底下被稀疏表示或者近稀疏表示(稀疏表示+被bound的error)。对于这个K-sparse的稀疏表示,我们可以用O(K*log(N/K))个mesurements得到一个相应长度的测量值。并且能够在已知这个测量值,测量矩阵以及K的情况下还原原始信号的稀疏表示。这里的O(K*log(N/K))是基于l_1norm的。l_0norm当然好,对于一些特殊结构的信号l_0norm远比l_1norm有效率。问题是这样的信号并不是很多。CS理论考虑的是所有可以被稀疏表示的信号,一般情况下,解这样的l_0优化问题是NP-hard的,这就是为什么绝大部分学者在研究l_1优化或l_1penalized least squares。也有少部分学者(如chartrand)在研究nonconvex CS,即l_p(0<p<1)优化。
如果某个信号在正交基上没有稀疏表示,显然无法用正交基来实现CS。
对于信号X,如果用Y=ΦX来直接获取观测值
而恢复算法是根据min||α||,s.t Y=ΦX=Φψα(其中X=ψα,α为信号X在正交基ψ上的分解系数)
如果信号X在正交基ψ上不是稀疏的,那么CS就基本失效。
CS其实就是一个降维过程,对于一个1xN的信号X,要完全恢复的话,需要采样N次,这就相当于是一个N乘N的方程组,可以得到唯一解。
如果信号满足稀疏性(假如为K稀疏),那么只要采样N>>M≥K个测量值,就可以在一个非满秩的方程组中,通过min||α||的恢复算法来重建信号X。
在这种情况下,可以采用一个有冗余的dictionary(非正交的)来对信号X进行稀疏表示,然后才能通过上述的恢复算法来重建信号。
闫敬文,男,1964年生,教授,理学博士,中国民主同盟会会员,中国通信学会会员,中国图像图形学会会员,中国业余无线电会员吉林省首批会员。1987年毕业于吉林工业大学,获工学学士学位;1992年7月获得中国科学院长春地理研究所地图学与遥感(研究方向:微波遥感)理学硕士学位,并分配到长春邮电学院任教;1997年获得中国科学院长春光机所理学博士学位(研究方向:光学遥感及应用)。现主要从事遥感图像处理、数据压缩、通信理论、小波分析理论和应用研究工作。著作《超小波分析及应用》
通常情况下,欠定线性方程是没有唯一解的,如果加上其他的条件则可以缩小解得范围,比如加上二范数最小化这个条件,则方程可以得到最小范数解,该解唯一,我们知道二范数是能量的度量单位,它是用来度量重构误差的,如果我们不用二范数改用另外的附加条件,比如稀疏性,要求方程的解具有最小数目的非零项,也就是零范数,那么方程到底有没有唯一解,怎么证明求得的是全局解而不是局部解,此外假设有全局的唯一解,那么求解过程呢,是一个NP问题,既然零范数具有现实意义,那么可不可以找它的近似解呢,这就引出了l1范数最小化问题,用1范数来代替0范数的话,他们最终求的解是不是一致,是不是1范数求的解一定是0范数解的近似值,这两个解得误差有多大,是不是可以被接受,当然这些问题不属于我们这些搞图像处理的小鱼小虾来研究,我们只需要接受结果就行,剩下的证明推导是那些搞应用数学的大牛的事情。
再看一下信号处理领域的Sparse,我们应该熟悉JPEG跟JPEG2000的区别吧,JPEG的核心算法是DCT,而后者是DWT,本质上,这两种处理方法都是将信号从一个域变换到另外一个域(把坐标系进行旋转,将信号投影到不同的基上),从而获得信号的稀疏表示,即用最少的系数来表示信号,不过DWT比DCT更加稀疏而已。信号不同,对应最稀疏表达的基也会不同,比如,对于一维信号可能小波基是最稀疏的,而对于图像而言,可能那些Curvelet和contourlet是最优的,对于有些信号,也有可能需要将几种基结合起来才是最优的。当然,我们可以通过求解零范数问题来得到信号的最稀疏表达。
当然求解信号的稀疏表达问题,被分成两种类型:L1范数最小化,和启发式的贪婪算法。L1范数最小化是通过用L1范数来近似0范数,取1而不取1/2,2/3或者其他值,是因为1范数最小化是凸优化问题,可以将求解过程转化成有一个线性规划问题。
关于压缩感知的理解
对于压缩感知,最开始提出的令人振奋的是可以低于奈奎斯特采样频率来采样,实现信号的压缩传感。首先我不知这个采样是不是体现测量矩阵和源信号的乘积上?,如果是的话,我们来分析:给定一个源信号,长度为n*1,测量矩阵为m*n,故观测信号大小为m*1,其中m<n,在获取观测信号的过程中,观测信号的每一个元素mi为测量矩阵的每一行和源信号的内积,也就是说这样采样是采了源信号的每一个点,不能说是欠采样。所以,压缩感知的本质应该是把一个长度为n的信号压缩成长度为m的信号,最后我们通过长度为m的信号来重构出长度为n的信号(利用源信号满足稀疏性或者源信号在变换域中满足稀疏性),归结为解一个欠定方程组的问题。故,压缩感知只是一个新概念,分析方法都是稀疏分量分析的一些方法,压缩感知只是稀疏分量分析的一个应用而已。
http://ccvai.xjtu.edu.cn/fund.do?method=getfunddetailbyid&id=36
压缩感知理论及其研究进展
http://www.docin.com/p-42423226.html
基于压缩感知认知模型的面像识别与理解
面像识别是模式分类、图像处理、计算机视觉、机器学习等领域的研究热点,其研究不但对于模式识别理论发展具有重要的学术意义,而且有着广泛的产业化前景,从而有可能为国家的经济建设做出贡献。本项目根据压缩感知原理,结合人的认知实际,提出崭新的视觉认知模型。该模型将测试样本表示为训练集(字典)的线性组合,组合系数的稀疏性与稀疏集中度可以用来衡量其类别属性。本项目将重点研究:(1)小样本条件下的降维与稀疏表示;(2)多重回归分析中的最优响应变量构造;(3)基于超分辨率重建技术与正则化策略的图像质量恢复;(4)大规模优化计算与在线学习算法;(5)面像认知与识别系统。项目的创新之处在于整合认知科学、信号处理、非线性优化、在线学习等理论,提出基于压缩感知的视觉认知模型并应用于面像识别领域,以解决小样本及非线性变化(畸变、遮挡等)问题。本课题的研究将丰富模式识别与机器学习理论,并为面像识别问题提供新的解决途径。
与人类视听觉感知密切相关的图像、语音和文本(语言)信息在社会、经济和国家安全等领域中扮演着重要角色,并在今后一段时间内仍将迅猛增长。这类信息可被人类直接感知和理解,也可用计算机进行处理,但计算机的处理能力远逊于人类且处理效率远不能满足当今社会的发展需求。如何借鉴人类的认知机理和相关数学的最新研究成果,建立新的计算模型和方法,从而大幅度提高计算机对这类信息的理解能力与处理效率,不仅可有力推动信息科学的快速发展,也将为国民经济和社会发展做出重大贡献。
一、科学目标
本重大研究计划的总体科学目标是:围绕国家重大需求,充分发挥信息科学、生命科学和数理科学的交叉优势,从人类的视听觉认知机理出发,研究并构建新的计算模型与计算方法,提高计算机对非结构化视听觉感知信息的理解能力和海量异构信息的处理效率,克服图像、语音和文本(语言)信息处理所面临的瓶颈困难,为确保国家安全与公共安全、推动信息服务及相关产业发展以及提高国民生活和健康水平做出重要贡献。具体表现为:在视听觉信息处理的基础理论研究方面取得重要进展;在视听觉信息协同计算、自然语言(汉语)理解以及与视听觉认知相关的脑―机接口等三项关键技术方面取得重大突破;集成上述相关研究成果,研制具有自然环境感知与智能行为决策能力的无人驾驶车辆验证平台,主要性能指标达到世界先进水平,从而提升我国在视听觉信息处理领域的整体研究实力,培养具有国际影响力的优秀人才与团队,为国家安全和社会发展提供相关研究环境与技术支撑。
二、核心科学问题
本重大研究计划将围绕“感知特征提取、表达与整合”、“感知数据的机器学习与理解”和“多模态信息协同计算”等核心科学问题,组织并实施如下四个主要方面的研究工作。
(一)图像与视觉信息计算
主要研究图像与视觉信息计算的认知机理,视觉基本特征的提取与选择,物体识别与图像内容理解,复杂场景下运动目标的行为分析等。提出若干图像与视觉信息的高效计算模型,取得国际公认的原创性研究成果(在Nature, Science, IEEE Trans. PAMI等刊物上发表高水平论文),培养具有国际影响力的优秀人才与研究团队。
(二)语音与听觉信息计算
主要研究听觉感知机理与语音场景分析,自然环境下的语音识别与高表现力的语音合成,口语对话分析与理解等。取得在国际上有影响的原创性研究成果,提出若干语音与听觉信息的有效计算模型,在本领域国际权威刊物上发表高水平论文,培养具有国际影响力的优秀人才与研究团队。
(三)自然语言(汉语)理解
主要研究语言加工的认知机理,语言知识建模和语义计算模型,面向网络的汉语适度理解模型和系列分析工具,支持自然环境下口语对话分析、识别与理解的关键技术等。在国内已有相关成果的基础上,统筹构建大规模高标准汉语语义知识库。将上述研究成果应用到语言(汉语)信息处理典型系统中,显著提高对自然语言(句子、段落、篇章)的理解能力,并在网络信息检索、过滤和知识获取方面得到验证。
(四)多模态信息的协同计算与脑—机接口
主要研究多模态感知信息协同的认知机理与计算模型,基于视听觉信息融合的模式识别与环境交互方法,跨模态视频信息检索与网络敏感信息过滤技术等。大幅度提高跨模态视频信息检索的查准率,显著提升本领域整体研究实力。
研究与视听觉认知相关的脑信号提取、脑区定位与脑功能网络分析方法和技术,脑—机交互中的信号传输、处理与控制技术,与视听觉认知相关的脑—机接口典型应用。在改善残疾人生活质量和功能康复等方面得到验证或应用,为延伸和提高人类行为控制能力提供新技术。
三、关键技术与集成验证平台
在上述研究工作的基础上,本重大研究计划进一步开展与视听觉信息处理相关的关键技术和集成验证平台研究。
(一)视听觉信息协同计算的关键技术
研究机器视听觉信息的协同计算模型及系统实现技术,基于视听觉信息融合的模式识别技术与验证系统,跨模态视频信息检索与网络敏感信息过滤技术及应用。基于多模态协同计算模型的网络视频信息搜索的查准率比同期国外最好水平高5%—10%,并在网络信息安全与服务等领域得到验证。
(二)自然语言(汉语)理解关键技术
研究汉语通用词汇的规范化语义知识库及其构建技术,面向网络的汉语适度理解模型及系列分析工具的实现技术,支持自然环境下口语对话分析、识别与理解的关键技术。在国内现有相关成果的基础上,统筹构建汉语语义知识库,汉语通用词汇规模不小于5万词,带有语义标注的汉语平衡语料库规模不小于1千万字。将研究成果应用到网络环境下的汉语处理系统中,信息检索与知识获取的准确率比现有最好技术明显提高。
(三)与视听觉认知相关的脑―机接口关键技术
研究与视听觉认知相关的脑信号提取、脑区定位与脑功能网络分析技术,脑—机交互中的信号传输、处理、控制技术及系统实现,与视听觉认知相关的脑—机接口典型应用。所提无创脑―机接口信息提取与分析等技术处于同期国际领先水平,在改善残疾人生活质量和功能康复等方面得到验证或应用。
(四)无人驾驶车辆集成验证平台
集成上述基础理论与关键技术的相关研究成果,将传统视觉计算模型与新的视觉认知模型相结合,实现环境感知与建模方法新突破;实现多传感器跨模态跨尺度信息融合,生成高质量三维场景认知地图,构建高性能智能车辆无人驾驶验证平台;提供新的基于人—车—路状态综合分析的智能辅助安全驾驶关键技术;在国防、智能辅助安全驾驶等相关领域得到验证或应用并产生重要影响。
四、项目资助
本重大研究计划的实施周期为8年(2008年8月至2015年12月),拟投入总经费为1.5亿元。
本重大研究计划主要以“培育项目”、“重点支持项目”和“集成项目”的形式予以资助,三类项目在资助强度和实现目标上有所不同。对有较好的创新学术思路和研究价值,但尚需进一步探索研究的申请项目,将以“培育项目”方式予以资助(约为50万元/项);对有很好的创新学术思想和研究价值,有良好的研究基础和成果积累,且对研究计划总体目标有较大贡献的申请项目,将以“重点支持项目”的方式予以资助(约为300万元/项);对实现研究计划总体目标有决定作用的研究方向,将以更大支持强度的“集成项目”方式予以资助(约为1000万元—1600万元/项)。根据项目执行的年度进展情况或考察结果,本重大研究计划将适度调整获准项目的资助经费(中止课题或追加经费)。
指导专家组成员
组 长郑南宁 院 士 机器视觉模式识别西安交通大学
副组长 李德毅 院 士 数据理解 总参61所
副组长 陈 霖 院 士 认知科学视觉感知 中科院生物物理所
成 员 常谦顺 研究员 方程计算图像处理 中科院数学与系统研究院
成 员 孙富春 教 授 智能控制机器人 清华大学
成 员 胡德文 教 授 模式识别脑机接口 国防科技大学
成 员 杨静宇 教 授 机器视觉图像处理 南京理工大学
成 员 宗成庆 研究员 自然语言处理语音识别 中科院自动化所
秘 书 辛景民 教 授 模式识别信号处理 西安交通大学