计算机视觉问题总结

opencv双目标定,知道左右相机的旋转和平移矩阵,如何求出两个相机的相对位置?

答:将第一个矩阵的旋转矩阵转换为单位矩阵,平移向量转换为0向量,即可。

计算机视觉到底是不是计算机科学下面的研究方向?

答:必须是,应该现在的计算机视觉基本都是搞计算机的人在做,还有就是一些做自动化的也在做,计算机视觉在国内最厉害的就是中科院的自动化所。

实际上,还有个微软亚洲研究院实力貌似也不比自动化所低,但是是国际化的机构。

最最厉害的,当然还是美国的几所顶尖大学和几家科技巨头公司。

双目立体视觉系统,三维重建哪个做得好?

答:双目立体视觉就是三维重建的一种技术而已,两者之间并不存在哪个做得好这么一说。

三维模型重建可以怎样用于机器人导航?

答:参考SLAM相关的资料就可以了,simultaneous localization and mapping同步定位和映射,主要涉及的就是:机器人自主导航。

计算机视觉领域的经典论文有哪些?

答:CV邻域经典论文有很多。而且CV领域包含的范围也很大,换而言之,这个问题很大。

可以根据自己的研究方向去找经典论文。比如:边缘检测方向Canny1986年那篇论文就非常经典,还有Lowe2004年发表的关于特征点匹配的文章也同样很经典。这些论文之所以成为经典是因为作者关于某一个问题做了深入而又详细的工作。从经典论文中你能得到很多启发。判断经典论文的一个简单方法是:看文献引用次数。一般引用次数越多说明,说明这个领域内的研究人员越认可论文作者的工作。

综合图像处理、模式识别、机器学习和数据挖掘技术的有价值的应用,除了图像检索,还有别的么?

答:图像识别、图像理解等,目前流行的是给一幅图自动描述出该图中的内容。比如:有个人在湖里划船。

利用OpenCV开发行人检测程序,怎样提高检测速率?

答:提高运算速度,你可以考虑使用CUDA。

计算机图像处理方向怎么样?

答:图像处理属于信号处理的范畴,一般解决的是二维信号的变换问题。图像处理是许多计算科学研究方向的基础。

做边缘检测、图像增强、图像分割,是远远不够的,需要结合当前的最火爆的深度学习,尝试用它来解决上述问题。

标定好的双目相机是不是不能再移动了?

答:相机标定的目的是确定相机的内外参数,双目相机标定也不例外,相机的内参数是相机本身的物理属性,跟相机本身有关,同时受标定时的温湿度等外部环境的影响,所以当标定好相机之后防止受外部环境的影响,最好不要乱移动。

这也是为什么实际应用中,相机使用一段时间之后是要重新进行标定的原因。

学习哪些数学对研究计算机视觉有帮助?

答:一是线性代数或者矩阵理论,因为计算机视觉的主要研究对象是图像,而数字图像又是用矩阵来表示的。

二是概率与统计,因为计算机视觉研究的主要目标是让计算机通过摄像头具有理解自然场景的能力。处理实际生活当中的推断问题那就要用到概率与统计知识了。

计算机视觉研究中用到的其他方面的数学还有很多,比如:离散数学、图论、微分几何、黎曼几何、李群和李代数、流形学习、张量分析、主成分分析、非线性优化等等。

在做计算机视觉研究中,你没有必要先把这些基础知识都学习了再来搞研究。即使你把这些数学知识都掌握了,针对研究中要解决的问题说不定用的也不是这些数学知识。

最聪明的方式是:带着研究的问题去寻找数学上的工具,比掌握了数学知识再来寻找问题要符合实际,除非你开始学的是数学专业,不然的话,研究中最好以问题为导向,用到什么就学习什么,否则学习很多数学基础知识,到了最后大多数学过的知识却没用上。

总之,研究中用到什么数学知识就学习什么知识就好,没必要把所有涉及到的都学一遍,搞科研毕竟不是在应付数学专业考试。

如果做计算机视觉研究同时又对数学有兴趣,可以关注数学方面的最新科研进展,看看有哪些新理论、新算法出现,能不能用到你的研究方向上,这样做就足够了。用新方法去解决老问题,也是一种有效的创新手段。

最后,还是要强调:做计算机视觉方面的研究,完全没有必要一开始就把自己埋到数学书堆里。

opencv 标定得到相机内参数和外参数后,怎么由图像坐标求世界坐标呢?

答:只有相机标定参数,仅通过图像是求不出世界坐标的,原因是:图像是二维的而世界坐标要求是三维的,标定过的相机只是起到了量角器的作用,却不能当做尺子来用。

求世界坐标的话,还需知道更多的图像中的实际大小,正如做相机标定时,要知道确切的相机外参数,就需要先知道标定板上每个方格的实际尺寸大小。

计算机视觉中的多视图几何这本书看了有什么作用吗?

答:如果不做三维重建方面的工作,建议就不要看了,对其他研究方向的人来说本书的作用不大。看这本书的前提是你要有点线性代数的基础,里面主要概念有:单应矩阵、本质矩阵、基本矩阵、相机自标定等。

实际上只要将多幅图像之间的对应关系用张量来表示,前面的这些概念就都是浮云!

相机标定要用到 opencv哪个库?

答:openCV本身就是个计算视觉开源库。

相机标定用到OpenCV中的应该不是该开源库中哪一个子库。

具体判断用到了哪些子库,你可以根据标定过程中用到的函数来寻找。

自学机器视觉应该怎么入门?

找本机器视觉的书来系统的学习。《图像处理分析与机器视觉》、《机器视觉算法与应用》、《机器视觉与机电一体化实践》。

学习了哪些知识,计算机视觉才算入门?

答:计算机视觉从图像处理开始入手,掌握之后可以深入到机器学习方面,最终是让计算机具有类似人类视觉的功能。

角点提取matlab工具箱相机标定是什么意思?

答:角点提取就是找出标定板上的黑白交界处角点的坐标,相机标定就是根据这些角点的坐标求取相机的内外参数。

opencv图像预处理一般要做哪些处理?

答:具体做哪些预处理需要根据待解决的任务来说。比如,你要进行边缘检测时为了抑制噪声,需要用滤波器对图像做预处理。

再比如,你要做光学字符识别时为了找出每个字符,需要做图像分割进行预处理。

总之,面对的任务不同,所定义的预处理就不同。

不能简单的定义哪些操作算是预处理,哪些不是预处理。因为它们都是相对你的任务而言的。

opencv摄像机标定?

答:张正友的1998年论文,里面讲得非常详细。

看1987年Tsai的论文和1998年Zhang的论文。这两篇论文足够你对用标定板进行标定有详细的了解了。

相机标定图像矫正法傅里叶梅林法特征点法哪种图像矫正方法好?

追求可靠性的话,当然是传统的相机标定图像校正法好。

追求方便性的话,你可以选特征点法或傅里叶梅林法。

相机标定中角点重投什么意思?

角点重投影是为了显示一下用计算出来的相机矩阵对角点进行重投影得到的理论位置。

也是为了显示,理论得到的角点与实际角点之间的差别。

重投影误差最小化通常作为相机标定中的一个目标函数来用的。

计算机视觉大牛有哪些?

答:国内谭铁牛,国外Richard Szeliski。

齐次坐标是什么?图像处理中引入齐次坐标的目的是什么?

答:一个点p的坐标为(x,y),它的齐次坐标可以表示为(kx,ky,k)。反过来,当知道一个齐次坐标点(kx,ky,k),也可以计算出它的原始坐标点(x,y)。通常k=1,则点p的其次坐标是(x,y,1)。

图像处理中,引入齐次坐标的目的是为了处理三维空间问题。实际上背后的原理是黎曼几何,参见关于黎曼几何的书。

相机标定每次标定的误差都很大的原因?

答:相机内参数(包括焦距、主点、畸变系数、扭曲因子)是由相机物理属性决定的。按道理如果不改变相机的物理属性,标定结果应该是不变的。

但是每次标定的结果为什么又会变化呢?不外有两种原因:
1、相机标定过程中中可能受收到很多外部物理因素(像差、散焦、传感器噪声、量化误差等)的影响。

2、所用算法的稳定性较差,当前相机标定领域公认的健壮性较好的优化算法仍然是bundle adjustment(光束平差法)。

可以从上述两个方面找找每次试验结果会差别很大的原因。

计算机视觉中,目前有哪些经典的目标跟踪算法?

答:最经典的就是KLT算法。

《计算机视觉:一种现代方法》这本书怎么样?

答:这本书还算经典,当前《计算机视觉算法与应用》也是相当经典,后者这本书中包含的内容要多一些。

如果是想做为计算机视觉入门的书籍,先从图像处理的书开始。

因为图像处理->计算机视觉->机器学习,基本代表计算机视觉的三个层次(初级->中级->高级)。

图像奇异值是标准差吗?

 

答:不是!图像奇异值是通过奇异值分解得到的。

矩阵A的奇异值为A’,A的特征值的平方根(A’表示矩阵A的转置矩阵),通过此可以求出奇异值。

图像处理中的标准差计算公式为

计算机视觉问题总结_第1张图片

中,I、K为两幅图像,m、n为图像的宽和高。

用简单明了的话解释一下蚁群算法?

答:蚁群算法就是模拟蚂蚁觅食行为的一种群体算法。

蚂蚁在找寻食物的过程中会在觅食的路径上留下信息素,蚁群根据信息素的堆积浓度可以很快找出食物与蚁穴之间的最短路径

M.Dorigo的两篇经典论文“Ant Colony Optimizaiton”和“Ant Algorithm for discrete optimization”。

注:M.Dorigo是蚁群算法的创建者,他的文章很具有权威性。

常见的图像三维重建方法有哪些?

简单来分有主动式和被动式两种。

主动式:结构光,激光扫描,超声波成像,等。

被动式:shape from X(X代表有多种方式)

常见的X有:纹理、轮廓、光度、运动等。

你可能感兴趣的:(计算机视觉)