中冶赛迪机器视觉讲座-机器人学

人工智能机器视觉概述

2006 心理学家Frank Rosenblatt 首度提出深度学习的概念。

图像识别进入卷积神经网络算法 时代,目前机器视觉用在安防人脸识别多些,在工业上的应用还是少些。

灰度信息 0(深色)~255(白色)

计算机就是通过这些 0-255的矩阵,来理解我们人类的世界。如果读入的彩色图像大小为128*128,则矩阵大小即为128*128*3RGB图像是三维的,三个维度分别表示红 绿 蓝三个分量,大小是0到255
每个像素都是由这三个分量组合而成。

图像其实可以看成二维信号,时域信号,010101的分布,通过傅里叶变换可以拆分成不同的频率的正玄波叠加。


中冶赛迪机器视觉讲座-机器人学_第1张图片

那么图像处理就是基于这个原理,去掉部分频率的正玄波得到一个新的结果。
比如,一张人脸照片,我们对它进行傅里叶变换,会获得一张新图,这张图片是时域结果的展示,边缘是深色,中心位置是浅色,因为图片边缘和4个角处频率最高。

比如对时域图进行高通滤波,只保留高频部分,即可获得高清晰的边缘,反之有低通滤波。

卷积神经网络对于图像的处理是一种黑箱模式,我们不知道卷积神经网络对图像处理时内部发生了什么,我们只是给它大量的数据,比如给猫的图片,并给图片打上标签 label。

关于傅里叶的参考文章
百科 关于二进制图像
数字图像概述1
数字图像概述2


机器人学-二维空间位姿

  • 1. 位置与位姿简述

空间中的点,他可以被描述成一个坐标向量,也被称为一个约束向量。如图,向量表示点相对于某个参考坐标系的位移。一个坐标系或者笛卡尔坐标系统,是由一组正交轴构成的,这些轴相交于一个被称为原点的点。

中冶赛迪机器视觉讲座-机器人学_第2张图片

中冶赛迪机器视觉讲座-机器人学_第3张图片

如上图左,在二维世界坐标系下有物体B,因为物体B会移动,为了方便计算,我们建立以B为圆点的坐标系,下图右,在B的坐标系下,有个物体P,以上,根据向量的定位,我们知道了B相对于b的位置,P相对于B的位姿,如何求P相对于世界A的位置?
右下角公式表示:A坐标系下P点位置 = A坐标系下B的位姿 * B坐标系下P点的位置

中冶赛迪机器视觉讲座-机器人学_第4张图片
先确定位姿关系、再求位置关系
中冶赛迪机器视觉讲座-机器人学_第5张图片
中冶赛迪机器视觉讲座-机器人学_第6张图片
二维空间位姿描述1
中冶赛迪机器视觉讲座-机器人学_第7张图片
二维空间位姿描述2
  • 2. 三维空间位姿描述

三维情况实际上是二维的延伸,我们在二维坐标系上增加一个额外的坐标轴Z,它同时与X、Y正交,Z轴的方向符合右手规则,并构成右手坐标系。

右手坐标系:伸出右手,大拇指为X,二指为Y,三指为Z

知乎大神关于位姿的论述


你可能感兴趣的:(中冶赛迪机器视觉讲座-机器人学)