同济大学计算机视觉,面向计算机视觉课程综合性实验平台.doc

面向计算机视觉课程综合性实验平台

面向计算机视觉课程综合性实验平台   摘 要:针对计算机视觉课程的特点,提出建立面向课程的综合性实验平台,具体介绍全景拼接实验、生物特征识别实验、三维模型检索实验和深度学习实验4个实验平台的特点,结合同济大学计算机视觉课程的实际教学,介绍此实验平台的建设方案和经验

关键词:计算机视觉;全景拼接;生物特征识别;三维模型检索;深度学习

文章编号:1672-5913(2017)05-0136-04

中图分类号:G642

1 背 景

计算机视觉是最近20年发展起来的一门新兴学科[1],是一门研究如何使机器“看”的科学;更进一步说,是利用计算机对传感器如图像传感器、深度信息传感器、声音传感器等采集的信号进行分析,从而达到对客观世界进行理解的目的。作为一门科学学科,计算机视觉试图建立能够从图像或者多维数据中获取“信息”的人工智能系统,因此计算机视觉也可以看作研究如何使人工系统从图像或多维数据中“感知”的科学

近5年,随着人工智能领域技术如深度学习技术的飞速发展,计算机视觉学科在很多问题上,如人脸识别、目标检测与跟踪、像素级分割、场景理解、三维重建等,也取得突破性的进展,其应用范围也变得日益广阔。在这种大背景下,全球各大高校陆续开设了计算机视觉课程,比较有代表性的课程包括斯坦福大学李飞飞教授开设的Computer Vision: Foundations and Applications课程[2]、华盛顿大学Ali Farhadi教授开设的Computer Vision课程[3]等。同济大学软件学院的计算机视觉课程[4]开设于2010年秋季学期,是全国范围内较早在本科阶段开设此课程的院系

2 教学难点与应对策略

计算机视觉是一门理论性和实践性都很强的课程,学生较难掌握。学习本门课程需要综合运用多门课程的知识,如微积分、线性代数、概率论、高等几何、数字图像处理、机器学习等,这对教师和学生都有很高的要求。同时,由于该学科是一门新兴学科,学科理论与方法目前仍处于快速发展阶段,因此,如何把当前该领域最新的思想和方法融入教学环节中,一直是任课教师所面临的巨大挑战

为了加深学生对课上讲授理论内容的理解和认识,任课教师对大部分关键理论和算法都给出代码实现并配以验证性实验,学生可以利用上机课时对代码内容进行学习。虽然这种方式非常有利于学生对课堂理论内容的理解和掌握,但是在教学实践过程中,这种教学形式还存在一些不足之处,主要体现在两个方面

(1)目前,课程的代码实现都是针对独立的算法,注重培养学生对关键算法的理解能力,而代码和知识点都较为分散,没有形成针对一个大型任务的整体实验平台,不利于培养学生解决整体复杂问题的能力

(2)目前,课程的上机实验都是验证性实验,教师不仅给出所有的代码实现,还配置好运行环境,准备好实验数据,而上机的主要目的是让学生通过阅读和调试代码对课上所学理论内容加以理解和消化;但是我们发现,部分学习自制力较差的学生不仅在上机时间没有按照要求参与实验,而且也没有认真阅读和调试实验程序。我们分析认为,产生这种情况的部分原因是教师没有给学生明确分配需要完成的任务,导致其参与度降低

为了解决上述问题,我们建议打造4个面向计算机视觉课程的综合性实验平台,覆盖课程大约90%的知识点。总体的思路是:所有实验都根据课程进度划分为若干个相对独立的模块,实验的整体性框架代码和模块的框架性代码都由教师提供,模块的一些关键部分则空出来,留给学生完成;每次上机前,由教师描述本次上机的目的和需要学生完成的具体任务,学生可以在上机时段根据课堂内容对模块空缺的关键部分进行完善;当各综合性实验结束时,实验程序可以处理一个相对完整和复杂的问题。这样不仅有利于培养学生解决整体复杂问题的能力,还能提升学生对上机课的参与程度,培养学生的学习兴趣。具体来说,根据目前的教学内容,我们可以建设4个综合性实验平台,包括全景拼接实验平台、生物特征识别实验平台、三维模型检索实验平台和深度学习实验平台

3 综合性实验平台的建设

根据现行计算机视觉课程的教学内容,我们可以设计4个综合性实验平台。其中,总体框架性代码和模块的框架性代码都由教师提供;随着课堂教学的展开,学生须利用上机课时完成相应模块核心代码的编写工作,且模块核心代码所使用的算法会在理论课上讲授

3.1 全景拼接实验平台

全景拼接是一种把两张或多张图像根据重合内容拼接成一张大的图像的技术。这些图像需要满足一定的假设条件,即图像所拍摄的景物基本上处于同一个物理平面,两张图像的内容之间需要存在显著的重合。把两张图像拼接成一??图像的示例如图1所示,其中,图1(a)和1(b)是同济大学软件学院正门的有部分区域重叠的两张图像,图1(c)是把1(a)变换到1(b)所在坐

你可能感兴趣的:(同济大学计算机视觉)