加入收藏  || English Version 
 
《计算机视觉》教学大纲

  发布日期:2015-03-11  浏览量:952


                                                

计算机视觉》课程是信息与计算科学专业的选修课程.《计算机视觉》以视觉技术为逻辑起点,以信息与计算科学专业的学生为讲授对象.计算机视觉(Machine Vision)是基于视觉技术的一门边缘科学,其核心技术是视觉处理,并通过对视觉处理来实行进一步的检测与控制等.它的研究内容非常广泛,涉及计算机、图像处理、模式识别、人工智能、信号处理、光学、机械等多个领域.用简单的一句话来概括就是用机器代替人眼来做各种测量和判断.本课程有助于开阔学生视野、使学生了解本专业的发展前沿,是集理论性与应用性为一体的学科.

设置本课程的目的是:使学习者在全面了解视觉技术的历史、现状与发展趋势的基础上,系统掌握计算机视觉图像基本处理的理论、方法、技术,运用计算机视觉基本理论、实验装置和图像处理App,加深理解计算机视觉的基本概念,具备在计算机上利用图像处理App进行相关操作的实际技能,培养学生的动手能力和分析问题解决问题的能力,把学生培养成面向二十一世纪的复合型人才.

学习本课程的要求是:学习者应掌握计算机视觉的基础理论、基本方法和实用算法,如:二值图像分析、图像预处理、图像增强、边缘检测、图像分割、纹理分析、明暗分析、深度图与立体视觉.并掌握一定的科学研究方法与技能,为有潜力成为研究型人才的学生打下一定基础.

先修课程要求:MATLAB编程,空间解析几何,数学分析,高等代数.

本课程计划72学时课堂教学+36学时实验,3学分,每周4+2个课时.

选用教材:()杰恩(Jain.R)等著,计算机视觉(英文版),机械工业出版社,2003

教学手段:课堂讲授为主,习题课,试验为辅

考核方法:闭卷书面考试

 

 

 

教学进程安排表

周次

学时数

教学方法

备注

1

3

计算机视觉的定义,视觉系统所包含的部分,视觉所面临的问题;计算机视觉的应用;对图像的简单处理,与其它学科的关系.

讲课

 

2

3

成像和图像表示.先容成像原理,成像过程产生的变形和各种感应器,特别是CCD摄像机;目前流行的图像表示技术.讨论图像与空间的关系.

讲课

 

3

3

二值图像处理().二值图像中的拓扑定义,图像的基本算法的表示,标志算法,物体的性质提取.

讲课与习题课相结合

 

4

3

二值图像处理(二).形态学,物体的性质提取;阀值化方法.

讲课

 

5

3

模式识别().基本概念,类别的表示,分类器,决策树.

讲课

 

6

3

模式识别(二).Bayes分类和人工神经网络.

讲课与习题课相结合

 

7

3

滤波和图像增强().滤波和图像增强的原因,灰度值的映射(含直方图的均衡化),小块噪声去除.

讲课

 

8

3

滤波和图像增强(二).平滑处理,中值滤波器,边缘检测.

讲课

 

9

3

滤波和图像增强(三).Canny边缘检测,卷积,矩阵空间的基,Fouier变换.

讲课与习题课相结合

 

10

3

彩色和阴影.色彩的物理性质,彩色的RGB基和其它基表示,彩色直方图,彩色图像分割.

讲课

 

11

3

纹理分析.纹理分析和纹理分割.

讲课

 

12

3

基于图像内容的图像恢复.图像库,图像查询,图像距离和图像数据库的结构.

讲课与习题课相结合

 

13

3

基于2D图像序列的运动分析().运动现象和应用,运动向量的计算.

讲课

 

14

3

基于2D图像序列的运动分析(二).运动点的路径计算,检测视频中的显著变化.

讲课

 

15

3

图像分割().区域的确定和表示,轮廓的确定.

讲课与习题课相结合

 

16

3

图像分割(二).对分割的拟合,确定高层次的结构,基于运动关联性的分割.

讲课

 

17

3

2D图像匹配().2D数据的配准,点的表示,仿射映射.

讲课

 

18

3

2D图像匹配(二).最好二维仿射变换,基于仿射变换的2D物体识别,基于关系匹配的2D物体识别,非线性变形.

讲课与习题课相结合

 

19

3

基于2D图像的3D理解().特征图像,基于方块的直线标记,2D图像中的三维线索.

讲课

 

20

3

基于2D图像的3D理解(二).透视成像模型,基于立体图像的深度感知,薄棱镜方程.

讲课与习题课相结合

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

第一章  绪论

一、学习目的

通过本章的学习,熟练掌握计算机视觉的定义,视觉系统所包含的部分,视觉所面临的问题;计算机视觉的应用;对图像的简单处理,与其它学科的关系.绪论计划6学时.

二、课程内容

§1.1  Marr的视觉计算理论

简要地先容Marr的视觉理论的基本思想及其理论框架.

§1.2  计算机视觉的应用

计算机视觉技术正广泛地应用于各个方面,从医学图像到遥感图像,从工业检测到文件处理,从毫微米技术到多媒体数据库,不一而足.可以说,需要人类视觉的场合几乎都需要计算机视觉.应该指出的是,许多人类视觉无法感知的场合,如精确定量感知、危险场景感知、不可见物体感知等,计算机视觉更突显其优越性.

§1.3  计算机视觉研究内容与面临的困难

计算机视觉研究可以分为如下五大研究内容:输入设备、低层视觉、中层视觉、高层视觉、体系结构.识别和理解周围场景是一件非常容易的事,但对于机器来说,却是一件很困难的事.

§1.4  计算机视觉与其它学科领域的关系

与计算机视觉有关的学科有许多.本节主要讨论一些与计算机视觉密切相关的领域.关于计算机视觉与其它学科的关系,大家不作详尽的讨论.

§1.5  成像几何基础

这里大家只考虑三维空间到二维空间的两种常用映射:透视投影变换和正交投影变换.

三、重点、难点提示和教学手段

(一)重点、难点

1计算机视觉研究内容与面临的困难

2计算机视觉与其它学科领域的关系

3成像几何基础

(二)教学手段

课堂讲授与习题课相结合.

四、思考与练习

(注:思考与练习的形式有教师自行确定)

 

第二章  二值图像分析

一、学习目的

二值视觉系统的输入一般是灰度图像,通常使用阈值法首先将图像变成二值图像,以便把物体从背景中分离出来,其中的阈值取决于照明条件和物体的反射特性.二值图像可用来计算特定任务中物体的几何和拓扑特性,在许多应用中,这种特性对识别物体来说是足够的.二值视觉系统已经在光学字符识别、染色体分析和工业零件的识别中得到了广泛应用.通过本章的学习,熟练掌握二值图像中的拓扑定义,图像的基本算法的表示,标志算法,物体的性质提取.形态学,物体的性质提取;阀值化方法.本章计划6学时.

二、课程内容

§2.1 阈值

从图像中识别代表物体的区域(或子图像),这种对人来说是件非常容易的事,对计算机来说却是令人吃惊的困难.为了将物体区域同图像其它区域分离出来,需要首先对图像进行分割.把图像划分成区域的过程称为分割.

§2.2 几何特性

通过阈值化方法从图像中检测出物体后,下一步就要对物体进行识别和定位.在大多数工业应用中,摄像机的位置和环境是已知的,因此通过简单的几何常识就可以从物体的二维图像确定出物体的三维位置.在大多数应用中,物体的数量不是很多,如果物体的尺寸和形状完全不同,则可以利用尺度和形状特征来识别这些物体.实际上在许多工业应用中,经常使用区域的一些简单特征,如大小、位置和方向,来确定物体的位置并识别它们.

§2.3 投影

给定一条直线,用垂直该直线的一簇等间距直线将一幅二值图像分割成若干条,每一条内像素值1的像素个数为该条二值图像在给定直线上的投影(projection).

§2.4  游程长度编码

游程长度编码(run-length encoding)是另一种二值图像的简洁表示方法,它是用图像像素值连续为1的个数(像素1的长度)来描述图像.这种编码已被用于图像传输.另外,图像的某些性质,如物体区域面积,也可以从游程长度编码直接计算出来.

三、重点、难点提示和教学手段

(一)重点、难点


1阈值

2几何特性

3投影

4游程长度编码


(二)教学手段

课堂讲授与习题课相结合.

四、思考与练习

(注:思考与练习的形式有教师自行确定)

 

第三章  区域分析

一、学习目的

图像中的区域是指相互连结的具有相似特性的一组像素.由于区域可能对应场景中的物体,因此,区域的检测对于图像说明十分重要.一幅图像可能包含若干个物体,而每一个物体又可能包含对应于物体不同部位的若干个区域.为了精确说明一幅图像,首先要把一幅图像划分成对应于不同物体或物体不同部位的区域.本章计划6学时.

二、课程内容

§3.1  区域和边缘

图像区域划分有两种方法:一种是基于区域的方法,另一种是使用边缘检测的轮廓预估方法

§3.2  分割

把一幅灰度图像转换成二值图像是图像分割的最简单形式.用于求取二值图像的阈值算法可以推广到求取多值图像,其中的阈值算法已经在第三章中讨论过了.为了在各种变化的场景中都能得到鲁棒的图像分割,阈值分割算法应能根据图像强度取样来自动选取合适的阈值.阈值分割法不要过分依赖于物体的灰度常识,且使用有关灰度值的相对特性来选取合适的阈值.

§3.3  区域表示

区域有许多应用,也有许多种表示方法.不同的表示方法有着不同的应用.一些应用只需计算单个区域,而另一些则需要计算图像各区域的关系.本节将讨论几种区域表示方法并研究它们的特性.大多数区域表示方法可以归纳为下面三种类型:阵列表示,层级表示,基于特征的区域表示

§3.4  分裂和合并

使用分裂和合并的组合算法可以实现自动细化分割运算.分裂和合并运算是通过合并属于同一物体的邻接区域来消除错误的边界和虚假的区域,同时可以通过分裂属于不同物体的区域来增添丢失的边界

§3.5  区域增长

寻找初始区域核,并从区域核开始,逐渐增长核区域,形成满足一定约束的较大的区域.例如,一致性谓词是基于区域灰度的平面或二次曲面函数拟合.然而,在一般情况下,一致性谓词是基于图像区域的特征,如,平均强度、方差、纹理和颜色等.

三、重点、难点提示和教学手段

(一)重点、难点


1分割

2区域表示

3分裂和合并

4区域增长


(二)教学手段

课堂讲授与习题课相结合

四、思考与练习

(注:思考与练习的形式有教师自行确定)

 

第四章  图像预处理

一、学习目的

通过本章的学习,熟练掌握图像增强技术的两种方法:空间域法和频率域法.空间域方法主要是在空间域内对图像像素直接运算处理.频率域方法就是在图像的某种变换域,对图像的变换值进行运算,如先对图像进行傅立叶变换,再对图像的频谱进行某种计算(如滤波等),最后将计算后的图像逆变换到空间域.本章计划9学时.

二、课程内容

§4.1  直方图修正

直方图均衡化是一种通过重新均匀地分布各灰度值来增强图像对比度的方法.经过直方图均衡化的图像对二值化阈值选取十分有利.一般来说,直方图修正能提高图像的主观质量,因此在处理艺术图像时非常有用

§4.2  图像线性运算

熟练掌握线性系统和傅立叶变换

§4.3  线性滤波器

熟练掌握均值滤波器,高斯平滑滤波

§4.4  非线性滤波

熟练掌握中值滤波,边缘保持滤波器

三、重点、难点提示和教学手段

(一)重点、难点

1直方图修正

2图像线性运算,线性系统和傅立叶变换

3线性滤波器,均值滤波器,高斯平滑滤波

4非线性滤波中值滤波,边缘保持滤波器

(二)教学手段

课堂讲授与习题课相结合,计算机试验.

四、思考与练习

(注:思考与练习的形式有教师自行确定)

 

第五章  边缘检测

一、学习目的

边缘(edge)是指图像局部强度变化最显著的部分.边缘主要存在于目标与目标、目标与背景、区域与区域(包括不同色彩)之间,是图像分割、纹理特征和形状特征等图像分析的重要基础.图像分析和理解的第一步常常是边缘检测(edge detection).本章计划9学时.

二、课程内容

§5.1  梯度

边缘检测是检测图像局部显著变化的最基本运算.在一维情况下,阶跃边缘同图像的一阶导数局部峰值有关.梯度是函数变化的一种度量,而一幅图像可以看作是图像强度连续函数的取样点阵列.因此,同一维情况类似,图像灰度值的显著变化可用梯度的离散逼近函数来检测

§5.2  边缘检测算法

熟练掌握边缘检测算法有如下四个步骤:滤波,增强,检测,定位.熟练掌握Roberts算子、Sobel算子、Prewitt算子.

§5.3  二阶微分算子

熟练掌握二阶导数有两种算子:拉普拉斯算子和二阶方向导数

§5.4  LOG算法

将高斯滤波和拉普拉斯边缘检测结合在一起,形成LOGLaplacian of Gaussian, LOG)算法,也称之为拉普拉斯高斯算法.了解LOG边缘检测器的基本特征

§5.5  图像逼近

理解图像逼近

§5.6  Canny 边缘检测器

Canny边缘检测器是高斯函数的一阶导数,是对信噪比与定位之乘积的最优化逼近算子.

§5.7  边缘检测器性能

理解评价边缘检测器性能的测度公式

 

三、重点、难点提示和教学手段

(一)重点、难点

1梯度

2边缘检测算法,Roberts算子、Sobel算子、Prewitt算子

3二阶微分算子,拉普拉斯算子和二阶方向导数;

4LOG算法

5Canny 边缘检测器;

(二)教学手段

课堂讲授与习题课相结合

四、思考与练习

(注:思考与练习的形式有教师自行确定)

 

第六章  纹理分析

一、学习目的

通过本章的学习,掌握纹理分析和纹理分割.

二、课程内容

§6.1  纹理分析统计方法

熟练掌握纹理分析统计方法,灰度级同现矩阵,自相关法

§6.2  纹理分析

理解有序纹理的结构分析,基于模型的纹理分析,用分形理论分析纹理

§6.3  从纹理恢复形状

了解纹理基元的尺寸、形状、和密度等变化为表面形状和姿态估计提供了依据.从纹理恢复形状算法正是利用了这些纹理基元的变化特性,以便从二维图像恢复三维信息.本章计划9学时.

三、重点、难点提示和教学手段

(一)重点、难点

1灰度级同现矩阵

2、自相关法;

3、有序纹理的结构分析;

4、基于模型的纹理分析;

5、用分形理论分析纹理;

6、从纹理恢复形状.

(二)教学手段

课堂讲授与习题课相结合

四、思考与练习

(注:思考与练习的形式有教师自行确定)

 

阅读书目(或参考文献)

[1] () Tom Mitchell著,曾华军等译,机器学习,机械工业出版社,2005

[2] 云得著 《计算机视觉》科学出版社,2002年.

[3] () Tom M.Mitchell著,机器学习(英文版),机械工业出版社,2003

 

打印此页】【顶部】【关闭
   
版权所有 2019 澳门赌搏网站大全 All rights reserved 皖ICP备05018241号
地址:安徽省合肥市九龙路111号澳门新莆京娱乐网站磬苑校区理工楼H楼 邮编:230601 E-mail:math@ahu.edu.cn
访问统计:自2013年9月1日以来总访问:1000  后台管理


XML 地图 | Sitemap 地图