图像处理分析与机器视觉(第二版)
[绝版]基本信息
内容简介回到顶部↑
本书是为计算机专业图像处理、图像分析和机器视觉课程编写的教材,被美国卡耐基梅隆大学等高等学校选用。
本书内容包括图像预处理、图像分割、形状表示与描述、物体识别与图像理解、三维视觉、数学形态学图像处理技术、离散图像变换、图像压缩、纹理描述、运动分析以及实际应用的案例研究等等。全书力图将复杂的概念用易于理解的算法描述出来,书中提供了大量图示和插图,特别有助于对概念的理解。每章最后还附有大量思考题和练习题以及丰富的参考文献列表,便于读者学习和理解。
本书所讲解的概念和原理覆盖了十分广泛的领域,涉及人工智能(如启发式搜索)、信号处理(如卷积、傅立叶变换)、人工神经网络、模式识别、模糊数学等一系列相关学科。读者通过学习本书,可以学到这些学科中很多具有普遍价值的知识和具体的应用方法。
本书可作为高等院校计算机专业高年级本科生和研究生相应课程的教材,可以结合实际情况学习相应的章节。本书也特别适合有一定基础的读者自学。本书对从事相关科学技术领域的研究和工程技术人员也有很高的参考价值。此外,对于本领域的专业人士也可结合其英文版一起作为技术手册使用。
本书内容包括图像预处理、图像分割、形状表示与描述、物体识别与图像理解、三维视觉、数学形态学图像处理技术、离散图像变换、图像压缩、纹理描述、运动分析以及实际应用的案例研究等等。全书力图将复杂的概念用易于理解的算法描述出来,书中提供了大量图示和插图,特别有助于对概念的理解。每章最后还附有大量思考题和练习题以及丰富的参考文献列表,便于读者学习和理解。
本书所讲解的概念和原理覆盖了十分广泛的领域,涉及人工智能(如启发式搜索)、信号处理(如卷积、傅立叶变换)、人工神经网络、模式识别、模糊数学等一系列相关学科。读者通过学习本书,可以学到这些学科中很多具有普遍价值的知识和具体的应用方法。
本书可作为高等院校计算机专业高年级本科生和研究生相应课程的教材,可以结合实际情况学习相应的章节。本书也特别适合有一定基础的读者自学。本书对从事相关科学技术领域的研究和工程技术人员也有很高的参考价值。此外,对于本领域的专业人士也可结合其英文版一起作为技术手册使用。
目录回到顶部↑
第1章 引言
1.1 总结
1.2 习题
1.3 参考文献
第2章 数字图像及其性质
2.1 基本概念
2.1.1 图像函数
2.1.2 狄拉克(dirac)分布和卷积
2.1.3 傅立叶变换
2.1.4 作为随机过程的图像
2.1.5 作为线性系统的图像
2.2 图像数字化
2.2.1 采样
2.2.2 量化
2.2.3 彩色图像
2.3 数字图像性质
2.3.1 数字图像的度量和拓扑性质
2.3.2 直方图
2.3.3 图像的视觉感知
2.3.4 图像品质
1.1 总结
1.2 习题
1.3 参考文献
第2章 数字图像及其性质
2.1 基本概念
2.1.1 图像函数
2.1.2 狄拉克(dirac)分布和卷积
2.1.3 傅立叶变换
2.1.4 作为随机过程的图像
2.1.5 作为线性系统的图像
2.2 图像数字化
2.2.1 采样
2.2.2 量化
2.2.3 彩色图像
2.3 数字图像性质
2.3.1 数字图像的度量和拓扑性质
2.3.2 直方图
2.3.3 图像的视觉感知
2.3.4 图像品质
译者序回到顶部↑
早在翻译本书3年以前,我就在“数字图像处理”和“图像与视觉计算”课程的教学过程中,向学生推荐这本教材作为参考书,但是当时只有国外出版的英文书,学生不易获得。2002年国内出版了影印的英文版,这大大方便了学生的课后学习。为了帮助学生解决在阅读英文版时遇到的困难,我承担了这本书的翻译工作。当然,有了中文版,对更广大的读者尤其是不能熟练阅读英文书的读者而言,无疑可以使学习变得容易一些,因而也就能更好地发挥本书的作用。
在本书的翻译过程中,对于英文版中明显存在的(主要是排印或疏忽导致的错误),我们都进行了订正。这些错误一般都很明显,因此译文中没有专门声明,读者如果对照英文版也不难看出。有英文阅读能力的读者,不妨参照英文版来阅读本书,这样可以加深对相关专业术语的理解,也不失为一种提高专业英语阅读能力的实践途径。
本书的翻译者(按照工作量的大小排序)为:艾海舟(第1~5,9~10章)、武勃(第7,11章)、邸慧军(第6,14章)、王佟(第8章)、施新刚(第12~13章)、孙兴华(第15章)、王宇博(第16章和术语表)。艾海舟负责全部书稿的审定。由于译者水平有限,书中难免存在纰漏,欢迎广大读者批评指正。读者发现的问题,请发电子邮件告知,以便今后再版时订正过来。
艾海舟
清华大学计算机系
电子邮件:ahz@mail.tsinghua.edu.cn
主页网址:http://media.cs.tsinghua.edu.cn/~ahz
在本书的翻译过程中,对于英文版中明显存在的(主要是排印或疏忽导致的错误),我们都进行了订正。这些错误一般都很明显,因此译文中没有专门声明,读者如果对照英文版也不难看出。有英文阅读能力的读者,不妨参照英文版来阅读本书,这样可以加深对相关专业术语的理解,也不失为一种提高专业英语阅读能力的实践途径。
本书的翻译者(按照工作量的大小排序)为:艾海舟(第1~5,9~10章)、武勃(第7,11章)、邸慧军(第6,14章)、王佟(第8章)、施新刚(第12~13章)、孙兴华(第15章)、王宇博(第16章和术语表)。艾海舟负责全部书稿的审定。由于译者水平有限,书中难免存在纰漏,欢迎广大读者批评指正。读者发现的问题,请发电子邮件告知,以便今后再版时订正过来。
艾海舟
清华大学计算机系
电子邮件:ahz@mail.tsinghua.edu.cn
主页网址:http://media.cs.tsinghua.edu.cn/~ahz
序言回到顶部↑
图像处理、分析与机器视觉是认知科学与计算机科学中的一个令人兴奋的活跃分支。自20世纪70年代,该领域经历了人们对其兴趣的爆炸性增长之后,在80到90年代逐步走向成熟,伴随而来的是实际应用的显著增长,其中遥感、技术诊断、自主车导航、医学成像(2D和3D)和自动监视是发展忌陕的方向。这种进展从市场上相关软件和硬件产品的日益增加就可见一斑,世界范围的大学里都提供了有关图像处理和机器视觉的课程也可反映这一进展。
在我们所覆盖的领域里,已经有很多教材,大多数(事实上,所有我们知道的)在本书中都已引用到。但是,本学科仍缺少既适合于初学者学习,又对有一定基础的读者有参考价值,同时还反映了最新进展的“完整”意义的教材。本书是我们1993年出版的教材的第二版,我们期望包含已经出现了的和还正在发生着的许多非常迅速的发展,这些新的发展使一些在过去大约20年间出版的非常好的教材很快变得过时了。本书的读者对象既包含对本领域几乎没有任何经验的本科生,也包括为特别主题寻求高级“跳板”的硕士研究生。这本教材的每个章节都在第一版的基础上进行了更新(尤其是参考文献),此外,还增加了一些全新的章节:JPEG和MPEG压缩、分形、模糊逻辑识别、隐马尔可夫模型、卡尔曼滤波、点分布模型、三维视觉、分水岭分割、小波以及整个一个章节的实例分析。而且,现在每章都包含了一个概要小节。为了帮助读者加深理解,每章之后新增加了习题单元,其形式包括需要简洁回答的思考题和不同难度的问题,通常需要使用计算机工具及编写应用程序。
这本书反映了作者在给本科生和研究生讲授课程当中所积累的经验,这些课程包括数字图像处理、数字图像分析、机器视觉、模式识别和智能机器人。我们希望这种结合教学经验的方式能够为初学者提供完整的基础,为有一定基础的学生充分地理解与该主题相关的领域提供足够先进的资料。不过需要指出的是目前发展更活跃的领域会在很短的时间内超出本教材的范围。
本书是可以有多种安排形式的。我们选择从低层次处理开始,逐步过渡到更高层次的图像解释,因为我们认为图像理解起源于一个共同的信息库。本书共分为16章,从低层次处理开始,逐步展开到高层次的图像表示,这一结构在从第10章之后将变得不那么明显,这时我们给出变换、压缩、形态学、纹理、运动分析这些非常有用但常常是有特殊目的的处理方法,这些处理并不总是出现在处理链中。最后一章介绍了4个当前的研究项目,以便解释已经讲过的技术的实际应用方法。
章节按顺序编号,公式和图按照章内顺序编码。每章之后列出大量的参考文献和习题。我们按照有助于实现的方式正规地总结了一些挑选出来的算法,但其他讨论到的算法则没有总结(不然的话,本书的篇幅会两倍于此)。我们选择算法的依据是,我们认为是关键的或最有用的,或最具解释性的。
每章所介绍的内容包含从入门级的资料到当前研究的总体情况,因此,初学者不太可能第一次阅读就能消化给定主题的所有内容。在当前的段落中,时常会出现有必要引用后面章节资料的情况,但是这时对当前资料的理解不会依赖于对后面出现的内容的理解。对于有一定基础的学生,本书可以作为在该领域进行研究活动的参考资料和“路标”——我们相信在本书付印之时其参考文献足以反映当前的研究方向,但是在这里我们对被忽视了的著作表示歉意。仔细的读者将会发现许多参考文献是非常新的,但是应该明确的是,过不了多久就会有本书中没有提及的更多的相关著作发表。
本书的篇幅很长,因此远比一门课程的内容要多。显然,使用本书的方式有很多种,我们提出了如下的形成四个独特模块的顺序,仅供参考:
数字图像处理,本科生课程。
数字图像分析,本科生厮究生课程,数字图像处理可以作为该课程的先修课程。
计算机视觉I,本科生/研究生课程,数字图像处理可以作为该课程的先修课程。
计算机视觉II,研究生课程,计算机视觉I可以作为该课程的先修课程。
一门课程的重点部分以及必要的先修课程一般取决于本地的情况,有关划分内容的建议我们将在序言之后给出。
作业应该尽可能使用现有的软件,我们的经验是这种性质的课程不应该被看作是“程序设计课程”,但是事实上是这样的:学生对于本书所论述内容的实践经验越直接,他们对内容的理解就越好。自从本书第一版出版以来,基于万维网(World Wide Web)的信息爆炸性增长,使得我们提供的习题可以不需要从低层做起——我们没有直接给出到万维网资料的链接,是因为考虑到它们变化得太快了,但是,有关本书及其他的特殊支持资料的链接可以通过出版商的网站查找到,网址是http://www.brookscole.com。
如果没有广泛地使用因特网(Internet)、计算机网络和电子邮件的话;完成此书是不可能的。我们要感谢爱荷华大学(University of Iowa)、捷克理工大学(Czech Technical University)、利兹大学计算机学院(School of Computer Studies at Leeds University),他们提供了撰写此书所需的条件。 ’
Milan Sonka曾在捷克理工大学控制工程系和电机工程系工作了10年,目前是美国爱荷华大学电机与计算机工程系副教授。他的研究兴趣包括医学图像分析、基于知识的图像分析和机器视觉。Vaclav Hlavac是捷克理工大学控制工程系副教授,他的研究兴趣是基于知识的图像分析和基于3D模型的视觉。Roger Boyle是英国利兹大学计算机学院人工智能高级讲师,他的研究兴趣是低层视觉和模式识别。前两位作者曾经共同工作过一些年,他们从1993年起与第三位作者一直在合作。
本书初稿的许多改进得益于作者们与他们的老师、同事以及学生的许多讨论。我们要特别感谢捷克理工大学的Tomas Pajdla,Petr Kodl,Radim Sara,爱荷华大学的Steve Collins,Lappeenranta大学的Jussi Parkkinen,Bremen大学的Guido Prause,利兹大学的David Hogg,以及许多其他的人,虽然这里没有提到他们的名字,但并不能减少他们贡献的价值。来自家庭的一贯支持和鼓励,尽管难以用语言表达,但这些对于本书的完成是十分重要的。再一次,我们保证下一本书不会在业余时间或假期里撰写(但是,我们的这本书是个例外)。
所有的作者对整本书都有贡献——封面的排名是根据个人的贡献量确定的。任何事实错误都由全体负责,但是排印方面的任何错误都由Roger Boyle承担。我们将会高兴地共同承担将来版本的校订工作。
Milan Sonka(Milan-sonka@uiowa.edu)
爱荷华大学,(美国爱荷华市,爱荷华,)
Vaclav Hlavac(hlavac@vision.felk.cvut.cz)
在我们所覆盖的领域里,已经有很多教材,大多数(事实上,所有我们知道的)在本书中都已引用到。但是,本学科仍缺少既适合于初学者学习,又对有一定基础的读者有参考价值,同时还反映了最新进展的“完整”意义的教材。本书是我们1993年出版的教材的第二版,我们期望包含已经出现了的和还正在发生着的许多非常迅速的发展,这些新的发展使一些在过去大约20年间出版的非常好的教材很快变得过时了。本书的读者对象既包含对本领域几乎没有任何经验的本科生,也包括为特别主题寻求高级“跳板”的硕士研究生。这本教材的每个章节都在第一版的基础上进行了更新(尤其是参考文献),此外,还增加了一些全新的章节:JPEG和MPEG压缩、分形、模糊逻辑识别、隐马尔可夫模型、卡尔曼滤波、点分布模型、三维视觉、分水岭分割、小波以及整个一个章节的实例分析。而且,现在每章都包含了一个概要小节。为了帮助读者加深理解,每章之后新增加了习题单元,其形式包括需要简洁回答的思考题和不同难度的问题,通常需要使用计算机工具及编写应用程序。
这本书反映了作者在给本科生和研究生讲授课程当中所积累的经验,这些课程包括数字图像处理、数字图像分析、机器视觉、模式识别和智能机器人。我们希望这种结合教学经验的方式能够为初学者提供完整的基础,为有一定基础的学生充分地理解与该主题相关的领域提供足够先进的资料。不过需要指出的是目前发展更活跃的领域会在很短的时间内超出本教材的范围。
本书是可以有多种安排形式的。我们选择从低层次处理开始,逐步过渡到更高层次的图像解释,因为我们认为图像理解起源于一个共同的信息库。本书共分为16章,从低层次处理开始,逐步展开到高层次的图像表示,这一结构在从第10章之后将变得不那么明显,这时我们给出变换、压缩、形态学、纹理、运动分析这些非常有用但常常是有特殊目的的处理方法,这些处理并不总是出现在处理链中。最后一章介绍了4个当前的研究项目,以便解释已经讲过的技术的实际应用方法。
章节按顺序编号,公式和图按照章内顺序编码。每章之后列出大量的参考文献和习题。我们按照有助于实现的方式正规地总结了一些挑选出来的算法,但其他讨论到的算法则没有总结(不然的话,本书的篇幅会两倍于此)。我们选择算法的依据是,我们认为是关键的或最有用的,或最具解释性的。
每章所介绍的内容包含从入门级的资料到当前研究的总体情况,因此,初学者不太可能第一次阅读就能消化给定主题的所有内容。在当前的段落中,时常会出现有必要引用后面章节资料的情况,但是这时对当前资料的理解不会依赖于对后面出现的内容的理解。对于有一定基础的学生,本书可以作为在该领域进行研究活动的参考资料和“路标”——我们相信在本书付印之时其参考文献足以反映当前的研究方向,但是在这里我们对被忽视了的著作表示歉意。仔细的读者将会发现许多参考文献是非常新的,但是应该明确的是,过不了多久就会有本书中没有提及的更多的相关著作发表。
本书的篇幅很长,因此远比一门课程的内容要多。显然,使用本书的方式有很多种,我们提出了如下的形成四个独特模块的顺序,仅供参考:
数字图像处理,本科生课程。
数字图像分析,本科生厮究生课程,数字图像处理可以作为该课程的先修课程。
计算机视觉I,本科生/研究生课程,数字图像处理可以作为该课程的先修课程。
计算机视觉II,研究生课程,计算机视觉I可以作为该课程的先修课程。
一门课程的重点部分以及必要的先修课程一般取决于本地的情况,有关划分内容的建议我们将在序言之后给出。
作业应该尽可能使用现有的软件,我们的经验是这种性质的课程不应该被看作是“程序设计课程”,但是事实上是这样的:学生对于本书所论述内容的实践经验越直接,他们对内容的理解就越好。自从本书第一版出版以来,基于万维网(World Wide Web)的信息爆炸性增长,使得我们提供的习题可以不需要从低层做起——我们没有直接给出到万维网资料的链接,是因为考虑到它们变化得太快了,但是,有关本书及其他的特殊支持资料的链接可以通过出版商的网站查找到,网址是http://www.brookscole.com。
如果没有广泛地使用因特网(Internet)、计算机网络和电子邮件的话;完成此书是不可能的。我们要感谢爱荷华大学(University of Iowa)、捷克理工大学(Czech Technical University)、利兹大学计算机学院(School of Computer Studies at Leeds University),他们提供了撰写此书所需的条件。 ’
Milan Sonka曾在捷克理工大学控制工程系和电机工程系工作了10年,目前是美国爱荷华大学电机与计算机工程系副教授。他的研究兴趣包括医学图像分析、基于知识的图像分析和机器视觉。Vaclav Hlavac是捷克理工大学控制工程系副教授,他的研究兴趣是基于知识的图像分析和基于3D模型的视觉。Roger Boyle是英国利兹大学计算机学院人工智能高级讲师,他的研究兴趣是低层视觉和模式识别。前两位作者曾经共同工作过一些年,他们从1993年起与第三位作者一直在合作。
本书初稿的许多改进得益于作者们与他们的老师、同事以及学生的许多讨论。我们要特别感谢捷克理工大学的Tomas Pajdla,Petr Kodl,Radim Sara,爱荷华大学的Steve Collins,Lappeenranta大学的Jussi Parkkinen,Bremen大学的Guido Prause,利兹大学的David Hogg,以及许多其他的人,虽然这里没有提到他们的名字,但并不能减少他们贡献的价值。来自家庭的一贯支持和鼓励,尽管难以用语言表达,但这些对于本书的完成是十分重要的。再一次,我们保证下一本书不会在业余时间或假期里撰写(但是,我们的这本书是个例外)。
所有的作者对整本书都有贡献——封面的排名是根据个人的贡献量确定的。任何事实错误都由全体负责,但是排印方面的任何错误都由Roger Boyle承担。我们将会高兴地共同承担将来版本的校订工作。
Milan Sonka(Milan-sonka@uiowa.edu)
爱荷华大学,(美国爱荷华市,爱荷华,)
Vaclav Hlavac(hlavac@vision.felk.cvut.cz)








点击看大图





加载中...

