基本信息
- 原书名:Elements of Information Theory
- 原出版社: John Wiley & Sons, Inc.

编辑推荐
本书介绍信息论及其应用,内容丰富,涉及信息、统计、计算机科学等领域,系统和全面地介绍了香农信息论的基本理论与多类应用问题,其中包括作者的许多研究成果。本书包含大量的例题与背景说明,涉及信息处理与信息世界中的许多问题。本书是美国斯坦福大学、莱斯大学等使用的信息论教材,是学习信息论的主要参考书。
内容简介
数学书籍
本书全面系统地介绍了香农信息论的基本理论以及多类应用问题,其中包括了作者的许多研究成果。本书阐述了熵、相对熵和互信息之间的基本代数关系,论述了渐近均分性(AEP)、随机过程和数据压缩的熵率,Kolmogorov复杂度、信道容量定理、微分熵以及网络信息理论等内容,并采用“使用不等式串、中间不加任何文字、最后直接加以解释”的创新表述方式,使读者学习了一定数量的证明后,在没有任何解释的情况下就能理解其中的大部分步骤,并给予必要的解释。
本书适合作为通信理论、计算机科学和数学等专业学生学习信息论的教材。章后提供的习题便于老师的教学,以及增强学生对信息论的理解。
本书特点
● 包含大量新的素材,如信息论与博弈的关系
● 采用典型序列的方法对编码理论进行描述与证明
● 采用随机码方法证明信道与有失真信源编码定理
作译者
Joy A. Thomas 1990年获美国斯坦福大学电子工程博士学位,1984~1985年被授予IEEEChareles LeGeyt Fortescue Fellowship,1987~1990年被授予IBM Graduate Fellowship。
目录
第2章 熵、相对熵和互信息 9
2.1 熵 9
2.2 联合熵和条件熵 11
2.3 相对熵和互信息 13
2.4 熵与互信息的关系 14
2.5 熵、相对熵和互信息的链式法则 15
2.6 Jensen不等式及其结果 17
2.7 对数和不等式及其应用 22
2.8 数据处理不等式 24
2.9 热力学第二定律 25
2.10 充分统计量 27
2.11 Fano不等式 28
要点 30
习题 31
历史回顾 36
第3章 渐近均分性 39
3.1 渐近均分性的定义 39
3.2 AEP的结果应用:数据压缩 41
3.3 高概率集与典型集 42
译者序
本书的第 2、3、4、9章是关于信息度量问题的讨论,除了介绍香农熵的引入与性质外,还介绍了随机序列的熵率与AEP(渐近均分性)理论。随机序列的熵率与AEP理论是经典的信息论问题,在20世纪60年代的早期信息论著作中有较多的讨论,但在近期的信息论著作中却较少见,这些问题在随机过程的信息处理中有用。第9章则是关于连续型随机变量微分熵的讨论。
通信系统编码理论是信息论的主体部分,其中包括无失真信源编码问题(又称数据压缩理论)、信道编码问题、有失真信源编码问题(又称率失真理论)与网络信息论(又称多用户信息论)四部分内容,分别在第 5、6、8、10、13、14 章中讨论,其中信源与信道编码理论在其他教材或著作中虽有讨论,但本书的内容更为丰富,如有反馈高斯信道编码定理等在其他教材或著作中较为少见。有失真信源编码理论与网络信息论在国内的有关教材中虽有提及,但篇幅不大。本书对这两部分内容都做了系统论述,因此本书是全面介绍信息编码理论的著作。这部分内容的另一个重要特点是对编码理论的描述与证明采用了典型序列的方法来叙述与讨论,对主要的信道与有失真信源编码定理采用随机码的证明方法,这是20世纪 70 年代后信息论研究的主流方法。它们对信息论的主要理论实现了完全严格的数学描述与证明。阅读这些定理的证明有一定的难度,但通过这些定理证明的阅读与理解可以加深对信息编码理论的理解。
本书的第7、11、12、15章是信息论的应用部分,其中第 7 章介绍 Kolmogorov 复杂度问题,这是信息论与计算复杂度相结合的一个学科领域,在有的文献中又称之为算法信息论。该章的主要结论是证明了Kolmogorov复杂度与香农熵的等价性定理,这就得到了信息论与计算机科学的本质联系,也说明了香农熵的广泛意义。第11章和第12章是讨论信息论与统计的联系,其中最大熵原理、谱估计理论与Fisher信息矩阵理论都是信息与统计密切相关的内容,利用信息论的相对熵与典型序列理论对多种统计问题可得到它们更精确的误差估计,证明了多个统计误差可实现指数下降的结论。第15章是利用信息论的方法研究投资组合决策问题,其中许多结果由作者得到。
本书内容十分丰富,涉及信息、统计、金融、逻辑与计算机科学等多个领域,并有大量的例题与背景说明,这些例题与背景涉及信息处理与信息世界中的许多问题,内容十分丰富。在信息编码理论的论述中,所讨论的问题与处理的方法是信息论中最典型的问题与方法,学习与研究这些问题与方法可了解到国际信息论学术界在信息论研究中所使用的语言与方法。本书对所论述的主要定理、重要性质与计算公式都有总结与汇总,并在第1章和第16章中给以介绍和说明。
国际上许多院校把本书作为信息论的经典教材。在电子、通信、计算机与数学等专业领域中,信息论方向的研究生都采用本书为教材或主要参考书,部分本科专业也讲授其中的部分内容。因此本书也适用于国内有关专业作为研究生或本科生的教材或参考书。学好本书就可为信息论打下良好的基础。有关应用部分的内容各章并不关联,因此在学习或讲授时可以选读或选讲。
20世纪末与21世纪初是信息科学与 IT 产业突飞猛进的时代,这些进展无疑得益于信息论基础理论的建立。自本书英文版出版后信息论又有许多重要发展,如调制解调码的理论与应用、数据压缩编码理论的实现以及Turbo码与LDPC码的出现与发展,这些都是信息论理论与应用的重大突破,在信息技术与信息产业发展中发挥了重大的作用。因此,对从事信息论研究与教学的工作者或研究生来讲,还应关心与了解这些发展,以适应信息科学与技术迅速发展的时代。
本书由阮吉寿、张华、沈世镒共同翻译,其中阮吉寿翻译了前言、第1、6、7、8、9、10、11、15章;张华翻译了目录、第2、3、4、5、16章、索引,并对此进行了校对;沈世镒翻译了第12、13、14章。本书由阮吉寿统一执笔,沈世镒对全书把关。同时本书在初稿的翻译过程中,目前在美国攻读博士学位的尚越和余涛同学分别在第7、8、9、10章和第12、13、14章做了有益的工作,这里向他们表示感谢。
由于译者水平和学识有限,难以在本书涉及的方向均具有科班水平,加上时间仓促,翻译中难免有错误和不妥之处,敬请广大读者批评指正。
译 者
2005年1月
前言
本书来自已经使用了十多年的信息论讲义,原讲义是面向信息专业高年级本科生和一年级研究生两学期用的教材。本书打算作为通信理论、计算机科学和统计专业学生学习信息论的教材。
信息论中有两个简明要点。第一,熵和互信息这样的概念是为了回答基本问题而产生的。例如,熵是随机变量的最小描述复杂度,互信息是度量在噪声背景下的通信速率。另外,我们后面还会提到,互信息相当于已知边信息条件下财富双倍率的增长。第二,回答信息论理论问题的答案具有自然代数的结构。例如熵具有链式法则,因而相关联的相对熵和互信息也有相应的链式法则。因为有了它们,才使得数据压缩和通信工程中的问题得到深入的解释。我们都有这样的感受,当某人研究某个问题时,往往历经大量的代数运算推理得到了结果,但此时没有真正了解问题的全貌。最终是通过反复观察结果,才对整个问题有完整、明确的认识。所以,对一个问题的全面理解,不是靠推理,而是靠对结果的观察。要更具体地说明这一点,物理学中的牛顿三大定律和薛定谔波动方程也许是最合适不过的例子。谁曾预见过薛定谔波动方程后来会有如此令人敬畏的哲学解释呢?
在本书中,我们常会在着眼于问题之前,先了解一下答案的性质。比如第2章中,我们首先定义了熵、相对熵和互信息,然后研究它们之间的关系,再对这些关系做一些解释,由此揭示如何融会贯通地使用各式各样的方法去解决实际问题。同理,我们顺便探讨热力学第二定律的含义。熵总是增加的吗?答案既肯定也否定。这种或然结果会令专家感兴趣,但初学者或许认为这是必然的而不会深入考虑。
在实际教学中,教师往往会对教材加入一些自己的见解。事实上,寻找无人知道的证明或者有所创新的结果是一件很愉快的事情。如果有人将新的思想和已经证明的内容在课堂上讲解给学生,那么不仅学生会积极反馈“对,对,对”,而且也会大大地提升教授该课程的乐趣。我们正是这样从研究本教材的许多新想法中获得乐趣。
本书中加入大量新素材,例如,关于信息论与博弈的关系;热力学第二定律的普遍性的讨论,包括它在马尔可夫链中,在信道容量定理的联合典型性的证明过程中,在赫夫曼码的竞争最优性中,以及在关于最大熵谱密度估计的伯格(Burg)定理的证明过程中的应用。Kolmogorov复杂度这一章也是本书的独到之处。而将Fisher信息、互信息与Brunn-Minkowski不等式和熵幂不等式联系在一起,也是我们引以为自豪之处。令我们感到惊讶的是,关于行列式不等式的许多经典结论,当利用信息论知识后会很容易得到证明。
自从香农的奠基性论文面世以来,尽管信息论已有了相当大的发展,但我们还是要努力强调它的相关性。虽然香农创立信息论时是受到通信理论中的问题启发的,然而我们认为信息论是一门独立的学科,可应用于通信理论和统计学中。
我们之所以将信息论作为一个学科领域从通信理论、概率论和统计学的背景中独立出来,是因为已经明显不可能从这些学科中获得难以理解的关于信息的概念。
由于本书中绝大多数结论是以定理和证明的形式给出的,所以我们期望通过对这些定理的巧妙证明能说明这些结论的完美性。一般来讲,我们在介绍问题之前先描述问题的解的性质,而这些很有趣的性质会使接下来的证明顺理成章。
使用不等式链、中间不加任何文字、最后直接加以解释,是我们在表述方式上的一项创新。当读者学习我们所给的证明过程达到一定数量时,希望他或她在没有任何解释下就能理解其中的大部分步骤,并得到所需的解释。这些不等式链好比是模拟测试题,读者可以通过它们确认自己是否已掌握证明那些重要定理的必备知识。这些证明过程的自然流程是如此引人注目,以致于我们轻视了写作技巧中的某条重要原则。由于没有空话,因而突出了思路的逻辑性与主题思想。我们希望当读者阅读完本书后,能够与我们共同分享我们所推崇的,具有优美、简洁、自然风格的信息论。
本书广泛使用弱典型序列的方法,此概念可以追溯到香农1948年的创造性工作,而它真正得到发展是在20世纪70年代初期。其中的主要思想就是所谓的渐近均分性(AEP),或许可以粗略地说成“几乎一切事情都差不多是等可能的”。
第2章是本书正式内容的开始,阐述了熵、相对熵和互信息之间的基本代数关系,同时对热力学第二定律和充分统计量也进行了讨论。渐近均分性是第3章重中之重的内容,这也导致我们将随机过程和数据压缩的熵率分别放在第4章和第5章中论述。第6章介绍博弈,并将数据压缩的对偶性和财富的增长率推向深入。
第7章探讨Kolmogorov复杂度的基本思想,它是对信息论进行理性思考的基础。我们的目标是寻找最普遍、最简短的描述,而不是在平均意义下的次佳描述。的确存在这样的普遍性概念可以用来描述目标的复杂度。该章也论述了神奇数W,它可揭示数学上的不少奥秘,是图灵机(Turing machine)停止运转的概率的推广。
第8章论述信道容量定理,这是信息论的基本定理。第9章叙述微分熵的必备知识,它们是将早期容量定理推广到连续噪声信道的基础。重要的高斯信道容量问题在第10章中论述。
第12章阐述信息论和统计学之间的关系。早在20世纪50年代,库尔贝克(Kullback)就首次对此进行了研究,此后相对被忽视。由于率失真理论比无噪声数据压缩理论需要更多的背景知识,因而将其放置在本书较后的第13章。
网络信息理论是个大的主题,安排在第14章,主要研究的是在噪声和干扰存在的情形下同时可达的信息流。有许多新的思想在网络信息理论中开始活跃起来,其主要新要素有干扰和反馈。第15章讲述股票市场,这是第6章所讨论的博弈的推广,也再次表明了信息论和博弈之间的紧密联系。
第16章讲述信息论中的有关不等式,我们借此一隅把散布于全书中的有趣不等式重新收拢在一个新的框架中,并且再加上一些关于随机抽取子集熵率的有趣的新不等式。集合求和的容量的Brunn-Minkowski不等式、独立随机变量之和的有效方差的熵幂不等式以及Fisher信息不等式之间的美妙关系也在这章中得到详尽的阐述。
本书力求推理严密,因此对数学的要求相当高,要求读者至少学过一学期的概率论课程且成绩优秀,大致为本科高年级或研究生水平。尽管如此,我们还是努力避免使用测度论,因为了解它仅仅对第15章中遍历过程的AEP证明起到简化作用。这符合我们的观点,那就是信息论基础与信息论技巧不同,后者才需要将所有推广都写进去。
本书每一章均以总结各章关键结论的方式结束。所提出的要点以方程形式表述,没有写出其限制条件。总结要点之后,我们列出一系列习题,接着以简短的历史回顾方式讲述了主要结论的来龙去脉。本书末尾的参考文献包括该领域中的许多关键性论文,以及参阅其他书目和相关主题的概述性文章的索引。
本书的主体是第2、3、4、5、8、9、10、12、13、14章,它们自成体系,读懂了它们就可以对信息论有很好的理解。但在我们看来,第7章的Kolmogorov复杂度是深入理解信息论的必备知识,余下的几章包括博弈和不等式,目的是使主题更加连贯和完美。