《深入理解计算机系统》(Computer Systems: A Programmer’s Perspective,CS: APP)这本书的主要读者是计算机科学家、计算机工程师,以及那些想通过学习计算机系统的内在运作而能够写出更好程序的人。
我们的目的是解释所有计算机系统的本质概念,并向你展示这些概念是如何实实在在地影响应用程序的正确性、性能和实用性的。其他的系统书都是从建造者的角度来写的,讲述如何实现硬件或是系统软件,包括操作系统、编译器和网络接口。而本书是从程序员的角度来写的,讲述应用程序员如何能够利用系统知识来写出更好的程序。当然,学习一个计算机系统应该做些什么是学习如何构建一个计算机系统的很好的出发点,所以,对于希望继续学习系统软硬件实现的人来说,《深入理解计算机系统(原书第2版)》也是一本很有价值的介绍性读物。
如果你研究和领会了这本书里的概念,你将开始你的成为极少数的“牛人”之路,这些“牛人”知道事情是如何运作的,也知道当事情出现故障时如何修复他。我们的目标是以一种你会立刻发现很有用的方式来呈现这些基本概念。同时,你也要做好更深入探究的准备,研究像编译器、计算机体系结构、操作系统、嵌入式系统和网络互联这样的题目。
读者所应具备的背景知识
《深入理解计算机系统(原书第2版)》中的机器代码表示是基于英特尔及其竞争者支持的两种相关联的格式,俗称 “x86”。对于很多系统来说,IA32机器代码已经成为一种事实上的标准。x86-64是IA32的一种扩展,它允许程序操作更多的数据,引用更广范围的内存地址。由于x86-64系统可以运行IA32的代码,因而在可预见的未来,这两种格式的机器代码都会得到广泛的应用。我们考虑的是这些机器如何在Unix或类Unix(比如Linux)操作系统上运行C语言程序。(为了简化表述,我们用术语Unix来统称所有继承自Unix的系统,包括Solaris、MacOS和Linux在内。)文中包含有大量已在Linux系统上编译和运行过的程序范例。我们假设你能访问一台这样的机器,并且能够登录,能够做一些诸如切换目录之类的简单操作。
如果你的计算机运行的是Microsoft Windows系统,你有两种选择。第一种选择是,获取一个Linux的拷贝(参见www.ubuntu.com),然后安装Linux作为“双重启动”的一个选项,这样你的机器就能运行其中任意一个操作系统了。另一种选择就是,通过安装Cygwin工具(www.cygwin.com),你就能在Windows下得到一个类似Unix的外壳(shell)以及一个非常类似于Linux所提供的环境。不过,Cygwin并不能提供所有的Linux功能。
我们还假设你对C和C++有一定的了解。如果你以前只有Java经验,那么你需要付出更多的努力来完成这种转换,不过我们也会帮助你。Java和C有相似的语法和控制语句。不过,有一些C 语言的内容,特别是指针、显式的动态内存分配和格式化I/O,Java中都是没有的。所幸的是,C是一个较小的语言,在Brain Kernighan和Dennis Ritchie经典的“K&R”文字中得到了清晰优美的描述[58]。无论你的编程背景如何,都应该考虑将K&R作为你个人系统书籍收藏的一部分。
这本书的前几章揭示了C语言程序和它们相对应的机器语言程序之间的交互作用。机器语言示例都是用运行在IA32和x86-64处理器上的GNU GCC编译器生成的。我们不需要你以前有任何硬件、机器语言或是汇编语言编程的经验。
C语言初学者?关于C编程语言的建议
为了帮助C语言编程背景薄弱(或全无背景)的读者,我们在《深入理解计算机系统(原书第2版)》中加入了这样一些专门的注释来突出C中一些特别重要的特性。我们假设你熟悉C++或Java。
如何阅读此书
从程序员的角度来学习计算机系统是如何工作的会非常有趣,主要是因为你可以主动地来做这件事情。无论何时你学到一些新的东西,都可以马上试验并且直接看到运行结果。事实上,我们相信学习系统的惟一方法就是做(do)系统,即在真正的系统上解决具体的问题,或是编写和运行程序。
这个主题观念贯穿全书。当引入一个新概念时,将会有一个或多个练习题紧随其后,你应该马上做一做来检验你的理解。这些练习题的解答在每章的末尾。当你阅读时,尝试自己来解答每个问题,然后再查阅答案,看看自己是否正确。每一章后面都有一组难度不同的家庭作业题。你的指导老师在教师手册中有这些问题的答案。对每个家庭作业题,我们标注了我们认为的难度级别:
只需要几分钟。几乎或完全不需要编程。
可能需要将近20分钟。通常包括编写和测试一些代码,许多都源自我们在考试中出的题目。
需要很大的努力,也许是1~2个小时。一般包括编写和测试大量的代码。
一个实验作业,需要将近10个小时。
文中每段代码示例都是经过GCC编译并在Linux系统上测试后直接生成的,没有任何人为的改动。当然,你的系统上GCC的版本可能不同,或者根本就是另外一种编译器,那么你的编译器可能生成不一样的机器代码,但是整体行为表现应该是一样的。所有的源程序代码都可以从CS:APP的主页(csapp.cs.cmu.edu)上获取。在本文中,源程序的文件名列在两条水平线的右边,水平线之间是格式化的代码。比如,图1中的程序能在code/intro目录下的hello.c文件中找到。我们鼓励你,当遇到这些示例程序时,在你的系统上试试运行它们。
图1 一个典型的代码示例
为了避免使本书体积过大,内容过多,我们创建了许多网络旁注(Web asides),包括一些对本书主要内容的补充资料。本书中用CHAP:TOP这样形式的标记来引用这些旁注,这里CHAP是该章主题的一个缩写编码,而TOP是涉及的话题的缩写代码。例如,网络旁注DATA:BOOL包含有对第二章中数据表示里面有关布尔代数的内容的补充资料;而网络旁注ARCH:VLOG包含的是用Verilog硬件描述语言来做处理器设计的资料,是对第四章中处理器设计部分的补充。所有的网络旁注都可以从CS:APP的主页上获取。
. 旁注:什么是旁注?
整本书中,你将会遇到很多以这种形式出现的旁注。旁注是附加说明,能使你对当前讨论的主题多一些了解。旁注可以有很多用处。一些是小的历史故事。例如,C语言、Linux和Internet是从何而来的?有些地方,旁注是用来澄清学生们经常感到疑惑的问题。例如,高速缓存的行、组和块有什么区别?还有的地方,旁注给出了一些现实世界的例子。例如,一个浮点错误怎么毁掉了法国的一枚火箭,或是一个真正的希捷磁盘驱动器看上去是什么样子的。最后,还有一些旁注仅仅就是一些有趣的东东,例如,什么是“hoinky”?
《深入理解计算机系统(原书第2版)》概述
CS:APP这本书由12章组成,旨在阐述计算机系统的核心概念。
·第1章:计算机系统漫游。这一章通过研究“hello, world”这个简单程序的生命周期,介绍计算机系统的主要概念和主题。
·第2章:信息的表示和处理。我们讲述了计算机的算术运算,重点描述了会对程序员有影响的无符号数和数的二进制补码(two’s complement)表示的特性。我们考虑数字是如何表示的,以及由此确定对于一个给定的字长,其可能编码值的范围。我们讨论该如何表示数字,以及因此用给定的字长能编码的数值的范围。我们探讨有符号和无符号数字之间类型转换的效果,还阐述算术运算的数学特性。菜鸟级程序员经常很惊奇地了解到(用二进制补码表示的)两个正数的和或者积可能为负。另一方面,二进制补码的算术运算满足代数环的特性,因此,编译器可以很安全地把一个常量乘法转化为一系列的移位和加法。我们用C语言的位级操作来说明布尔代数的原理和应用。我们从两个方面讲述了IEEE标准的浮点格式:一是如何用它来表示数值,一是浮点运算的数学属性。
对计算机的算术运算有深刻的理解是写出可靠程序的关键。比如,程序员和编译器不能用表达式(x-y<0)来替代(x<y),因为前者可能会产生溢出。甚至于也不能用表达式(-y<-x)来替代,因为在二进制补码表示中负数和正数的范围是不对称的。算术溢出是造成程序错误和安全漏洞的一个常见根源,然而很少有书从一个程序员的角度来讲述计算机算术运算的特性。
·第3章:程序的机器级表示。我们教读者如何阅读由C编译器生成的IA32和x86-64汇编语言。我们说明为不同控制结构,比如条件、循环和开关语句,生成的基本指令模式。我们还讲述过程的执行,包括栈分配、寄存器使用惯例和参数传递。我们讨论不同数据结构如结构、联合(union)和数组的分配和访问方式。我们还以分析程序在机器级的样子作为途径,来理解常见的代码安全漏洞,例如,缓冲区溢出,以及理解程序员、编译器和操作系统可以采取的减轻这些威胁的措施。学习本章的概念能够帮助读者成为更好的程序员,因为你们懂得你们的程序在机器上是如何表示的。另外一个好处就在于读者会对指针有非常全面而具体的理解。
·第4章:处理器体系结构。这一章讲述基本的组合和时序逻辑元素,并展示这些元素如何在数据通路(datapath)中组合到一起,来执行IA32指令集的一个称为“Y86”的简化子集。我们从设计单时钟周期、非流水线化的数据通路开始,这个设计概念上非常简单,但是运行速度不会太快。然后我们引入流水线化(pipelining)的思想,将处理一条指令所需要的不同步骤实现为独立的阶段。这个设计中,在任何时刻,每个阶段都可以处理不同的指令。我们的五阶段处理器流水线更加实用了。本章中处理器设计的控制逻辑是用一种称为HCL的简单硬件描述语言来描述的。用HCL写的硬件设计能够编译和链接到本书提供的模拟器中,还可以根据这些设计生成Verilog描述,它适合合成(synthesis)到实际可以运行的硬件上去。
·第5章:优化程序性能。在这一章里,我们介绍了许多提高代码性能的技术,主要思想就是程序员通过让编译器能够生成更有效的机器代码来学习编写C代码。我们一开始介绍的是减少程序需要做的工作的变换,这些是在任何机器上写任何程序时都应该遵循的。然后讲的是增加生成的机器代码中指令级并行度的变换,因而提高了程序在现代“超标量(superscalar)”处理器上的性能。为了解释这些变换行之有效的原理,我们介绍了一个简单的操作模型,它描述了现代乱序(out-of-order)处理器是如何工作的,然后给出了如何根据一个程序的图形化表示中的关键路径来测量一个程序可能的性能。你会惊讶于对C代码做一些简单的变换能给程序带来多大的速度提升。
·第6章:存储器层次结构。对应用程序员来说,存储器系统是计算机系统中最直接可见的部分之一。到目前为止,读者一直认同这样一个存储器系统概念模型,认为它是一个有一致访问时间的线性数组。实际上,存储器系统是一个由不同容量、造价和访问时间的存储设备组成的层次结构。我们讲述不同类型的随机存取存储器(RAM)和只读存储器(ROM),以及磁盘和固态硬盘(译者注:直译应为固态驱动器,但固态硬盘一词已经被大家接受,所以延用)的几何形状和组织构造。我们描述这些存储设备是如何放置在层次结构中的,讲述访问局部性是如何使这种层次结构成为可能的。我们通过一个独特的观点使这些理论具体化、形象化,那就是将存储器系统视为一个“存储器山”,山脊是时间局部性,而斜坡是空间局部性。最后,我们向读者阐述如何通过改善程序的时间局部性和空间局部性来提高应用程序的性能。
·第7章:链接。本章讲述静态和动态链接,包括的概念有可重定位的(relocatable)和可执行的目标文件、符号解析、重定位(relocation)、静态库、共享目标库,以及与位置无关的代码。大多数讲述系统的书中都不讲链接,出于下面几个原因,我们要讲述它。第一,程序员遇到的最令人迷惑的问题中,有一些是和链接时的小故障有关的,尤其是对那些大型软件包来说。第二,链接器生成的目标文件是与一些像加载、虚拟存储器和存储器映射这样的概念相关的。
·第8章:异常控制流。在本书的这个部分,我们通过介绍异常控制流(比如,除了正常分支和过程调用以外的控制流的变化)的一般概念打破单一程序的模型。我们给出存在于系统所有层次的异常控制流的例子,从底层的硬件异常和中断,到并发进程的上下文切换,到由于Unix信号传送引起的控制流突变,到C语言中破坏栈原则的非本地跳转(nonlocal jump)。
在这一章,我们介绍进程的基本概念,进程是对一个正在执行的程序的一种抽象。读者会学习到进程是如何工作的,以及如何在应用程序中创建和操纵进程。我们会展示应用程序员如何通过Unix系统调用来使用多个进程。学完本章之后,读者就能够编写带作业控制的Unix外壳(shell)了。同时,这里也会向读者初步展示程序的并发执行会引起不确定的行为和后果。
·第9章:虚拟存储器。我们讲述虚拟存储器系统是希望读者对它是如何工作的以及它的特性有所了解。我们想让读者了解为什么不同的并发进程各自都有一个完全相同的地址范围,能共享某些页,而又独占另外一些页。我们还覆盖讲了一些管理和操纵虚拟存储器的问题。特别地,我们讨论了存储分配操作,就像Unix的malloc和free操作。阐述这些内容是出于下面几个目的。它加强了这样一个概念,那就是虚拟存储器空间只是一个字节数组,程序可以把它划分成不同的存储单元。它帮助读者理解包含有像存储泄漏和非法指针引用这样存储器引用错误的程序的后果。最后,许多应用程序员编写自己的优化了的存储分配操作来满足应用程序的需要和特性。这一章比其他任何一章都更能展现将计算机系统中的硬件和软件结合起来阐述的优点。而传统的计算机体系结构和操作系统书都只讲述了虚拟存储器的某一方面。
·第10章:系统级I/O。我们讲述Unix I/O的基本概念,例如文件和描述符。我们描述如何共享文件,I/O重定向是如何工作的,还有如何访问文件的元数据。我们还开发了一个健壮的带缓冲区的I/O包,可以正确处理一种称为short counts的奇特行为,也就是库函数只读取一部分的输入数据。我们阐述C的标准I/O库,以及它与Unix I/O的关系,重点谈到标准I/O的局限性,这些局限性使之不适合网络编程。总地说来,本章的论题是后面两章网络和并发编程的基础。
·第11章:网络编程。对编程而言,网络是非常有趣的I/O设备,将许多我们前面文中学习的概念,比如进程、信号、字节顺序(byte ordering)、存储器映射和动态存储器分配,联系在一起。网络程序还为下一章的主题——并发,提供了一个很令人信服的上下文。本章只是网络编程的一个很小的部分,使读者能够编写一个Web服务器。我们还讲述位于所有网络程序底层的客户端-服务器模型。我们展现了一个程序员对Internet的观点,并且教读者如何用套接字(socket)接口来编写Internet客户端和服务器。最后,我们介绍超文本传输协议HTTP,并开发了一个简单的迭代式(iterative)Web服务器。
·第12章:并发编程。这一章以Internet服务器设计为例介绍了并发编程。我们比较对照了三种编写并发程序的基本机制(进程、I/O多路复用技术和线程),并且展示如何用它们来建造并发Internet服务器。我们探讨了用P、V信号操作来实现同步、线程安全和可重入(reentrancy)、竞争条件以及死锁等的基本原则。对大多数服务器应用来说,写并发代码都是很关键的。我们还讲述了线程级编程的使用方法,来解释应用程序中的并行性,使得程序在多核的处理器上能执行得更快。使所有的核来解决同一个计算问题需要很小心谨慎的协调并发的线程,既要保证正确性,又要争取获得高性能。
《深入理解计算机系统(原书第2版)》新增内容
本书的第一版于2003年出版。考虑到计算机技术发展如此迅速,这本书的内容还算是保持得令人吃惊的好。事实证明Intel x86的机器上运行类Unix操作系统,加上采用C语言编程是一种能够涵盖当今许多系统的组合。硬件技术和编译器的变化,以及很多老师教授这些内容的经验,都促使我们做了大量的修改。
下面列出的是一些更加详细的改进:
第2章:信息的表示和处理。通过更加详细地解释概念以及更多的练习和家庭作业,我们试图使这部分内容更加易懂。我们将一些比较偏理论的内容放到了网络旁注里。还讲述了一些由于计算机算术运算的溢出造成的安全漏洞。
第3章:程序的机器级表示。我们将内容的覆盖范围扩展到了包括x86-64,也就是将x86处理器扩展到了64位字长。也使用了更新版本的gcc产生的代码。另外还增强了对缓冲区溢出漏洞的描述。在网络旁注里,我们给出了两类不同的浮点指令,还介绍了当编译器试图做更高等级优化的时候,做的一些奇特的变换。另外,还有一个网络旁注描述了如何在一个C语言程序中嵌入x86汇编代码。
第4章:处理器体系结构。更加详细地说明了我们的处理器设计中的异常发现和处理。在网络旁注里,我们也给出了我们的处理器设计的Verilog描述映射,使得我们的设计能够综合到可运行的硬件上。
第5章:优化程序性能。我们极大地改变了对乱序处理器如何运行的描述,还提出了一种简单的技术,能够基于程序的数据流图表示中的路径来分析程序的性能。在网络旁注里,描述了C语言程序员如何能够利用较新的x86处理器中提供的SIMD(单指令流,多数据流)指令来编程。
第6章:存储器层次结构。我们增加了固态硬盘的内容,还更新了我们的表述,使之基于Intel Core i7处理器的存储器层次结构。
第7章:链接。本章的变化不大。
第8章:异常控制流。我们改进了对于进程模型如何引入一些基本的并发概念的讨论,例如,非确定性。
第9章:虚拟存储器。我们更新了我们的存储器系统案例研究,采用了64位Intel Core i7处理器为例来讲述。我们还更新了malloc函数的示例实现, 使之既能在32位也能在64位环境中执行.
第10章:系统级I/O。本章的变化不大。
第11章:网络编程。本章变换不大。
第12章:并发编程。我们增加了关于并发性一般原则的内容,还讲述了程序员如何利用线程级并行性使得程序在多核机器上能运行得更快。
此外,我们还增加和修改了很多练习和家庭作业题目。
《深入理解计算机系统(原书第2版)》的起源
《深入理解计算机系统(原书第2版)》起源于1998年秋季我们在卡内基梅隆(CMU)大学开设的一门编号为15-213的介绍性课程:计算机系统导论(Introduction to Computer System,ICS)[14]。从那以后,每学期都开设了ICS这门课程,每期有150-250名学生,从本科二年级到硕士研究生都有,所学专业也很广泛。这门课程是卡内基梅隆大学计算机科学系(CS)以及电子和计算机工程系(ECE)所有本科生的必修课,也是大多数高级系统课程的先行必修课。
ICS这门课程的宗旨是用一种不同的方式向学生介绍计算机。因为,我们的学生中几乎没有人有机会亲自去构造一个计算机系统。另一方面,大多数学生,甚至包括所有的计算机科学家和计算机工程师,也需要日常使用计算机和编写计算机程序。所以我们决定从程序员的角度来讲解系统,并采用这样的原则来过滤要讲述的内容:我们只讨论那些影响用户级C语言程序的性能、正确性或实用性的主题。
比如,我们排除了诸如硬件加法器和总线设计这样的主题。虽然我们谈及了机器语言,但是重点并不在于如何手工编写汇编语言,而是关注C语言编译器是如何将C语言的结构翻译成机器代码的,包括编译器是如何翻译指针、循环、过程调用以及开关(switch)语句的。更进一步地,我们将更广泛和全盘地看待系统,包括硬件和系统软件,涵盖了包括链接、加载、进程、信号、性能优化、虚拟存储器、I/O以及网络与并发编程等在内的主题。
这种做法使得我们讲授ICS课程的方式对学生来讲既实用、具体,还能动手,同时也非常能调动学生的积极性。很快地,我们收到来自学生和教职工非常热烈而积极的反响,我们意识到卡内基梅隆大学以外的其他人也可以从我们的方法中获益。因此,这本书从ICS课程的笔记中应运而生了,而现在我们对它做了修改,使之能够反映科学技术以及计算机系统实现中的变化和进步。
写给指导教师们:可以基于《深入理解计算机系统(原书第2版)》的课程
指导教师可以使用CS: APP这本书来讲授五种不同类型的系统课程(图2)。具体每门课程则有赖于课程大纲的要求、个人品位、学生的背景和能力。图中的课程从左往右,越来越强调以程序员的角度来看待系统。以下是简单的描述:
·ORG:一门以非传统风格讲述传统主题的计算机组成原理课程。传统的主题包括逻辑设计、处理器体系结构、汇编语言和存储器系统。然而,更多地强调对程序员的影响。例如,要反过来考虑数据表示对C语言程序的数据类型和操作的影响。又例如,使用的汇编代码表示是基于C语言编译器产生的机器代码的,而不是手工编写的。
·ORG+:一门特别强调硬件对应用程序性能影响的ORG课程。和ORG课程相比,学生要更多地学习代码优化和改进他们的C语言程序的存储器性能。
·ICS:基本的ICS课程,旨在培养一类程序员,他们能够理解硬件、操作系统和编译系统对应用程序的性能和正确性的影响和ORG+课程的一个显著不同是,本课程不论及低层次的处理器体系结构。相反地,程序员只同现代乱序处理器的高级模型打交道。ICS课程非常适合安排进一个10周的小学期,如果期望步调更从容一些,也可以延长到一个15周的学期。
·ICS+:在基本的ICS课程基础上,额外论述一些系统编程的问题,比如系统级I/O、网络编程和并发编程。这是卡内基梅隆大学的一门一学期长度的课程,会讲述本书中除了低级处理器体系结构以外的所有章。
·SP:一门系统编程课程。和ICS+课程相似,但是剔除了浮点和性能优化的内容,更加强调系统编程,包括进程控制、动态链接、系统级I/O、网络编程和并发编程。指导教师可能会想从其他渠道对某些高级论题做些补充,比如守护进程(daemon)、终端控制和Unix IPC(进程间通信)。
课 程
章节论题ORGORG+ICSICS+SP
1系统漫游
2数据表示
3机器语言
4处理器体系结构
5代码优化
6存储器层次结构
7链接
8异常控制流
9虚拟存储器
10系统级I/O
11网络编程
12并发编程
图2 五类基于CS: APP这本书的课程
注释:(a)只有硬件;(b)无动态存储分配;(c)无动态链接;(d)无浮点数。ICS+是卡内基梅隆的15-213课程。
图2要表达的主要信息是CS: APP这本书给了学生和指导老师多种选择。如果你希望你的学生更多地了解低层次的处理器体系结构,那么通过ORG和ORG+课程可以达到目的。另一方面,如果你想将当前的计算机组成原理课程转换成ICS或者ICS+课程,但是又担心突然做这样剧烈的变化,那么你可以逐步递增转向ICS课程。你可以从OGR课程开始,它以一种非传统的方式教授传统的问题。一旦你对这些内容感到驾轻就熟了,就可以转到ORG+,最终转到ICS。如果学生没有C语言的经验(比如他们只用Java编过程序),你可以花几周的时间在C语言上,然后再讲述ORG或者ICS课程的内容。
最后,我们认为ORG+和SP课程适合安排为两期(两个小学期或者两个学期)。或者你可以考虑按照一期ICS和一期SP的方式来教授ICS+课程。
经过课堂验证的实验练习
ICS+课程在卡内基梅隆大学得到了学生们很高的评价。学生对这门课的课程评价,中值分数一般为5.0/5.0,平均分数一般为4.6/5.0。学生们说这门课非常有趣,令人兴奋,主要就是因为相关的实验练习。这些实验练习可以从CS: APP的主页上获得。下面是本书提供的一些实验的示例。
·数据实验。这个实验要求学生实现简单的逻辑和算术运算函数,但是只能使用一个非常有限的C语言子集。比如,他们只能用位级操作来计算一个数字的绝对值。这个实验帮助学生们了解C语言数据类型的位级表示,和数据操作的位级行为。
·二进制炸弹实验。二进制炸弹是一个作为目标代码文件提供给学生们的程序。运行时,它提示用户输入6个不同的字符串。如果其中的任何一个不正确,炸弹就会“爆炸”,打印出一条错误信息,并且在一个分级(grading)服务器上记录事件日志。学生们必须通过对程序反汇编和逆向工程来测定应该是哪6个串,从而解除他们各自炸弹的雷管。该实验教会学生理解汇编语言,并且强制他们学习怎样使用调试器。
·缓冲区溢出实验。它要求学生们通过利用一个缓冲区溢出漏洞,来修改一个二进制可执行文件的运行时行为。这个实验教会学生们栈的原理,并让他们了解到写那种易于遭受缓冲区溢出攻击的代码的危险性。
·体系结构实验。第4章的几个家庭作业问题能够组合成一个实验作业,在实验中,学生们修改处理器的HCL描述,增加新的指令、修改分支预测策略,或者增加或删除旁路路径和寄存器端口。修改后的处理器能够被模拟,并通过运行自动化测试检测出大多数可能的错误。这个实验使学生们能体验到处理器设计中令人激动的部分,而不需要掌握逻辑设计和硬件描述语言的完整的知识。
·性能实验。学生们必须优化应用程序的核心函数(比如卷积积分或矩阵转置)的性能。这个实验非常清晰地表明了高速缓存的特性,并带给学生们低级程序优化的经验。
·外壳实验。学生们实现他们自己的带有作业控制的Unix外壳程序,包括ctrl-c和ctrl-z按键、fg、bg和jobs命令。这是学生们第一次接触并发,并且让他们对Unix的进程控制、信号和信号处理有清晰的了解。
·malloc实验。学生们实现他们自己的malloc、free和realloc(可选地)版本。这个实验让学生们清晰地理解数据的布局和组织,并且要求他们评估时间和空间效率的各种权衡和折中。
·代理实验。学生们实现一个位于浏览器和万维网其他部分之间的并行Web代理。这个实验向学生们揭示了Web客户端和服务器这样的主题,并且联系起了课程中的许多概念,比如字节排序、文件I/O、进程控制、信号、信号处理、存储器映射、套接字和并发。学生们很高兴能够看到他们的程序在真实的web浏览器和web服务器之间起到作用。
CS: APP的教师手册中有对实验的详细讨论,还有关于下载支持软件的说明。
第二版的致谢
我们深深的感谢那些帮助我们写出CS: APP第二版的人们。
首先,我们要感谢在卡内基梅隆大学教授ICS课程的同事们,感谢你们见解深刻的反馈意见和鼓励:Guy Blelloch、Roger Dannenberg、David Eckhardt、Greg Ganger、Seth Goldstein、Greg Kesden、Bruce Maggs、Todd Mowry、Andreas Nowatzyk、Frank Pfenning和Markus Pueschel。
还要感谢报告第一版勘误的目光敏锐的读者们,Daniel Amelang、Rui Baptista、Quarup Barreirinhas、Michael Bombyk、J?rg Brauer、Jordan Brough、Yixin Cao、James Caroll、Rui Carvalho、Hyoung-Kee Choi、Al Davis、Grant Davis、Christian Dufour、Mao Fan、Tim Freeman、Inge Frick、Max Gebhardt、Jeff Goldblat、Thomas Gross、Anita Gupta、John Hampton、Hiep Hong、Greg Israelsen、Ronald Jones、Haudy Kazemi、Brian Kell、Constantine Kousoulis、Sacha Krakowiak、Arun Krishnaswamy、Martin Kulas、Michael Li、Zeyang Li、Ricky Liu、Mario Lo Conte、Dirk Maas、Devon Macey、Carl Marcinik、Will Marrero、Simone Martins、Tao Men、Mark Morrissey、Venkata Naidu、Bhas Nalabothula、Thomas Niemann、Eric Peskin、David Po、Anne Rogers、John Ross、Michael Scott、Seiki、Ray Shih、Darren Shultz、Erik Silkensen、Suryanto、Emil Tarazi、Nawanan Theera-Ampornpunt、Joe Trdinich、Michael Trigoboff、James Troup、Martin Vopatek、Alan West、Betsy Wolff、Tim Wong、JamesWoodruff、Scott Wright、Jackie Xiao、Guanpeng Xu、Qing Xu、Caren Yang、Yin Yongsheng、Wang Yuanxuan、Steven Zhang和Day Zhong。特别感谢Inge Frick,他发现了我们lock-and-copy(加锁拷贝)例子中一个极不明显但很深刻的错误,还要特别感谢Ricky Liu,他校对的技术真是很棒。
我们Intel实验室的同事Andrew Chien和Limor Fix在本书的写作过程中一直非常支持。非常感谢Steve Schlosser提供了一些关于磁盘驱动器的总结描述,Casey Helfrich和Michael Ryan安装并维护了我们新的Core i7机器。Michael Kozuch、Babu Pillai和Jason Campbell对存储器系统性能、多核系统和能量墙问题提出了很有价值的见解。Phil Gibbons和Shimin Chen跟我们分享了大量关于固态硬盘设计的专业知识。
我们还有机会邀请了Wen-Mei Hwu、Markus Pueschel和Jiri Simsa这样的高人给予了一些针对具体问题的意见和高屋建瓴的建议。James Hoe帮助我们写了Y86处理器的Verilog描述,还完成了所有将设计合成到可运行的硬件上的工作。
非常感谢审阅《深入理解计算机系统(原书第2版)》草稿的我们的同事们:James Archibald (百翰杨大学,Brigham Young University)、Richard Carver (乔治梅森大学,George Mason University)、Mirela Damian (维拉诺瓦大学,Villanova University)、Peter Dinda (西北大学)、John Fiore (坦普尔大学,Temple University)、Jason Fritts (圣路易斯,St. Louis University)、John Greiner (莱斯大学), Brian Harvey (加州大学伯克利分校)、Don Heller (宾夕法利亚州立大学)、Wei Chung Hsu (明尼苏达大学)、Michelle Hugue (马里兰大学), Jeremy Johnson (德雷克塞尔大学,Drexel University)、Geoff Kuenning (哈维马德学院,Harvey Mudd College)、Ricky Liu、Sam Madden (麻省理工学院)、Fred Martin (马萨诸塞大学洛厄尔分校,University of Massachusetts, Lowell)、Abraham Matta (波士顿大学)、Markus Pueschel (卡内基梅隆大学)、Norman Ramsey (塔夫茨大学,Tufts University)、Glenn Reinmann (加州大学洛杉矶分校)、Michela Taufer (特拉华大学,University of Delaware)和Craig Zilles (伊利诺伊大学香槟分校)。
Windfall软件公司的Paul Anagnostopoulos出色的完成了本书的排版,并领导了制作团队。非常感谢Paul和他超棒的团队:Rick Camp (文字编辑)、Joe Snowden (排版)、MaryEllen N. Oliver (校对)、Laurel Muller (美术)和Ted Laux (索引制作)。
最后,我们要感谢我们在普伦蒂斯霍尔出版社(Prentice Hall)的朋友们。Marcia Horton总是支持着我们。我们的编辑Matt Goldstein由始至终表现出了一流的领导才能。我们由衷地感谢他们的帮助、鼓励和真知灼见。
第一版的致谢
我们衷心地感谢那些给了我们中肯批评和鼓励的众多朋友及同事。特别感谢我们15-213课程的学生们,他们充满感染力的精力和热情鞭策我们前行。Nick Carter和Vinny Furia无私地提供了他们的malloc程序包。
Guy Blelloch、Greg Kesden、Bruce Maggs和Todd Mowry 在多个学期中教授此课,给我们鼓励并帮助改进课程内容。Herb Derby提供了早期的精神指导和鼓励。Allan Fisher、Garth Gibson、Thomas Gross、Satya、Peter Steenkiste和Hui Zhang从一开始就鼓励我们开设这门课程。Garth早期给的建议促使本书的工作得以开展,并且在Allan Fisher 领导的小组的帮助下又细化和修订了本书的工作。Mark Stehlik 和 Peter Lee 提供了极大的支持,使得这些内容成为本科生课程的一部分。Greg Kesden 针对ICS在操作系统课程上的影响提供了有益的反馈意见。Greg Ganger和Jiri Schindler提供了一些磁盘驱动的描述说明,并回答了我们关于现代磁盘的疑问。Tom Striker 向我们展示了存储器山的比喻。James Hoe 在处理器体系结构方面提出了很多有用的建议和反馈。
有一群特殊的学生极大地帮助我们发展了这门课程的内容,他们是Khalil Amiri、Angela Demke Brown、Chris Colohan、Jason Crawford、Peter Dinda、Julio Lopez、Bruce Lowekamp、Jeff Pierce、Sanjay Rao、Balaji Sarpeshkar、Blake Scholl、Sanjit Seshia、Greg Steffan、Tiankai Tu、Kip Walker和Yinglian Xie。尤其是Chris Colohan 建立了愉悦的氛围并持续到今天,还发明了传奇般的“二进制炸弹”,这是一个对教授机器语言代码和调试概念非常有用的工具。
Chris Bauer、Alan Cox、Peter Dinda、Sandhya Dwarkadis、John Greiner、Bruce Jacob、Barry Johnson、Don Heller、Bruce Lowekamp、Greg Morrisett、Brian Noble、Bobbie Othmer、Bill Pugh、Michael Scott、Mark Smotherman、Greg Steffan和Bob Wier 花费了大量时间阅读此书的早期草稿,并给予我们建议。特别感谢Peter Dinda(西北大学)、John Greiner(莱茨大学)、Wei Hsu(明尼苏达大学)、Bruce Lowekamp (威廉&玛丽大学)、Bobbie Othmer(明尼苏达大学)、Michael Scott(罗彻斯特大学)和Bob Wier(落基山学院)在教学中测试此书的试用版。同样特别感谢他们的学生们!
我们还要感谢Prentice Hall出版公司的同事。感谢Marcia Horton、Eric Frank和Harold Stone不懈地支持和远见。Harold还帮我们提供了对RISC和CISC处理器体系结构准确的历史观点。Jerry Ralya有惊人的见识,并教会了我们很多如何写作的知识。
最后,我们衷心感谢伟大的技术作家Brian Kernighan以及后来的W. Richard Stevens,他们向我们证明了技术书籍也能写得如此优美。
谢谢你们所有的人。
Randy Bryant
Dave O’Hallaron
于匹兹堡,宾夕法尼亚州