第10版的新内容
自本书第9版出版以来,本领域创新和改进不断。在新版本中,我试着反映这些变化,并保持对整个领域广泛而全面的覆盖。为了本次修订,我们对第9版进行了广泛审阅,审阅者是讲授这些主题的教授和在本领域工作的专业人士。因此,全书进一步明晰或改进了许多地方的描述,也完善了插图。
除了这些用以提升教学效果和用户友好性的改动外,本书还有一些实质性的变化。全书的章节组织仍然和以前大致相同,但修订了许多资料,并添加了新资料。最值得注意的变化如下:
GPGPU(图形处理单元(GPU)上的通用计算):近年来最重要的新发展之一就是GPGPU的广泛使用,它与传统的CPU协作,以处理涉及大量数据的各种应用程序。书中新增加了一章专门讨论GPGPU。
异构多核处理器:多核架构的最新发展是异构多核处理器。多核处理器一章中添加了新的一节,考察了各种类型的异构多核处理器。
嵌入式系统:对第1章中的嵌入式系统概述部分做了大幅修订和扩充,以反映嵌入式技术的现状。
微控制器:就数量而言,当前我们所使用的几乎所有计算机都是嵌入式微控制器。第1章中的嵌入式系统部分现在包括微控制器。全书以ARM Cortex-M3微控制器为例贯穿始终。
云计算:新增了对云计算的讨论,第1章对其进行了概述,第17章进行了更详细的阐述。
系统性能:修订、扩充和重组了关于系统性能问题的部分,以使其显得更加清晰和透彻。第2章专门讨论了这个主题,而且系统性能问题将贯穿全书。
闪存:更新和扩充了闪存部分,现在包含对内存(第5章)与外存(第6章)闪存技术与组成的讨论。
非易失性RAM:本版添加的内容是三种重要的新非易失性固态RAM技术—STT-RAM、PCRAM和ReRAM,它们位于存储器层次结构中的不同位置。
直接缓存访问(DCA):为了满足高速网络连接的协议处理需求,Intel和其他制造商开发了DCA技术,它提供的吞吐量远远高于传统的直接内存访问(DMA)方法。作为新内容,第7章对DCA进行了详细讨论。
Intel酷睿微架构:与上一版相同,Intel x86系列自始至终都作为主要的示例系统。我们更新了这部分内容以反映新的Intel系统,尤其是Intel酷睿微架构,它用于PC和服务器产品。
家庭作业:增加了家庭作业的数量,这些作业都配有参考答案,可供学生练习。
对ACM/IEEE计算机科学课程指南 2013的支持
本书既适合学术读者,也适合专业读者。作为一本教科书,它可以用于计算机科学、计算机工程和电气工程专业的一学期或两学期的本科课程。这一版旨在支持ACM/IEEE计算机科学课程指南 2013(CS2013)的建议。CS2013把所有课程划分为三类:核心一级(所有的主题都应包含在课程中),核心二级(应包含所有或几乎所有的主题),选修(希望提供广度和深度)。在体系结构和组成(AR)部分,CS2013包括五个核心二级主题和三个选修主题,每个主题又有多个子主题。本书涵盖了CS2013列出的所有八个主题。表P.1给出了本教材对AR知识领域提供的支持。
表P.1对CS2013 AR知识领域的覆盖
IAS知识单元 主题 本书覆盖章节
数字逻辑与数字系统(核心二级) " 计算机体系结构概述与历史
" 组合或时序逻辑/现场可编程门阵列作为基本的组合+时序逻辑构建模块
. " 多种表示/分层的解释(硬件仅仅是另外一层)
" 物理约束(门延迟、扇入、扇出、能耗/功率) " 第1章
" 第11章
数据的机器级表示(核心二级) " 位、字节和字
" 数值数据的表示和数值的进制
" 定点和浮点系统
" 有符号和补码表示
" 非数值数据的表示(字符编码和图数据) " 第9章
" 第10章
汇编级计算机组成(核心二级) " 冯·诺依曼机的基本组成
" 控制单元;取指、译码和执行
" 指令集和类型(数据处理、控制、I/O)
" 汇编/机器语言编程
" 指令格式
" 寻址模式
" 子程序调用和返回机制(参照PL/语言翻译与执行)
" I/O和中断
" 共享内存的多处理器/多核结构
" SIMD与MIMD简介,Flynn分类法 " 第1章
" 第7章
" 第12章
" 第13章
" 第17章
" 第18章
" 第20章
" 第21章
" 附录A
存储系统的组织与结构(核心二级) " 存储系统及其技术
" 存储层次结构:时间和空间局部性
" 主存组成和操作
" 延迟、周期时间、带宽和交叉
" 缓存(地址映射、块大小、替换和存储策略)
" 多处理器缓存一致性/使用存储系统的内核间同步/原子性内存操作
" 虚拟存储器(页表、TLB)
" 故障处理和可靠性 " 第4章
" 第5章
" 第6章
" 第8章
" 第17章
接口与通信(核心二级) " I/O基本原理:握手,缓冲,可编程I/O,中断驱动的I/O
" 中断结构:向量化和优先级,中断确认
" 外部存储,物理组成和驱动
" 总线:总线协议,仲裁,直接内存访问(DMA)
" RAID体系结构 " 第3章
" 第6章
" 第7章
功能性组成(选修) " 实现简单的数据通路,包括指令流水线,冒险检测和解决
" 控制单元:硬布线实现与微程序实现
" 指令流水线
" 指令级并行(ILP)简介 " 第14章
" 第16章
" 第20章
" 第21章
多处理及其他体系结构(选修) " 举例介绍SIMD和MIMD指令集与体系结构
" 互联网络
" 共享多处理器内存系统和内存一致性
" 多处理器缓存一致性 " 第12章
" 第13章
" 第17章
性能提高(选修) " 超标量体系结构
" 分支预测,推测执行,乱序执行
" 预取
" 向量处理器和GPU
" 多线程的硬件支持
" 可扩展性 " 第15章
" 第16章
" 第19章
本书的目的
本书是关于计算机结构与功能的,它的目的是尽可能清晰完整地介绍现代计算机系统的性质与特点。
由于种种原因,这个任务颇具挑战性。首先,有各种各样的产品可以被称作计算机,从只值几美元的单芯片微处理器到价值数千万美元的超级计算机。多样性不仅表现在成本方面,还表现在尺寸、性能和应用方面。其次,计算机技术的特色就是变化一直非常迅速,且从未停止。这些变化涉及计算机技术的方方面面,从用于构造计算机组件的底层集成电路技术,到组合这些组件时越来越多地利用到的并行性组成的概念。
尽管计算机领域不断变化且非常多样,但某些基本概念始终是适用的。这些概念的应用取决于技术的现状和设计者的性价比目标。本书的目的是对计算机组成与体系结构进行全面讨论,并将它们与当代的设计问题联系起来。
副书名“性能设计”展示了本书采用的主题与方法。虽然获得高性能在计算机系统设计中一直都很重要,但这一需求从未像现在这样强烈,也从未这样难以满足。计算机系统所有的基本性能特征,包括处理器速度、内存速度、内存容量和互连数据速率,都在迅速增长。而且,它们的增长速度不尽相同,这使得很难设计一个平衡系统来最大化所有元素的性能和利用率。因此,计算机设计逐渐变成了一个游戏:改变一个部分的结构或功能来弥补另一个部分的性能不足。我们将在整本书中看到,这个游戏在许多设计决策中都发挥着作用。
和其他任何系统一样,计算机系统由一组相互关联的部件组成。描述系统特性最好的方式是它的结构和功能,结构是指部件的互连方式,而功能是指各个部件的操作。此外,计算机的组成是层次结构的。每个主要部件都可以分解为若干主要子部件,可以描述这些子部件的结构和功能,由此来进一步说明这个主要部件。为了清晰和易于理解,本书自上至下描述了这个层次结构:
计算机系统:主要部件是处理器、内存、I/O。
处理器:主要部件是控制单元、寄存器、ALU和指令执行单元。
控制单元:为处理器所有部件的操作和协调提供控制信号。传统上使用的是微程序实现,主要部件是控制存储器、微指令序列逻辑和寄存器。最近,微程序设计并不那么突出了,但仍然是一种重要的实现技术。
我们的目标是在清晰明确的上下文中展示新的内容,从而尽可能地帮助读者理解这些知识,同时,相比自下至上的方式,学生的学习积极性会更高。
在讨论过程中,我们从体系结构(机器语言程序员可见的系统属性)和组成(实现该体系结构的操作单元及其互连)两个角度来看系统的方方面面。
示例系统
本书旨在使读者了解当代操作系统的设计原则和实现问题。仅有纯粹的概念和理论是不够的,为了说明这些概念并把它们与必须做出的实际设计选择联系起来,我们选择了两个处理器系列作为运行示例:
Intel x86体系结构:非嵌入式计算机系统中应用最广泛的体系结构是x86。x86本质上是复杂指令集计算机(CISC),但是又具有一些精简指令集计算机(RISC)的特点。x86系列的最新成员使用了超标量和多核设计原则。x86体系结构特性的演变为计算机体系结构大多数设计原则的演变提供了一个独特的研究案例。
ARM:ARM体系结构大概是应用最广泛的嵌入式处理器,用于手机、iPod、远程传感器设备和许多其他设备。ARM本质上是RISC。ARM系列的最新成员使用了超标量和多核设计原则。
本书中的许多例子(但不是全部)都来自这两个计算机系列。许多其他系统,不论是当代的还是过去的,都体现了重要的计算机体系结构设计特性。
本书的组织结构
本书由六个部分组成:
引言
计算机系统
算术与逻辑
中央处理单元
并行结构(包括多核)
控制单元
本书具备很多教学特色,包括使用交互式仿真和大量图表来使讨论更加清晰。每章都有关键词列表、复习题、家庭作业以及扩展阅读建议。本书还包括常用缩略词列表和参考书目列表。
教师资源
教师的教辅资料可从本书的教师资源中心(IRC)获取,可以通过出版商网站www.pearsonhighered.com/stallings访问,也可以在本书的配套网站WilliamStallings.com/Computer-Organization上点击“Pearson Resources for Instructors”的链接访问。如需访问IRC,请通过pearsonhighered.com/educator/replocator/requestSalesRep.page与当地的Pearson销售代表联系,或致电Pearson教师服务热线1-800-526-0485。IRC提供以下资料:
项目手册:项目资源,包括文档和可移植的软件,以及本前言后面列出的所有项目类别的推荐项目作业。
参考答案手册:每章复习题和练习题的参考答案。
PPT:全部章节的PPT,适合用于教学。
PDF文档:本书所有的图表文件。
题库:每章的问题集。
样例教学大纲:本书包含的资料多于一学期所需的量。因此,为教师提供了几个样例教学大纲,以指导在有限时间内如何使用本书。这些样例都是基于教授本书第1版时的实际经验。
配套网站WilliamStallings.com/ComputerOrganization(点击Instructor Resources链接)包含如下内容:
使用本书的其他课程的网站链接。
Internet邮件列表的注册信息,供使用本书的教师之间以及与作者之间进行信息、建议与问题的交流。
学生资源
在新版本中,学生可以在两个网站上获得大量的原始支持材料。在WilliamStallings.com/ComputerOrganization(点击Student Resources链接)的配套网站上,有按章节组织的相关链接列表和勘误表。
购买新书的读者可以在6个月内访问付费内容网站,其中包含在线章节、在线附录、家庭作业与参考答案。
最后,WilliamStallings.com/StudentSupport.html上的Computer Science Student Resource Site由我维护。
项目和其他学生练习
对许多老师来说,计算机组成与体系结构课程的一个重要组成部分是一个或多个项目,通过这些项目,学生可以获得实践经验来强化课本中的概念。本书为此提供了无与伦比的支持,教师可将这些项目用于教学。Prentice Hall提供的教辅资源不仅包括如何布置和构建项目的指导,还包含一组针对各种项目类型和特定任务的用户手册,所有这些都是专门为本书编写的。教师可以针对下列各方面布置作业:
交互式仿真作业:说明见后文。
研究项目:一系列研究任务,指导学生在互联网上研究特定主题并撰写报告。
仿真项目:IRC支持使用两个仿真包:SimpleScalar可用于探索计算机组成与体系结构设计问题;SMPCache是一个强大的教学工具,能够检查对称多处理器的缓存设计问题。
汇编语言项目:使用一种简化的汇编语言CodeBlue,提供了基于流行的Core War概念的任务。
阅读/报告任务:文献论文列表,每章一篇或多篇论文,可以分配给学生阅读并撰写一篇简短的报告。
写作作业:一份写作作业清单,帮助学习书中的内容。
题库:包含是非题、多选题、填空题及答案。
这些多样化的项目和学生练习使教师能够把本书作为丰富学习体验的一个组成部分,也可以定制课程计划以满足师生的特定需求。详情请见本书附录A。
交互式仿真
本版的一个重要特征是结合了交互式仿真。这些仿真为理解现代计算机系统的复杂设计特性提供了一个强大的工具。共有20个交互式仿真用于说明计算机组成与体系结构设计的关键概念和算法。在本书的相应位置上,我们用图标表示有相关的交互式仿真可供学生在线使用。在动画中,用户可以设置初始条件,因此可以作为学生作业的基础。教师补充材料包括一组作业,每个对应一个动画。每个作业都有几个可以布置给学生的具体问题。
要访问动画,请点击本书网站http://williamstallings.com/ComputerOrganization上的旋转地球。
致谢
新版本受益于许多人的审阅,他们慷慨地献出了自己的时间和专业知识。以下教授和讲师审阅了全部或大部分内容:Molisa Derk(Dickinson State大学),Yaohang Li (Old Dominion大学),Dwayne Ockel (Regis大学),Nelson Luiz Passos(Midwestern State大学),Mohammad Abdus Salam(Southern大学),Vladimir Zwass(Fairleigh Dickinson大学)。
感谢为一个或多个章节提供了详细的技术意见的各位,他们是:Rekai Gonzalez Alberquilla,Allen Baum,Jalil Boukhobza,Dmitry Bufistov,Humberto Calderón,Jesus Carretero,Ashkan Eghbal,Peter Glaskowsky,Ram Huggahalli,Chris Jesshope,Athanasios Kakarountas,Isil Oz,Mitchell Poplingher,Roger Shepherd,Jigar Savla,Karl Stevens,Siri Uppalapati,Sriram Vajapeyam博士,Kugan Vivekanandarajah,Pooria M. Yaghini,Peter Zeno。
Peter Zeno撰写了第19章中的GPGPU部分。
Appalachian State大学的Cindy Norris教授、New Brunswick大学的Bin Mu教授以及Alaska 大学的Kenrick Mock教授提供了家庭作业。
Massachusetts大学的Aswin Sreedhar设计了交互式仿真作业,并编写了习题库。
西班牙Extremadura大学的Miguel Angel Vega Rodriguez教授、Juan Manuel Sanchez Perez教授(博士)和Juan Antonio Gomez Pulido教授(博士)编写了指导手册中的SMPCache问题,以及SMPCache用户指南。
Wisconsin大学的Todd Bezenek和Lehigh大学的James Stine编写了指导手册中的SimpleScalar问题,Todd还编写了SimpleScalar用户指南。
最后,我要感谢负责出版这本书的诸位编辑,他们所做的工作一如既往地出色。他们来自Pearson出版集团,特别是我的编辑Tracy Johnson,她的助理Kelsey Loanes,项目经理Carole Snyder,以及生产经理Bob Engelhardt。我还要感谢Mahalatchoumy Saravanan以及Jouve India的工作人员,他们迅速出色地完成了生产任务。还要感谢Pearson集团的营销和销售人员,没有他们的努力,这本书就不会呈现在大家面前。