深入理解计算机系统CSAPP-3

2020-12-14 , 1389 , 104 , 144

听音频 🔊 . 看视频 🎦

．理解链接时出现的错误。

根据我们的经验，一些最令人困扰的程序错误往往都与链接器操作有关，尤其是当你试图构建大型的软件系统时。比如，链接器报告说它无法解析一个引用，这是什么意思？静态变量和全局变量的区别是什么？

如果你在不同的c文件中定义了名字相同的两个全局变量会发生什么？

静态库和动态库的区别是什么？

我们在命令行上排列库的顺序有什么影响？最严重的是，为什么有些链接错误直到运行时才会出现？在第7章中，你将得到这些问题的答案。

．避免安全漏洞。

多年来，缓冲区溢出错误是造成大多数网络和lnternet服务器上安全漏洞的主要原因。存在这些错误是因为很少有程序员能够理解需要限制从不受信任的源接收数据的数量和格式。

学习安全编程的第一步就是理解数据和控制信息存储在程序栈上的方式会引起的后果。作为学习汇编语言的一部分，我们将在第3章中描述堆栈原理和缓冲区溢出错误。我们还将学习程序员、编译器和操作系统可以用来降低攻击威胁的方法。

1.4 处理器读并解释储存在内存中的指令

此刻，hello·c源程序已经被编译系统翻译成了可执行目标文件hello，并被存放在磁盘上。要想在Unix系统上运行该可执行文件，我们将它的文件名输人到称为shell的应用程序中：

linux>./hello

hello，world

linux>

shell是一个命令行解释器，它输出一个提示符，等待输人一个命令行，然后执行这个命令。如果该命令行的第一个单词不是一个内置的shell命令，那么shell就会假设这是一个可执行文件的名字，它将加载并运行这个文件。所以在此例中，shell将加载并运行he旦。程序，然后等待程序终止。hello程序在屏幕上输出它的消息，然后终止。shell随后输出一个提示符，等待下一个输人的命令行。

1.4.1 系统的硬件组成

为了理解运行hello程序时发生了什么，我们需要了解一个典型系统的硬件组织，如图1一4所示。这张图是近期lntel系统产品族的模型，但是所有其他系统也有相同的外观和特性。现在不要担心这张图很复杂一一一我们将在本书分阶段对其进行详尽的介绍。

1．总线

-loading-

贯穿整个系统的是一组电子管道，称作总线，它携带信息字节并负责在各个部件间传递。通常总线被设计成传送定长的字节块，也就是字(word). 字中的字节数（即字长）是一个基本的系统参数，各个系统中都不尽相同。现在的大多数机器字长要么是4个字节（32位），要么是8个字节（64位）。本书中，我们不对字长做任何固定的假设。相反，我们将在需要明确定义的上下文中具体说明一个“字”是多大。

UfqiLong

2．I/O设备

I/0（输人/输出）设备是系统与外部世界的联系通道。我们的示例系统包括四个I/O设备：作为用户输人的键盘和鼠标，作为用户输出的显示器，以及用于长期存储数据和程序的磁盘驱动器（简单地说就是磁盘）。最开始，可执行程序hello就存放在磁盘上。

每个I/O设备都通过一个控制器或适配器与I/O总线相连。控制器和适配器之间的区别主要在于它们的封装方式。控制器是I/O设备本身或者系统的主印制电路板（通常称作主板）上的芯片组。而适配器则是一块插在主板插槽上的卡。无论如何，它们的功能都是在I/O总线和I/O设备之间传递信息。

图1一4 一个典型系统的硬件组成

CPU：中央处理单元；ALU：算术/逻辑单元；PC：程序计数器；USB：通用串行总线

第6章会更多地说明磁盘之类的1/O设备是如何工作的。在第10章中，你将学习如何在应用程序中利用Unix1/0接口访问设备。我们将特别关注网络类设备，不过这些技术对于其他设备来说也是通用的。

3．主存

主存是一个临时存储设备，在处理器执行程序时，用来存放程序和程序处理的数据。从物理上来说，主存是由一组动态随机存取存储器（DRAM）芯片组成的。从逻辑上来说，存储器是一个线性的字节数组，每个字节都有其唯一的地址（数组索引），这些地址是从零开始的。

一般来说，组成程序的每条机器指令都由不同数量的字节构成。与c程序变量相对应的数据项的大小是根据类型变化的。比如，在运行Linux的x86一64机器上，short类型的数据需要2个字节，土n乜和。乜类型需要4个字节，而long和double类型需要8个字节。

第6章将具体介绍存储器技术，比如DRAM芯片是如何工作的，它们又是如何组合起来构成主存的。

4．处理器

中央处理单元（CPU)，简称处理器，是解释（或执行）存储在主存中指令的引擎。处理器的核心是一个大小为一个字的存储设备（或寄存器），称为程序计数器（PC)。在任何时刻，PC都指向主存中的某条机器语言指令（即含有该条指令的地址）产从系统通电开始，直到系统断电，处理器一直在不断地执行程序计数器指向的指令，再更新程序计数器，使其指向下一条指令。

-loading-

UfqiLong

处理器看上去是按照一个非常简单的指令执行模型来操作的，这个模型是由指令集架构决定的。在这个模型中，指令按照严格的顺序执行，而执行一条指令包含执行一系列的步骤。处理器从程序计数器指向的内存处读取指令, 解释指令中的位，执行该指令指示的简单操作，然后更新PC，使其指向下一条指令，而这条指令并不一定和在内存中刚刚执行的指令相邻。

这样的简单操作并不多，他们围绕主存、寄存器文件（register file）和算术/逻辑单元（ALU）进行。寄存器文件是一个小的存储设备，由一些单个字长的寄存器组成，每个寄存器都有一个唯一的名字。ALU计算新的数据和地址值。下面是一些简单操作的例子，CPU在指令的要求下可能会执行这些操作。

--加载

从主存复制一个字节或者一个字到寄存器，以覆盖寄存器原来的内容。

--存储

从寄存器复制一个字节或者一个字到主存的某个位置，以覆盖这个位置上原来的内容。

--操作

把两个寄存器的内容复制到ALU，ALU对这两个字做算术运算，并将结果存放到一个寄存器中，以覆盖该寄存器中原来的内容。

--跳转

从指令本身抽取一个字，并将这个字复制到程序计数器（PC）中，以覆盖PC中原来的值。

处理器看上去是它的指令集架构的简单实现，但是实际上现代处理器使用了非常复杂的机制来加速程序的执行。因此，我们将处理器的指令集架构和处理器的微体系结构区分开来：

指令集架构描述的是每条机器代码指令的效果；

而微体系结构描述的是处理器实际上是如何实现的。