计算机组成和体系结构第五讲

2020-03-23 226浏览

1.计算机组成和体系结构第五讲四川大学网络空间安全学院 2020年3月23日封面来自arm.com 1
2.版权声明课件中所使用的图片、视频等资源版权归原作者所有。课件原创内容采用创作共用署名－非商业使用－相同方式共享4.0国际版许可证(Creative Commons BY-NC-SA 4.0 International License) 授权使用。 Copyright@四川大学网络空间安全学院计算机组成与体系结构课程组，2020 2
3.上期内容回顾概论初识计算机系统、计算机发展历史、计算机层次化结构、冯诺依曼模型及非冯诺依曼模型数字电子技术基础计算机系统中数字的表示、布尔代数运算符、常见组合逻辑电路和时序电路计算机体系结构 CPU结构（寄存器、算术逻辑单元、总线、时钟）、内存、I/O和中断一个简化的计算机体系结构MARIE 数据通路的构成、指令集的编码和寻址、寄存器传输表示、MARIE汇编语言、控制信号和加入信号模式的寄存器传输表示前四章内容各部分之间的联系 3
4.本期学习目标学习内容：教材第5章“仔细审视指令集架构” 进一步加深理解指令集在整个计算机系统中的重要作用初步掌握正确解读现有指令集的方法初步了解指令集设计的方法教材5.2节指令格式学习掌握指令格式设计中需要考虑的因素和现有的解决方案教材5.3节指令类型学习掌握常见的指令类型教材5.4节寻址学习掌握常见的寻址类型 4
5.中英文缩写对照表英文缩写英文全称中文全称 ISA Instruction Set Architecture 指令集架构 GPR General-purpose Register 通用寄存器 RISC Reduced Instruction Set Computer 精简指令集计算机 RPN Reverse Polish Notation 逆波兰式（后缀表达式） 5
6.指令集架构 6.1
7.引言Q1:指令集架构包含哪些内容Q2:为什么要学习指令集架构 6.2
8.引言Q1:指令集架构包含哪些内容指令集架构(Instruction Set Architecture, ISA) 包含了一个计算机体系结构所有指令构成的集合，以及这些指令的编码方法。Q2:为什么要学习指令集架构 x86指令集图片来源：https://www.computing.dcu.ie/~humphrys/Notes/OS/hardware.html6.2
9.引言Q1:指令集架构包含哪些内容指令集架构(Instruction Set Architecture, ISA) 包含了一个计算机体系结构所有指令构成的集合，以及这些指令的编码方法。Q2:为什么要学习指令集架构指令集是计算机系统中软硬件的接口了解指令集架构有助于理解CPU的设计 6.2
10.引言Q1:指令集架构包含哪些内容指令集架构(Instruction Set Architecture, ISA) 包含了一个计算机体系结构所有指令构成的集合，以及这些指令的编码方法。Q2:为什么要学习指令集架构指令集是计算机系统中软硬件的接口了解指令集架构有助于理解CPU的设计和如何设计CPU 6.2
11.指令集设计决策我们用MARIE的指令作为例子，分析指令集设计需要考虑的因素 16位固定长度的指令 15条指令，对应4位固定长度操作码最多有一个12位显式操作数算术逻辑单元输入来自AC寄存器和内存(MBR寄存器) 支持内存的直接寻址和间接寻址 6.3
12.指令集设计决策我们用MARIE的指令作为例子，分析指令集设计需要考虑的因素 16位固定长度的指令 15条指令，对应4位固定长度操作码最多有一个12位显式操作数算术逻辑单元输入来自AC寄存器和内存(MBR寄存器) 支持内存的直接寻址和间接寻址指令的长度(表示一条指令需要的比特数以及是否是固定值) 6.3
13.指令集设计决策我们用MARIE的指令作为例子，分析指令集设计需要考虑的因素 16位固定长度的指令 15条指令，对应4位固定长度操作码最多有一个12位显式操作数算术逻辑单元输入来自AC寄存器和内存(MBR寄存器) 支持内存的直接寻址和间接寻址指令的长度(表示一条指令需要的比特数以及是否是固定值) 指令类型的数量以及如何对指令类型进行编码 6.3
14.指令集设计决策我们用MARIE的指令作为例子，分析指令集设计需要考虑的因素 16位固定长度的指令 15条指令，对应4位固定长度操作码最多有一个12位显式操作数算术逻辑单元输入来自AC寄存器和内存(MBR寄存器) 支持内存的直接寻址和间接寻址指令的长度(表示一条指令需要的比特数以及是否是固定值) 指令类型的数量以及如何对指令类型进行编码操作数的类型、数量和对应的数据范围 6.3
15.指令集设计决策我们用MARIE的指令作为例子，分析指令集设计需要考虑的因素 16位固定长度的指令 15条指令，对应4位固定长度操作码最多有一个12位显式操作数算术逻辑单元输入来自AC寄存器和内存(MBR寄存器) 支持内存的直接寻址和间接寻址指令的长度(表示一条指令需要的比特数以及是否是固定值) 指令类型的数量以及如何对指令类型进行编码操作数的类型、数量和对应的数据范围指令操作数的存储 6.3
16.指令集设计决策我们用MARIE的指令作为例子，分析指令集设计需要考虑的因素 16位固定长度的指令 15条指令，对应4位固定长度操作码最多有一个12位显式操作数算术逻辑单元输入来自AC寄存器和内存(MBR寄存器) 支持内存的直接寻址和间接寻址指令的长度(表示一条指令需要的比特数以及是否是固定值) 指令类型的数量以及如何对指令类型进行编码操作数的类型、数量和对应的数据范围指令操作数的存储指令集架构支持的内存寻址方式 6.3
17.指令集的评价指标 6.4
18.指令集的评价指标指令执行效率 6.4
19.指令集的评价指标指令执行效率指令和操作数读取效率 6.4
20.指令集的评价指标指令执行效率指令和操作数读取效率指令通过流水线(Pipeline)执行的效率 6.4
21.指令集的评价指标指令执行效率指令和操作数读取效率指令通过流水线(Pipeline)执行的效率实现同样的运算需要的指令数量 6.4
22.指令集的评价指标指令执行效率指令和操作数读取效率指令通过流水线(Pipeline)执行的效率实现同样的运算需要的指令数量指令译码复杂度(控制单元电路实现复杂度) 6.4
23.指令集的评价指标指令执行效率指令和操作数读取效率指令通过流水线(Pipeline)执行的效率实现同样的运算需要的指令数量指令译码复杂度(控制单元电路实现复杂度) 可寻址空间的大小 6.4
24.常见设计决策及特点采用短指令提高指令的读取和译码性能，限制了指令类型的数量，对操作数的个数和大小有更严格的要求定长指令的译码相对容易但是浪费了存储空间扩展操作码可以充分利用定长指令的存储空间从而表示更多的指令类型，同时可能降低指令长度按照字长寻址的内存难以存取单个字节，大多数现有体系结构采用按字节寻址 6.5
25.多字节存储方式Q:如何用字节寻址的内存存储字？A:大端存储和小端存储端(Endianness)代表了计算机中存储多字节数据的顺序小端(Little Endian)：低位有效字节存储在低位地址大端(Big Endian)：低位有效字节存储在高位地址假设字长为32,一个地址为𝑥的字𝑏� 𝑏� 𝑏� 𝑏� 存储单元排列如下: 地址 𝑥 𝑥+1 𝑥+2 𝑥+3 小端存储 𝑏� 𝑏� 𝑏� 𝑏� 大端存储 𝑏� 𝑏� 𝑏� 𝑏� 6.6
26.大端存储和小端存储实例假设字长为32, 初始地址为0x200, 连续三个无符号整数 0xABCD1234、0x00FF4321和0x10的内存存储情况如下： 6.7
27.大端存储和小端存储总结大端存储和小端存储代表的字节顺序而不是位顺序大端存储的优缺点：更加自然：字节顺序和地址顺序一致可以快速确定数字的符号(符号位在最低地址) 字符串的存储顺序和整数一致："ABC" = 0x41 0x42 0x43 => 0x414243 小端存储的优缺点高位数字转为低位数字更方便：32位数字 0x12345678和低16位0x5678的地址是一样的 6.8
28.CPU内部的数据存储 6.9
29.CPU内部的数据存储堆栈型架构：操作数隐式放置在一个堆栈中 6.9
30.CPU内部的数据存储堆栈型架构：操作数隐式放置在一个堆栈中累加器型架构：当指令对应的运算包含两个操作数时，其中一个操作数隐式放置在累加器寄存器中 6.9
31.CPU内部的数据存储堆栈型架构：操作数隐式放置在一个堆栈中累加器型架构：当指令对应的运算包含两个操作数时，其中一个操作数隐式放置在累加器寄存器中通用寄存器型架构：操作数可以保存在寄存器中 6.9
32.CPU内部的数据存储堆栈型架构：操作数隐式放置在一个堆栈中累加器型架构：当指令对应的运算包含两个操作数时，其中一个操作数隐式放置在累加器寄存器中通用寄存器型架构：操作数可以保存在寄存器中存储器-存储器型：可以有多个操作数存放在内存，允许实现任何操作数都不在寄存器的指令 6.9
33.CPU内部的数据存储堆栈型架构：操作数隐式放置在一个堆栈中累加器型架构：当指令对应的运算包含两个操作数时，其中一个操作数隐式放置在累加器寄存器中通用寄存器型架构：操作数可以保存在寄存器中存储器-存储器型：可以有多个操作数存放在内存，允许实现任何操作数都不在寄存器的指令寄存器-存储器型：至少一个操作数在寄存器中，另一个操作数在内存中 6.9
34.CPU内部的数据存储堆栈型架构：操作数隐式放置在一个堆栈中累加器型架构：当指令对应的运算包含两个操作数时，其中一个操作数隐式放置在累加器寄存器中通用寄存器型架构：操作数可以保存在寄存器中存储器-存储器型：可以有多个操作数存放在内存，允许实现任何操作数都不在寄存器的指令寄存器-存储器型：至少一个操作数在寄存器中，另一个操作数在内存中取-存型：所有操作数都在寄存器中 6.9
35.不同存储方式指令集架构示例例子：假设要实现地址为𝑥的存储单元和地址为𝑦的存储单元中的数据相加之后写入地址为𝑧的存储单元堆栈型架构： PUSH x PUSH y ADD POP z 累加器型架构： LOAD x ADD y STORE z 通用寄存器型架构(存储器-存储器型)： ADD ax, x, y STORE ax, z 通用寄存器型架构(寄存器-存储器型)： LOAD ax, x IADD ax, y STORE ax, z 通用寄存器型架构(取-存型)： LOAD ax, x LOAD bx, y ADD cx, ax, bx STORE cx, z 6 . 10
36.指令操作数的数量和长度按照操作数的数量分类：零地址指令：仅有操作码单地址指令：操作码＋一个操作数(通常是一个内存地址) 双地址指令：操作码＋两个操作数(通常是两个寄存器，或者是一个寄存器一个地址) 三地址指令：操作码＋三个操作数(三个寄存器地址，或者是寄存器地址和内存地址的组合) 不同存储方式支持的操作数数量：存储方式堆栈型累加器型通用寄存器型零地址指令是是是单地址指令是是是双地址指令否否是三地址指令否否是 6 . 11
37.堆栈型架构和逆波兰式堆栈型架构可以实现所有的运算都是零地址指令单地址指令只包括PUSH和POP 考虑一个三地址指令OP dt, sc1, sc2，其中 OP代表操作码 dt代表目的地址 sc1代表第一个操作数的地址 sc2代表第二个操作数的地址则该指令可以改写为 PUSH sc1 PUSH sc2 OP POP dt 6 . 12
38.堆栈型架构和逆波兰式堆栈型架构可以实现所有的运算都是零地址指令单地址指令只包括PUSH和POP 堆栈型架构的应用：求解由逆波兰式(后缀表达式)表达的长算术表达式后缀表达式：运算符放在表达式的最后例：4 + 3的后缀表达式是4 3 + 考虑一个三地址指令OP dt, sc1, sc2，其中 OP代表操作码 dt代表目的地址 sc1代表第一个操作数的地址 sc2代表第二个操作数的地址则该指令可以改写为 PUSH sc1 PUSH sc2 OP POP dt 6 . 12
39.后缀表达式的转换表达式树遍历法给定一个前缀/中缀/后缀描述的表达式，写出其对应的前缀/中缀/后缀表达式写出原前缀/中缀/后缀表达式对应的表达式树，对表达式树进行对应的前缀/中缀/后缀遍历，适当添加括号保证执行顺序中缀表达式每一步都加括号可以保证执行顺序，前缀表达式和后缀表达式不需要括号按优先级替换法按照运算符优先级依次将该运算符对应的中缀表达式变换为后缀表达式 1+2×3⇒1+23× ⇒123× + 6 . 13
40.堆栈执行后缀表达式如果当前token是操作数，入栈如果当前token是运算符，从栈顶读取操作数(出栈)进行计算，将结果入栈例：对于后缀表达式1 2 3 × + 栈操作 1 (空) PUSH 1 2 1 PUSH 2 3 12 PUSH 3 × 123 POP 3; POP 2; MUL 2, 3; PUSH 6 + 16 POP 6; POP 1; ADD 1, 6; PUSH 7 $ 7 token 6 . 14
41.扩展操作码 MARIE的指令集中采用固定长度的操作码表示不同的指令类型定长指令的译码相对容易但是浪费了存储空间变长指令译码复杂不同类型的指令需要的操作数数量不同扩展操作码(Expanding Opcodes)：在定长的指令中，通过变长的操作码，表示更多的指令类型 6 . 15
42.扩展操作码的示例假设某体系结构中有16个寄存器和4K个可寻址存储单元，采用16位字长的指令 16个寄存器对应4位寄存器地址 4K个内存可寻址单元对应12位内存地址采用扩展操作码的指令类型采用固定操作码长度的指令类型 6 . 16
43.扩展操作码的编码区别操作码的长度：采用转义操作码(Escape Opcode) 转义操作码的作用：表示操作码的编码超过当前长度示例: 假设某体系结构中地址长度为4，如何采用16位字长的指令编码下列指令： 15条三地址指令 14条双地址指令 31条单地址指令 16条零地址指令 6 . 17
44.扩展操作码的译码按照编码模式分类后分别编码示例：对于右边的编码，对应的译码方式如下所示 if (IR[15:12] != 1111) { 译码并执行对应的三地址指令 } else (IR[15:9] != 1111 111) { 译码并执行对应的双地址指令 } else (IR[15:4] != 1111 1111 1111) { 译码并执行对应的单地址指令 } else { 译码并执行对应的零地址指令 } 6 . 18
45.利用位模式判断扩展操作码是否可行判断是否采用𝐾位可以编码一个使用扩展操作码的指令集：使用位模式每一个位模式代表了一个特定的操作编码长度要足够表示所有可能的操作组合示例：假设地址长度为4,采用16位指令是否与编码右侧两个指令集 15条三地址指令：位模式数量 15 × 2 � × 2 � × 2 � = 61440 14条双地址指令：位模式数量14 × 2 � × 2 � = 3584 31条单地址指令：位模式数量31 × 2 � = 496 16条零地址指令：位模式数量16 合计65536 ≤ 2��个位模式，可以被16位指令编码 15条三地址指令：位模式数量 15 × 2 � × 2 � × 2 � = 61440 15条双地址指令：位模式数量15 × 2 � × 2 � = 3840 31条单地址指令：位模式数量31 × 2 � = 496 16条零地址指令：位模式数量16 合计65792 > 2��个位模式，不能被16位指令编码 6 . 19
46.指令类型 6 . 20
47.指令类型数据传输表示数据的传输，例如：内存传送到寄存器：LOAD 寄存器之间数据传输：MOVE 寄存器传送到内存：STORE 内存/寄存器到栈：PUSH 栈到内存/寄存器：POP 原子操作：TEST, EXCHANGE等 6 . 20
48.指令类型数据传输算术运算表示算术运算，例如：算术运算：ADD、SUBSTRACT、MULTIPLY、DIVIDE等自增运算：INCREMENT等 6 . 20
49.指令类型数据传输算术运算布尔逻辑运算表示布尔逻辑运算，例如：布尔代数运算符：AND，OR，XOR，NOT等比较函数：EQUAL，NEQUAL，LT，GT，LEQ，GEQ等 6 . 20
50.指令类型数据传输算术运算布尔逻辑运算位操作将数据看作01数列进行按位操作的运算，例如按位的逻辑运算：AND，OR，XOR等算术逻辑移位：LSHIFT和RSHIFT 符号位不移位，但是如果符号位上的移出位和符号位不同将导致算术溢出例：(10110000) = − 80左移1位得到 (11100000) = − 32，但是移出位0 ≠ 符号位1,因此发生算术溢出例：(11100000) = − 32左移1位得到 (11000000) = − 64,移出位1 = 符号位1,因此没有发生算术溢出循环移位指令：LROTATE和RROTATE 移出位填充到对侧例：(00000001)右移1位得到(00000000)，右循环移位1 位得到(10000000) 6 . 20
51.指令类型数据传输算术运算布尔逻辑运算位操作输入/输出指令 6 . 20
52.指令类型数据传输算术运算布尔逻辑运算位操作输入/输出指令传送控制指令改变程序执行顺序的指令，例如：跳转和条件跳转：JUMP、JE等函数调用：CALL 中断：INT 6 . 20
53.指令类型数据传输算术运算布尔逻辑运算位操作输入/输出指令传送控制指令专用指令一些特殊的指令，例如：无指令：NOP（用于流水线避免数据冲突） 6 . 20
54.寻址方式常见的寻址方法：立即寻址(Immediate Addressing) 直接寻址(Direct Addressing) 间接寻址(Indirect Addressing) 变址寻址(Indexed Addressing) 基址寻址(Based Addressing) 堆栈寻址(Stack Addressing) 6 . 21
55.寻址方法 6 . 22
56.寻址方法立即寻址指令中的地址直接指定操作数例：对于右边的内存，采用立即寻址，执行指令LOAD 0x800之后寄存器AC的值是0x0800 6 . 22
57.寻址方法直接寻址指令中的地址直接指向操作数的地址指令中12位地址可寻址空间大小：2�� 例：对于右边的内存，采用直接寻址，执行指令LOAD 0x800之后寄存器AC的值是0x0900 寄存器(直接)寻址指令中不用地址数，而是用一个寄存器名字，例：LOAD R1。寻址地址为对应的寄存器中存储的值，寻址方法和直接寻址一致 6 . 22
58.寻址方法间接寻址指令中的地址指向的地址保存了直接指向操作数的地址指令中12位地址可寻址空间大小：2��(字长) 例：对于右边的内存，采用间接寻址，执行指令LOAD 0x800之后寄存器AC的值是0x1000 寄存器间接寻址指令中不用地址数，而是用一个寄存器名字，例：LOAD R1。寻址地址为对应的寄存器中存储的值，寻址方法和间接寻址一致 6 . 22
59.寻址方法变址寻址在一个特定的寄存器（称为变址寄存器）中保存了一个地址偏移值，通过指令中的地址加上变址寄存器中的偏移值得到实际的地址，进行直接寻址基址寻址在一个特定的寄存器（称为基址寄存器）中保存了一个地址偏移值，将指令中的地址作为偏移值加上基址寄存器中的地址得到实际的地址，进行直接寻址指令中12位地址可寻址空间大小：2�� + 2�� 例：对于右边的内存，采用变址寻址和基址寻址，执行指令 LOAD 0x800之后寄存器AC的值是0x0500 6 . 22
60.第五讲结束 7.1
61.本期内容回顾学习内容：教材第5章“仔细审视指令集架构” 进一步加深理解指令集在整个计算机系统中的重要作用初步掌握正确解读现有指令集的方法初步了解指令集设计的方法教材5.2节指令格式学习掌握指令格式设计中需要考虑的因素和现有的解决方案教材5.3节指令类型学习掌握常见的指令类型教材5.4节寻址学习掌握常见的寻址类型 7.2
62.扩展阅读 7.3
63.Q&A 8