第四章 指令级并行主要内容41指令级并行的概念42指令的动态调度43控制相关的动态解决技术44多指令流出技术Tomasulo算法产生的背景IBM 360/91比CDC6600晚三年推出商业计算机使用Cache技术之前整个360系列仅一个指令系统和一个编译器要求具有很高的浮点性能,但不是通过高端机器的专用的编译器实现只有四个双精度浮点寄存器,编译器调度的有效性受到很大限制访存时间和浮点计算时间都很长
42指令的动态调度静态调度:在出现数据相关时,为了消除或 者减少流水线空转,编译器确定并分离出程 序中存在相关的指令,然后进行指令调度, 并对代码进行优化。动态调度:通过硬件重新安排指令的执行顺序, 来调整相关指令实际执行时的关系,减少处理 器空转。以硬件复杂性的显著增加为代价。 第四章 指令级并行421 动态调度的原理 到目前为止我们所使用流水线的最大的局限性:指令必须顺序流出看下面一
第四章 指令级并行主要内容41指令级并行的概念42指令的动态调度43控制相关的动态解决技术44多指令流出技术42指令的动态调度编译器本质上通过对每个循环迭代中寄存器重命名来展开循环硬件也可通过寄存器重命名和乱序执行来获得同样的效果动态调度记分牌Tomasulo’s算法冒险的检测和调度如果存在数据相关,硬件检测机制会做如下的事情知道相关消除动态调度暂停指令停止取指令和发射指令静态调度(开始于60s,
#
#
#
第二章 指令系统(第三讲)指令系统结构Load/Store型指令集结构MIPS是一种多元指令集结构体现了当今多种机器(AMD29K、DEC station 3100、HP850、IBM 801、Intel i860、MIPS M/120A、MIPS M/1000、Motorola 88k、RISC I、SGI4D/60、SPARC station 1、Sun 4/110、Sun 4/260等)的指
第四章 指令级并行主要内容41指令级并行的概念42指令的动态调度43控制相关的动态解决技术44多指令流出技术44多指令流出技术多指令流出处理器实现一个时钟周期内流出多条指令时达到CPI小于1多流出处理器2种基本结构超标量(Superscalar)超标量每个时钟周期流出的指令数不定可以编译器静态调度,也可以硬件动态调度超长指令字( VLIW, Very long Instruction Word)每
#
HauptteiltextZweite EbeneDritte EbeneFolientitelDate:File:PRO2_ S7Siemens AG 2001. All rights Training for Automation and Drives状态位指令S7-CPU 的寄存器和存储器区域累加器ACCU1ACCU4ACCU3ACCU2仅适用于S7-400AR2AR1地址寄存器打开的 D
违法有害信息,请在下方选择原因提交举报