重叠流水和向量流水处理机.pptx
上传人:骑着****猪猪 上传时间:2024-09-15 格式:PPTX 页数:118 大小:1.6MB 金币:20 举报 版权申诉
预览加载中,请您耐心等待几秒...

重叠流水和向量流水处理机.pptx

重叠流水和向量流水处理机.pptx

预览

免费试读已结束,剩余 108 页请下载文档后查看

20 金币

下载此文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

会计学5.1重叠方式执行n条指令需:T=(1+2n)t;优点:指令执行时间缩短了近1/2;功能部件的利用率也有所提高;缺点:需要增加一些部件,控制也要复杂些;执行n条指令需要:T=(2+n)t指令的执行时间缩短了近2/3,是一种比较理想的指令执行方式;这种执行方式存在着访存冲突,要解决访主存的冲突问题,通常采用以下几种方式:(1)主存分成两个独立编址的存储器,一个专门存放指令,一个专门存放操作数;(2)指令和数据仍然混存在一个存储器中,采用多体交叉主存结构,不能根本解决;(3)采用先行控制技术,增设采用先进先出方式工作的指令缓冲寄存器。3一次重叠:把取指令操作隐含在分析、执行指令过程中,则在任何时候只允许上条指令“执行”与下条指令“分析”相重叠。三、先行控制结果:解决了分析与执行时间不等长问题。硬件结构:相关处理图5.5IBM370“执行”指令的执行3.主存空间数相关的处理4.通用寄存器组相关的处理设机器的基本指令格式为图5.7指令解释过程中与通用寄存器内容有关的微操作时间关系图5.8“执行k”、“分析k+1”重叠时,访问通用寄存器组的时间关系图5.9用相关专用通路解决通用寄存器组的数相关(2)通用寄存器组基址值和变址值相关的处理图5.11B一次、二次相关的推后处理图5.12B相关专用通路法5.2流水方式流水线工作方式:指令一条接着一条从输入端流入,经过各个子过程后从输出端流出。图5.16是对应5.14浮点数加法器流水线的时空图(2)流水线特点:1)流水一定重叠,比重叠更苛刻。2)一条流水线通常有多个流水段组成。3)每段有专用功能部件,各部件顺序连接,不断流。4)流水线有建立时间、满载时间、排空时间。5)各段时间尽量短、一致;不一致时最慢子过程为瓶颈。6)给出指标如最大吞吐率,为满负载最佳指标。2流水线分类TI-ASC运算器流水线(多功能)按工作方式分为:A.静态流水线:在某一时间内各段只能按一种功能连接流水,只有等流水线全部流空后,才能切换为另一种功能;浮加排空完,再进行定乘按流水线中各功能段是否有反馈回路,分为:A.线性流水线:各段串行联接,没有反馈回路,各个段只经过一次;B.非线性流水线:除有串行联接通路外,还有某种反馈回路,需多次经过某个段或越过某个段;一、吞吐率、加速比和效率。(1)各段时间均相等的流水线各段时间均相等的流水线时空图流水线完成n个连续任务所需要的总时间为(假设一条k段线性流水线)Tk=kΔt+(n-1)Δt=(k+n-1)Δt流水线的实际吞吐率最大吞吐率与实际吞吐率的关系⑵流水线中各个段的执行时间不完全相等,流水线出现“瓶颈”部件。解决流水线“瓶颈”问题有两种方法:另一种方法:将流水线的“瓶颈”子部件设置多套并联2.加速比(1)各个功能段执行时间均相等的k段流水线上完成n个连续任务的实际加速比为:(2)如果流水线上各个功能段的执行时间不相等,则流水线的加速比为:3.效率(1)在流水线的各功能段执行时间相等连续输入n个任务的情况下,一条k段流水线的效率为:(2)流水线的各段执行时间不相等连续执行n个任务时的流水线效率为:二.标量流水线的性能举例流水线的实际吞吐率TP为:【例5.2】设向量A和B各有4个元素,图5.20为静态双功能的流水线连接图,其中,1→2→3→5组成加法流水线,1→4→5组成乘法流水线,设每个流水线所经过的时间均为∆t,则计算向量点积流水线的实际吞吐率TP为:【例5.3】假设图5.20表示的双功能流水线为动态双功能流水线,则重新计算向量点积流水线的实际吞吐率TP为:课堂练习一、局部性相关处理解决方法:(2)指令相关原因:由指令可修改引起。(3)数据相关原因:对主存数据或通用寄存器数据的操作引起的相关。相关类型一解决方案:a.延迟执行法(后推法)不同拍之间相关时,停顿后继指令的运行,直到前面指令结果生成;(R或M相关)同一拍中相关时,采用推后读、提前写方法(后半拍读、前半拍写);(R或M相关)RISC指令的装载延迟,采用联锁硬件检测,并使流水线停顿,直到相关消除。b.相关专用通路法执行结果除写寄存器外,可直接送到ALU的操作数保存栈中。(R相关)c.异步流动法让流水线中相关指令的后续不相关指令先执行,自动消除相关。相关类型二:WAR(先读后写)、WAW(写写)2.局部相关的分布式控制和管理结构框图:a.利用公共数据总线作为相关专用通路;b.利用FLR“忙”位,检测REG的RAW相关;c.利用修改站号(寄存器重命名),检测和消除REG的WAR和WAW相关;d.利用存数缓冲器的动态存储器地址判别技术,检测和消除MEM的RAW、WAR和WAW相关。二、全局性相关处理2.猜测法指令预取器3.