多线程使多个线程以重叠的方式共享单个处理器的功能单元.ppt
上传人:天马****23 上传时间:2024-09-11 格式:PPT 页数:16 大小:297KB 金币:10 举报 版权申诉
预览加载中,请您耐心等待几秒...

多线程使多个线程以重叠的方式共享单个处理器的功能单元.ppt

多线程使多个线程以重叠的方式共享单个处理器的功能单元.ppt

预览

免费试读已结束,剩余 6 页请下载文档后查看

10 金币

下载此文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

第一种方法:细粒度多线程技术它在每条指令间都能进行线程的切换,从而导致多个线程的交替执行。主要优点:能够隐藏由任何或长或短的阻塞带来的吞吐率的损失主要缺点:减慢了每个独立线程的执行第二种方法:粗粒度多线程技术粗粒度多线程之间的切换只在发生代价较高、时间较长的阻塞出现时。缺点:不能有效地减少吞吐率的损失。原因:由粗粒度多线程的流水线建立时间的开销造成的。由于实现粗粒度多线程的CPU只执行单个线程的指令,因此当发生阻塞时,流水线必须排空或暂停。阻塞后切换的新的线程在指令执行产生结果之前必须先填满整个流水线。7.6.1将线程级并行转换为指令级并行同时多线程技术是一种在多流出、动态调度处理器上开发线程级并行和指令级并行的改进的多线程技术。1.产生的主要原因2.一个超标量处理器在以下几种配置时其性能的差别支持细粒度多线程的超标量处理器线程的交替执行消除了完全空闲的流出槽。由于在每个时钟周期内只流出一个线程的指令,指令级并行的限制仍然导致一个时钟周期内存在不少的空闲流出槽。支持同时多线程的超标量处理器通过在一个时钟周期内调度多个线程使用流出槽,从而同时实现线程级并行和指令级并行。理想情况下,流出槽的使用率只受限于多个线程对资源的需求和可用资源间的不平衡。图7.16:超标量处理器中的4种不同的流出槽使用方法开发的基础:使用动态调度技术的处理器已经具有了开发线程级并行所需的硬件设置。动态调度超标量处理器有大量的虚拟寄存器组,可以用来保存每个独立线程的寄存器状态。由于寄存器重命名机制提供了唯一的寄存器标识符,多个线程的指令可以在数据路径上混合执行,而不会导致各线程间源操作数和目的操作数的混乱。多线程技术可以通过在一个乱序执行的处理器上为每个线程设置重命名表、保留各自的PC值、提供多个线程的指令结果提交的能力来实现。7.6.2同时多线程处理器的设计同时多线程只有在细粒度的实现方式下才有意义并发多个同优先级的线程必然拉长单个线程的执行时间通过指定一个优先线程来减小这种影响,从而在整体性能提高的同时对单个指定的线程性能只产生较小的影响。多个线程的混合执行将不可避免地影响单个线程的执行时间为提高单个线程的性能,应该为指定的优先线程尽可能多地向前取指,并且在分支预测失效和预取缓冲失效的情况下清空取指单元。但是这样限制了其他线程可用来调度的指令条数,从而减少了吞吐率。所有的多线程处理器都必须在这里寻求一种折衷方案。只要一有可能,处理器就运行指定的优先线程。从取指阶段开始就优先处理优先线程只要优先线程的指令预取缓冲区未满,就为它优先取指。只有当优先线程的缓冲区填满以后才为其他线程预取指令。当有两个优先线程时,需要并发预取两个指令流,这给取指部件和指令cache的设置都增添了复杂度。设计同时多线程处理器时面临的其他主要问题通过研究这些问题还可以了解到7.6.3同时多线程的性能图7.17表示在超标量处理器上增添8个线程的同时多线程能力时获得的性能提高图7.18表示SMT与基本的超标量处理器在主要内部指标利用率和命中率上的对比两个特点