那种几十上百个核心的处理器如果用“反超线程技术”模拟成16~32个逻辑核心,给PC使用效果怎么样?

发布时间:
2024-12-25 20:22
阅读量:
5

这个技术AMD Intel都在研究,Intel还发了论文,但是,截止到2024年12月,目前没有在CPU上成功运行过,Intel 研发中的Royal Core计划也取消了。

题主的想法,实际上是一种基于超标量 Superscalar 与超长指令字VLIW架构的逆向超线程技术。[1]

Intel公布Anaphase技术提升多核CPU单线程性能

这项技术雏形出现在Intel IA64架构上面,很多先烈(其实就是 AMD 和 Intel 这两位爷)都在尝试过,目前的结果都失败了,[2]

Core Fusion就是这样的一个技术,通过动态将多个核心聚合成一个大核心,可以灵活地获得多线程性能的提升,也能提升单线程性能,然而基于前面所说的缘故,四发射已经能基本充分地发挥ILP,更多的发射数目、更多的执行单元和更大的L1缓存的提升并不是很明显。Intel Barcelona Research Center提出了一种新的技术:Anaphase,这个技术通过将传统的单个线程在细粒度水平上分解成多个猜测线程(SpMT,Speculative multithreading)并分布到多核心处理器的多个核心上并行执行,最终加速了原单线程的性能。[3]

单线程提升41% Intel逆超线程技术解析

左:一个传统的单线程,包含了四个大区块和多个小区块[4]

右:Anaphase将其分成两个猜测线程,每个线程具有若干个大区块和小区块
  Anaphase是一种软硬结合的方案,软件上,编译器负责将程序的单个线程分解为多个猜测线程并进行标注,硬件上,处理器通过标注将对应的猜测线程分布到多个CPU核心上并行执行,并对他们进行跟踪、同步。Anaphase引入了一个ICMC组件,将一系列的处理器核心联合起来,这个称为Tile(原意:砖、瓦)的结构就是猜测多线程运行的基本单元。

答主听说的第一个CPU架构实现是AMD在研发推土机架构的时候尝试的,AMD已经在双核心Socket AM2 处理器当中试图内置这项技术作为回击 Intel 双核 Conroe处理器的杀手锏,即逆超线程技术 (Reverse-HyperThreading)。 所谓逆超线程技术,即让2个Socket AM2处理器核心为1个单线程程序同时进行计算服务。结局我们已经知道了,就是AMD推土机在性能大战中输给了Intel酷睿2处理器,输得一败涂地。这个结局用屁股想都能想的出来,因为AMD没有像Intel ICC那样著名而且成为行业优化标杆的C编译器。AMD的目前自研C编译器是用LLVM魔改的,更接近于公版优化水平,根本无法承担起优化汇编指令序列填充重排队列到满足逆向超线程充分利用多核心的重任。

另一个是Intel在研发Royal Core架构,这一架构是现有Lion Cove的后续产品,也是英特尔近五年来首个不采用“Cove”命名的核心架构。Royal Core预计将首先应用于未来的Nova Lake处理器中。与此同时,Beast Lake处理器也将采用Royal Core的1.1版本,而后续的Beast Lake Next则会使用升级后的Royal Core 2.0版本。

据推测,Royal Core的1.1及更高版本可能会重新引入超线程设计,但该设计将更加精细化。英特尔或将P-Core拆分为两个较小的核心,以实现更高效的多线程处理能力。到了Royal Core 2.0版本时,单个P-Core可能最多支持4个线程,使得性能与并行处理能力进一步提升。

遗憾的是,因为2024年Intel CPU产品线发生了很多翻车意外,经济困难,Intel CEO辛格疯砍研发项目挽救财务状况,Intel目前已经宣布放弃了 Royal Core 这个最有可能将逆向超线程实装的CPU架构的研发。

上面Intel和AMD两家的努力,说明 VLIW 编译器研发出来很难,太鸡儿难了,Intel AMD都没有搞得下去。

题主暂时就别想了,这是世界上最懂CPU的两家公司,没有之一没有之一!先后研发了20年的答案,暂时还是交了两张白卷!

END