Intel 12代酷睿大小核架构探秘：小核性能暴涨80％

2021-08-20 15:28:22来源：快科技关键词：Intel CPU处理器阅读量：25655

导读：Intel 12代酷睿将采用全新的大小核混合架构设计，其中大核/性能核基于Golden Cove架构，最多8个，小核/能效核基于Gracemont架构，最多也是8个。

　　Intel Alder Lake 12代酷睿将采用全新的大小核混合架构设计，其中大核/性能核(P-Core)基于Golden Cove架构，最多8个，小核/能效核(E-Core)基于Gracemont架构，最多也是8个。

　　两种架构的核心有何差异？一年一度的架构日活动上，Intel终于揭开了它们的神秘面纱。

　　当然，CPU架构设计是极为高深的，一般人把握不了，也无需研究太多，我们这里大致过一下最关键的一些技术点。

　　Golden Cove是此前10代酷睿Sunny Cove、11代酷睿移动版Willow Cove、11代酷睿桌面版Cypress Cove的进一步升级版，但变化很大，大量基础模块都重构或升级，其设计理念也将影响未来多代产品的演化。

　　负责指令拾取和解码的前端部分，就发生了翻天覆地的变化，号称近十年来的最大变革，堪比当年的Skylake，负责方称它旨在提高速度、突破低时延和单线程应用程序性能的限制。

　　最直接、最明显的就是解码器宽度由4个升级为6个，这可是x86架构的第一次，同时每时钟周期执行uop从6个增至8个，解码长度从16字节翻番至32字节。缓存、队列也都大大强化，缓存可达4K，队列每线程可处理72条目，单线程达144个。

　　编码预取大大增强，分支目标从5K增至12K，4K iTLB、2K/4M iTLB分别翻番至256、32，同时改进了分支预测精度，编码预取机制更加智能。

　　乱序引擎部分，同样更宽、更深、更智能，分配由5路增至6路，执行端口由10个增至12个，调度器尺寸增大，重排序缓冲区(ROB)从352条目增至512条目，两倍多于AMD Zen3，仅次于苹果M1(大约630条目)，重命名和分配阶段也可以执行更多指令。

　　整数执行引擎部分，增加了第五个整数执行端口，所有五个端口都可以执行ALU、LEA，理论上就原生ALU吞吐能力而言是最宽的x86内核。

　　矢量执行引擎部分，增加了新的快速加法器(FADD)，比传统FMA单元效率更高、延迟更低，FMA单元则增加支持FP16浮点数据类型，属于AVX-512指令集的一部分。

　　载入和存储部分，通过载入AGU增加了一个专用的执行端口，这样载入端口从2个增至3个，同时载入缓冲和存储缓冲更深，载入延迟更低，而针对当今负载不断增加的内存级并行需求，数据处理能力也大大增加。

　　二级缓存，桌面和移动端每核心还是1.25MB，服务器端的Sapphire Rapids则增加到2MB，并支持多路径预取、全写入预测带宽优化，可减少内存读取。

　　Intel宣称，Golden Cove架构相比于现在11代酷睿桌面上的Cypress Cove，实现了平均大约19％的IPC(每时钟周期指令数)提升，可以理解为同频性能的提升幅度。

　　它还支持AMX高级矩阵扩展指令，内置下一代AI加速技术，用于学习推理和训练，包括专用硬件和新指令集架构，可明显提高矩阵乘法运算。

　　Gracemont小核心属于Atom凌动家族，是2008年以来的第七代，之前分别是Bonnell、Saltwell、Silvermont、Airmont、Goldmont(包括Plus版本)、Tremont。

　　按照Intel的说法，Gracemont核心很迷你，一个Golden Cove大核心的空间里，可以放入四个Gracemont小核心，以及它们共享的4MB二级缓存。

　　别看是小核心，性能其实一点都不弱。Intel声称，单核单线程对比，Gracemont的同频延迟性能相比六代酷睿Skylake提升超过40％，而同等性能下功耗则可降低40％。

　　四核四线程的Gracemont对比双核四线程的Skylake，峰值吞吐性能可提升80％，而同等性能下功耗可降低80％。

　　Intel表示，这种小核心设计可以在有限的芯片空间内，实现多核任务负载，并具备宽泛的频率范围，降低整体消耗，为更高频率运行提供果功耗和散热空间，满足更多动态任务负载。

　　它还可以利用各种技术进步，在不额外增加功耗的情况下，对工作负载进行优先级排序，并直接提升性能。

　　架构方面，小核心就相对简单不少了，但变化也很大，比如指令缓存增大至64KB，可在不耗费内存子系统功率的情况下保存可用指令，还有Intel的第一个按需指令长度解码器，可生成预解码信息，加速现代工作负载。

　　同时借助更深的分支历史、更大的指令尺寸，分支预测精度大大增加，拥有5000个条目的分支目标缓存区。

　　后端也更宽了，具备5组宽度分配、8组宽度引退、256个乱序窗口入口、17个执行端口，以及4个整数ALU、2个载入AGU、2个存储AGU、2个跳转端口、2个整数存储数据、2个浮点/矢量存储、2个浮点/矢量堆栈、以及第3个矢量ALU。

　　内存部分，使用了双载入、双存储单元的配置，二级缓存增大至4MB，以及深度缓冲、高级预取器，支持Intel Resource Director资源重定向技术，可以让软件在不同核心、不同软件线程之间实现精准的控制。

　　哦对了，Gracemont是第一个支持AVX2指令集的能效核心，还支持整数AI操作新扩展、Intel控制流强制技术、Intel虚拟化重定向保护技术。

　　(原标题：Intel 12代酷睿大小核架构探秘：小核性能暴涨80%)

上一篇：浙大开通全国首个5G校园网：内外网同时访问速率1000M以上

下一篇：霍尼韦尔的BVLOS套件旨在让无人机飞得更远更久

我要评论

昵称

匿名

文明上网，理性发言。（您还可以输入200个字符)

表情

所有评论仅代表网友意见，与本站立场无关。

Intel突传好消息！NVIDIA、博通正试产18A制程芯片
NVIDIA和博通正在对Intel的18A制程技术进行测试，如果一切顺利，IFS（Intel代工服务）有可能获得“数亿美元”的制造合同。
Intel18A制程芯片
2025-03-05 11:27:31
Intel宣布世界最先进光刻机投产！晶圆生产效率/可靠性翻倍
Intel宣布，ASML首批两台高数值孔径（High-NA EUV）极紫光刻机已经在其工厂投入生产。据悉，Intel利用先进光刻机已在一季内生产3万片晶圆，这些晶圆可以产出数千颗计算芯片。
Intel光刻机晶圆生产
2025-02-26 14:35:24
Intel与三星显示签署合作备忘录，共同开发AI设备专用显示器
Intel与三星显示之间的合作关系已有一定历史。近日，Intel与三星显示签署了一份合作备忘录，旨在共同开发针对AI PC等人工智能设备的新型显示器。
Intel三星显示AI设备专用显示器
2025-02-26 09:31:12
Intel有望收获最高50亿美元投资！爱尔兰工厂已卖出110亿美元
据报道，美国资产管理公司Apollo Global Management已经提出，有意向Intel投资几十亿美元，最多可达50亿美元。
Intel爱尔兰工厂
2024-09-25 08:20:26
Intel发布Lunar Lake芯片：集成16/32GB内存
在2024年台北国际电脑展上，英特尔展示了其备受期待的下一代笔记本电脑芯片——Intel Lunar Lake，这款芯片预计将在今年秋季正式上市。
Intel芯片
2024-06-04 16:47:23
烧光232亿拿不出一张给力显卡？Intel回应放弃GPU部门
对于Intel放弃GPU部门的传闻，主管GPU业务的高管Raja Koduri就曾回应了，Intel依然致力于显卡路线图，正在加速Alchemist显卡(目前Arc显卡的架构代号)，并继续改善体验。
显卡图像处理器Intel
2022-09-14 09:51:39

版权与免责声明：

凡本站注明“来源：智能制造网”的所有作品，均为浙江兴旺宝明通网络有限公司-智能制造网合法拥有版权或有权使用的作品，未经本站授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的，应在授权范围内使用，并注明“来源：智能制造网”。违反上述声明者，本站将追究其相关法律责任。

本站转载并注明自其它来源（非智能制造网）的作品，目的在于传递更多信息，并不代表本站赞同其观点或和对其真实性负责，不承担此类作品侵权行为的直接责任及连带责任。如其他媒体、平台或个人从本站转载时，必须保留本站注明的作品第一来源，并自负版权等法律责任。如擅自篡改为“稿件来源：智能制造网”，本站将依法追究责任。

鉴于本站稿件来源广泛、数量较多，如涉及作品内容、版权等问题，请与本站联系并提供相关证明材料：联系电话：0571-89719789；邮箱：1271141964@qq.com。