10月11日美国旧金山现场报道:
除了正式发布升级版的Instinct MI325X GPU加速卡,AMD还宣布了全新的下一代Instinct MI350系列的首款产品“Instinct MI355X”,并披露了部分规格、性能数据。
MI355X将在2025年下半年上市,也就是还有差不多一年时间。
MI350系列将首次升级为台积电3nm工艺,首次采用CDNA 4架构,首次引入FP6、FP4浮点数据类型,搭配内存还是HBM3E但是容量高达288GB。
具体功耗没有披露,但是MI325X已经最高达1000W,AMD也透露MI355X会顺应行业趋势(NVIDIA B200 1000W、GB200 1700W),因此必然会显著超过1000W。
FP6、FP4都属于浮点数据格式,分别代表6位、4位精度,也就是只需6位、4位就能表达一个数字,相比于FP16、F8精度大大降低,但是数据处理量也大大减少,适合大模型的量化,特别是大语言模型和混合专家模型。
如果你不需要太高的精度,更想要速度,FP6、FP4就非常适合。
MI355X上的FP6、FP4浮点性能都是9.2 PFlops(每秒9200万亿次运算),同时还将FP16、FP8性能都提升了80%,分别达到2.3 PFlops、4.6 PFlops。
NVIDIA Blackwell GPU同样引入了FP6、FP4精度,但是性能更高,分别达20 PFlops、40 PFlops。
单卡多达288GB HBM3E内存确实是无可匹敌,同时带宽高达8TB/s。
对比MI325X分别多出1/8、1/3,而相比目前已上市的MI300X都增加了足足50%。
对比竞品,Blackwell B200也只有192GB HBM3E,但带宽同样做到了8TB/s。
MI355X同样支持单平台八卡,这样就有总计2.3TB HBME内存、64TB/s带宽,性能更是高达FP16 18.5 PFlops、FP8 37 PFlops、FP6/FP4 74 PFlops。
它也将在明年下半年供货。
Instinct系列的性能进步幅度无疑是飞跃性的,一代一个新模样,跨代对比更是惊人。
MI355X对比MI300X,FP16性能达到了7.4倍之多,HBM容量也有1.5倍,所能处理的模型参数规模,也从7140亿增加到4.2万亿,足足6倍之多。
展望未来,2026年将推出再下一代的Instinct MI400系列,基于再下一代的CDNA架构(CDNA 5?),规格和性能必将再次迈上一个大大的台阶。
原标题:288GB海量内存!AMD官宣下代GPU加速卡Instinct MI355X:3nm CNDA4全新架构
版权与免责声明:
凡本站注明“来源:智能制造网”的所有作品,均为浙江兴旺宝明通网络有限公司-智能制造网合法拥有版权或有权使用的作品,未经本站授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:智能制造网”。违反上述声明者,本站将追究其相关法律责任。
本站转载并注明自其它来源(非智能制造网)的作品,目的在于传递更多信息,并不代表本站赞同其观点或和对其真实性负责,不承担此类作品侵权行为的直接责任及连带责任。如其他媒体、平台或个人从本站转载时,必须保留本站注明的作品第一来源,并自负版权等法律责任。如擅自篡改为“稿件来源:智能制造网”,本站将依法追究责任。
鉴于本站稿件来源广泛、数量较多,如涉及作品内容、版权等问题,请与本站联系并提供相关证明材料:联系电话:0571-89719789;邮箱:1271141964@qq.com。