行业资讯

英特尔第五代至强处理器详解

1 英特尔第五代至强可扩展处理器详解,生成式 AI 算力新台阶
  如今 AI 的生意越做越大,从出圈爆火,到千行百业都开始拥抱 AI,越来越多的企业,都会将 AI 导入到他们的生意模式当中。预计到 2026 年有超过 3000 亿美金将投入到生成式 AI 当中,这其中包括硬件、软件、解决方案等。50% 以上的边缘应用也会采用 AI 技术。到 2028 年有 80% 以上的 PC 都会转换成 AI PC,通过 AI 可以提升大家在 PC 上的生产力。还有 80% 以上的公司,也会在 2026 年之前会导入某种程度的生成式 AI 以提高企业生产力。各行各业都在积极的拥抱 AI,这离不开强大的算力支持,英特尔在去年 AI 风头正劲的时候推出了第五代英特尔至强可扩展处理器,为云端 AI 能力带来了全新的体验。

2 第五代至强最多可达64 核,双路可达128核
  第五代至强最多拥有 64 核心,并引入了诸多 AI 特性,如 AMX、AVX-512 指令集等,并通过性能的提升,对生成式 AI 应用带来更快的体验。第五代至强可扩展处理器内存达 5600MT/s,三级缓存进一步提升,加速处理器的数据交换。在软件生态上英特尔也进行了很大投入,目前,英特尔上传了 300 个以上的深度学习模型到社区,也支持了 50 个以上的基于机器学习的、且基于第五代至强优化过的模型,这些开发者都可以调用。针对开发者,英特尔同步更新了其 AI 开发软件,可以在第五代至强上的应用做到较大优化,针对主流大模型、生成式 AI 模型的框架,如 PyTorch 和 TensorFlow,可以无缝拓展至英特尔至强可扩展处理器上。

3 性能提升最高可达 40%
  针对第五代至强可扩展处理器的诸多变化,英特尔市场营销集团副总裁、中国区数据中心销售总经理兼中国区运营商销售总经理庄秉翰表示,“基于硬件和软件的优化,第五代至强和第四代至强相比,在 AI 训练、实时推理、批量推理上,基于不同的算法,都可以看到不同性能的提升,最高可提升 40%。”

4 全新芯片布局
  芯片布局方面,通过把四片芯片改成两片芯片的设计,可以更好的对芯片的面积进行控制。通过 MDF 和 SCF 连接,在第五代至强可进一步实现芯片之间的高效互连。在关键表现上,第五代至强做了如下调整:
  升级到 Raptor Cove 核心。
核心数增加,从最多的 60 核升级到 64 核。
LLC 大小从 1.875MB 增加到 5MB。
DDR 速度从 4800MT/s提升到了 5600MT/s。
UPI 速度从 16GT/s提升到 20GT/s。
SoC 芯片拓扑结构更改,4 芯片封装改为 2 芯片封装。

5 待机功耗降低。
  待机功耗下降是通过英特尔全集成供电模块(FIVR),实现不同场景下节电优化。在性能能效方面,与第四代至强相比,第五代至强有两个数据提升比较明显,一个是常规的整数计算,第五代至强 SPEC integer 和整数相关的一系列的性能评价指标有 21% 的提升。针对 AI 负载,性能提升更多达到 42%。
有时候调整应用程序的架构也可以最大限度地降低功耗。举例来说,如果要训练大模型,假设总共有20个大模型,每个模型的训练周期为3个月,需要1000台机器来训练,每台机器功率为1万瓦。如果规定只需训练其中的5个模型,而剩下的15个模型不需要训练,这样就能节省75%的电能。因此,有时候通过调整应用程序的架构,可以更有效地降低功耗。

6 缓存&内存性能提升
  在三级缓存上,第五代至强每个模块的三级缓存容量达到了 5MB,所以这款芯片有高达 320MB 缓存,如果数据集不是很大,大部分的数据都可以放在 LLC 缓存当中,大量减少对内存的访问。而在数据停留在缓存里面和到内存去访问,能带来的性能收益是比较大的。第五代至强在设计上做到同频同延迟下密度提升 30%。
  内存方面,第五代至强 DDR 速度从 4800MT/s提升到 5600MT/s,英特尔做了很多优化,包括一些 MIM 的内存、基板上走线的提升以及片上的低噪声的供电措施等,还通过 DFE 功能尽可能的减少码间干扰(ISI)。

7 软件解决方案发展迅速,充分利用第五代至强性能
  面对数字化新的需求,英特尔通过新的计算范式支持新的数字化需求。云计算是 AI 时代离不开的话题,AI 时代下,存在三个瓶颈,一是算力,二是数据,三是工程化能力。第五代至强可扩展处理器在 AI 推理训练上最高提升了 14 倍,基础架构的存储能够达到 2.8 倍,网络边缘可以达到 3.2 倍,高性能计算能达到 3 倍,数据分析可以达到 3.7 倍,这些综合起来可以获得了多维度的提升,L3 缓存增加,受益最大的是数据库,AI 和大数据分析也会从 L3 的提升中受益。在 AI 当中,通过英特尔 AMX 加速器专门针对矩阵运算,性能便会大幅提升。
第五代至强可扩展处理器将持续保持至强平台性能的领先地位,与第四代至强可扩展处理器相比,其 AI 推理的高性能提升高达 42%,通用计算性能增益 21%。

8 西安扬芯产品线保持更新,助力科研计算事业
西安扬芯常年耕耘科研计算事业,是国内实力雄厚的高性能计算的企业,竭力成为您值得信赖的科研工作站,科研服务器供应商合作伙伴。主要从事研究开发科研计算系统,并围绕高端工作站服务器,在科研领域提供软件开发,系统集成与技术服务,市场影响辐射全国,向全国各大高校,科研院所,跨国公司提供量身定制的专业化计算模拟平台的解决方案,公司在业内得到了广泛的认可和良好的赞誉。

你可能也会喜欢...

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注