英伟达、软银深化 AI 合作,后者将接收全球首个正式版 DGX B200 系统

英伟达 AI Summit Japan 2024 正在日本东京举行,在昨日的峰会上,英伟达宣布了与日本科技巨头的多项合作。根据英伟达官方新闻稿,软银将接收全球首个正式版 DGX B200 系统,该系统将成为软银新一代 NVIDIA DGX SuperPOD 方案超级计算机的基础。这台超算还将采用 Quantum-2 InfiniBand 网络,完工后将成为日本有史以来最强大的 AI 超级计算机。该超算将承载软银自身的生成式 AI 开发和 AI 相关业务,并向日本大学、研究机构和企业开放。软银的下代超级计算机也将采用英伟达方案,这台超算将面向“极其计算密集型”的工作负载,初步规划中将基于英伟达的 Grace Blackwell 平台设计,采用 GB200 NVL72 机架系统。在软银的电信业务方面,该企业同英伟达紧密合作开发出了新型无线接入网 AI-RAN,这一网络在满足 5G 工作负载需求的同时可将空闲容量用于 AI 推理工作负载。帕鲁AI获悉,传统电信网络的规模是按照峰值负载设计,这意味着在非峰值时段存在大量空余容量,平均使用率仅有 1/3。而 AI-RAN 则可实现剩余 2/3 容量的货币化。英伟达和软银双方估计,电信运营商在 AI-RAN 上每投资 1 美元可获得约 5 美元的收入。计算入运营成本和资本支出,软银为其基础设施导入 AI-RAN 可获得 219% 的回报率。英伟达 CEO 黄仁勋表示:日本在开拓具有全球影响力的技术创新方面有着悠久的历史。借助软银对英伟达全栈式 AI、Omniverse 和 5G AI-RAN 平台的重大投资,日本正在跃升为 AI 产业革命的全球领导者,推动电信、交通、机器人和医疗保健行业进入新的增长时代,在 AI 时代造福人类。