DIGIPUNK
去投稿

英伟达 Blackwell 架构 GPU 实现 AI 推理性能突破 单节点运行 6710 亿参数模型

英伟达在 GTC 2025 峰会上展示 Blackwell 架构 GPU,其 DGX 系统单节点运行 6710 亿参数模型实现每秒 253 Token 响应速度,较业界提升超 40%。采用 FP8 混合精度模式使显存占用降至 FP16 的 60%,推动千亿级模型单机部署商业化进程。

2025年03月19日