英伟达在 GTC 2025 峰会上展示 Blackwell 架构 GPU,其 DGX 系统单节点运行 6710 亿参数模型实现每秒 253 Token 响应速度,较业界提升超 40%。采用 FP8 混合精度模式使显存占用降至 FP16 的 60%,推动千亿级模型单机部署商业化进程。