DIGIPUNK
去投稿

深度求新发布 Prover-V2-671B 数学推理大模型,参数规模达 6710 亿

国内研究机构深度求索推出 6710 亿参数数学推理专用大模型 Prover-V2-671B,其基于 DeepseekV3 架构实现 37 亿活跃参数的高效运算。该模型通过多精度计算与 FP8 量化技术,在训练阶段节省 28% 显存并实现推理速度倍增。

2025年05月01日