蚂蚁数科发布金融推理大模型Agentar-Fin-R1，性能超越同尺寸开源模型

核心要点👉

🚀 蚂蚁数科发布金融推理大模型Agentar-Fin-R1，性能超越同尺寸开源模型
💯 构建覆盖银行/证券/保险等全场景的金融任务体系，含6大类66小类场景
⚙️ 提供32B/8B推理版本及14B/72B非推理版本，支持MOE架构加速
🔁 通过RAG技术实现自主进化，动态吸收金融政策与市场信息
🌐 联合多家机构推出Finova评测基准并开源，推动行业标准化

数智朋克讯，在2025世界人工智能大会上，蚂蚁数科揭晓了金融推理大模型Agentar-Fin-R1，该模型基于阿里巴巴通义千问Qwen3架构研发，专为金融AI应用设计，旨在构建可靠、可控且可优化的智能中枢。评测数据显示，Agentar-Fin-R1在FinEval1.0和FinanceIQ等权威基准测试中，性能超越DeepSeek-R1等同尺寸开源通用模型及现有金融大模型，突显其在金融专业性、复杂推理能力及安全合规性上的优势。

数据层面，蚂蚁数科构建了覆盖银行、证券、保险、基金、信托等全场景的金融任务体系，包含6大类66小类细分场景。利用千亿级金融专业语料库，结合可信数据合成技术与专家标注的金融长思维链（CoT）机制，模型处理复杂任务的效率显著提升，确保“出厂即专家”的实战能力。训练过程中，创新的加权算法优化了学习效率，大幅降低二次微调的数据需求与算力消耗，为企业部署提供低成本门槛。

Agentar-Fin-R1提供32B和8B参数推理版本，并基于百灵大模型MOE架构提升推理速度；同时支持14B和72B非推理版本，满足金融机构多样化场景需求。模型具备自主进化能力，通过RAG技术动态吸收金融政策、市场动态等更新信息，配套评测工具持续优化性能。

蚂蚁数科联合中国工商银行、宁波银行、北京前沿金融监管科技研究院及上海人工智能行业协会，推出Finova大模型金融应用评测基准。该基准聚焦智能体能力、复杂推理和安全合规三大维度，已全面开源，推动行业标准化。Finova测试中，Agentar-Fin-R1表现优异，甚至超越更大参数通用模型。

作为蚂蚁集团旗下科技子公司，蚂蚁数科聚焦金融与新能源领域，累计服务全部国有银行、股份制银行及超60%地方性商业银行。其实践案例包括助力上海某银行打造AI手机银行，采用“对话即服务”模式，用户通过自然交互获取金融服务，月活用户同比增长25%。蚂蚁数科CEO赵闻飙强调，通用大模型存在“知识鸿沟”，专业金融大模型是深化AI融合的关键路径，将重塑金融机构竞争力。

蚂蚁数科发布金融推理大模型Agentar-Fin-R1，性能超越同尺寸开源模型

数智资讯订阅