核心要点👉
- 🚀 蚂蚁数科发布金融推理大模型Agentar-Fin-R1,性能超越同尺寸开源模型
- 💯 构建覆盖银行/证券/保险等全场景的金融任务体系,含6大类66小类场景
- ⚙️ 提供32B/8B推理版本及14B/72B非推理版本,支持MOE架构加速
- 🔁 通过RAG技术实现自主进化,动态吸收金融政策与市场信息
- 🌐 联合多家机构推出Finova评测基准并开源,推动行业标准化
数智朋克讯,在2025世界人工智能大会上,蚂蚁数科揭晓了金融推理大模型Agentar-Fin-R1,该模型基于阿里巴巴通义千问Qwen3架构研发,专为金融AI应用设计,旨在构建可靠、可控且可优化的智能中枢。评测数据显示,Agentar-Fin-R1在FinEval1.0和FinanceIQ等权威基准测试中,性能超越DeepSeek-R1等同尺寸开源通用模型及现有金融大模型,突显其在金融专业性、复杂推理能力及安全合规性上的优势。
数据层面,蚂蚁数科构建了覆盖银行、证券、保险、基金、信托等全场景的金融任务体系,包含6大类66小类细分场景。利用千亿级金融专业语料库,结合可信数据合成技术与专家标注的金融长思维链(CoT)机制,模型处理复杂任务的效率显著提升,确保“出厂即专家”的实战能力。训练过程中,创新的加权算法优化了学习效率,大幅降低二次微调的数据需求与算力消耗,为企业部署提供低成本门槛。
Agentar-Fin-R1提供32B和8B参数推理版本,并基于百灵大模型MOE架构提升推理速度;同时支持14B和72B非推理版本,满足金融机构多样化场景需求。模型具备自主进化能力,通过RAG技术动态吸收金融政策、市场动态等更新信息,配套评测工具持续优化性能。
蚂蚁数科联合中国工商银行、宁波银行、北京前沿金融监管科技研究院及上海人工智能行业协会,推出Finova大模型金融应用评测基准。该基准聚焦智能体能力、复杂推理和安全合规三大维度,已全面开源,推动行业标准化。Finova测试中,Agentar-Fin-R1表现优异,甚至超越更大参数通用模型。
作为蚂蚁集团旗下科技子公司,蚂蚁数科聚焦金融与新能源领域,累计服务全部国有银行、股份制银行及超60%地方性商业银行。其实践案例包括助力上海某银行打造AI手机银行,采用“对话即服务”模式,用户通过自然交互获取金融服务,月活用户同比增长25%。蚂蚁数科CEO赵闻飙强调,通用大模型存在“知识鸿沟”,专业金融大模型是深化AI融合的关键路径,将重塑金融机构竞争力。