DIGIPUNK
去投稿
发表于:a day ago

蚂蚁数科发布金融推理大模型Agentar-Fin-R1,性能超越同尺寸开源模型

数智朋克
发布者:数智朋克
阅读:1 分钟
我要投稿
核心要点👉
  • 🚀 蚂蚁数科发布金融推理大模型Agentar-Fin-R1,性能超越同尺寸开源模型
  • 💯 构建覆盖银行/证券/保险等全场景的金融任务体系,含6大类66小类场景
  • ⚙️ 提供32B/8B推理版本及14B/72B非推理版本,支持MOE架构加速
  • 🔁 通过RAG技术实现自主进化,动态吸收金融政策与市场信息
  • 🌐 联合多家机构推出Finova评测基准并开源,推动行业标准化

数智朋克讯,在2025世界人工智能大会上,蚂蚁数科揭晓了金融推理大模型Agentar-Fin-R1,该模型基于阿里巴巴通义千问Qwen3架构研发,专为金融AI应用设计,旨在构建可靠、可控且可优化的智能中枢。评测数据显示,Agentar-Fin-R1在FinEval1.0和FinanceIQ等权威基准测试中,性能超越DeepSeek-R1等同尺寸开源通用模型及现有金融大模型,突显其在金融专业性、复杂推理能力及安全合规性上的优势。

数据层面,蚂蚁数科构建了覆盖银行、证券、保险、基金、信托等全场景的金融任务体系,包含6大类66小类细分场景。利用千亿级金融专业语料库,结合可信数据合成技术与专家标注的金融长思维链(CoT)机制,模型处理复杂任务的效率显著提升,确保“出厂即专家”的实战能力。训练过程中,创新的加权算法优化了学习效率,大幅降低二次微调的数据需求与算力消耗,为企业部署提供低成本门槛。

Agentar-Fin-R1提供32B和8B参数推理版本,并基于百灵大模型MOE架构提升推理速度;同时支持14B和72B非推理版本,满足金融机构多样化场景需求。模型具备自主进化能力,通过RAG技术动态吸收金融政策、市场动态等更新信息,配套评测工具持续优化性能。

蚂蚁数科联合中国工商银行、宁波银行、北京前沿金融监管科技研究院及上海人工智能行业协会,推出Finova大模型金融应用评测基准。该基准聚焦智能体能力、复杂推理和安全合规三大维度,已全面开源,推动行业标准化。Finova测试中,Agentar-Fin-R1表现优异,甚至超越更大参数通用模型。

作为蚂蚁集团旗下科技子公司,蚂蚁数科聚焦金融与新能源领域,累计服务全部国有银行、股份制银行及超60%地方性商业银行。其实践案例包括助力上海某银行打造AI手机银行,采用“对话即服务”模式,用户通过自然交互获取金融服务,月活用户同比增长25%。蚂蚁数科CEO赵闻飙强调,通用大模型存在“知识鸿沟”专业金融大模型是深化AI融合的关键路径,将重塑金融机构竞争力。

本文链接: https://www.shuzhipunk.com/articles/qxPZLcuIGUT
转载请注明文章出处

文章所属标签
金融大模型
Agentar-Fin-R1
Finova评测基准
金融AI应用
蚂蚁数科