电话:4008119163
关闭
您当前的位置:首页 > 职场资讯 > 职场攻略

蚂蚁数科发布金融推理大模型Agentar-Fin-R1,多项成果引关注

来源:网络整理 时间:2025-07-29 作者:佚名 浏览量:

智东西

作者 王涵

编辑 漠影

7月28日,智东西报道,上午时分,蚂蚁数科正式对外推出了名为Agentar-Fin-R1的金融推理大模型。该模型是以Qwen3为技术基础研发而成,并在FinEval1.0、FinanceIQ等金融领域的模型评测标准中,表现优于DeepSeek-R1等同等规模的开放源代码通用大模型以及金融专业大模型。

Agentar-Fin-R1设有32B和8B两种参数版本,以及14B和72B参数的非推理大型模型,旨在满足金融机构在不同应用场景中的部署需求。同时,蚂蚁数科还推出了基于百灵大模型的MoE(混合专家)架构模型,旨在实现更快的推理速度。

蚂蚁数科不仅公开了金融应用的大模型评测标准Finova,而且还发布了Agentar-Deepfinance-100K这一金融领域的大规模训练数据集。

一、蚂蚁数科用3个特点登顶权威榜单,超越同类金融大模型

王维,蚂蚁数科的首席技术官,阐述了Agentar-Fin-R1的核心优势,该产品具备“稳定可靠、易于控制、便于优化”的三个显著特性。

首先,王维强调“可靠”的重要性,他认为,行业大模型必须建立一套系统化且专业的金融任务体系。

为此,Agentar-Fin-R1构建了涵盖银行、证券、保险、基金、信托等金融领域的六大类、六十六小类的金融任务体系。基于此体系,蚂蚁数科采用了可靠的数据合成技术和长思维链的精准标注路径,从具体场景数据入手,成功搭建了一个规模达到10万的大规模训练数据集。

Agentar-Fin-R1依托于任务导向的体系及庞大的数据训练集,在激活功能方面与Qwen、DeepSeek等主流的通用大型模型表现相当。而在金融推理方面,该模型在FinEval 1.0、FinancelQ及Finova等金融评估榜单中,其表现已超越了与自身规模相近的DeepSeek-R1等开源通用大型模型,以及金融领域的大型模型。

王维指出,在金融大模型的训练过程中,该模型以金融任务体系为焦点,并融入主动学习的经验。它能自动发现模型的不足之处,进而有目的地生成数据、调整策略,这样既提高了训练的效率,又有效防止了大规模遗忘现象的发生。

金融学分析蚂蚁金服__蚂蚁金融本质

Agentar-Fin-R1凭借不到一半的数据量便实现了更佳的模型性能,在多任务均衡训练过程中,该模型显著减少了微调阶段所需的数据和计算资源,并实现了较高的迁移学习效率。

除此之外,Agentar-Fin-R1将不断进步。蚂蚁数科的首席技术官王维提出,行业内的模型应当构建起高频且灵活的迭代体系,以便模型能够持续识别并解决自身的问题与不足,进而实现迅速的修正。

为此,我们必须付出双管齐下的努力,首先,要密切留意实际数据,以准确判断模型的表现;其次,还需紧密关注金融领域的最新动态,包括市场的调整以及产业机构与产品的演变。

最终,蚂蚁数科将借助训练与评测的协同作用,以及高效生成的训练数据,推动模型不断进化,从而让Agentar-Fin-R1更加符合金融领域的实际需求。

二、全面开源金融基准测试集,联合五大机构发布

除此之外,蚂蚁数科携手中国工商银行、宁波银行、北京前沿金融监管科技研究院以及上海人工智能行业协会等众多机构,共同推出了大模型金融应用评测的基准工具——Finova。

Finova是一个专门用于评估复杂推理以及金融智能体任务的测试集合,它全面覆盖了金融行业在意图识别、工具调用以及结构化表现等方面的各项测评环节。

据悉,蚂蚁数科开创性地建立了包含高难度金融推理问题的数据库,该库基于蚂蚁多年来收集的实战业务数据,经过筛选了5000万个问题及人工审核,并结合了长序列思维链的精准路径,最终构建了一套全方位衡量实际业务能力的评估体系。

除此之外,蚂蚁数科还决定将Agentar-Deepfinance-100K这一大规模金融领域的训练数据集全面向公众开放。

结语:金融与AI深度融合,步入“垂直专用”深水区

赵闻彪,蚂蚁数科的CEO,指出AI智能体产业价值的实现,其核心在于从“水平通用”向“垂直专用”的战略转型。

Agentar-Fin-R1的发布,Finova评测基准的推出,以及Agentar-Deepfinance-100K数据集的公开,这些举措均体现了金融行业在这一领域的转型实践。

人工智能技术的持续进步使得金融机构对大型模型的需求变得更加细致化,它们的应用范围已从最初的客服、办公等基础场景,逐渐拓展至风险控制、财富管理以及信贷审批等关键业务流程中。

然而,在模型实际推广与运用阶段,如何保障模型能在不同金融机构的业务场景中稳定运作,以及如何协调模型性能提升与数据安全防护之间的矛盾,这些挑战仍需AI企业和金融机构携手应对。

客服服务热线
4008119163
24小时服务
微信公众号
手机浏览

Copyright C 2018 All Rights Reserved 版权所有 聚贤人力 皖ICP备20008326号-40

地址:安徽省合肥市高新技术开发区人力资源产业园 EMAIL:qlwl@foxmail.com

Powered by PHPYun.

用微信扫一扫