在世界人工智能大会(WAIC)的盛大舞台上,蚂蚁数科迈出了引人注目的一步,推出了专为金融推理设计的国内首个商业化大模型。与此同时,该公司还慷慨地开源了包含1350个金融难题的Finova评测基准以及一个拥有百万级数据的DeepFinance训练集。
这一举措被视为中国产业AI向更高价值领域迈进的重要里程碑,同时也映射出金融智能化之路上的重重挑战与破局之道。
行业现状:金融AI面临“渗透率困境”
尽管全球金融机构对AI的投入持续增加,但AI在核心业务场景中的渗透率依然较低。花旗银行的一项调研揭示,93%的金融机构预计AI将在未来五年内提升利润,预计到2028年,人工智能可为银行业带来1700亿美元的利润增长,增幅达9%。然而,现实情况却远未如此乐观。
蚂蚁数科金融AI产品总经理曹刚在接受访问时坦言,当AI进入业务的核心区域,如营销、风控及客户管理等,其应用渗透率便大幅下降。这背后的根本原因在于金融场景的严苛要求:技术层面,大模型尤其是推理模型的发展尚不成熟,应用效果存在不确定性;业务层面,金融领域业务复杂多变,每个细分场景都有其独特的需求,这对AI的专业知识和数据质量提出了极高的要求。
大模型的训练、部署及推理成本高昂,硬件投入巨大,推理效率相对较低,对底层算力有着极高的要求。这使得许多机构在权衡技术投入与商业价值时显得犹豫不决,进一步阻碍了AI在核心业务中的广泛应用。
蚂蚁策略:深耕金融领域,打造“金融大脑”
面对这些挑战,蚂蚁数科CTO王维提出了专注金融与能源两大高价值领域的发展策略,强调通过垂直深度来构建竞争优势。此次发布的金融大模型专注于满足金融场景的复杂推理需求,如风控和理财建议等,通过两阶段训练显著提升了其专业表现。
蚂蚁数科自建的DeepFinance金融思维链数据集由金融专家标注,覆盖了存款、信贷、投资等14大场景及上百个细分任务。同时,该大模型还集成了“蚁天鉴”安全评测层,确保输出符合金融级的审慎要求,有效抑制幻觉并满足合规标准。
蚂蚁数科的解题思路清晰明了:以推理能力和安全合规为核心,通过垂直训练、高质量数据及工程优化来解决金融场景的“高专业、低容错”问题。通过开源数据集和评测基准,推动行业共建,降低金融AI的落地门槛。蚂蚁数科聚焦于头部银行和保险公司,提供从咨询到产品的全链路服务,旨在成为金融AI落地的基础设施。
王维指出,AI应用正逐步从“通用场景试验”向“核心业务重构”迈进,金融推理模型是智能体的核心组件,缺失这一组件将难以驱动业务重构。
合规与责任:未来竞争的核心
展望未来,王维认为金融智能体的终极形态并非人机协作,而是由AI组织驱动业务。这一论断背后,透露出蚂蚁对金融AI技术拐点的深刻洞察——推理大模型正推动AI从“工具”向“决策者”转变。
曹刚强调,未来的竞争核心在于合规与责任。蚂蚁在Agentar平台内置了“监管围栏”,自动过滤不合规的输出。同时,他也呼吁行业明确AI错误的责任归属问题。
随着金融AI从技术探索期迈入业务重构期,未来三年将围绕推理模型的普及、多智能体协作以及成本民主化三大主线迎来爆发。蚂蚁数科通过“开源数据集+垂直模型”的组合,试图定义行业的新标准。能否攻克“核心业务渗透”与“合规落地”这两大难关,将成为决定胜负的关键。