从“文科生”到“数字专家”：蚂蚁数科如何以系统工程破解 AI 落地最后一公里？

2026年春，大模型技术爆发已届三载。

回望三年前，行业尚处于对参数规模与对话能力的狂热追求中；而今，在2026年4月10日于北京举行的“金融大模型应用与智能体建设研讨会”上，取代这种狂热的是对“产业落地最后一公里”的冷峻审视。

穿透幻象，AI大模型如何走向产业“深水区”？

“大模型本质是个‘文科生’，读过万卷书，却行不了万里路。”蚂蚁数科金融行业解决方案总经理宁鹏在会上的一番话，精准地戳中了当前金融机构的集体痛点。

站在2026年的时间关口，金融业对AI的期待已不再是写一封精美的（HK3990）邮件或一段流畅的代码，而是如何让AI真正深入信贷风控的复杂决策、理财咨询的严苛合规、以及投研分析的逻辑推演。金融业天然的“严谨性”与大模型的“幻觉性”之间，依然横亘着一道难以逾越的鸿沟。

作为国内最早践行“AI First（FFBC）”战略的领军者，蚂蚁数科在面对这股巨浪时，展现出了一种冷静的工程思维。宁鹏直言，在大模型刚刚席卷产业时，即使是蚂蚁内部也曾有过“恐慌感”。但经过数千个日夜的实战，蚂蚁得出的结论是：穿透产业“最后一公里”的关键，不在于模型本身的完美，而在于构建一套足以驯服“文科生”的系统工程。

本文将深度解构宁鹏在2026研讨会中所分享的硬核逻辑：从“默认不相信大模型”的工程哲学，到重塑专家能力的“四车间”架构，看蚂蚁如何通过系统工程的确定性，消解大模型的随机性，从而真正打通AI进入金融核心地带的最后关隘。

驯服“文科生”：为什么工程架构比模型参数更重要？

在AI圈有一句流传甚广的话：“模型决定了能力的上限，而工程决定了能力的下限。”但在宁鹏看来，对于容错率极低的金融业而言，下限即是生命线。

“我们认为大模型的本质是个‘文科生’，”宁鹏在专访中给出了一个生动的比喻，“它读过万卷书，才华横溢，能言善辩，但它最大的问题是存在‘幻觉’，且逻辑不可解释。而在金融场景，我们要求的不仅是‘行万里路’的实干能力，更是对零幻觉和强逻辑的近乎偏执的追求。”

这种“文科生”属性与金融业务的“严谨性”之间，存在着天然的错位。为此，蚂蚁数科在实践中提出了一个看似“反直觉”的设计哲学：在构建系统时，默认是不相信大模型的。

1. 从“单纯调优”到“工程约束”

在2026年的今天，行业已经达成共识：仅仅依靠不断喂数据、精调（Fine-tuning）参数，无法从根本上消除大模型的随机性。宁鹏指出，金融落地的关隘不在于模型能考多少分，而在于如何把这个“才华横溢但有时不靠谱”的文科生关进专业逻辑的“笼子”里。这个笼子，就是工程架构。

2. 核心范式：系统工程重于模型本身

为什么工程架构在2026年成为了主角？宁鹏梳理了三个核心维度：

l 确定性胜过涌现性：金融业务流需要的是“1+1必须等于2”的确定性，而非大模型偶尔闪现的“灵光一现”。通过工程化的工作流（Workflow），将业务逻辑预先固化，让大模型只在受控的环节发挥其理解和表达能力。

l 从对话框走向工作台：早期的ai应用（886108）多是Chatbot（聊天机器人），用户问，模型答。而蚂蚁数科推行的则是“工作台模式”，将大模型嵌入到复杂的业务流程中，使其成为流程中的一个环节，而非流程的全部。

l 安全围栏的实时监控：在模型输出的前后，设置多层“安全围栏”，通过对抗性检测和合规性校验，确保输出的内容不越界、不违规。

3. 认知重塑：AI First的本质

宁鹏在演讲中强调，AI First（FFBC）战略的本质并不是简单的“给业务加个AI插件”，而是对组织内部知识、工具和认知的系统性重塑。这意味着，金融机构需要重新审视自己的知识资产，将其从非结构的文档转化为大模型可理解、可调用的“专业技能包”。

“只有当我们不再神话大模型，而是把它当成一个需要被工程约束、被专业打磨的‘数字员工’时，大模型才真正具备了穿透产业最后一公里的可能。”宁鹏如是说。

“四车间”工程范式：把“文科生”关进专业逻辑的笼子

如果说大模型是提供动力的“引擎”，那么在2026年的金融落地实践中，蚂蚁数科构建的“Agentic AI 系统工程”就是整台精密仪器的变速箱和刹车系统。

宁鹏在研讨会上详细展示了这套被称为“四车间”的工程化范式。这不仅是一套技术架构，更是蚂蚁解决金融级“零幻觉”和“逻辑可解释性”的核心密钥。

1. 意图车间：听懂“弦外之音”

在金融交互中，用户的话语往往是模糊且感性的。意图车间的作用，是通过大模型强大的语义理解能力，将用户的“自然语言”精准翻译成系统的“业务指令”。

l 不仅是理解，更是对齐：它能识别出用户究竟是想查账单，还是想投诉，亦或是潜在的理财意向，并将其引导至预设的合规路径上。

2. 策划车间：专家大脑的“逻辑复刻”

这是解决“幻觉”的关键。在这一步，蚂蚁并没有让大模型自由发挥，而是采用了“SOP（标准作业程序）化”的逻辑。

l 行万里路的逻辑：策划车间预设了大量的专家知识和业务流程。当意图明确后，它会像资深理财师一样，规划出解决问题的最佳路径。它决定了AI应该调用哪个数据库，遵循哪条合规准则，确保每一步思考都有据可依。

3. 执行车间：从“说客”到“实干家”

这是穿透最后一公里的“手脚”。执行车间负责调用底层的专业工具和插件。

l 严谨性保障：涉及资金计算、数据提取等硬核操作时，系统会跳过大模型的生成模式，直接调用经过严格测试的传统代码或专业金融模型。大模型在这里的作用是“调度员”，而非“计算器”。

4. 表达车间：安全合规的“最后防线”

当所有结果准备就绪，表达车间会对内容进行最后的润色与校核。

l 安全围栏的实时拦截：宁鹏强调，在最终输出给用户前，必须经过合规性校验。如果大模型的回复中出现了过度承诺、违规推荐或不合规用语，表达车间会立即触发现场拦截并修正。

核心逻辑：用“确定性”消解“随机性”

“这四个车间的前三个，其实都是在固化‘行万里路’的逻辑。”宁鹏在采访中解释道，“我们将大模型的能力拆解开来，只让它在它擅长的领域发力，而在需要严谨性的地方，由工程架构来接管。”

通过这种“四车间”的流水线作业，蚂蚁数科成功将大模型的角色从一个“自由创作的文科生”，改造为一个“接受专业指令的数字专家”。这种架构上的重塑，让金融机构敢于把核心业务交到AI手中，真正实现了从“PPT里的愿景”到“工作台上的工具”的跨越。

复刻 Top Sales：Agent 如何重塑金融“超级个体”？

在 2026 年的金融职场，一个新入职半年的理财师，如何能像拥有十年经验的资深专家一样，为高端客户提供精准的资产配置建议？

答案就在宁鹏提到的“2P（Professional（IPDN））业务助理”模式中。

1. 85% 的“大脑复刻”

宁鹏在采访中分享了一个核心指标：通过 Agentic AI 系统工程，蚂蚁已经能够实现对 Top Sales（顶尖销售/顾问）大脑能力的 85% 复刻。

“我们并不是在造一个机器人取代人，而是在为每一个理财师配备一个‘数字分身’。”宁鹏解释道。这个助手不仅读过万卷书（大模型底座），更掌握了行万里路的逻辑（四车间架构下的专家经验）。它能实时辅助理财师洞察市场波动，自动生成个性化的客户陪访建议，并确保所有的沟通都符合监管红线。

2. 从 2C 到 2P 的全域重塑

在 2026 年的实践中，这种能力正在全面重塑金融业务的每一个端点：

l 2C 端（触达）： AI 金融管家为用户提供管家式服务。它不再是冰冷的搜索框，而是能记忆用户偏好、实现“千人千面”配置的数字伙伴。

l 2P 端（赋能）：重点在于扩大服务半径。过去，一名优秀的理财师由于精力有限，只能深度服务几十个高净值客户；而今，在 AI 助手的协同下，人均产能和运营效率得到了指数级提升。

l 2B 端（效率）：在对公业务和信贷风控领域，AI 正在从繁杂的文档审核、资质核查中解放人力。

3. AI First 带来的职业进化

宁鹏强调，AI First（FFBC）的本质是对组织内部认知的重塑。在蚂蚁内部，这种变革让员工从重复性的“体力劳动”转向了更具创造性的“策略设计”。

“当大模型可以规模化地复刻专家经验时，金融服务的门槛被拉低了，但专业化的上限被拉高了。”这种“超级个体”的崛起，正是 AI 穿透产业最后一公里的最生动注脚——它让专业的金融服务不再是少数人的特权，而是像扫码支付一样，成为每个人指尖上的便利。

从“能力评估”到“结果交付”：RAS 模式破解 AI 投资回报率难题

在 2026 年的金融大模型招标中，机构最常问的一句话已经从“你的模型多少参数？”变成了“你的 AI 到底能帮我赚多少钱（或省多少钱）？”

面对这个直接且现实的 ROI（投资回报率）拷问，宁鹏提出了蚂蚁数科的评估哲学——RAS 模式。这一模式的出现，标志着 AI 应用从“炫技阶段”正式跨入“实效阶段”。

1. 什么是 RAS？

不同于传统的 IT 系统考核，RAS 模式将 AI 的价值拆解为三个深度耦合的维度：

l R (Results) 业务结果： AI 是否带来了业务结果的提速？例如，信贷审批的通过率是否提升，或者像“蚂小财”一样，是否带来了用户定投次数（+78%）和资产配置合理度（+5%）的真实增长。

l A (Ability) 能力复刻：这是最核心的指标——AI 能否复刻顶尖专家的隐性经验？宁鹏提到的“复刻 Top Sales 85% 的能力”正是 A 维度的具象化。它衡量的是 AI 辅助下，新手与老兵之间能力鸿沟的缩减程度。

l S (Speed/Scale) 效率与规模： AI 是否解决了单靠人力无法覆盖的规模化问题？比如实现 7x24 小时的全天候盯盘，或是在不增加人力的前提下，将理财师的服务半径扩大数倍。

2. 告别“幻觉率”，拥抱“胜率”

宁鹏在专访中提到一个深刻的观察：很多金融机构纠结于大模型回答的准确率，但这往往是技术视角的误区。在RAS 模式下，蚂蚁更看重的是“胜率”——即 AI 给出的建议，在真实业务博弈中是否比传统方案更有效、更精准。

3. 与业务结果深度绑定

“我们正在探索与业务结果深度绑定的合作模式，”宁鹏表示。在 2026 年，单纯卖 API 接口的时代已经过去。RAS 模式的本质是“风险共担、价值共创”：科技公司不再只提供工具，而是提供一种能够直接转变为业务产出的“数字产能”。

通过 RAS 模式，金融机构可以清晰地看到：AI 的投入不再是一笔不知何时回笼的“科研费用”，而是可以直接计入业务利润表的“生产要素”。

结语：让 AI 像扫码支付一样便利

穿透产业“最后一公里”，终点在哪里？

宁鹏在演讲最后给出的答案简洁而有力：让 AI 像扫码支付一样，便利地服务于每个人的生活。

从 2023 年的惊艳亮相，到 2026 年的深水实战，大模型在金融业的足迹证明了：技术的价值不在于它有多“像人”，而在于它能多好地“为人服务”。当“四车间”架构驯服了“文科生”的幻觉，当 RAS 模式量化了 AI 的价值，一个由“超级智能体”支撑的普惠金融时代已然降临。

这不仅仅是一次技术升级，更是一场关于信任、专业与效率的产业重塑。在 2026 年的北京春天，我们看到的不仅是代码的涌现，更是金融服务真正回归“以人为本”的全新起点。

问财摘要