当大模型竞赛趋于同质化,AI的下一增长点正在悄然转向“Agent智能体”。亚马逊AGI掌门人大卫·阮提出,真正的突破不在于参数更大,而在于AI能否真正“干活”。本篇文章将从技术演进、产业趋势到人才机会,系统拆解Agent范式的核心逻辑,并为普通人提供一套可执行的弯道超车策略。

人工智能的浪潮汹涌澎湃,当我们还在惊叹大模型如GPT-5的强大时,一位站在AI前沿的华人科学家——亚马逊AGI实验室负责人大卫·阮(David Luan),已经为我们揭示了行业发展的下一个巨大篇章:AI Agent。

(图源:The Verge官网)
他大胆预测,传统大模型竞赛已趋于同质化,AI下一增长点可能不是“让大模型越来越大”,而是出现能够真正替人类解决实际问题的Agent。
一、AI奇才大卫·阮的非凡履历
大卫·阮在AI领域堪称传奇。他已经在AI领域有15年的从业经历,同时职业生涯的每一步,都踏在了AI发展的关键节点上。
从2017年到2020年中,大卫·阮在OpenAI担任研究和工程团队的领导者。期间,他带领团队研发了GPT-2、GPT-3,以及革命性的图像生成模型CLIP和DALL-E。这段经历让他深刻体会到AI研究的乐趣与无限可能。
离开OpenAI后,他转投谷歌,主导了当时强大的大型语言模型PaLM的研发工作。然而,大卫·阮并未止步于此。他很快与团队成员共同创立了Adept,这是一家专注于AI Agent的开创性公司。Adept首次提出了“计算机智能体”(the computer-use agent)的概念,并且推出了第一个可投入生产的Agent产品Action Transformer。

(图源:Adept官网)
去年夏天,大卫·阮做出了一个影响深远的决定–他率领Adept的核心技术团队,以一种被业界称为“反向收购式招聘(reverse acquihire)”的方式,加入了亚马逊,成为这家科技巨头的AGI研究实验室的负责人。他透露,做出这一选择是因为他预见了AI竞争的走向,尤其是在Agent领域,亚马逊拥有赢得这场竞赛所需的巨大规模和计算资源。
二、大模型竞赛已达瓶颈?Agent才是下一增长点
当前,AI行业正面临一个关键转折点。大卫·阮直言,现有AI模型,比如GPT-5,进步速度似乎正在放缓,不同前沿模型的能力也趋于同质化。这就像麻省理工学院教授Phillip Isola的“柏拉图式表征假说”所描述的,随着模型在海量数据上训练,它们最终会趋同于表达我们共享的唯一现实。
这里,简单介绍下“柏拉图式表征假说”。柏拉图在《理想国》中提出,一群人自出生起就被铁链绑在洞穴里,只能面对洞穴墙壁,背后有火把和被操控的木偶。他们从未见过外面的世界,只能看到木偶投射在墙上的影子,并坚信这些影子就是 “唯一的现实”。

(图源:维基百科)
AI大模型如同洞穴中的囚徒,从未接触过现实世界,只能通过现实世界的 “影子”,也就是整理好的训练数据,去间接感知现实。比如大模型能描述 “疼痛”,但永远无法体验疼痛;它能写 “爱”,但无法理解爱的情感本质。
在这种背景下,传统的基准测试,如国际数学奥林匹克竞赛等,已经变得不那么重要了。大卫·阮将这比作“数字相机早期的像素大战”,虽然数字很高,但与实际拍照效果的相关性很弱。
大卫·阮强调,“AGI远不止是聊天,也远不止是编程”。他为AGI定义了一个更具体、更具实用意义的目标–一个能够帮助人类在计算机上完成任何想做的事情的模型。这不是为了取代人类,而是要成为每个知识工作者的“通用队友”,极大地提升人类的时间杠杆。
三、告别“聊天机器人”:Agent的真面目
我们现在接触到的许多所谓“Agent”产品,在大卫·阮看来,大多只是“多了些额外步骤的聊天机器人”。它们可能点击一个按钮,或者在浏览器上尝试执行操作,但往往效率低下且不可靠,错误率甚至高达三分之一。
真正的Agent,拥有颠覆性的潜力。他举例说,一个药物发现Agent不应仅仅是整理科研文献,而是要能真正连接湿实验室,使用科学仪器,提出并运行最佳实验,观察结果并进行调整,直到达成目标。这带来的效率提升是现有AI技术无法比拟的。
大卫·阮指出,当前AI大模型的固有局限性在于它们的训练方式。大模型主要通过下一词预测或者行为克隆进行训练,它们只学习“该说什么”,而非“为什么说”或“行动的因果机制”。这导致了幻觉和不确定性,在需要实际决策和执行的任务中是致命的。
为了克服这些局限,亚马逊正在进行一项开创性的研究:大规模自我对弈(large-scale self-play)。自我对弈,也就是强化学习,是DeepMind在2010左右真正推广开来的技术。在围棋领域,DeepMind构建了无数个模拟围棋环境,然后让模型反复与自己对弈。每当它发现一种能比之前版本的自己更胜一筹的策略时,通过强化学习,它就会得到正向奖励,从而在未来更多地采用这种策略。后来,当它与世界冠军对弈时,走出了人类从未见过的棋步,推动了整个围棋领域的发展。
大卫·阮的团队正在创建海量的强化学习“健身房”(RL Gyms)。这些“健身房”并非物理场所,而是各种知识工作环境的模拟器。比如,模拟Salesforce系统(SCRM)、企业资源规划(ERP)、计算机辅助设计(CAD)程序、电子病历系统,甚至是会计软件。在这些虚拟环境中,模型可以提出工作目标、尝试解决问题,并根据行动结果获得奖励和反馈。例如,“我折旧算对了吗?”或者“我成功预订航班了吗?”。通过这种方式,Agent能真正学习到行动的后果,而非仅仅模仿人类行为。大卫·阮坚信,这是实现AGI的关键缺失环节,而亚马逊正在全力以赴地扩展这一训练方法。
四、Agent未来将成为云服务的“原子级模块”
大卫·阮表示,Agent对于亚马逊的战略意义重大。他认为,未来的云服务的构成将发生变化,比如代码由AI编写,智能和决策由AI完成。
在这种新范式下,Agent将成为云服务的“原子级模块”。亚马逊内部丰富的私有数据和多步骤工作流,如One Medical、供应链、AWS等,都为Agent训练提供了宝贵的一手数据,这比来自互联网的数据更有效。
亚马逊AGI实验室与公司其他部门保持相对独立,以便以创业公司般的速度快速推进。他们的工作已经开始在实际产品中落地。例如,他们的Nova Act研究预览版已于今年3月发布,目标是打造“普通但超级可靠”的Agent。Nova Act已在企业级应用中取得了令人瞩目的成就,例如用于医生护士注册、自动化旅行预订等工作流,实现了95%以上的可靠性。这相比其他Agent产品平均60%的可靠性,是一个巨大的飞跃。

(图源:亚马逊AGI实验室官网)
大卫·阮乐观地表示,他们离实现“Agent界的GPT”时刻已经不足一年。他认为,在亚马逊这种特定的强化学习训练方法,将带来Agent发展的巨大加速。
五、AI人才稀缺,但新人可弯道超车
关于AI人才,大卫·阮提供了一些令人惊讶的洞察。他估计,全球能够独立、整体地构思并训练一个前沿模型的人数,可能不到150人。另外约500人则是非常有价值的贡献者,因此,能够触及前沿模型研发核心的人,总数可能不足1000人。
人才市场的需求极其旺盛,顶级人才的薪酬高昂,是完全理性的,因为这样的人才凤毛麟角。
然而,大卫·阮也表示AI的学习曲线极快,新人只要找对方向、与优秀的人合作、努力工作,三到四年内就能进入前沿领域。AI研究的特点是,你只要多问几个问题,就可能触及一个无人能解的问题,然后就能专注于此并成为该领域的专家。
大卫·阮预计,AI领域的人才数量一定会扩张。但他也指出,基础模型训练存在严重的“规模不经济”。与传统软件工程不同,基础模型的每个决策都会相互影响,因为最终只有一个可交付成果——那个“巨大的权重包”。这使得你不需要100个中等水平的人,而只需要10个顶尖人才。因此,尽管能做有意义工作的人会增加,但能在顶尖的、资金最雄厚的项目中,坐到核心位置的人数仍会受到限制。
大卫·阮给有志于AI行业发展的人提供了宝贵建议:
- 选择加入拥有大量计算资源的小型团队。能有机会在特定环境中实践自己的研究想法,这一点非常重要。如果你去一个已经有3000人的地方,你其实不会有这样的机会。那里有太多资历更深的人排在你前面,他们都迫不及待地想尝试自己的特定想法。
- 重视产品、用户界面、模型的协同设计。要去一个真正具备强烈产品意识,并且能预见用户如何将AI产品,深度融入自己生活的地方。
- 寻找下一个“杀手级应用”。虽然现在聊天机器人、编程助手是AI进行PMF的主流产品形态。但是,未来五年将出现6、7种新的、如今不明显但届时将理所当然的产品形态。现在识别并投入其中,将是获得“不对称优势”的最佳方式。
AI的未来充满无限可能,而Agent无疑是通往更智能、更实用世界的关键一步。大卫·阮的洞察,为我们描绘了一幅清晰的行业未来图景,也指明了个人和企业在AI大潮中抓住机遇的方向。
参考:
[1] https://www.theverge.com/decoder-podcast-with-nilay-patel/761830/amazon-david-luan-agi-lab-adept-ai-interview
作者:明思AI