图灵奖得主查德 · 萨顿称普通生成式 AI 难以完成真正科学发现

哈哈库 百科资讯 1

6 月 2 日消息,科技媒体 The Decoder 昨日(6 月 1 日)发布博文,报道称图灵奖得主理查德 · 萨顿(Richard Sutton)认为普通生成式 AI 缺少自我评估与持续筛选能力,难以完成真正科学发现。

注:萨顿是美国计算机科学家,强化学习领域主要奠基人,现任阿尔伯塔大学计算机科学教授、北京大学图灵导师、前 DeepMind 研究科学家,2025 年 3 月与安德鲁 · 巴托共同获 2024 年图灵奖。

图源:WikiMedia

萨顿指出普通生成式 AI 并不具备真正科学发现所需的关键能力。大语言模型、图像模型和视频模型能从海量样本中学习,并生成相似内容,但好结果通常来自训练材料本身。

当模型输出真正新颖内容时,它往往已经超出原有材料。面对事实问题,这类新颖内容常被称为幻觉。萨顿用研究者笑话概括现状:好的部分不新,新颖的部分不好。

萨顿并未否认生成式 AI 的实用价值。它可用于摘要、研究辅助、助手和娱乐。若目标只是更快、更便宜、更小、更可定制地模仿原对象,生成式 AI 仍能带来明确价值。

萨顿认为,科学发现不能停在模仿。真正发现包含变异、评估、选择性保留 3 步。系统需要提出不同选项,测试它们,再保留有效方法。这也是进化、科学方法、规划、搜索和强化学习中的共同原则。

普通生成式 AI 最缺的是评估。语言和图像模型能生成许多变体,但没有测试环节,就无法筛出更好方案。人类选择图片、棋局胜率、形式化证明、程序测试和模拟奖励,都可成为有效反馈。

萨顿列举 AlphaGo(阿尔法围棋)、AlphaZero、AlphaFold、AlphaProof、Claude Code 和 GT-Sophy 等案例。这些系统都有超出文本或图像生成的评估闭环,因此能追踪更优解,而不只是产出候选答案。

他还批评 AI 行业过度押注更大的语言模型,他更看重能长期与环境互动、从经验中学习、构建世界模型并规划策略的 AI 智能体。