陶哲轩最新采访：将OpenAI o1 比作“一名平庸但不完全无能的研究生”被误解了

AI寒武纪

2024-10-08 14:17发布于江苏

全文2907字，阅读约需9分钟，帮我划重点

划重点

01加州大学洛杉矶分校的数学教授陶哲轩在接受《大西洋月刊》采访，澄清了对OpenAI o1推理能力的误解。

02陶哲轩将o1比作“一名平庸但不完全无能的研究生”，强调其作为研究助手的潜力。

03他认为，AI与人类在学习和解决问题的模式上完全不同，应被视为一种互补工具。

04通过与聊天机器人对话，研究人员可以更高效地进行数学合作，实现类似于工厂流水线的工业化数学研究。

05然而，陶哲轩表示，他更感兴趣的是尚未存在的数学领域，认为人类和AI的结合将在前沿领域发挥重要作用。

以上内容由腾讯混元大模型生成，仅供参考

加州大学洛杉矶分校的数学教授陶哲轩，人称“数学界的莫扎特”，公认的当代最伟大的数学家，拿奖拿到手软！最近，他接受了《大西洋月刊》Matteo Wong的采访，谈到了他对 AI 的看法，并澄清了前段时间广泛流传的他对OpenAI o1看法一个误解:OpenAI声称o1具备“推理”能力，但陶哲轩曾将其比作“一名平庸但不完全无能的研究生”，事实是o1是一名平庸或无能的研究助手

Terence Tao（陶哲轩），加州大学洛杉矶分校的数学教授，是现实中的超级智能。他常被称为“数学界的莫扎特”，被广泛认为是当今世界上最伟大的数学家之一。他曾荣获多项大奖，包括相当于数学界诺贝尔奖的荣誉，因其在数学方面的突破性贡献而备受推崇。目前，人工智能远远无法与他的水平相提并论

然而，科技公司正在努力让AI达到这一高度。近年来引起广泛关注的AI，如ChatGPT等，最初并非为处理数学推理而设计的。它们主要关注的是语言处理：当你向这样的程序提问时，它并不会真正理解或执行数学方程，也不会形成证明，而是根据词语出现的可能性来给出答案。例如，原版的ChatGPT无法进行加法或乘法运算，但通过见过的代数例子，它可以解决像_x + 2 = 4_这样的方程：“要解_x + 2 = 4_，两边都减去2……”。不过，现在OpenAI推出了一款新系列的“推理模型”，这些模型能够“像人类一样”进行问题解决，并处理复杂的数学和科学任务。如果这些模型取得成功，它们可能会彻底改变像陶哲轩及其同行所从事的缓慢且孤独的研究工作

在看到陶哲轩在网上发布他对o1的评价时——他将其比作“一名平庸但并非完全无能的研究生”——Matteo Wong想进一步了解他对这一技术潜力的看法。在上周的通话中，陶哲轩描述了一种由AI驱动的 “工业规模数学”，这是前所未有的：在不久的将来，AI不会成为独立的创造性合作伙伴，而是作为数学家假设和方法的辅助工具。这种新的数学形式可能会开启未知的知识领域，但核心依然是人类的智慧，它强调人类和机器的不同优势，并将它们视为互补关系，而非竞争关系

以下对话内容经过编辑以适应长度和清晰度

Matteo Wong: 你第一次使用ChatGPT时是什么体验？

Terence Tao: 它刚推出时我就试用了。我向它提出了一些较难的数学问题，但结果有些可笑。虽然它的英语表达很流畅，也使用了正确的术语，但几乎没有深度。对于真正高级的问题，早期的GPT并没有给我留下深刻印象。它们更适合用来做一些有趣的事情，比如用诗歌或童话故事解释数学概念，这点确实令人印象深刻

Wong: OpenAI声称o1具备“推理”能力，但你曾将其比作“一名平庸但不完全无能的研究生”

Tao: 这个比喻被广泛传播，但也被误解了。我并不是说这个工具在所有方面都等同于研究生。我更感兴趣的是将这些工具用作研究助手。研究项目中有许多繁琐的步骤：你可能有一个想法，想要展开计算，但这些计算必须手动完成，且需要逐步推导

Wong: 所以它是一名平庸或无能的研究助手

Tao: 是的，作为助手，它的表现可以说是平庸的。但我确实设想过未来可以通过与聊天机器人对话来进行研究。假设你有一个想法，聊天机器人可以跟随并填写所有细节

在某些领域，这已经开始发生了。AI早已征服了国际象棋，但国际象棋仍然蓬勃发展，因为现在一位技术不错的棋手可以推测某些情况下的最佳走法，然后利用棋局引擎来分析未来20步的局势。我可以预见在数学领域会出现类似的情况：你有一个项目，问“如果我尝试这种方法会怎样？” 而不需要亲自花费数小时验证，你可以指导GPT为你完成

在o1的帮助下，这种操作在某种程度上已经可以实现。我给它出了一个我知道如何解决的问题，并尝试引导模型。起初我给了它提示，但它无视了提示，选择了其他方法，结果失败了。当我指出错误时，它道歉说“好吧，我会按你的方法来做。”然后它合理地按照我的指示执行，但很快又卡住了，我不得不再次纠正它。这个模型从未找到最聪明的步骤。它能做所有例行的工作，但缺乏创造性

研究生和AI的一个关键区别在于研究生会学习。你告诉AI它的方法不对，它会道歉，并可能暂时纠正，但有时它会再次尝试之前的方法。而且如果你重新开启一个AI会话，所有进度都要重来。我对研究生的耐心更大，因为即使他们完全失败，他们仍有学习和自我纠正的潜力

Wong: OpenAI声称它的模型可以识别错误，但你认为这与人类从错误中获得的持续学习不同，而后者正是使错误对人类有用的原因

Tao: 是的，人类会成长。这些模型是静态的——我给GPT-4的反馈可能会成为GPT-5训练数据的0.00001%，但这与学生学习的过程完全不同

AI和人类在学习和解决问题的模式上完全不同——我认为AI应该被视为一种互补工具。对于许多任务，AI与人类协作可能是最有前途的方式

Wong: 你之前还提到，计算机程序可能会改变数学，让人类之间更容易合作。你能解释一下吗？生成式AI能在这方面起到什么作用吗？

Tao: 严格来说，它们不算是AI，但“证明助手”是一类非常有用的计算机工具，可以验证数学论证是否正确。这使得大规模数学合作成为可能，这是最近才出现的现象。

数学本质上是非常脆弱的：如果证明中的某一步出现错误，整个论证可能会

崩溃。如果你有100人合作一个项目，把证明分成100部分，每人负责其中一部分，但如果他们之间没有很好地协调，这些部分可能无法拼接在一起。正因为如此，通常很少有超过五个人合作完成一个数学项目

而有了证明助手，你不需要完全信任与你合作的人，因为程序会给出100%的保证。这样你就可以进行类似于工厂流水线的工业化数学研究，而这种模式目前还不存在。每个人专注于某一类特定结果的证明，就像现代供应链一样

问题在于这些程序非常挑剔。你必须用专门的语言来编写论证，不能直接用英语书写。AI也许能够实现从人类语言到程序语言的翻译，而语言翻译正是大型语言模型擅长的。理想的场景是，你只需与聊天机器人对话解释你的证明，机器人会将其实时转化为证明系统的语言

Wong: 所以聊天机器人并不是知识或想法的来源，而是一个接口工具。

Tao: 没错，它可以成为一个非常有用的“粘合剂”

Wong: 这可能有助于解决哪些类型的问题？

Tao: 传统的数学理念是你选择一个非常难的问题，然后让一两个人花费数年时间在阁楼里埋头研究。你希望用AI解决的数学问题正好相反。最简单的方法就是让AI解决我们数学中最困难的问题。我认为这不会非常成功，因为我们已经有人类在解决这些问题了

我最感兴趣的是那些尚未存在的数学。我刚刚发起的一个项目涉及“普遍代数”，研究某些数学命题或方程是否能够推导出其他命题。过去人们的研究方法是选择一两个方程进行深入研究，类似于手工艺人一次只制作一个玩具，然后再制作下一个。而现在我们有了工厂，可以一次生产成千上万个玩具。在我的项目中，有大约4000个方程，任务是找到它们之间的联系。每个方程相对简单，但存在数百万种可能的推论。就像10个光点，10个方程已经被深入研究过，而其他大部分都仍是未知领域

Wong: 这让我想起谷歌DeepMind公司开发的AlphaFold，这个AI程序能够预测蛋白质的三维结构，而这曾经是需要一个一个蛋白质去研究的

Tao: 对，但这并不意味着蛋白质科学已经过时。你必须改变你研究的问题。150年前，数学家主要通过解决偏微分方程来展现他们的价值。现在有软件可以自动完成这些工作。600年前，数学家们需要计算正弦和余弦表，这些是导航所必需的，但现在计算机几秒钟就能生成这些数据

我对重复人类已经擅长的任务没有兴趣。这似乎效率低下。我认为在前沿领域，我们将始终需要人类和AI的结合。它们各有优势。AI擅长将数十亿个数据点转化为一个好的答案，而人类擅长通过少量观察得出富有创意的猜测

⭐星标AI寒武纪，好内容不错过⭐

用你的赞和在看告诉我～

👇👇

查看原图 48K