IBM辩论机器人对战人类辩手:17%的人从机器人那边跑票

腾讯科技讯 2月12日,IBM人工智能系统与人类顶级辩手在美国旧金山进行了首次大型公开辩论赛,辩题为“应不应该支持学前教育”,最终17%的人在结束后,认为人类说的有道理,从支持正方转向了支持反方。

IBM的辩论系统名为Project Debater,是首个能与人类进行复杂辩论的人工智能系统。

人类辩手Harish Hatarajan是最优秀的辩手之一,他赢得了最多的辩论赛,包括2012年欧洲辩论赛冠军。此外,这位人类辩手从未与IBM的机器辩手竞争过。

此次辩论在旧金山一个有800人的公共会议中心进行,并在全球直播。

无论是人工智能系统还是其对手,事前对辩论主题没有进行任何准备,因此,谁能够说服您,则完全取决于辩论情况。

辩题:应不应该支持学前教育

正方:应该支持(机器)

反方:不应该支持(人类辩手)

形式:正式辩论前15分钟公布辩题,机器先陈述三分钟,人类陈述三分钟,共计三个回合。

结果:有17%的人在结束后,认为人类说的有道理,从支持正方转向了支持反方。近60%的人认为机器的辩论过程中,让自己收获到了知识。

IBM的AI“机器辩手”

IBM研究院的计算机科学家和辩论专家丹·拉哈夫(Dan Lahav)曾经在1949年的一篇论文中写道,开发能够玩游戏的人工智能系统从一开始就是人工智能领域固有的目标。克劳德·香农(Claude Shannon)描述了如何对计算机进行编程,使其能够以一定的水平下棋。十年后,来自IBM的亚瑟·塞缪尔(Arthur Samuel)开发了第一个下棋程序Checkers。

时间快进到2011年,当IBM的华生计算机在“危险边缘”节目上和人类展开大战时,它充分展示了人工智能的能力。在这个历史性时刻过后的几天,基于一个令人惊讶的简单想法,IBM的专家开始思考另外一个问题——我们能不能开发一个能够进行辩论的人工智能系统?

两千年前,辩论和修辞已经吸引了最伟大的希腊哲学家,而辩论和向他人表达推理能力奠定了人类文明社会的基石。这是人类意义上的一个决定性特征。因此,在这一可能是人类独有的领域开发人工智能系统是一项艰巨的挑战。

针对这一挑战,IBM研究人员开发了“机器辩手”(Project Debater),这是有史以来第一个能够在一场全面的现场辩论中与人类进行有意义沟通的人工智能系统。

在每一次辩论开始时,辩手们都会选择一个有争议的话题,IBM机器辩手从有权威性的报纸和期刊的100亿句子中挑选出最相关、最有说服力的主张和证据,从而创作出一篇连贯的四分钟演讲。

随后,机器辩手倾听对手的四分钟反应,找出关键的主张,并立即产生令人信服的反驳,表现出类似人类的推理。在辩论开始之前或者结束后,观众被要求投票,在辩论结束后,双方都要作简要陈述。

机器辩手代表了一种新的人工智能挑战,因为与下国际象棋或围棋相比,辩论是更开放的活动。

即使在竞争性辩论中,一些规则也源于人类古老的讨论文化,并不像国际象棋有明确定义的动作的规则。这一根本区别具有重要的影响。首先,在复杂的棋盘游戏中,人工智能系统可能会想出任何策略来确保获胜,即使相关的动作不能轻易被人类理解。在辩论中,情况不再是这样了。人工智能系统必须适应人类的理性,并提出人类可以遵循和同情的推理路线。

第二,与以往与游戏相关的挑战形成鲜明对比的是,在辩论中,人工智能系统没有自然的得分功能。个人行动的价值,即论点,往往具有内在的主观性;此外,甚至没有一个商定的客观衡量标准来确定谁是辩论的胜利者。

机器辩手证明,人工智能可以在这一未知领域发挥重要作用,我们相信它将使一种新的决策形式成为可能,它将协同地将人和机器结合起来,让人类在信息更充分的条件下做出决策。

你会如何量化一个观点主张的价值?还是某个支持证据的价值?研究人员面临的挑战之一是在一个没有正确或错误答案的领域工作,而且可用的标记数据很少。

为了开发机器辩手,IBM研究团队必须赋予该系统三项功能,每项功能都是人工智能的新突破:

第一,数据驱动的演讲写作和演讲:机器辩手是第一个能够消化大量语料库的计算机案例,它能够对一个有争议的主题进行简短的描述,写出结构良好的演讲,并以清晰和有目的方式进行演讲,同时在适当的情况下融入幽默。

第二,倾听和理解能力:识别隐藏在长时间连续口语中的关键概念和观点的能力。

第三,模拟人类的辩论逻辑:以独特的知识表示方式模拟人类争议和争议的世界,使人工智能系统能够根据需要提出有原则的论点。

去年6月,IBM公司在一个受控制的环境中演示了机器辩手。两位人类辩手和机器辩手辩论,共有50名观众。这两位人类辩手之前曾经和机器辩手较量过。