“AI教母”李飞飞：我并不认为大模型正在耗尽数据，拒谈新创业项目

腾讯科技

2024-05-10 12:44发布于北京腾讯新闻科技频道官方账号

划重点

1
李飞飞称她并不担心AI末日，反而对过度炒作AI可能导致人类灭绝感到担忧。
2
李飞飞呼吁人们将焦点转为更紧迫的问题，比如AI引发的虚假信息泛滥问题。
3
对于致力于创办空间智能公司的问题，李飞飞拒绝透露相关信息。
4
李飞飞认为科技公司与公共部门在资源方面正逐渐失衡，斯坦福大学NLP实验室只有64个GPU。

腾讯科技讯 5月10日消息，据国外媒体报道，在美国当地时间周四，华裔人工智能科学家、斯坦福大学教授李飞飞现身旧金山科技峰会，与资深科技记者艾米丽·张深入探讨了人工智能的安全与伦理等热点问题。

在对话中，李飞飞表示，公众关注的焦点应转向更为紧迫的问题，如人工智能所引发的虚假信息泛滥。她认为，当前对生成式人工智能技术的普遍“悲观情绪”存在过度渲染之嫌。她直言：“我对于过度炒作人工智能可能导致人类灭绝的风险感到担忧。”

今年早些时候，一份研究报告曾警示，在最坏的情况下，人工智能可能对人类构成“灭绝级威胁”。这不禁让人想起科幻电影《机器人》与《机械姬》的虚构场景。然而，李飞飞对此持审慎态度，她认为这样的未来不太可能成为现实，公众应当更多地关注人工智能带来的直接、实际的影响。

她强调：“那些场景更多属于科幻领域，思考这些并非无益，但相较于这些，我们更应面对的是那些真实存在的社会风险。无论是虚假信息和错误信息对我们民主进程的破坏，还是劳动力市场的转变和隐私保护问题，它们都在影响着真实世界中的人们。”

李飞飞还表达了对人工智能未来的乐观态度，她认为这项技术所拥有的积极影响尚未得到充分的重视。她表示：“人工智能有诸多方式可以让人们的生活和工作变得更好。我深感遗憾，我们并未给予那些真正致力于用创造性方式为世界带来好处的人们足够的发言权。”

作为一位杰出的计算机科学家，李飞飞创建了著名的ImageNet数据库，为现代人工智能的发展奠定了基础，因此被誉为“AI教母”。如今，她不仅担任拜登政府的人工智能政策顾问，还是斯坦福大学以人为中心人工智能研究所的联合主任。据悉，李飞飞目前正致力于创建空间智能初创公司，运用类似人类的视觉数据处理技术为人工智能赋予高级推理能力。然而，在彭博科技峰会上，李飞飞拒绝回答程关于她创业计划的问题。

以下为李飞飞与主持人的对话全文：

问："AI教母"，你如何看待这个赋予你的特别称呼？

李飞飞：我从未自诩为任何事物的教母，但当这个称号赋予我时，我确实对其进行了反思。随后，我意识到，既然男性可以被称为各种领域的教父，那么女性也完全可以被誉为教母。因此，我欣然接受了这个荣誉。

问：作为我们时代最具影响力的计算机科学艺术家之一，你发表了数百篇学术论文，并创建了ImageNet数据库，为现代人工智能的发展奠定了基础。在你创建ImageNet之初，你有预见到它会有如此深远的影响吗？

李飞飞：ImageNet的构思始于2007年，它可能是大数据在人工智能算法中作用的一个关键转折点。从科学的角度出发，我坚信大数据将彻底改变我们研究人工智能的方式。然而，我从未设想过大数据、神经网络和GPU之间的完美融合，这种融合基本上催生了现代人工智能的崛起。至于它所带来的进步速度，更是我未曾预料的。

问：你正与乔·拜登总统（Joe Biden）、山姆·奥特曼（Sam Altman，OpenAI联合创始人兼首席执行官）、桑达尔·皮查伊（Sundar Pichai，谷歌及其母公司Alphabet首席执行官）、萨提亚·纳德拉（Satya Nadella，微软首席执行官）等可能决定这项技术未来的环境中工作。你在国会作证，并成为总统特别顾问团队的一员。对于那些手握大权的人，你最想传达的信息是什么？

李飞飞：事实上，我传递的信息与我在K12夏令营或斯坦福大学活动中所强调的并无二致。我们介绍AI课程时，旨在让大家认识到这项技术的本质，了解它是什么，以及如何在最负责任、最深思熟虑的方式下使用它。我们应该接受它，因为它是一种正在改变我们文明的横向技术，带来了诸多益处，如加速科学发现、帮助我们找到癌症的治疗方法、绘制生物多样性图谱以及发现新材料等。但同时，我们也必须认识到人工智能所有可能的后果和潜在的非预期影响，以及如何负责任地开发和部署这项技术。我认为，在当今的谈话中，无论是在白宫还是在校园里，保持更多的平衡和深思熟虑都是至关重要的。

问：我们身处的这个时代，我不确定这是否会被视为一个危机或转折点，但人工智能模型似乎正在耗尽我们用于训练的数据。因此，一些公司开始转向人工智能生成的数据和合成数据作为训练模型的新途径。你对此有何看法？这个问题有多严重？潜在的风险是什么？我们又该如何应对？

李飞飞：首先，关于“我们的模型正在耗尽数据”这一观点，我认为它过于狭隘了。我明白你指的是那些大语言模型（LLM）正在消耗互联网上的大量数据，特别是来自网站、Reddit、维基百科等公开资源。但即便仅从语言模型的角度来看，我们仍有大量的差异化数据等待挖掘，以构建更为定制化的模型。无论是新闻业、医疗保健，还是其他不同的企业垂直领域，都有丰富的数据尚未被充分利用。事实上，许多行业尚未全面进入数字时代，我们尚未触及的数据领域还很多，如医疗保健、环境、教育等。因此，我并不认为我们正在耗尽数据。

问：对于现在越来越多地使用人工智能生成的数据来训练模型，你认为这是好事还是坏事？这会不会让我们与原始数据来源渐行渐远，甚至可能带来风险？

李飞飞：这个问题其实比我们想象的要复杂得多。生成数据的方法多种多样。例如，在我的斯坦福实验室中，我们进行了大量的机器人研究和机器人学习。在这些领域，数据的重要性不言而喻，因为有时我们难以收集到足够的人类生成数据，如动作等。模拟数据在这种情况下就显得尤为重要。至于是否会使我们走上危险的道路，我认为关键在于我们如何使用这些数据。即使使用人类生成的数据，也存在风险；同样地，模拟数据也存在潜在风险。关键在于我们是否以负责任、深思熟虑的方式去利用这些数据。此外，关于人类数据的整体情况，我们还需要考虑更多因素，如暗网等。因此，问题的核心不在于数据的来源是模拟还是真实，而在于我们如何管理和使用这些数据。

问：你正在涉足炙手可热且竞争激烈的人工智能创业领域，据传你正在筹备一家新公司。能否透露一些相关信息？

李飞飞：很抱歉，不能。

问：最近我们进行了一项关于人工智能时代信任度的民意调查。调查结果显示，没有人完全信任科技公司能够安全、可靠地开发人工智能，绝大多数人对这些公司持怀疑态度。如果你需要给大型人工智能公司排名，你最信任的是哪一家？最不信任的又是哪一家？

李飞飞：我的信任并不是建立在单一的企业或个体之上，而是建立在由我们共同构建的集体系统和机构之上。因此，这可能是一个具有挑战性的问题。我不会点名指出我最信任或最不信任的是哪一家公司。正如美国的开国元勋们一样，他们并没有将信任寄托在一个人身上，而是创建了一个值得我们所有人信赖的系统。

问：在人工智能领域，我们是否也在构建这样的集体系统？

李飞飞：确实，至少我们在斯坦福的人类中心研究所正在为此努力。我认为许多人都在尝试这样的路径。我常常自问，我们还有希望吗？尽管这是一个令人深思的问题，但我要说的是，我的希望并不寄托在我个人的希望上，而是寄托在人的力量上。我不是一个盲目乐观的人，但人是复杂的，我们都有着共同的特质。希望在于人，在于我们共同的意志和责任感。许多事情正在发生，我们都在行动。许多人都在致力于将这项技术打造成一项可以信赖的、能够造福全人类的文明技术。

问：关于人工智能的风险，人们常常提到诸如人类灭绝、恶意利用者以及种族偏见等严重问题。你最担忧的是哪一个？

李飞飞：我更关注的是那些更为紧迫的、灾难性的社会风险。我也担忧关于人类灭绝风险的过度炒作。我认为这些担忧已经失控了，它们更像是科幻小说中的情节，虽然它确实引发了我们的思考。思考这些问题并没有错，但与真正的社会风险相比，如虚假信息和错误信息的传播对我们民主进程的干扰，劳动力市场的变革，以及带有偏见的隐私问题等，这些都是我们当前必须面对的现实风险，因为它们直接影响到人们的日常生活。

问：Meta正在引领开源人工智能运动。在你看来，哪些技术应该开放，哪些技术又应该保持封闭？

李飞飞：这是一个复杂而微妙的问题。我确实坚信开放的生态系统对于我们的民主世界至关重要。我认为，过去几百年或一百年的美好之处就在于创新和创业以及信息的自由交流。因此，我们倡导这种开放的生态系统是非常必要的。

问：在人工智能领域，你认为有哪些重要但未被广泛讨论的话题？我们应该开始关注什么？

李飞飞：这实际上是一个很长的列表。我们应该更多地讨论我们如何真正设想并应用这项技术。我与医生、生物化学家、游客、艺术家和农民等各行各业的人交谈过。我们可以想象到，人工智能有很多潜在的应用方式，它可以极大地改善人们的生活，使工作更加高效。但我认为我们并没有充分讨论这些方面。我们过于关注灾难性的一面，而且只有少数人在讨论这些。然而，媒体却往往放大了这些担忧。我认为我们并没有给予那些真正以最具想象力、最富有创造性的方式尝试利用这项技术为世界带来好处的人足够的声音。

问：在你看来，有没有哪些人或公司让你觉得他们的言论或行为简直是“胡说八道”？

李飞飞：对于“胡说八道”这个描述，我认为它主要指向那些过度强调生存灭绝危机的言论。我尤其担忧美国某些地区，比如加州的某些法案，它们可能出于良好的初衷，但过度强调这一点，限制了模型的发展，甚至可能无意中将开源定为犯罪，并且没有真正考虑如何评估和衡量这些模型的潜在影响，这确实让我感到忧虑。

问：你认为我们是否可能过度监管人工智能领域？

李飞飞：确实，我们可能会以某种方式过度监管，正如过去我们所经历的一些情况那样，这可能会伤害到整个生态系统。然而，在医疗保健、交通和金融等实际应用领域，我们也需要考虑适当的保护措施，确保技术的健康发展。

问：你和拜登总统讨论过人工智能的相关问题吗？因为我知道你有向他汇报的线路。

李飞飞：关于我与拜登总统的谈话内容，我可以与你分享一些。我们确实讨论了对公共部门人工智能进行“登月式”投资。你知道，我们身处硅谷的中心，这里汇聚了所有的资源，包括人才、数据和算力，但这些都主要集中在私营部门。事实上，大型科技产业与美国的公共部门学术界在资源方面正逐渐失衡。例如，斯坦福大学自然语言处理实验室只有64个GPU，这种对比令人震惊。因此，我们讨论了如何为公共部门提供资源，因为公共部门是美国创新的重要引擎，它提供公共产品，产生科学发现，并为公众提供值得信赖、负责任的技术评估和解释。

问：最后一个问题，你一直非常关注人工智能领域中的性别和种族平等问题。你认为这个问题有多严重？如果不加以解决，将会带来什么后果？

李飞飞：你一直在这个问题上发出强烈的声音。事实上，我们在人工智能领域中的女性和少数族裔的声音还不够响亮。尽管我们看到越来越多的女性和不同背景的人进入科技和人工智能领域，但我们也看到，他们的声音往往被忽视或低估。我们需要认识到，这些年轻女性、来自不同背景的科技人员，他们的声音和观点同样重要。如果我们不给予他们足够的关注和机会，我们就是在浪费宝贵的人力资本。这些人是杰出的思想家、创新者、技术专家、教育家、发明家和科学家，他们的声音和想法对人工智能的未来发展至关重要。如果我们不让他们发声，不听取他们的想法，不提升他们的地位，我们就是在浪费我们共同的人力资本。（文/金鹿）