大模型还能让我们望梅止渴多久？｜智能周报

第一财经杂志

2024-10-13 22:11发布于北京《第一财经》杂志官方账号

撰文 | 新皮层小组

编辑 | 吴洋洋

大模型梦碎的时间点似乎越来越近。过去一周，有关人工智能的消息糟糕多于积极。

周初，诺贝尔物理学奖和化学奖接连砸向时下正热的人工智能领域。这些奖项出人意料且鼓舞人心，意味着人工智能的确已经根本性地改变了我们生活和科学体系的方方面面。然而对于眼下基于大模型展开的众多人工智能生意，这些既有研究的帮助有限。

特斯拉在本周花了大价钱布置和渲染了一片颇具未来感的人机风情社区——在这个社区里，机器人负责取悦人类，它们开车、跳舞、招待顾客甚至陪人聊天，而人类负责吃喝玩乐，酒足饭饱后搭乘特斯拉刚刚发布的Robotaxi（自动驾驶出租车）——Cybercab离开。

一切看起来很美好，未来似乎已经在眼前，然而现场一阵狂欢后，特斯拉的股价却下跌了近10%。冰冷现实提示我们，我们没有准备好的东西还有很多，从技术到监管，以及我们的各种组织形态本身。

自动驾驶还没有真的令人放心，大模型同样如此。坚持了2年后，Character AI彻底放弃了自研大模型。它不会是唯一的一家，虽然没有明确说明，但此前已投入硅谷大厂怀抱的Inflection AI、Adept、Covariant等曾经的独角兽放弃这一昂贵又继续突破无望的工作是迟早的事。本周，有消息传出称国内也有两家此前的独角兽可能放弃自研大模型。这一消息尚未获得证实。

连一向引领行业的OpenAI也日益动荡。首席科学家Ilya Sutskever和首席技术官Mira Murati接连离开公司后，OpenAI联创Durk Kingma和Sora负责人之一Tim Brooks也于本周离职，分别加入对手公司Anthropic和DeepMind。10月1日举办的OpenAI开发者大会上，OpenAI没有任何新产品或新技术推出。Sora迄今没有上线，GPT-5也已很久没人提及。曾有传闻称苹果计划入股OpenAI，但在最新一轮融资中，苹果消失得无影无踪。

以下内容由「新皮层」团队制作，欢迎关注。

Key Points

软件篇

Character AI放弃开发大模型；

MiniMax上线图生视频功能；

Kimi推出探索版，效仿OpenAI o1的分步推理；

纯鸿蒙系统开启公测；

硬件篇

特斯拉计划2026年推出4种自研电池，采用干法工艺；

Waymo同现代汽车合作生产Robotaxi，此前曾与极氪合作；

特斯拉发布首款自动驾驶出租车Cybercab

AMD发布新款人工智能芯片MI325X，与英伟达竞争；

字节发布首款AI硬件——一款可以呼唤大模型的耳机；

钱与人才流动

OpenAI联创Durk Kingma加入Anthropic；

Sora负责人之一Tim Brooks加入DeepMind；

OpenAI任命新的后训练主管，又有一名元老离职。

软件篇

Character AI放弃开发大模型

10月2日，Character.ai新任临时首席执行官Dominic Perella表示，该公司已基本放弃与OpenAI、亚马逊和Google等资金更雄厚的AI公司竞争，建立大型语言模型。相反，成立三年的Character.ai将专注于其更受欢迎的消费业务，即模拟各种人物和名人风格对话的聊天机器人，也包括由用户自己设计的聊天机器人。Perella表示，训练前沿模型的成本非常高，「即使是非常大的启动预算，也很难筹集到资金」。今年8月，Google将Character.ai两位创始人与该公司20%的员工挖走，加入其人工智能部门DeepMind，并支付27亿美元购买该初创公司模型的一次性许可。Perella表示，这笔与Google的交易还为这家初创公司提供了足够运营18个月的资金，并补充说，该公司未来可能会寻求从风险投资中筹集资金，并寻求与其他公司达成类似的许可协议。

MiniMax上线图生视频功能

10月10日，MiniMax视频模型宣布上线图生视频功能，向该视频模型输入一张图片，它可以生成一段长达6秒的视频。今年8月31日，MiniMax发布旗下第一个视频生成模型abab-video-1，支持文生视频。当时，MiniMax创始人闫俊杰在发布会后的采访中称，之后还将陆续推出「图生视频、文+图生成视频、可编辑的可控视频生成」等模型或功能。

Kimi推出探索版，效仿OpenAI o1的分步推理

10月11日，月之暗面发布「Kimi探索版」，通过将复杂问题分解为多步任务、在搜索过程中实现多步搜索，从而提升问题回答质量。月之暗面称，「Kimi探索版」的搜索量是普通版的10倍，1次搜索即可精读超过500个页面。根据月之暗面介绍，「Kimi探索版」与普通版有3个方面的差异。首先，在答题之前，「Kimi探索版」可以预先规划解决问题的整体策略，将复杂问题分解为层次化的子问题、建立任务结构，然后分步执行；其次，「Kimi探索版」可以一次并行搜索几十个不同的关键词，筛选和阅读几百个权威信息源；最后，「Kimi探索版」具备反思能力，可以改善回答质量，例如在反思后主动补充回答更多信息。

纯鸿蒙系统开启公测

10月8日，华为宣布原生鸿蒙操作系统HarmonyOS NEXT正式开启公测，首批公测机型包括华为Mate 60系列、华为Mate X5系列和华为MatePad Pro 13.2英寸系列。华为今年1月推出HarmonyOS NEXT系统的开发者预览版，并表示该系统将只能安装为鸿蒙开发的原生应用，不再兼容安卓应用。今年6月，华为宣布HarmonyOS NEXT首次将AI融入系统，推出Harmony Intelligence（鸿蒙原生智能），依托昇腾的算力和盘古大模型，提供系统级的AI能力。目前，已有超1万个应用和元服务上架HarmonyOS NEXT应用市场，包括美团、小红书、钉钉、微博等。此前在适配鸿蒙系统方面进展缓慢的腾讯系应用也有了新进展，10月12日，鸿蒙版微信加入公测。

硬件篇

特斯拉计划2026年推出4种自研电池，采用干法工艺

10月3日，有报道称，特斯拉内部同时启动了4个新版本的4680电池项目，并计划在2026年推出4款新电池，新电池代号为NC05、NC20、NC30和NC50（NC代表新电池）。其中，NC05为「主力」，将用于自动驾驶出租车Robotaxi和电动卡车Cybertruck等；NC20预计用于SUV和Cybertruck；NC30预计用于Cybertruck以及未来一款全电动轿车；NC50将专注于性能跑车。

Waymo同现代汽车合作生产Robotaxi，此前曾与极氪合作

10月4日，有报道称，Google旗下的自动驾驶子公司Waymo与韩国汽车制造商现代汽车达成了战略合作伙伴关系。现代汽车的IONIQ 5车型将集成Waymo第6代完全自动驾驶技术Waymo Driver，并在美国佐治亚州的现代汽车工厂完成组装。搭载Waymo Driver的IONIQ 5将于明年年底开始初步路测。双方还计划将相关车辆部署在Waymo的无人驾驶出租车服务网络Waymo One上。据称，Waymo将购买并拥有这些车辆。早在2021年年底，吉利旗下的极氪就获得了Waymo第6代自动驾驶汽车的生产定点，车型与极氪MIX（俗称「宝宝巴士」）同源。今年6月，Waymo宣布第6代车型已在美国开启路测。而现代汽车成为Waymo新的合作伙伴，或与美国商务部的新禁令有关。半个月前，美国商务部提议禁止美国道路上的智能网联汽车、自动驾驶汽车使用来自中国的关键软件和硬件。

特斯拉发布首款自动驾驶出租车Cybercab

当地时间10月10日晚间，特斯拉发布旗下首款自动驾驶出租车Cybercab和自动驾驶客货车Robovan。两款产品设计都相当激进，其中Cybercab没有后车窗，车门像蝴蝶翅膀一样向上打开，只有2个座位，采用感应充电。而与传统汽车和其他厂商的Robotaxi最大的不同在于，Cybercab是一款专门为自动驾驶设计的车——负责开车的是AI，车内甚至没有方向盘和踏板。这款车预计售价低于3万美元，预计2026年或2027年量产。

AMD发布新款人工智能芯片MI325X，与英伟达竞争

10月10日，AMD在旧金山举办的一次活动中宣布推出一款新款人工智能芯片Instinct MI325X，对标英伟达的Blackwell系列。此外，AMD还计划将于2025年下半年发布下一代MI350系列芯片，提升内存容量和底层架构，比之前的MI300X和MI250X芯片显著提高性能。AMD声称，MI325X将比英伟达H200 GPU的能力提高1.8倍，在人工智能训练方面能力相近或高出10%。MI325X最早将在今年四季度量产出货，并在明年一季度通过戴尔、Eviden、技嘉、惠普企业、联想等服务器制造商更广泛地提供。

字节发布首款AI硬件——一款可以呼唤大模型的耳机

10月11日，字节跳动在没有召开发布会的前提下直接发售了一款硬件产品——AI智能体耳机Ola Friend。这款产品沿用了开放式耳机的形态，单只重6.6g，续航时间为8小时，搭配充电盒使用可达到28小时。充电15分钟可以播放音乐2小时，充满需要2小时。Ola Friend预售价1199元，与苹果旗下的AirPods系列蓝牙耳机相当。在官方宣传片中，用户佩戴Ola Friend耳机，喊出关键词「豆包豆包」，即可唤醒字节自研的聊天机器人「豆包」，开启语音交互。要调用耳机中的豆包，用户需要先将耳机和手机里的字节豆包App配对，才能使用耳机呼唤豆包。这意味着用户脱离了手机蓝牙允许的10米范围，耳机里的豆包也会掉线。

钱与人才流动

OpenAI联创Durk Kingma加入Anthropic

10月1日，OpenAI联合创始人Durk Kingma在社交媒体X发帖，宣布他将入职人工智能初创公司Anthropic。2015年，Kingma加入OpenAI创始团队担任研究科学家，带领算法团队开发主要用于生成式AI模型的技术和方法。他曾于2018年6月从OpenAI离职，加入DeepMind，领导了关于文本、图像和视频生成模型的多个项目。

Sora负责人之一Tim Brooks加入DeepMind

10月4日，OpenAI的文生视频大模型Sora团队负责人之一Tim Brooks在社交媒体X发帖称，自己已经离开OpenAI，加入Google DeepMind团队。Google DeepMind首席执行官Demis Hassabis发帖欢迎Brooks，期待他「将世界模拟器的长期梦想变成现实」。此前，Google曾用「世界模拟器」一词形容其基础世界模型Genie，此模型能根据单个图像提示，生成交互式、动作可控的环境。

OpenAI任命新的后训练主管，又有一名元老离职

10月10日，有报道称OpenAI任命了Liam Fedus为后训练团队主管。后训练团队的任务是提高模型的稳健性、可靠性和安全性，确保OpenAI的产品在发布之前满足高标准。上一任后训练主管Barret Zoph已于9月底和首席技术官Mira Murati、首席研究官Bob McGrew同时离职。新上任的Liam Fedus曾在Google Brain工作，于2022年9月加入OpenAI，参与过ChatGPT的研发，是9月13日发布的新推理模型OpenAI o1七大负责人之一。差不多同一时间，OpenAI高级研究员Luke Metz在社交媒体宣布离职。他和Barret Zoph、Liam Fedus有着相似的职业背景，同样在Google担任过研究员，也是ChatGPT的幕后元老和o1的贡献者。近日还有消息称，Barret Zoph正在计划成立一家新公司，但尚不清楚Luke Metz和Mira Murati等人是否加入。