AI创投周报｜特斯拉发布Cybercab、Robovan无人驾驶车系列，AI寻矿初创KoBold Metals融资近5亿美金

阿尔法公社

2024-10-11 18:14发布于四川

AI创投周报是阿尔法公社推出的聚焦于以生成式AI为代表的人工智能新浪潮的创投资讯周报。阿尔法公社发现和投资非凡创业者（Alpha Founders），相信非凡创业者们在技术、商业和社会方面的巨大推动力，他们指引着创投生态的风向。

本周，我们观察到以下AI领域的新动向和新趋势：

1. 特斯拉发布会：Cybercab无人驾驶出租车，无人驾驶货车Robovan正式亮相，同时展示Opimus机器人，FSD系统最新动态。在特斯拉“We, Robot”发布会上，公司推出了Cybercab无人驾驶出租车和Robovan无人驾驶货车。埃隆·马斯克透露，将运营名为Cybercabs的自动驾驶出租车队，乘客可通过应用叫车，特斯拉车主也能通过应用共享车辆赚钱。还展示了Optimus人形机器人的多种功能，包括跳舞、调酒和猜拳。关于FSD（全自动驾驶）系统，马斯克宣布FSD预计于2025年第一季度在中国和欧洲推出，特斯拉正努力为FSD的推出解决数据安全和行驶安全问题。

2. Meta发布视频生成工具Movie Gen，挑战OpenAI Sora。Meta首次公开自家的用于媒体的突破性生成式AI研究：Movie Gen的视频生成工具，是AI视频生成领域的重大突破。根据 Meta 的描述，Movie Gen 的功能包括：文本生成视频和音频、编辑已有视频、图片生视频。Movie Gen能够根据文本提示生成长达16秒、1080p分辨率、每秒16帧的高清视频，并且支持视频编辑和个性化视频生成。此外，它还能生成与视频同步的背景音乐和音效，大大增强了视频的沉浸感。这一发布可能会给Sora带来压力。

3. KoBold Metals利用AI技术完成4.91亿美元融资，探索矿产新纪元。KoBold Metals，一家专注于利用人工智能技术寻找关键矿产的初创公司，近期宣布完成了4.91亿美元的融资，本轮目标是5.27亿美元。根据 PitchBook，之前的 1.95 亿美元融资轮使公司在融资后估值达到 10 亿美元。这家初创公司据报道希望在当前融资轮中达到 20 亿美元的估值。之前的投资者包括比尔·盖茨、杰夫·贝索斯、马云等。

人工智能产品和技术的新突破

1. 特斯拉发布会：Cybercab无人驾驶出租车，无人驾驶货车Robovan正式亮相，同时展示Opimus机器人，FSD系统最新动态

北京时间10月11日上午，特斯拉召开"We, Robot"发布会，发布会上宣布了Cybercab无人驾驶出租车、无人驾驶货车Robovan，Opimus机器人的推出，以及自动驾驶FSD的最新动态。

无人驾驶出租车被命名为Cybercab。这款汽车没有方向盘和踏板，设计充满未来感，Cybercab的设计包括鸥翼车门，能够提供全新的无人驾驶体验，但只能容纳2名乘客。且这辆车使用感应充电无线充电，完全没有插头。预计将在2026年开始生产，并在2027年大规模生产。

埃隆·马斯克计划运营一个名为Cybercabs的自动驾驶出租车队，乘客可以通过应用程序叫车。特斯拉车主也可以将自己的车辆列为机器人出租车，通过应用程序赚钱。马斯克强调，自动驾驶技术可以提高出行效率并降低成本，未来每英里的出行成本可能降至5至10美分。

此外，特斯拉还推出了Robovan，一种能装载多达20人的无人驾驶大车，外观像流线型的大号商务车，客运车型采用了双排、对坐的布局，配有大尺寸的侧滑门。

在发布会上，特斯拉还展示了Optimus人形机器人，这些机器人在现场跳舞、调酒甚至可以猜拳。马斯克表示，未来通用人形机器人市场需求将超过200亿台，Optimus将走进家庭与工厂，成为人类生活的伴侣，甚至成为意识的载体。

最后，马斯克公布了FSD（全自动驾驶）系统的最新动态：数百万车在接受训练，FSD推出时间线乐观。目前FSD已在美国累计行驶超过16亿英里，马斯克预测需要达到60亿英里的测试里程才能满足全球监管机构的要求。预计在2025年第一季度在中国和欧洲推出，具体推出时间还需监管批准。目前，特斯拉正从数据安全、行驶安全等角度为FSD的推出扫清障碍。

2. Meta发布视频生成工具Movie Gen，挑战OpenAI Sora

Meta首次公开自家的用于媒体的突破性生成式AI研究：Movie Gen的视频生成工具，是AI视频生成领域的重大突破。根据 Meta 的描述，Movie Gen 的功能包括：文本生成视频和音频、编辑已有视频、图片生视频。Movie Gen能够根据文本提示生成长达16秒、1080p分辨率、每秒16帧的高清视频，并且支持视频编辑和个性化视频生成。此外，它还能生成与视频同步的背景音乐和音效，大大增强了视频的沉浸感。

Movie Gen的核心是一个30B参数的Transformer模型，它通过预训练和微调在大量视频和图像数据集上学习，从而理解视觉世界。该模型采用了流匹配训练方法，相较于传统的扩散模型，它在生成效率和视频质量上都有显著提升。此外，Movie Gen还引入了创新的位置编码方法和时间平铺推理方法，以提高视频生成的灵活性和推理速度。

Meta还发布了一个13B参数的音频生成模型Movie Gen Audio，它能够生成长达45秒的高质量音频，包括环境声音、音效和背景音乐，与视频内容完美同步。Meta在92页的技术论文中公开了Movie Gen的架构和训练细节，展示了其在视频生成领域的深入研究和技术实力。尽管产品预计明年才会向公众开放，但这一发布无疑给OpenAI的Sora带来了压力，预示着AI视频生成领域的竞争将更加激烈。

3. AI成就获诺贝尔认可，AI领域的先驱者荣获2024年诺贝尔物理学奖和化学奖

2024年的诺贝尔奖在物理学和化学领域均授予了人工智能（AI）领域的先驱者，AI领域实现2024诺贝尔奖大丰收。

在物理学领域，美国科学家John J. Hopfield和英裔加拿大科学家Geoffrey E. Hinton因在人工神经网络和机器学习方面的奠基性工作而共享奖项。Hopfield网络和Hinton的反向传播算法为深度学习和现代AI的发展奠定了基础。Hinton，作为深度学习三巨头之一，被誉为“AI教父”，此前已荣获图灵奖，本次获奖也让Hinton成为史上第二位同时获得图灵奖和诺贝尔奖的科学家。

在化学领域，2024年诺贝尔化学奖授予戴维·贝克（David Baker），以表彰其在计算蛋白质设计方面的贡献；另一半则共同授予英国伦敦谷歌旗下人工智能公司“深层思维”（DeepMind）的德米斯·哈萨比斯（Demis Hassabis）和约翰·江珀（John M. Jumper），以表彰其在蛋白质结构预测方面的贡献。Baker成功设计了全新的蛋白质种类，而Hassabis和Jumper开发的AlphaFold 2解决了预测蛋白质复杂结构的长期挑战。AlphaFold 2的开发是DeepMind的杰作，DeepMind 是位于英国的人工智能研究实验室，成立于2010年，并在2014年被谷歌（Google）收购，成为 Alphabet 集团的一部分。DeepMind 的目标是通过结合机器学习和系统神经科学来构建强大的通用算法，以解决各种复杂的计算问题。

4. OpenAI近期动态：完成新一轮66亿美元融资，DevDay宣布四项API新功能，推出Canvas交互界面，但据有关报道，OpenAI 可能要到 2029 年才能盈利

上周，OpenAI完成融资，官宣获得Thrive Capital（13亿美元）、微软（7.5亿美元）、英伟达、软银（5亿美元）、老虎全球基金（3.5亿美元）、Altimeter Capital（2.5亿美元）等联合的达66亿美元融资，估值超1500亿美元。缓解了破产危机的同时加速Sora，猎户座等产品研发，新的资金将投入前沿AI研究的领导地位，增加计算能力，并继续构建帮助人们解决难题的创新工具。目前，全球每周有超过2.5亿人使用ChatGPT来提升工作、创造力和学习。在各个行业中，企业正在提高生产力和运营效率，开发者正在通过其平台创建全新的各种生成式AI应用。

2024年10月1日，OpenAI在旧金山召开了第二届开发者大会（DevDay），聚焦于对现有AI工具和API的增量改进。在大会上，OpenAI宣布了四项重要的API新功能：视觉微调（Vision Fine-Tuning）、实时API（Realtime API）、模型蒸馏（Model Distillation）和提示缓存（Prompt Caching）。这些新工具的发布，标志着OpenAI的战略重心转向赋予其开发者生态系统更多能力，而非直接在最终用户应用领域竞争。此外，GPT-4和GPT-4omini等模型的成本大幅下降，约下降98%，处理token的能力也得到了显著增强。

ChatGPT迎来了自发布以来最重大的UI更新，推出了名为Canvas的全新交互界面。Canvas允许用户在独立的窗口中与ChatGPT协同创作，打破了传统聊天框的限制，提供了一种全新的协作方式。Canvas有四个突出的亮点，更好的协作、更灵活的控制、更智能的触发和更丰富的快捷方式。Canvas目前处于早期测试阶段，OpenAI计划快速改进其功能。Canvas将逐步向ChatGPT Plus和团队用户推出，企业和教育用户将在下周获得访问权限，未来计划向所有ChatGPT免费用户开放。

尽管OpenAI不断推出新产品，据 The Information 的报道，其预计到 2029 年才能实现盈利，届时收入将达到 1000 亿美元，而 2026 年的亏损预计将达到 140 亿美元，是今年预期亏损的三倍。OpenAI 表示，尽管上半年的净亏损为 30 亿美元，但由于收入增长速度快于计算成本，其商业模式将会改善，毛利率预计从今年的 41% 提升至明年的 49%，并在 2028 年达到 67%。此外，OpenAI 的新产品的销售额预计在 2025 年底前超过 API 销售额，但 API 销售增长将放缓。OpenAI 正在研发能使用 PC 处理复杂任务的 Agent 产品，并考虑推出更昂贵的技术订阅服务。

5. 最新AI文生图模型Flux1.1发布，照片级真实图像触手可及

Flux1.1模型在Artificial Analysis image arena上以“蓝莓”为代号，超越了所有其他模型，获得了最高的整体Elo评分。这一成就标志着Flux1.1在图像质量、指令响应和多样性上的巨大优势。此外，Flux1.1的速度是前代模型的6倍，而价格却更为亲民，这使得它在性能和成本效益上都具有显著的竞争力。

Flux1.1背后的团队是Stable Diffusion原团队，包括Robin Rombach、Andreas Blattmann、Dominik Lorenz等，他们曾是Stable Diffusion项目的核心成员。在Stability AI的支持下，他们进一步发展了文本到图像生成模型，并在2022年加入了Stability AI。今年，他们成立了新的团队Black Forest Labs（黑森林实验室），并迅速发布了Flux1.1。

Flux1.1的成功不仅体现在技术上，还体现在其商业模式上。Black Forest Labs已完成3100万美元的种子轮融资，由Andreessen Horowitz领投，这为团队的未来发展提供了坚实的资金支持。此外，Flux1.1模型还通过Together.ai、Replicate、fal.ai、Freepik等在线平台提供，并且推出了BFL API，供其他开发者集成到自己的应用程序中。

人工智能初创公司的新融资

1. KoBold Metals利用AI技术完成4.91亿美元融资，探索矿产新纪元

KoBold Metals，一家专注于利用人工智能技术寻找关键矿产的初创公司，近期宣布完成了4.91亿美元的融资，本轮目标是5.27亿美元。根据 PitchBook，之前的 1.95 亿美元融资轮使公司在融资后估值达到 10 亿美元。这家初创公司据报道希望在当前融资轮中达到 20 亿美元的估值。之前的投资者包括比尔·盖茨、杰夫·贝索斯、马云等。

该公司最初专注于矿藏发现，现已向矿藏开发迈进，显示出战略调整和承担更多风险的意愿。KoBold Metals的CEO表示，公司最近发现的铜矿可能是历史上最重大的发现之一，预计年产铜量将达到数十万吨。为实现这一目标，KoBold计划投资约23亿美元用于资源开发。

该公司利用人工智能技术，在海量数据中寻找对能源转型至关重要的矿产，如铜、锂、镍和钴。在传统勘探中，发现矿藏的成功几率极低，大约一千次尝试中才有一次成功。KoBold希望利用AI技术提高这一成功率，减少失败的风险。

目前，KoBold在赞比亚进行的约60个勘探项目显示了其巨大的市场潜力。AI技术的应用使这家新兴公司在矿业领域崭露头角，为这一传统行业带来了新的机遇和挑战。

2. 前Salesforce CEO创立的AI客服Sierra，新一轮估值超40亿美元

Sierra，这家由前Salesforce联合首席执行官布雷特·泰勒共同创立的人工智能初创公司，正在寻求新一轮的数亿美元融资。本轮融资的投资方为Greenoaks Capital，新融资预计将使公司的估值至少达到三倍以上，超过40亿美元。此前在一月份的融资轮中，Sierra的估值为10亿美元。现有投资者包括红杉资本和Benchmark。

Sierra成立于一年多前，专注于销售一种能够自动化执行特定任务（例如客户服务，包括语音电话）的AI“代理”。布雷特·泰勒同时也是OpenAI董事会主席，他与曾负责谷歌增强现实和虚拟现实工作的克莱·巴沃共同创办了Sierra。泰勒表示，他在OpenAI的角色将是临时的，以便他最终能够专注于Sierra。

客户支持已成为对话式人工智能最成功的早期应用案例之一。然而，Sierra面临着激烈的竞争，既来自像Salesforce这样的科技巨头，也来自OpenAI本身，以及像Intercom、Decagon和Maven AGI这样的初创公司。Sierra最近宣布其人工智能代理现在可以通过电话与客户交谈，管理实时对话的来回交流，并提供服务特定上下文，以便能够使用公司的语言。

3. 专注于提供基于AMD硬件的GPU云平台的初创公司TensorWave获4300万美元融资，可能挑战英伟达GPU垄断地位

TensorWave，一家专注于提供基于AMD硬件的GPU云平台的初创公司，宣布已完成4300万美元的融资，由Nexus Venture Partners领投，公司估值达到1亿美元。此轮融资采用了SAFE（未来股权简单协议）形式。TensorWave的平台旨在提供优化的计算能力，专注于AI模型的训练、推理和部署，减少延迟并提供计算资源的灵活性。

TensorWave的使命是帮助企业在无需大量基础设施投资的情况下扩展其AI工作负载，同时减少对Nvidia的依赖。该公司的首席执行官Darrick Horton表示，他们意识到了Nvidia在GPU市场的垄断现象，并希望提供可行的替代方案以恢复市场竞争。TensorWave的总部设在拉斯维加斯，该地区的能源成本和运营费用较低，且团队与当地风险投资社区有着紧密联系。

TensorWave提供按小时租用GPU计算资源的服务，并要求至少六个月的合同期限。Horton指出，AMD MI300X的价格比Nvidia的GPU H100便宜，使得TensorWave能够将节省的成本传递给客户。此外，TensorWave还计划使用其GPU作为大规模债务融资的抵押品。

投资者对TensorWave的增长轨迹表示满意，预计年底经常性收入将增长8倍。TensorWave目前已有300万美元的年经常性收入，预计一旦将其MI300X的容量提高到20000个，年底将达到2500万美元。公司计划在今年年底开始使用AMD可能推出的下一代MI325X GPU，以应对日益增长的市场需求。随着TensorWave的迅速扩张，它有可能打破英伟达在AI算力领域的垄断地位。

4. 前亚马逊高管戴夫·克拉克创立供应链初创公司Auger，获1亿美元A轮融资

前亚马逊全球消费者部门CEO兼Flexport首席执行官戴夫·克拉克（Dave Clark）在贝尔维尤（Bellevue）成立了一家名为Auger的供应链科技初创公司，并从风险投资公司Oak HC/FT获得了1亿美元的A轮融资。Oak HC/FT是总部位于康涅狄格州斯坦福德和旧金山的风险投资公司，虽然以医疗保健和金融科技领域的投资闻名，但也对物流初创公司有所涉足。

Auger公司旨在通过一个基于人工智能的系统整合数据，减少供应链中的低效环节，提供实时洞察和自动化解决方案，以帮助大型企业做出更明智的决策。其核心理念源于克拉克在亚马逊23年的丰富经验，特别是在全球供应链领域。克拉克在亚马逊期间以消除低效、优化流程的声誉著称，推动了包括“最后一英里”包裹配送网络、Prime Air货运机队等重要项目。Auger是克拉克首次从零开始创立的公司，他将融合参与过的各种文化和经验，致力于解决全球供应链中的重大问题。

克拉克选择在西雅图地区启动Auger，主要是因为该地区拥有丰富的供应链专业人才。Auger的目标客户是那些拥有复杂全球供应链的财富100强公司，尤其是涉及制造、分销和零售的大型企业。克拉克认为，供应链技术市场潜力巨大，预计该市场规模将从现在的250亿美元增长到2030年代初期的500亿美元，年增长率接近20%。这次融资将主要用于Auger的初期团队组建和技术平台开发，并考虑收购一些具备创新技术和优秀人才的企业以加速发展。

5. 使用 LLM 构建应用程序的开发平台Braintrust完成3600万美元A轮融资，Andreessen Horowitz领投

使用 LLM 构建应用程序的开发平台Braintrust在A轮融资中成功筹集了3600万美元，该轮融资由知名风险投资公司Andreessen Horowitz领投，公司估值达到1.5亿美元。Braintrust通过迭代的LLM工作流程，适应了非确定性模型和不可预测的自然语言输入，从而简化了构建强大LLM应用的复杂性。用户可以轻松回答关于模型和提示变化的影响的问题，比如“更改提示时哪些示例会退化？”或“尝试这个新模型会怎样？”。

Braintrust的评估由三个组成部分：提示、评分器和示例数据集。提示用于引导LLM并跟踪其性能；评分器使用行业标准的自动评估或自定义代码来打分；数据集则集成了从生产和测试环境中捕获的评分示例，形成“黄金”数据集，这些数据集是集成的、版本化的、可扩展的和安全的。

该平台的特点是为技术和非技术团队成员直观设计，并且代码与用户界面同步。行业领导者已经加入使用Braintrust，他们认为Braintrust填补了评估非确定性AI系统的关键空白，将评估工作流程转变为主流工程过程，并为AI产品带来了端到端的测试，帮助公司产生有意义的质量指标。Braintrust已成为AI项目启动的首选平台，它改变了游戏规则，为寻找和解决问题提供了简便的方法。

6. 企业级全栈式文字生成平台Writer寻求1.5亿至2亿美元融资，估值达19亿美元

Writer，一家专注于企业级AI文字生成的平台，正在寻求1.5亿至2亿美元的融资，估值达到19亿美元，是一年前的两倍多。该公司推出了新的大语言模型，旨在与OpenAI等企业竞争。Writer的模型训练成本相对较低，仅花费约70万美元，而其他竞争对手则需数百万。Writer使用合成数据降低成本，同时保护隐私，这种方法正变得日益流行。

Writer的平台围绕其自研的Palmyra模型构建，提供Knowledge Graph、AI Guardrails和Application Layer等功能，满足企业在营销文案、数据分析和自定义AI应用等方面的需求。Palmyra模型专注于商业数据，不使用有版权问题的内容，保证了输出结果的干净和专业度。Writer承诺数据私密性，提供私有化部署，并针对企业需求进行模型微调。

Writer面临的竞争包括同赛道的创业公司、科技巨头如Google和Microsoft，以及LLM公司。尽管竞争加剧，Writer凭借其企业级安全保障、全栈式内容生成和管理平台，在企业市场中占据优势。公司目前已有250多家企业客户，包括Accenture、Uber、Salesforce等，使用Writer的技术进行支持、IT、运营、销售和市场营销等工作。Writer的增长和市场接受度表明，其在AI文字生成领域具有强大的潜力和市场认可。

本文由阿尔法公社综合自多个信息源，并在ChatGPT的辅助下写作，封面图片由Hidream.ai的Pixeling（千象）生成。

关于阿尔法公社

AI创投周报｜ 特斯拉发布Cybercab、Robovan无人驾驶车系列，AI寻矿初创KoBold Metals融资近5亿美金

AI创投周报｜特斯拉发布Cybercab、Robovan无人驾驶车系列，AI寻矿初创KoBold Metals融资近5亿美金