视频生成将爆发、超级多模态将出现!启明创投发布生成式AI十大展望

图片
视频生成将在三年内爆发、“超级多模态模型”即将出现、合成数据对于AI预训练将越来越重要……在今年的世界人工智能大会上,作为国内AI创投领域的重量级机构,启明创投正式发布了2024生成式AI“十大展望”。
作为中国在AI领域投资最早、布局最丰富的投资机构,启明创投在7月6日主办了2024世界人工智能大会(WAIC)“启明创投·创业与投资论坛——超级模型、超级应用、超级机遇”。在开幕演讲环节,启明创投主管合伙人周志峰发表了题为“技术突破到应用变革 - AI发展的新篇章”的演讲,围绕大语言模型、多模态模型、商业机会等做出2024生成式AI十大展望:
1. 当前生成式AI的两大核心技术GPT和扩散模型将逐步融合,激发全新模型能力;
2. 高质量数据的获取和组织将显著影响新一代模型,合成数据在预训练中的占比将大幅提升;
3. Multi-Agent技术将飞跃,通过优化协作和分工显著提升生成式AI效率和效果;
4. 将出现图像和文本的统一连续表示,并且基于此的图文联合扩散模型将达到GPT-4o级别能力;
5. 图像和视频隐空间表示的压缩率提升五倍以上,从而使生成速度提升五倍以上;
6. 3年内视频生成将全面爆发,结合3D能力,可控的视频生成将对影视、动画、短片的生产模式带来变革;
7. 我们将见证压缩更多模态信息的超级多模态大模型,如文本、图像、语音、音乐、3D、传感器数据(控制信号、眼动信号、手势信息、雷达信号等);
8. 生成式AI打通了人类语言与机器语言的转换通道,命令机器完成复杂任务的成本将显著降低,带来巨大的生产力变革;
9. 端侧推理会有巨大增长,来自三个因素的叠加:推理优化算法+端侧推理芯片+端侧大模型;
10. AI将在多个数字化水平较高的行业中占据主导地位,并将重塑绝大部分企业软件。
据介绍,启明创投从2013年开始系统性布局人工智能领域,从AI 1.0到AI 2.0,经过十余年的深耕与前沿洞察,启明创投在AI领域投资了众多项目,多家上市或成长为独角兽企业。本次论坛,是今年世界人工智能大会唯一一场由创业投资机构发起的、旨在从创新视角展示和探讨生成式AI的分论坛,同时也是启明创投连续第二年主办该论坛。
图片
针对国内外AI产业的发展,周志峰在演讲中给出了许多有意义的洞察。他表示,AI是第三次计算革命,中国是最佳的孵化地。根据相关报告,2022年全球AI专利中,中国占61.6%,领先美国的20.9%;中国培养的世界顶尖AI研究者在2022年占全球47%,较2019年的29%大幅上升。周志峰认为,移动互联网时代,中国企业打造了诸多世界级明星应用和软件,这为中国引领新一波AI原生应用浪潮奠定了坚实基础。对于生成式AI的发展,周志峰认为,目前相关技术仍处于早期阶段,未来要落地仍需解决一些问题。不过,生成式AI的成本在过去一年出现显著下降。以1万个TOKEN的价格为例,1年前是120美元,如今已经降至1元人民币,降幅达到1000倍。
本次论坛还邀请到大语言模型、多模态模型、具身智能、生成式AI应用领域的徐多专家与学者、顶尖投资人和领军创业者。阶跃星辰创始人兼CEO姜大昕,复旦大学浩清特聘教授、上海可续智能研究院院长、无限光年创始人漆远,无问芯穹联合创始人&CEO夏立雪、生数科技联合创始人&CTO鲍凡等,在论坛上就大语言模型、多模态模型、具身智能和生成式AI应用等主题展开了精彩的分享与交流。
  作者:
文:张懿编辑:史博臻责任编辑:唐玮婕
转载此文请注明出处。