Gen AI助力RTE场景创新 声网发布RTE+AI能力全景图

  中国网科技10月26日讯 近日由声网和 RTE 开发者社区联合主办的RTE2024第十届实时互联网大会在北京正式开幕。面对AI+RTE新时代,声网创始人兼CEO赵斌在会上正式发布了RTE+AI能力全景图,从五个维度展示当下RTE与AI相结合的技术能力与应用方案。

图片

  生成式AI正在驱动IT行业发生大变革,赵斌认为,这一趋势主要体现在四个层面:终端、软件、云和人机界面。在终端上,大模型能力将驱动PC和Phone往AI PC和AI Phone的方向进化。在软件上,所有的软件都可以、也将会通过大模型重新实现,并从Software with AI发展至AI Native Software。在云的层面,所有云都需要具备对大模型训练和推理的能力,AI Native Cloud将成为主流。此外,人机界面的主流交互方式也将从键盘、鼠标、触屏变成自然语言对话界面(LUI)。

图片

  随着生成式AI成为下个时代IT行业进化的主题,RTE也成为了多模态应用和基础设施中一个关键的部分。10月初,声网的兄弟公司Agora作为语音API合作者,出现在了OpenAI 发布的Realtime API公开测试版中。

  在此次大会中,赵斌表示,声网与MiniMax正在打磨中国第一个Realtime API。赵斌也展示了声网基于MiniMax Realtime API打造的人工智能体。在演示视频中,人与智能体轻松流畅的进行实时语音对话。当人类打断智能体并提出新的疑问时,智能体也能够非常灵敏地快速反应,实现了与人类自然流畅的对话。

  在生成式 AI 的大潮下,RTE将会提供更为广阔的空间。赵斌也在分享中宣布,声网正式发布了RTE+AI能力全景图。在全景图中,声网从实时AI基础设施、RTE+AI生态能力、声网 AI Agent、实时多模态对话式AI解决方案、RTE+AI应用场景五个维度,清晰呈现了当下 RTE 与AI相结合的技术能力与应用方案。生成式AI与RTE结合带来的场景创新,将成为下一个十年的主题。

图片

  过去10年,声网不仅见证并推动了RTE从一个理念变成一个行业的过程,更身体力行的打破了国内实时音视频领域的三无状态。赵斌称,10年前行业内没有行业会议、专业书籍、以及专业媒体和社区。如今,RTE大会迈入第10年,声网也于今年8月正式出版行业首本系统介绍实时互动的技术型科普图书《读懂实时互动》,同时,RTE开发者社区也持续繁荣,加速推动。