Gen AI助力RTE场景创新声网发布RTE+AI能力全景图

中国网科技

2024-10-26 21:13发布于山东中国网科技频道官方账号

　　中国网科技10月26日讯近日由声网和 RTE 开发者社区联合主办的RTE2024第十届实时互联网大会在北京正式开幕。面对AI+RTE新时代，声网创始人兼CEO赵斌在会上正式发布了RTE+AI能力全景图，从五个维度展示当下RTE与AI相结合的技术能力与应用方案。

　　生成式AI正在驱动IT行业发生大变革，赵斌认为，这一趋势主要体现在四个层面：终端、软件、云和人机界面。在终端上，大模型能力将驱动PC和Phone往AI PC和AI Phone的方向进化。在软件上，所有的软件都可以、也将会通过大模型重新实现，并从Software with AI发展至AI Native Software。在云的层面，所有云都需要具备对大模型训练和推理的能力，AI Native Cloud将成为主流。此外，人机界面的主流交互方式也将从键盘、鼠标、触屏变成自然语言对话界面(LUI)。

　　随着生成式AI成为下个时代IT行业进化的主题，RTE也成为了多模态应用和基础设施中一个关键的部分。10月初，声网的兄弟公司Agora作为语音API合作者，出现在了OpenAI 发布的Realtime API公开测试版中。

　　在此次大会中，赵斌表示，声网与MiniMax正在打磨中国第一个Realtime API。赵斌也展示了声网基于MiniMax Realtime API打造的人工智能体。在演示视频中，人与智能体轻松流畅的进行实时语音对话。当人类打断智能体并提出新的疑问时，智能体也能够非常灵敏地快速反应，实现了与人类自然流畅的对话。

　　在生成式 AI 的大潮下，RTE将会提供更为广阔的空间。赵斌也在分享中宣布，声网正式发布了RTE+AI能力全景图。在全景图中，声网从实时AI基础设施、RTE+AI生态能力、声网 AI Agent、实时多模态对话式AI解决方案、RTE+AI应用场景五个维度，清晰呈现了当下 RTE 与AI相结合的技术能力与应用方案。生成式AI与RTE结合带来的场景创新，将成为下一个十年的主题。

　　过去10年，声网不仅见证并推动了RTE从一个理念变成一个行业的过程，更身体力行的打破了国内实时音视频领域的三无状态。赵斌称，10年前行业内没有行业会议、专业书籍、以及专业媒体和社区。如今，RTE大会迈入第10年，声网也于今年8月正式出版行业首本系统介绍实时互动的技术型科普图书《读懂实时互动》，同时，RTE开发者社区也持续繁荣，加速推动。

查看原图 80K

Gen AI助力RTE场景创新 声网发布RTE+AI能力全景图

Gen AI助力RTE场景创新声网发布RTE+AI能力全景图