华为云发布盘古媒体大模型:视频生成新突破 制作效率更快

快科技6月21日消息,在今日举行的华为开发者大会(HDC 2024)上,华为除了发布纯血鸿蒙HarmonyOS NEXT外,华为云还带来了盘古大模型5.0。
华为云盘古大模型5.0继续深入千行万业,新增盘古媒体大模型、盘古钢铁大模型、盘古高铁大模型、盘古具身智能大模型、盘古工业设计大模型、盘古安全大模型等盘古行业大模型。
据了解,盘古媒体大模型通过在语音生成、视频生成和AI翻译三方面技术创新,重塑了内容生产和应用的新模式。
图片
具体来看,通过盘古,使用者可将实拍视频转换为不同风格的高清动漫。
在现场演示的生成视频中,演员的舞蹈、武打等大运动轨迹能保持一致视觉效果,角色的面貌特征也保持前后一致。
该技术的突破,大大提升视频制作效率,作品一次拍摄多元化制作,实现价值最大化。
在语音生成方面,盘古大模型通过AI原声译制与视频生成能力,实现了将原片译制成不同语言的视频,并保留原始角色的音色、情感和语气。
更重要的是,盘古还能同步生成新的口型,确保不同语言对应的口型一致。
针对AI翻译,华为云盘古大模型对云会议系统进行升级,通过基于大模型的语音复刻、AI文字翻译以及TTS技术,实现语音同声传译。