Sora根本不懂电影!有影视公司反应这个AI极其原始

今年二月,OpenAI推出了AI生成视频大模型Sora,为该领域引起轰动。尽管尚未公开测试,已有少量视觉艺术者、设计者获得访问权限,并发布了Sora生成的优秀视频短片。其中,来自加拿大的Shy Kids团队凭借对Sora的深入了解,拍摄了1分21秒的短片《气球人》,成功将Sora视为摄像机替代品。
图片
谈到制作过程,他们表述AI直接从文本生成理想大片尚属幻想。实践证实,OpenAI可能误导观众以为所有样本皆由Sora独立完成,而实际情况是,样本背后包含大量人工专业制作,如分镜、剪辑、调色和特效等,目前AI难以胜任。
制作电影仍需大量人工参与
Shy Kids,来自加拿大多伦多的专业影视创作团队,因其独特且创新的媒体表现手法闻名于世,被誉为“朋克摇滚皮克斯”。该团队曾荣获美国电视艺术家协会(Emmy Award)奖项的提名,以及奥斯卡金像奖的入围资格。此外,他们还为迪士尼、Netflix、HBO等知名平台制作过众多优秀作品,在业内享有盛誉。
然而,即使是如此专业的团队,在使用Sora制作视频过程中,也遭遇了一些挑战。他们发现,传统的剧本分镜制作流程在Sora上难以实现。
图片
据本片导演介绍,他们所使用的Sora仍沿用传统的文本输入生成视频模式,并不支持当前广泛应用的多模态输入。这使得他们无法直接向Sora展示分镜图,从而无法生成连贯的视频,只能逐个分镜单独生成视频再进行拼接。
然而,这又带来了新的问题。尽管AI能够根据导演的需求生成相应的素材,但由于其对事物的理解与人类存在差异,因此无法保证每个片段都能准确复现所需元素。
图片
导演举例说明:如果要求Sora在厨房内拍摄一张桌上放着香蕉的长镜头,那么它会基于对“香蕉”这一概念的理解生成视频。虽然经过训练,它可以识别出香蕉的颜色、形状等特征,但由于缺乏实际的香蕉图像或图片库,每次生成的香蕉可能有所不同,这对长视频的拍摄产生了很大困扰。
图片
为了确保视频的连贯性,团队不得不对Sora生成的片段进行裁剪和拼接。同时,由于AI无法稳定生成特定的角色或道具,这也给《气球人》的制作带来了诸多传统影视制作中未曾面临的难题。
AI拍电影竟缺乏“镜头概念”?
这部短片的主角是一个黄色气球头的人物,由于AI无法稳定生成此类角色,故在这部仅有1分21秒的作品中,几乎每一秒都需经大量后期调整才能保证角色的统一。
图片
为了解决此问题,Shy Kids决定采取大胆策略,通过大量生成相关片段,筛选出相对统一且有用的部分,进而组成完整影片。这使得原本计划拍摄的电影转变为类似纪录片的拼接形式。
负责后期制作的帕德里克表示:“短片虽有剧本,但团队需灵活应对”,“我们只是获取了大量镜头,并尝试以有趣的方式将其剪辑给旁白。”他透露,为了完成这部影片,每一秒钟的成片都需要约300倍的素材。
渲染这些原始素材成为影片制作中最为耗时的环节之一,团队表示每次得到的素材长度在3-20秒之间,但渲染时间却长达10-20分钟。即使渲染出最终采用的素材,仍然需要大量的人工后期处理。
图片
Shy Kids提供的信息显示,即使每次都要求生成黄色气球,Sora有时仍会生成红色气球,由于无更合适素材可用,后期团队只能借助PS和AE将其涂成黄色。
当前的人工智能Sora在理解和实现这些概念方面仍存在困难。对此,Shy Kids表示:“关于如何描绘电影场景中的某个镜头,九个人可能会有九种不同的看法。我们在开发这款工具时,并未真正站在电影制作者的立场去思考问题。”尽管Shy Kids团队深知他们所体验到的Sora版本尚处于初级阶段,但他们仍然对混乱无序的摄像机位置和视角感到惊讶。
此外,Shy Kids团队还指出,他们曾尝试在文本中强调固定机位或镜头语言的重要性,但他们并不确定这是否是因为Sora无法理解他们的输入方式,抑或是Sora本身缺乏相关的概念。
图片
Sora作为一款基于深度学习的人工智能平台,能够通过机器学习和自然语言处理等技术,实现高效的视频制作。此次《气球人》的成功,无疑证明了这一点。
然而,在赞赏之余,也有人提出了不同的看法。部分网友认为,虽然Sora的表现令人瞩目,但其背后仍然需要大量的人力支持。这些人力投入了数百小时的工作,却往往被人们忽视。此外,还有人对OpenAI等公司过度强调AI技术的营销方式表示反感。
但索菲亚认为,Sora给电影制作者们开启了全新世界的大门,对电影制作行业造成了深远影响。Sora 是当之无愧的电影制作行业的革新者,它的出现,不仅改变了电影制作的方式,也改变了观众对电影的期待。
个人观点,仅供参考