为何AI艺术总是如此糟糕?

全文4950字,阅读约需15分钟,帮我划重点

划重点

01人工智能在艺术领域的应用引发争议,有人认为它推动了创作民主化,让普通人也能创作作品。

02然而,目前的人工智能艺术作品往往空洞、无趣,距离真正优秀的作品仍有很大差距。

03AI艺术对创意行业工作者造成威胁,因为他们可能会被更先进的AI技术取代。

04专家担忧,未来的人工智能可能无法准确描绘人手,甚至无法理解作品的深层含义。

05面对AI艺术的威胁,创意行业需要适应新时代,寻找新的工作方式和机会。

以上内容由腾讯混元大模型生成,仅供参考

文 | 追问nextquestion
一种说法认为,人工智能是创意平等化的推动者,它打破了艺术创作的技术门槛,让懂科技的人可以创作各种形式的作品。“没有艺术细胞”再也阻止不了人们的创作。
“我们发明这个工具是为了让创作更加民主——让自觉不算艺术家的人也能生成图像。”文本生成图像工具DALLE-E的首席研究员说。而OpenAI创始人Sam Altman在他的书中预言,生成式AI将会取代95%的创意性工作。“全部免费、快捷、近乎完美。别说图像,就是视频甚至活动创意,人工智能也不在话下。”用另一位AI创业者的话说,“当今世界的艺术创作像便秘一样滞涩,而我们要让生产创意性产品像拉彩虹一样喷薄涌现”。
对于真正的艺术从业者,以及重视消费的文字、图像和音乐的人来说,这显然是个打击。每当有颠覆现状的承诺出现时,总伴随着合理的担忧——替代品可能会更糟。这不仅关乎依赖艺术创作谋生的专业人士,也影响到那些热爱阅读精心编写的文字、欣赏深思熟虑的视觉艺术、以及观看电影寻找可能带来的惊喜、激励人心或其他有意义转变(而非只用于娱乐)的人们。再说,那些认为“拉彩虹”是创意巅峰的人的艺术愿景,真的值得被我们严肃看待吗?
取代人工创作的计划有一重阻碍:到目前为止,AI工具都还不太擅长艺术创作。生成式AI基于训练数据的模式识别进行创作,用数据揣摩提示词主人的意图。但如果艺术有深于文字或平面组成的含义,有深于金钱交易的价值,那剥离了原始语境后,空洞的数据填充还有意义吗?
图片
一张DALL-E生成的图像。提示词:“用一张图片告诉我什么是艺术”
在用许多人类的伟大作品训练以后,以ChatGPT为代表的文本生成式AI,以Stable Diffusion、Midjourney、Lensa和DALL-E为代表的图像生成式AI,以Suno为代表的音乐生成式AI以及以Runway和Sora为代表的视频生成式AI可以呈现出以假乱真、貌似人为的艺术创作。然而只要稍微往下深入探究,它们空洞、无趣的本质就会暴露[1]。一位目前在Meta工作的前任记者认为[2],“目前还没有任何AI生成的作品真正经得住我细品……全是些转瞬即逝的噱头。”
如果有一天,未来的人工智能可以创作出让人百读不厌的小说、单曲循环的歌曲、愿意花高价去影院欣赏的电影,会怎么样?或许更关键的问题是,这些科技大亨有没有可能根本搞不懂人类为什么要创作、要欣赏艺术?
廉价的AI艺术
视觉艺术家运用机器学习进行创作已经几十年的历史了,但作品呈现出的一直是艺术家的灵感和思考过程,而不是机器的。概念艺术家Anna Ridler会使用一种叫“生成对抗网络”(GAN)的深度学习架构,完全由她提供的图像进行训练。相反,当前的文字-图像生成器,例如Midjourney和DALL-E,由互联网上数以亿计的图像训练而成。“它们藏在API之后,很难做一些概念上有趣的东西。这就是个黑匣子。”Ridler如此评价这些不利于探索创新的公司闭源产物[3]。
这些生成器做出来的东西稀奇古怪,还总有些不对劲:众所周知,生成式AI对数据的依赖导致其无法准确描绘人手,而据心理学家Gary Marcus所说,AI同样难以实现统计学上过于小概率的提示词,例如“一匹骑着宇航员的马”,目前似乎只有人类有如此想象力(最新的AI模型也难免输出一张宇航员骑马的图片)。“这些图像有一种诡异的病态,这种特质可能会成为21世纪20年代中期,也就是最近几年的年代标记,”Ridler说, “使用这些工具越久,你越会意识到:想通过它们生成有趣的、原创的东西有多难。”
AI真正擅长的,是用铺天盖地的平庸、省时的艺术作品洗刷互联网,打乱创作市场。“当人们看到你市场营销中的AI图片,你知道他们在想什么吗?你没有预算。这就是电子版的背香奈儿包仿品,你的整个品牌定位一下就显得廉价无力。”艺术家Del Walker在X上发表如此言论[4]。
文字生成器也面临同样的问题。去年,科幻文学杂志Clarkesworld创始人Neil Clarke在收到超过一半的ChatGPT生成作品投稿后不再接受投稿。“去年这事刚开始的时候,我告诉大家(AI生成作品)比我们见过最差的人类作家的作品还糟糕,而在一次更新以后,它们跟最差的那一批算是旗鼓相当了。” Clarke说,“作为统计模型,它总是预判下一个最可能接上的词,并不真正理解自己在写什么。而‘理解’算是讲个好故事必须要有的东西吧。”
优秀的叙事作品往往有不止一层含义——仅凭数据,统计模型很可能难以参透文字中的潜台词和寓意。这也解释了为什么AI创作出的故事往往粗浅扁平。Clarke指出,哪怕从语法上无可挑剔,这些文本的可读性也不高。
“现在,你可以要求GPT-4生成类似完整剧本的东西:120页,有前后名称一致的角色和与市面上电影类似的对话,” 身为美国编剧工会委员之一的剧作家John August也分享了他的见解,“它真的合乎情理吗?这我不知道。可能它好过你读过最糟糕的剧本,但这标准太低。我们离(AI)创作出人们真正想看的作品还有很长的路要走。”
实际上,AI已经开始参与影视制作了。例如更改演员的嘴型以匹配外语配音,或是制作背景道具、背景人物[5]。目前比较有争议的是有AI参与制作的纪录片。2021年的作品《流浪者:一部关于安东尼·波登的电影》(Roadrunner:A Film About Anthony Bourdain)用AI制作了安东尼·波登(已故)说台词的片段;2022年《安迪·沃霍尔日记》(The Andy Warhol Diaries)也采用了类似的策略。四月份,存档制作人联盟(the Archival Producers Alliance,暂无官方译名)的领导人共同起草了一份“纪实片人工智能使用途径清单”草案[6],包括允许AI修饰或者修复图片等,同时警告同行必须慎重考虑直接使用生成式AI进行创作。
没有人可以准确预测人工智能发展转折点,但我们知道,目前的科技发展距离所谓“一键生成个人定制创作”还有很远。“试想,用AI生成一部指定演员、情节和地点的电影,完全贴合你的个人喜好。真到了那一天,这种能力会让普通人可以从头制作自己的电影,也会让演员和整个影视相关行业失业。”某个AI行业团体说。
下一代的AI工具完全有可能让这种幻想成为现实。不过这也引出一个问题:与目前消费的艺术相比,“可以私人定制且完成度高的电影”真的是大多数人想要的吗?
人工智能对创意行业的冲击
不管人工智能改变行业听起来有多反乌托邦(例如这项科技被用来制作违背女性意愿的色情图像和视频),我们已经可以看到它造成的影响。与AI一样,依托社交媒体建立的创意行业初心也是艺术民主化:绕开垄断的传统大媒,让个体有能力创作,并给予他们一个展示的平台。
人工智能的加入是一把双刃剑。一方面,AI能让创作者用新工具制作过去负担不起或是还没有能力实现的视效、音效等等;另一方面,AI也带来了全面升级的诈骗手段。
Ryan Broderick常在自己的简报网站Garbage Day上讨论人工智能的文化影响。他将AI和社交媒体进行了比较:“我恐怕我们正在驶入一个‘富人享受真人内容,穷人被迫摄取生成内容’的未来。”他认为这和互联网现状一致,富人可以订阅专业人士撰写的报刊杂志,而工人阶级通过社交媒体获取信息,在各种抓人眼球、耸人听闻的内容中屎里掏金
要知道,社交媒体或许扰乱了原本被资本牢牢把手的市场,让更多人有了展示自己作品的平台,但以此谋生的人并没有因此增多——甚至可以说社交媒体起到了反作用。真正的获利者仍然是平台的拥有者,就像这一波人工智能的发展中获利的是向高管提供取代人力工具的创始人。
图片
Anna Ridler的作品《无数(郁金香)》一件包含上千张郁金香照片的装置作品,Ridler后来又运用这些素材进行了其他项目创作。她介绍说,“将这些素材(可以说是一个数据集)以艺术本身的方式呈现,人们能注意到一件作品制作过程中需要的时间、精力和技巧。同时它也展现出了机器学习过程中常常隐藏在算法之后的人为因素。”
事实上,哪怕AI无法不依赖人类艺术家独立创作高质量作品,它的存在仍然对创意行业工作者造成了威胁。过去几年中,艺术家眼睁睁看着自己的作品被用来训练AI模型,就好像看着自己一点点被取代。
“这让人禁不住怀疑:如果一台电脑就可以模仿我的作品,我还有什么才华可言呢?” 一位使用写作AI工具Sudowrite的小说家这样说道。年轻人也开始重新考虑是否要踏入艺术界。在去年十月的联邦贸易委员会关于生成式AI对创意产业影响的圆桌会议上,插画家Steven Zapata提到:“潜在客户在网上搜索我们的名字时偶然发现可以免费下载的AI仿制品,这对我们个人的职业生涯乃至整个行业的市场影响可能是灾难性的。”
以科幻小说和科技批判闻名的Cory Doctorow认为,人工智能艺术的讨论中最关键的问题是:“我们如何防止本该让艺术家赚取的钱流入码农的口袋?”
如何看待AI对艺术的威胁?
诚然,我们应当严肃看待人工智能对生产力带来的冲击,以及对伦理和环境的影响,但就如Doctorow补充所说,我们也需要停止无限鼓吹AI的能力。“曾经人们鼓吹Facebook的广告好到足以洗脑,结果就是脸书的广告销量暴涨。现在AI行业销售人员也在使用相同的话术,提升产品的销量。”
这也是AI行业销售人士对艺术的看法:在他们眼中,艺术也是用来买卖交易的商品,而不是用来欣赏感受的精神寄托。2010年,Zadie Smith在一篇评论电影《社交网络》(The Social Network,讲述学生时期的扎克伯格创立脸书)的文章[7]中提出“使用脸书的感受就像在扎克伯格的大脑里生活”。她写道,“一切都按照扎克伯格的想法设立:他是红绿色盲,所以软件是蓝色;他认为‘友谊’就是交换个人无关紧要的冷知识,所以你的界面充斥着这类信息。”
图片
由提示词“艺术家使用 AI 制作精美艺术的肖像”生成的 DALL-E 图像。
为什么数百万甚至数以亿计的人要遵从这样的生活方式?我们应该扪心自问,一个大二学生做出来的产品是否是我们交友的最佳方式,就像我们同样该问自己,是否希望AI高管和他们的支持者决定创作的未来。
亿万富翁、风投资本家Marc Andreesen去年发表了愚蠢言论“科技乐观派宣言” [8],抱怨与“象牙塔里的专家”相比,他这样的人多么缺乏文化力量。可以合理推断他口中的意识形态敌人包括伦理学家、学者、工会领袖等——这些人会为了自己和普通百姓的福祉,反对他眼中的“进步”举措:自由市场、零监管制度和罔顾应用前景而对科技发展永无止境的投资。
有趣的是,“科技乐观派宣言”恰恰暴露了Andreesen对艺术的理解堪比初中生对文学的理解深度(参考书目:英雄之旅,乔治·奥威尔,哈利波特)。他列出了几十号“科技乐观派奠基人”,其中绝大多数是经济学者,唯一的艺术家是安迪·沃霍尔。
安迪·沃霍尔(Andy Warhol)是二十世纪重要的美国艺术家,波普艺术的先驱和核心人物。他的作品内容针对消费社会、大众文化和传播媒介,与美国社会的消费主义、商业主义和名人崇拜紧密相连。
就像认为虚拟偶像会取代真人网红的人不了解网红受欢迎的原因一样,认为AI能够“取缔好莱坞”或者音乐、发行行业的人,不懂人们为什么需要艺术。谷歌的新功能“AI概述”对这个问题的解答是:“欣赏艺术会让人分泌多巴胺。”
人们欣赏好的作品,不光是因为化学分泌物。艺术挑战我们的思维,抚慰我们的心灵,激发我们的思考,触动我们的情感,点燃我们的激情,启迪我们的精神,促使我们深思。艺术是一个奇迹,欣赏艺术是在同时感受神迹的降临和人类的存在本身,让我们体验人的神性和神的人性。人工智能常被拿来与邪教相提并论,它的激进支持者近乎虔诚地相信AI有一天会无所不能。但如果你凝视艺术时心中只有表象,那你的产出也无法触及灵魂。
Doctorow认为,AI生成艺术将会成为一种新的艺术形式,就像歌曲选录一度受到鄙夷,现在却成了音乐制作的常见手法一样。媒体理论学者Ignas Kalpokas认为人工智能艺术“具有启示性”[9],揭露了人类对当今社会集体无意识的层面——数据模式。不过同时他也承认,AI创作的作品越多,观众“越容易分心”。
歌曲选录(sampling):指将现成歌曲的采样片段直接用在新歌中进行二次创作。代表作品:《7 Rings》by Ariana Grande,《My Name Is》by Eminem
按照现在的发展趋势,未来的艺术与娱乐可能会是这样:普通人输入一句提示词,再轻点按钮,就能让个人AI助理生成书影音。但到时候这种形式的娱乐能否吸引我们的注意力还未可知。真到了那一天,创意行业也会和过去的百年间的变化一样适应新时代。
人文环境的适应性
“专业创意行业的历史一直存在竞争——电视打电影,电影打广播,” AI艺术家兼电子文化评论家Lev Manovich解释说,“行业转型可能更偏向现场直播,可能更注重人体表演。如果机器能交出好莱坞级别的媒体作品,那行业就得做出别的东西。这个过程中会有人失去工作,但也会有新的工作岗位出现。”
我很好奇,在现有的科技背景下,什么条件能让科幻文学杂志编辑Clarke同意发表AI生成的小说。“当人工智能能凭自己的意愿写小说,并自己选择向我投稿的时候。那就跟外星人没什么区别了:我不会拒绝,因为到那一步它已经是新形式的生命。”他说,“但那是科幻小说情节。如果我此生能见识到也不错,但我不会屏息等待这一天的降临。”
参考文献: