DALL-E 3预览版开测,将于今年10月正式开放

日前, OpenAI方面面向部分测试人员发布了其文本转图像生成器DALL-E的升级版本DALL-E 3预览版,并表示计划将其整合到ChatGPT中,这也是该公司首次将其大语言模型与文生图模型结合在一起。据OpenAI官网公布的相关消息显示,DALL-E 3将于今年10月初向ChatGPT Plus和ChatGPT Enterprise用户正式开放。
据悉,作为文本转图像生成器,DALL-E可根据书面文本提示生成图像。其名称则来自艺术家萨尔瓦多·达利(Salvador Dalí)和《机器人总动员》的主角WALL-E,第一代版本于2021年1月首次亮相,第二代版本则发布于2022年4月。
图片
据OpenAI方面透露,相比DALL-E 2和DALL-E 1,DALL-E 3具备更强大的图像细节和差异识别能力,可处理更多的细微差别和细节,从而帮助用户将想法转化为准确的图像。同时DALL-E 3能够理解更长的prompt,以及更好地理解文本的上下文,可以根据多段描述生成图像。对此OpenAI CEO Sam Altman表示,DALL-E 3相当惊人,“如果不尝试的话,很难理解这是多么了不起的事情。”
而DALL-E 3与ChatGPT的集成,也就意味着ChatGPT Plus和ChatGPT Enterprise用户可通过文本直接在ChatGPT中生成各种类型图片。并且值得一提的是,ChatGPT还会帮助用户优化提示词。对此OpenAI方面表示,DALL-E 3与ChatGPT的整合得以让更多的人加入AI艺术创作的队伍,因为“使用者不必擅长给出提示词”。
据悉在安全性上,OpenAI也为DALL-E 3上制定了诸多强有力的措施,例如禁止DALL-E 3生成非法内容;禁止DALL-E 3生成偏见、歧视、丑化公众人物的图像;限制DALL-E 3模仿特定艺术家风格的能力等。对此,OpenAI研究员Sandhini Agarwal表示,其对DALL-E 3的安全性“高度有信心”,并表示该模型在不断改进。
此外值得一提的是,日前微软方面宣布将深化和OpenAI 的合作,在必应聊天(Bing Chat)中引入对 DALL-E 3 的支持。但截至目前,微软方面并未公布该功能具体的上线时间。
【本文图片来自网络】