OpenAI 推出了 Dall-E 3,它使用 ChatGPT 来消除提示的痛苦。现在,您只需与聊天机器人对话,就能修改作品。
OpenAI发布了最新的人工智能艺术工具Dall-E 3。它使用 OpenAI 大受欢迎的聊天机器人 ChatGPT,通过自动扩展提示,为生成器提供更详细、更连贯的指令,从而帮助创作出更复杂、更精心的艺术作品。
Dall-E 3 的创新之处在于,它消除了对输入程序的文本进行细化所需的复杂性--这就是所谓的 "提示工程"--并允许用户通过 ChatGPT 的对话界面进行细化。新工具有助于降低生成复杂人工智能作品的门槛,也有助于 OpenAI 凭借其聊天机器人的卓越能力在竞争中保持领先地位。
以这张土豆国王的图片为例。
由于有许多工具可以将文字提示转化为视觉构图,这种由人工智能生成的古怪艺术作品在社交媒体上已司空见惯。但这幅作品是在 ChatGPT 的大量艺术帮助下创作的,它将简短的提示变成了更详细的提示,包括如何正确构图的说明。
这不仅是 Dall-E 的一大进步,也是整个生成式人工智能艺术的一大进步。Dall-E是皮克斯角色Wall-E和艺术家萨尔瓦多-达利(Salvador Dalí)的谐音,于2021年宣布并于2022年推出。它使用所谓的扩散模型来预测如何根据给定的提示渲染图像。只要数据量足够大,就能生成复杂、连贯、美观的图像。Dall-E 3 的不同之处在于人机互动的方式。
这幅由 Dall-E 3 渲染的图像展示了如何使用 ChatGPT 来填写提示语,从而生成一幅更连贯、更复杂的图像。通常情况下,这可能需要大量的提示工程,即用户尝试越来越复杂的提示来创建复杂的内容。但有了 Dall-E 3,ChatGPT 就能承担制作更复杂提示的工作。
Dall-E 3 根据以下提示制作了这幅图像: "这是一幅由半透明玻璃制成的人心插图,它矗立在惊涛骇浪中的基座上。一缕阳光穿透云层,照亮了心脏,揭示了其中的小宇宙。地平线上镌刻着一行醒目的大字'寻找你心中的宇宙'"。
Dall-E 3 还可以让用户通过 ChatGPT 完善创作,就像让真正的艺术家进行修改一样。"首席研究员兼 Dall-E 团队负责人阿迪提亚-拉梅什(Aditya Ramesh)说:"你不必再为冗长的提示而烦恼。"相反,你只需与 ChatGPT 互动,就像与同事交谈一样。"
Dall-E 团队的首席研究员加布里埃尔-高(Gabriel Goh)向《WIRED》展示了这一技巧,他要求 Dall-E 3 为一家假想的面馆制作几张宣传海报。在得到几个选项后,Goh 要求 Dall-E 3 通过 ChatGPT 提取其中一个选项,并将其变成挂在餐馆外面的招牌插图。
Dall-E 3 现在可以通过付费版聊天机器人 ChatGPT Plus 使用。
2022 年,大量人工智能艺术生成器的出现预示着更广泛的生成式人工智能热潮的开始。许多早期的生成器都很粗糙,无法完善或修改图像。除了 OpenAI 之外,Midjourney、Stable Diffusion 和 Ideogram 等初创公司也吸引了大量资金和公众的关注。但这些人工智能艺术系统的使用也引发了人们的担忧,担心专业的人类艺术家会被取代,也担心人工智能公司如何使用受版权保护的材料来训练他们的算法。
针对这一争议,OpenAI 今天还宣布,它将为艺术家提供一种方法,让他们在未来的训练运行中删除自己的作品。Dall-E 3 还将通过检测提示中是否包含知名艺术家的作品,防止用户试图生成具有知名艺术家风格的艺术作品。
OpenAI 还制定了保障措施,阻止用户生成色情或暴力图像,或以公众人物为主角的图像。OpenAI 的政策研究员桑迪尼-阿加瓦尔(Sandhini Agarwal)说,新版的 Dall-E 经历了更多的 "红队测试"(red teaming),其中包括研究人员试图突破其防护网。"阿加瓦尔说:"一个非常明确的色情内容请求,必须经过分类器处理,并会被拒绝。当然,一些程序员已经创建了不受限制的开源图片生成器。
人工智能生成艺术蓬勃发展的最显著成果之一就是充斥社交媒体的超现实图像。下面这张图片是在 ChatGPT 的帮助下,使用 Dall-E 3 根据以下提示生成的: "一幅完全由各种肉类组成的广阔景观展现在观众面前。鲜嫩多汁的烤牛肉山、鸡腿树、培根河和火腿巨石,构成了一幅超现实而又令人食指大动的场景。天空中点缀着意大利辣香肠太阳和色拉米香肠云朵"。
非特殊说明,本博所有文章均为博主原创。
如若转载,请注明出处:https://www.zerotech.cc/794.html