微软必应人工智能聊天系统中的 ChatGPT DALL-E 3 初体验

Admin 2023-9-21 226 9/21
微软必应人工智能聊天系统中的 ChatGPT DALL-E 3 初体验

要点
微软必应聊天工具将推出 DALL-E 3,这是 OpenAI 工具的高级版本,可将文字描述转换成详细的艺术作品。该升级版本将向部分用户推出。
DALL-E 3 在 DALL-E 2 的基础上进行了大幅改进,可以在图像中准确生成文字、标签和标志。
OpenAI 证实,DALL-E 3 将于 10 月份向其人工智能平台的付费用户开放。不过,必应聊天工具免费提供相同的 DALL-E 3 图像创建功能。
据该公司的一位消息人士称,微软必应聊天工具正在向 "一小部分用户 "推出 DALL-E 3(OpenAI 文本到图像工具的升级版本)。

由 ChatGPT 驱动的 DALL-E 3 集成已在我们的一个必应聊天微软账户上上线,它的工作原理与宣传的一样--你可以将图片描述转化为包含更多细节和文字的艺术品。与 DALL-E 2 不同的是,新的 DALL-E 3 在创建高质量作品方面要好得多,这要归功于它如何处理图片中的文本。

微软支持的 OpenAI 的 DALL-E 就像一个魔盒。你可以告诉人工智能绘制任何图片,它都能创造出独一无二的艺术品,但上一代模型并不擅长在图像中生成文字、标签和标志。新模型解决了文本生成问题,OpenAI 现在可以更准确地生成标签或标志。

例如,如果你要求必应聊天人工智能创建 "一幅牛油果坐在治疗师椅子上的插图,牛油果说'我只是觉得内心很空虚',中心有一个坑大小的洞。治疗师是一把勺子,正在潦草地做笔记",它可以准确地制作出这样的结果。图像中的文字 "我只是觉得内心空虚 "也能正确显示。

微软必应人工智能聊天系统中的 ChatGPT DALL-E 3 初体验

从上面的截图中可以看到,DALL-E 3 在处理图片中的文字时比前一代产品要好得多。DALL-E 2 制作出的作品中的字母是随机的,而必应聊天工具中的新人工智能模型却能按照描述准确地渲染图片中的文字。

我只是觉得心里空荡荡的 "完美地印在了图片上。

微软必应人工智能聊天系统中的 ChatGPT DALL-E 3 初体验

我们不知道必应聊天平台上有多少用户可以访问 DALL-E 3,它甚至还没有被添加到 ChatGPT 中,但微软的一位消息人士告诉我们,该支持正在向少数用户/账户推出。

昨天,OpenAI 在一篇宣布下一代文本到图像 AI 模型的博文中确认,其 AI 平台(ChatGPT Plus 和企业版)的付费用户可以在 10 月份访问 DALL-E 3。一旦订阅了 ChatGPT Plus,就可以直接在 ChatGPT 中输入提示并创建图像。

不过,如果你等不及或不想为 ChatGPT Plus 付费,你可以使用必应聊天的 DALL-E 3 图像创建器,它可以免费提供相同的功能。

如果你已经获得了 DALLE-3 的早期预览版,那么你应该可以在 Microsoft Edge Canary 的必应聊天中试用新的图片创建工具,该工具最近更新了 "网页上的人工智能写作 "和必应的 "电话上的继续 "功能。

DALL-E 比以前的模式更好用
与无法处理标签和标志、高质量图像请求等问题的前代产品相比,新的文本到图像人工智能模型在质量上有了多项改进。

目前还无法获得详细信息,但与之前的模型一样,ChatGPT 和必应聊天中的 DALL-E 3 是基于互联网创作者、摄影师、艺术家、图片库等数百万张图片的数据训练而成的。

"现代文本到图像系统往往会忽略文字或描述,迫使用户学习提示工程。DALL-E 3 代表着我们在生成与您提供的文本完全一致的图像能力上的一次飞跃,"OpenAI 在博文中指出。

新旧模型的主要区别在于,DALL-E 3 更注重文本、物体等小细节。

- THE END -
最后修改:2023年9月21日

非特殊说明,本博所有文章均为博主原创。