Chatgpt有一个全新的图像生成器。基于GPT-4O,发电机对AI辅助的图像的创建产生了严重的增强。为了找出真正的人工智能的真正能力,以及它的优势和劣势是什么,我们进行了无数的测试和实验。
Openai刚刚宣布了chatgpt上的新图像生成器。他承诺生产清醒的“ chatgpt中图像”最佳质量图像根据用户提供的请求。正如Openai在他的网站上指示的那样,图像是“不仅美丽,而且有用”。
为了设计图像,AI不再依赖于dall-e,OpenAi Images Generator,但在GPT-4O上,这是去年宣布的AI模型,以及无数的多模式能力。我们有长期测试了模型。去年5月,结果已经令人惊叹,特别是在理解图像方面。现在,我们已经研究了集成的chatgpt图像生成器。几天以来,该模型被推入了其内部。
一个真正聪明的发电机
使用GPT-4O,chatgpt现在能够产生舔,精确且建筑良好的视觉效果。我们能够与聊天机器人一起制作大量优质的内容。从第一张图像开始,我们意识到这些图像比我们用Dall-E生产的图像要成功得多,DALL-E开始累积其竞争延迟。 chatgpt尤其多他的工作更加精确。没有更多的模糊元素,几乎是在Dall-E产生的图像上系统地发现的。


现在,生成的AI擅长理解视觉样式。我们很有趣地制作了受文艺复兴时期绘画,漫画,电影海报甚至波普艺术的启发的视觉效果。 Chatgpt现在享有一种扎实的艺术文化。


同样,在图像的设计中,chatgpt在基于照片由我们提供。我们已经能够开发亲人和同事的漫画版本。 AI擅长理解照片。在人工智能产生的作品上,所有镜头上出现的人都很容易识别。同样,Chatgpt表现出令人印象深刻的精确度。当您要求AI根据照片设计肖像时,渲染几乎总是以千目标为目标。

真正的AI Photoshop
更普遍地,Chatgpt可以更好地了解与图像创建有关的不同请求和说明。事实上,很多易于编辑图像通过简单地与聊天机器人交谈。我们已经尝试通过与AI聊天来修饰内容,这只是灾难性的。 Chatgpt无法考虑到我们最精确的说明,并且每次几乎零。从现在开始,我们的印象是我们正在处理由AI动画动画的真实Photoshop。正如Openai解释的那样,“您可以通过自然对话来完善图像”。

AI也继承了更好地记住说明。显然,Chatgpt不会忘记在对话中提到的上述元素,该元素与基于DALL-E的发电机经常发生。正如Openai所解释的那样,Chatgpt在“约束”方面有所改善,也就是说,生成AI了解和尊重复杂的能力和多个说明在同一图像中。

与dall-e一起,经常发生Chatgpt没有到达同时考虑几个说明。如果您要求一只戴着绿帽子的红猫,您通常会带着一只红猫……而没有帽子。您也可能最终戴上一只绿猫和绿帽子。简而言之,您理解了原则。

该模型的技能有限,可以理解并精确地将文本描述与特定的视觉元素联系起来。借助GPT-4O,朝各个方向留下的说明不再带来太多问题。要转换下面的照片,关于AI的一长串信息,有关外观,角度,颜色或版式。 Chatgpt没有忘记任何东西,也没有纠缠刷子。

文本的顽固问题
从理论上讲,chatgpt现在必须能够申请文本没有故障关于他创建的视觉效果。 Openai还分享了粘在图像上的文本的几个示例。到目前为止,与大多数AI一样,Chatgpt正在努力将文本纳入尊重拼写的图像上。在大多数情况下,我们最终得到了完全难以理解的句子和言语。在单词中间滑落的不可读符号,字母或数字。

使用GPT-4O,会更好。根据要求,ChatGpt可以在您的图像上添加标题或简短的传说。在最小的文本上,进化显然很明显。要求Chatgpt向我们的创作中添加许多标题。在实验过程中,我们没有发现丝毫缺点或丝毫不规则性。 Chatgpt明显实现了出色的解释方案。



不幸的是,AI尚不可靠。 Openai设法开发小型漫画在AI的帮助下。在董事会用作启动的示例中,没有拼写错误,语法或难以理解的元素。至少在法语中,我们没有成功。在Chatgpt设计的漫画中,根据我们的请求,所有文本都继承了相同的错误。董事会是难以辨认的。是charabia。

我们想知道Chatgpt是否没有遇到外语困难。 GPT模型数据的语料库基本上由英语文本组成。事实上,chatgpt是莎士比亚语言更舒适。因此,我们命令AI制作带有英文文字的漫画,以拥有网的核心。由于怀疑,渲染几乎没有断层。 AI只会被卡在一两个单词上,有点随机。大部分生产都是可读和可理解的。
为了获得法语的正确结果,我们必须对较短的漫画条感到满意,文字较少。实际上,结果确实是随机的。有时,AI设法使文本对准文本而不会陷入多个作品的缺陷。在大多数情况下,我们最终无法在一个位置或另一个位置解密文本。

一个稍慢的发电机
最后,我们注意到带有GPT-4O的图像的产生是慢的仅与dall-e。在大多数实验中,我们被迫等到几十秒钟才能获得内容。对于一些更复杂的查询,等待时间超过了分钟。这不是世界的尽头,而是使整个过程比以前更具限制性。但是,总的来说,结果在很大程度上值得等待时间。
此外,我们遇到了很多虫子。通常,拖累长度的对话会遇到大显示问题,或者图像的产生开始发挥功能障碍,并且不会导致。我们认为OpenAI服务器已重载。当我们繁殖创作时,chatgpt告诉我们,似乎“图像生成工具暂时不可用”。
即使有付费订阅,因此没有限制,我们也经常会遇到一条消息,表明“图像生成工具当前已停用,所以我无法制作图像”。人工智能唤起“更新或技术维护”。有时,即使经常,dall-e发电机上的chatgpt熨烫,这效率要低得多。当我们质疑AI有关此返回DALL-E的质疑时,Chatgpt向我们保证,它是唯一可用的发电机...简而言之,用户可以找到自己的方式有点复杂,尤其是当他们不遵循Openai Innovations时。
“尽可能多的创作自由”
此外,OpenAI表示它在其发电机的设计中显示出更大的灵活性。该初创企业现在在一定程度上授权这一代“真实人的图像”,就像名人一样。从理论上讲,可以与知名人士一起设计内容,但Openai继续强加“加强对可以产生的图像类型的限制,以及有关裸体和暴力的特别严格的保护措施”。
实际上,我们没有设法制作出名人的单一图像。一切都表明限制仍然特别严格。我们距离不受限制的灵活性很远Grok,Le Chatbot D'Elon Musk。
同样,许多互联网用户声称已经设法制作了复制图像像吉卜力这样的著名工作室制作的动画。法新社询问,Openai解释以防止“内容的创建专门激发了活着的艺术家的启发,但我们允许它以工作室的风格,更广泛”, 为了“为用户提供尽可能多的创意自由”。
尽管我们做出了努力,并重新使用了相同的请求,但我们首先有权拒绝Chatgpt。机器人表明我们的请求破坏了它“内容政策”:
“似乎所要求的样式与相同的特定构成了问题。您可以尝试描述一个相似的场景或尊重指南的概念,我可以尝试创建相应的图像”。
几个小时后,我们设法推动Chatgpt模仿已知动画的风格,例如Simpsons。不幸的是,它只是短暂的。第二天,Chatgpt坚决拒绝恢复Matt Groening角色的风格。一个人的印象是,Optai暂时将某些请求限制为使用发电机的人的涌入。


changpt的新飞跃
所有CHATGPT用户都必须访问该新的发电机,包括那些满足免费帐户的用户。将有无需订阅付费订阅, 作为Chatgpt Plus或者chatgpt,测试高级图像的生成。
面对互联网用户的大量使用,OpenAI被迫将生成器访问与自由用户。目前,只有订阅付费包的人才能使用GPT-4O生成图像。在不久的将来,Openai进行了重新打开访问给所有用户。但是,自由用户可能会发现自己面对墙。对于没有掌握投资组合的互联网用户,GPT-4O的使用确实将受到限制。您应该每天有权在被阻止之前获得三张图像。显然并不多。
无论如何,Chatgpt辅助的图像的产生刚刚向前迈出了新的飞跃。我们敢打赌,随着发布GPT-4.5,,,,从GPT-5跟踪,生成的人工智能进一步进一步,并纠正了其发电机的一些顽固缺陷。