Chatgpt有一個全新的圖像生成器。基於GPT-4O,發電機對AI輔助的圖像的創建產生了嚴重的增強。為了找出真正的人工智能的真正能力,以及它的優勢和劣勢是什麼,我們進行了無數的測試和實驗。
Openai剛剛宣布了chatgpt上的新圖像生成器。他承諾生產清醒的“ chatgpt中圖像”最佳質量圖像根據用戶提供的請求。正如Openai在他的網站上指示的那樣,圖像是“不僅美麗,而且有用”。
為了設計圖像,AI不再依賴於dall-e,OpenAi Images Generator,但在GPT-4O上,這是去年宣布的AI模型,以及無數的多模式能力。我們有長期測試了模型。去年5月,結果已經令人驚嘆,特別是在理解圖像方面。現在,我們已經研究了集成的chatgpt圖像生成器。幾天以來,該模型被推入了其內部。
一個真正聰明的發電機
使用GPT-4O,chatgpt現在能夠產生舔,精確且建築良好的視覺效果。我們能夠與聊天機器人一起製作大量優質的內容。從第一張圖像開始,我們意識到這些圖像比我們用Dall-E生產的圖像要成功得多,DALL-E開始累積其競爭延遲。 chatgpt尤其多他的工作更加精確。沒有更多的模糊元素,幾乎是在Dall-E產生的圖像上系統地發現的。


現在,生成的AI擅長理解視覺樣式。我們很有趣地製作了受文藝復興時期繪畫,漫畫,電影海報甚至波普藝術的啟發的視覺效果。 Chatgpt現在享有一種紮實的藝術文化。


同樣,在圖像的設計中,chatgpt在基於照片由我們提供。我們已經能夠開發親人和同事的漫畫版本。 AI擅長理解照片。在人工智能產生的作品上,所有鏡頭上出現的人都很容易識別。同樣,Chatgpt表現出令人印象深刻的精確度。當您要求AI根據照片設計肖像時,渲染幾乎總是以千目標為目標。

真正的AI Photoshop
更普遍地,Chatgpt可以更好地了解與圖像創建有關的不同請求和說明。事實上,很多易於編輯圖像通過簡單地與聊天機器人交談。我們已經嘗試通過與AI聊天來修飾內容,這只是災難性的。 Chatgpt無法考慮到我們最精確的說明,並且每次幾乎零。從現在開始,我們的印像是我們正在處理由AI動畫動畫的真實Photoshop。正如Openai解釋的那樣,“您可以通過自然對話來完善圖像”。

AI也繼承了更好地記住說明。顯然,Chatgpt不會忘記在對話中提到的上述元素,該元素與基於DALL-E的發電機經常發生。正如Openai所解釋的那樣,Chatgpt在“約束”方面有所改善,也就是說,生成AI了解和尊重複雜的能力和多個說明在同一圖像中。

與dall-e一起,經常發生Chatgpt沒有到達同時考慮幾個說明。如果您要求一隻戴著綠帽子的紅貓,您通常會帶著一隻紅貓……而沒有帽子。您也可能最終戴上一隻綠貓和綠帽子。簡而言之,您理解了原則。

該模型的技能有限,可以理解並精確地將文本描述與特定的視覺元素聯繫起來。借助GPT-4O,朝各個方向留下的說明不再帶來太多問題。要轉換下面的照片,關於AI的一長串信息,有關外觀,角度,顏色或版式。 Chatgpt沒有忘記任何東西,也沒有糾纏刷子。

文本的頑固問題
從理論上講,chatgpt現在必須能夠申請文本沒有故障關於他創建的視覺效果。 Openai還分享了粘在圖像上的文本的幾個示例。到目前為止,與大多數AI一樣,Chatgpt正在努力將文本納入尊重拼寫的圖像上。在大多數情況下,我們最終得到了完全難以理解的句子和言語。在單詞中間滑落的不可讀符號,字母或數字。

使用GPT-4O,會更好。根據要求,ChatGpt可以在您的圖像上添加標題或簡短的傳說。在最小的文本上,進化顯然很明顯。要求Chatgpt向我們的創作中添加許多標題。在實驗過程中,我們沒有發現絲毫缺點或絲毫不規則性。 Chatgpt明顯實現了出色的解釋方案。



不幸的是,AI尚不可靠。 Openai設法開發小型漫畫在AI的幫助下。在董事會用作啟動的示例中,沒有拼寫錯誤,語法或難以理解的元素。至少在法語中,我們沒有成功。在Chatgpt設計的漫畫中,根據我們的請求,所有文本都繼承了相同的錯誤。董事會是難以辨認的。是charabia。

我們想知道Chatgpt是否沒有遇到外語困難。 GPT模型數據的語料庫基本上由英語文本組成。事實上,chatgpt是莎士比亞語言更舒適。因此,我們命令AI製作帶有英文文字的漫畫,以擁有網的核心。由於懷疑,渲染幾乎沒有斷層。 AI只會被卡在一兩個單詞上,有點隨機。大部分生產都是可讀和可理解的。
為了獲得法語的正確結果,我們必須對較短的漫畫條感到滿意,文字較少。實際上,結果確實是隨機的。有時,AI設法使文本對准文本而不會陷入多個作品的缺陷。在大多數情況下,我們最終無法在一個位置或另一個位置解密文本。

一個稍慢的發電機
最後,我們注意到帶有GPT-4O的圖像的產生是慢的僅與dall-e。在大多數實驗中,我們被迫等到幾十秒鐘才能獲得內容。對於一些更複雜的查詢,等待時間超過了分鐘。這不是世界的盡頭,而是使整個過程比以前更具限制性。但是,總的來說,結果在很大程度上值得等待時間。
此外,我們遇到了很多蟲子。通常,拖累長度的對話會遇到大顯示問題,或者圖像的產生開始發揮功能障礙,並且不會導致。我們認為OpenAI服務器已重載。當我們繁殖創作時,chatgpt告訴我們,似乎“圖像生成工具暫時不可用”。
即使有付費訂閱,因此沒有限制,我們也經常會遇到一條消息,表明“圖像生成工具當前已停用,所以我無法製作圖像”。人工智能喚起“更新或技術維護”。有時,即使經常,dall-e發電機上的chatgpt熨燙,這效率要低得多。當我們質疑AI有關此返回DALL-E的質疑時,Chatgpt向我們保證,它是唯一可用的發電機...簡而言之,用戶可以找到自己的方式有點複雜,尤其是當他們不遵循Openai Innovations時。
“盡可能多的創作自由”
此外,OpenAI表示它在其發電機的設計中顯示出更大的靈活性。該初創企業現在在一定程度上授權這一代“真實人的圖像”,就像名人一樣。從理論上講,可以與知名人士一起設計內容,但Openai繼續強加“加強對可以產生的圖像類型的限制,以及有關裸體和暴力的特別嚴格的保護措施”。
實際上,我們沒有設法製作出名人的單一圖像。一切都表明限制仍然特別嚴格。我們距離不受限制的靈活性很遠Grok,Le Chatbot D'Elon Musk。
同樣,許多互聯網用戶聲稱已經設法製作了複製圖像像吉卜力這樣的著名工作室製作的動畫。法新社詢問,Openai解釋以防止“內容的創建專門激發了活著的藝術家的啟發,但我們允許它以工作室的風格,更廣泛”, 為了“為用戶提供盡可能多的創意自由”。
儘管我們做出了努力,並重新使用了相同的請求,但我們首先有權拒絕Chatgpt。機器人表明我們的請求破壞了它“內容政策”:
“似乎所要求的樣式與相同的特定構成了問題。您可以嘗試描述一個相似的場景或尊重指南的概念,我可以嘗試創建相應的圖像”。
幾個小時後,我們設法推動Chatgpt模仿已知動畫的風格,例如Simpsons。不幸的是,它只是短暫的。第二天,Chatgpt堅決拒絕恢復Matt Groening角色的風格。一個人的印像是,Optai暫時將某些請求限制為使用發電機的人的湧入。


changpt的新飛躍
所有CHATGPT用戶都必須訪問該新的發電機,包括那些滿足免費帳戶的用戶。將有無需訂閱付費訂閱, 作為Chatgpt Plus或者chatgpt,測試高級圖像的生成。
面對互聯網用戶的大量使用,OpenAI被迫將生成器訪問與自由用戶。目前,只有訂閱付費包的人才能使用GPT-4O生成圖像。在不久的將來,Openai進行了重新打開訪問給所有用戶。但是,自由用戶可能會發現自己面對牆。對於沒有掌握投資組合的互聯網用戶,GPT-4O的使用確實將受到限制。您應該每天有權在被阻止之前獲得三張圖像。顯然並不多。
無論如何,Chatgpt輔助的圖像的產生剛剛向前邁出了新的飛躍。我們敢打賭,隨著發布GPT-4.5,,,,從GPT-5跟踪,生成的人工智能進一步進一步,並糾正了其發電機的一些頑固缺陷。