OpenAI於昨日(4月21日)正式推出ChatGPT Images 2.0,底層採用全新圖像生成模型gpt-image-2。新模型在文本渲染、複雜布局、多語言支持及寫實能力上實現了顯著突破,同時內容生成尺度較以往版本明顯放開,迅速引發全球AI社區的熱議。

最具代表性的案例來自網友生成的遊戲截圖。他使用簡單提示詞直接生成了一組以《金瓶梅》為主題的古代ARPG MMO開放世界遊戲截圖。畫面中呈現了古典街景、西門慶府等《金瓶梅》小說中的經典場景,並配有完整的遊戲UI框架以及遊戲角色。圖像細節豐富、光影自然、風格逼真,幾乎讓人誤以為是真實遊戲的截圖。


OpenAI官方表示,gpt-image-2是其迄今最強大的圖像生成模型,支持Instant(即時生成)和Thinking(思考模式)兩種方式。在Thinking模式下,模型可以先行推理、搜索網頁資訊、自我校驗,再輸出多張一致性圖像,尤其擅長雜誌排版、資訊圖、遊戲UI、漫畫故事板等複雜布局。OpenAI甚至用該模型生成了整個官方發布頁面,充分展示了其在精確文本渲染和視覺連貫性上的實力。

業內人士評價稱,新模型在多語言文本、全資訊圖和複雜場景生成上「近乎完美」,標誌著圖像生成從「快速繪製」向「智能創作」的轉變。儘管OpenAI仍保留一定內容安全機制,但此次《金瓶梅》主題案例凸顯模型在敏感題材上的尺度明顯擴大,引發了用戶對內容政策調整的討論。

有專家指出,這類能力提升將大幅降低遊戲開發、影視概念設計和視覺內容創作的門檻,但也需要警惕深度偽造等潛在風險。






