Re: [情報] GPT Image 2.0正式推出

作者tsubasawolfy (悠久の翼)

看板AI_Art

標題Re: [情報] GPT Image 2.0正式推出

時間Wed Apr 22 21:02:34 2026

繼續用Codex測試，使用Plan模式 "使用S__50716685.jpg 裡面的角色作為模板。設計一個final fantasy 赤魔導士(Red mag)外觀，產生三視圖及裝備解說。及世界觀設定為Final fantasy 14，以Limsa Lominsa為主要出生地。設計四張他在Limsa Lominsa內四處觀光照片，其中需包含主水晶。" 這邊他問了四個問題，每個問題各三個選項全部無腦點推薦 https://i.imgur.com/bFQ79hs.png 第一次的Plan 第二次後面都是細修就不貼了 https://i.imgur.com/LvmI6lu.png https://i.imgur.com/Un3b45Z.png https://i.imgur.com/ZXGj8BC.png 第一次的結果 (V1) https://i.imgur.com/t9DjqHq.jpeg https://i.imgur.com/DMWtIAB.jpeg https://i.imgur.com/YDnwdaq.jpeg https://i.imgur.com/bvjANPz.jpeg https://i.imgur.com/Kw3hjS4.jpeg 一看就是服裝變形的有點嚴重，最後一張甚至變露胸這時候他跳出這個 "目前成品都已在這個對話中生成。如果你要，我下一步可以直接幫你做第二輪微調，例如統一角色帽飾、把武器和外套再收斂得更一致，或改成更接近 FF14 遊戲內建模／宣傳圖的版本。" 哇~你還知道那邊不一致? 還要主動檢查XDDDDD 這邊一樣開Plan 要Codex進行帽飾、把武器和外套收斂。順便問弄一個Sub agent檢查會不會好一點? 然後他回答 "我看過設定板與場景圖後，現在的漂移主要集中在三個點：帽飾從「羽飾耳側飾件」變成了不同形狀的耳飾、外套領口與毛邊份量不一致、武器在部分圖裡更像刺劍與法器混合件。這種情況可以靠一輪更嚴格的主提示修正；sub agent 比較適合拿來做「生成後一致性核對」，不是必要，但如果你想把返工率壓低，它有幫助。" OK~既然Sub agent可以審核比對那就弄吧這是Sub agent檢查是否都一致，通過還會標記PASS XDD https://i.imgur.com/czzzSOY.png 這是第二輪成果(V2) https://i.imgur.com/WjheRwL.jpeg https://i.imgur.com/6spab6c.jpeg https://i.imgur.com/WGevan2.jpeg https://i.imgur.com/2TmlJE0.jpeg https://i.imgur.com/0CqqMLC.jpeg 恩...雖然帽飾、服裝、武器都一致了....但是怎麼連角色姿勢也都一致? 連臉的方向也固定住要Codex檢討的結果是 1. 角色一致性約束被寫得太靠近「整體外觀 + 鏡頭語言一起固定」 2. 場景 prompt 缺少「姿勢與臉部朝向必須變化」的反向要求 3. 基準圖本身也在強化同一種角色展示方式推薦下一輪規格要改成「分層鎖定」：硬鎖定：臉型、髮色、帽飾位置、外套結構、武器組合軟變化：臉部朝向、視線方向、站姿、手勢、鏡頭遠近、情緒強制分配：四張圖各自指定不同 pose / face direction 所以這就是第三輪(V3) 依據他的plan微調的成果 https://i.imgur.com/hIjXOUR.jpeg https://i.imgur.com/cN7caDA.jpeg https://i.imgur.com/LnBoEom.jpeg https://i.imgur.com/LVTMbGP.jpeg https://i.imgur.com/zYUthsY.jpeg 恩...真要說大概剩下手套不一致還有耳飾在第一張主水晶是固定在左耳到這邊進行三輪花費一小時，以及33%的5小時token量 (20美) https://i.imgur.com/etemYPT.png 結論用Codex plan模式會問問題進行微調出產後Codex自己也會發現哪邊要改善跟提出建議這幾點很不錯，比起單純GPT APP丟啥產啥好多了還可以弄另外Agent檢查是否符合要求，節省微調時間(但就多燒token) 爾且產圖速度真的比較慢 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 59.127.165.190 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/AI_Art/M.1776862959.A.0CA.html

推 error405: 去年還想不到AI會自己校正 04/22 21:07

→ necrophagist: 我覺得這風格細節多到看得不是很舒服而且這種要修 04/22 21:10

→ necrophagist: 會超痛苦 04/22 21:10

推 rex7788: 尾巴很奇怪，有點要強調整體出現 04/22 21:13

→ error405: 精細華麗風有點像midjourney 04/22 21:18

推 Kroner: 我也有過關節痛的經驗，真的超痛苦的啦！推薦去看醫生，早點處理比較不會拖延變嚴重。 04/22 21:18

→ sudekoma: https://imgpoi.com/i/P39OME.jpg 給NAI算是這樣 04/22 21:33

推 Supasizeit: Codex的tool call確定是2.0嗎 04/22 21:35

→ tsubasawolfy: 他是call skill內的imagegen內skill.md 04/22 21:52

→ tsubasawolfy: 不過看那堆中文應該是2.0 04/22 21:56

推 Chricey: 求推薦靠譜的復健診所，小弟關節治好再來跪謝！ 04/22 21:56

推 Jotarun: 他產的cg很多artifact感覺回到sd1.5時代了 04/23 08:04

推 AoWsL: 其實背景有點細緻過頭了 Midjourney 不太好做 04/23 08:05

→ AoWsL: 覺得應該是怎麼講名字應該叫空間壓縮吧剛剛查了一下 04/23 08:14

推 BruceChang: 風格是可以改的平滑一點..現在就是很ai味XD 04/23 19:51

推 Kroner: 長時間坐著工作，關節痛越來越嚴重，該怎麼辦？推薦UC2 04/23 19:51

推 Tosca: t2i都會有AI味你用真人畫的圖片再去給AI微修就不會AI味 04/23 20:35

推 Bustycat: 越複雜的內容越容易有所謂「AI味」 04/23 22:09