看板 AI_Art
繼續用Codex測試,使用Plan模式 "使用S__50716685.jpg 裡面的角色作為模板。設計一個final fantasy 赤魔導士(Red mag)外觀,產生三視圖及裝備解說。及世界觀設定為Final fantasy 14,以Limsa Lominsa為主要出生地。設計四張他在Limsa Lominsa內四處觀光照片,其中需包含主水晶 。" 這邊他問了四個問題,每個問題各三個選項 全部無腦點推薦 https://i.imgur.com/bFQ79hs.png 第一次的Plan 第二次後面都是細修就不貼了 https://i.imgur.com/LvmI6lu.png https://i.imgur.com/Un3b45Z.png https://i.imgur.com/ZXGj8BC.png 第一次的結果 (V1) https://i.imgur.com/t9DjqHq.jpeg https://i.imgur.com/DMWtIAB.jpeg https://i.imgur.com/YDnwdaq.jpeg https://i.imgur.com/bvjANPz.jpeg https://i.imgur.com/Kw3hjS4.jpeg 一看就是服裝變形的有點嚴重,最後一張甚至變露胸 這時候他跳出這個 "目前成品都已在這個對話中生成。如果你要,我下一步可以直接幫你做第二輪微調,例如 統一角色帽飾、把武器和外套再收斂得更一致,或改成更接近 FF14 遊戲內建模/宣傳圖 的版本。" 哇~你還知道那邊不一致? 還要主動檢查XDDDDD 這邊一樣開Plan 要Codex進行帽飾、把武器和外套收斂。順便問弄一個Sub agent檢查 會不會好一點? 然後他回答 "我看過設定板與場景圖後,現在的漂移主要集中在三個點:帽飾從「羽飾耳側飾件」變成 了不同形狀的耳飾、外套領口與毛邊份量不一致、武器在部分圖裡更像刺劍與法器混合件 。這種情況可以靠一輪更嚴格的主提示修正;sub agent 比較適合拿來做「生成後一致性 核對」,不是必要,但如果你想把返工率壓低,它有幫助。" OK~既然Sub agent可以審核比對 那就弄吧 這是Sub agent檢查是否都一致,通過還會標記PASS XDD https://i.imgur.com/czzzSOY.png 這是第二輪成果(V2) https://i.imgur.com/WjheRwL.jpeg https://i.imgur.com/6spab6c.jpeg https://i.imgur.com/WGevan2.jpeg https://i.imgur.com/2TmlJE0.jpeg https://i.imgur.com/0CqqMLC.jpeg 恩...雖然帽飾、服裝、武器都一致了....但是怎麼連角色姿勢也都一致? 連臉的方向也固定住 要Codex檢討的結果是 1. 角色一致性約束 被寫得太靠近「整體外觀 + 鏡頭語言一起固定」 2. 場景 prompt 缺少「姿勢與臉部朝向必須變化」的反向要求 3. 基準圖本身 也在強化同一種角色展示方式 推薦下一輪規格要改成「分層鎖定」: 硬鎖定:臉型、髮色、帽飾位置、外套結構、武器組合 軟變化:臉部朝向、視線方向、站姿、手勢、鏡頭遠近、情緒 強制分配:四張圖各自指定不同 pose / face direction 所以這就是第三輪(V3) 依據他的plan微調的成果 https://i.imgur.com/hIjXOUR.jpeg https://i.imgur.com/cN7caDA.jpeg https://i.imgur.com/LnBoEom.jpeg https://i.imgur.com/LVTMbGP.jpeg https://i.imgur.com/zYUthsY.jpeg 恩...真要說大概剩下手套不一致 還有耳飾在第一張主水晶是固定在左耳 到這邊進行三輪 花費一小時,以及33%的5小時token量 (20美) https://i.imgur.com/etemYPT.png 結論 用Codex plan模式會問問題進行微調 出產後Codex自己也會發現哪邊要改善跟提出建議 這幾點很不錯,比起單純GPT APP丟啥產啥好多了 還可以弄另外Agent檢查是否符合要求,節省微調時間(但就多燒token) 爾且產圖速度真的比較慢 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 59.127.165.190 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/AI_Art/M.1776862959.A.0CA.html
error405: 去年還想不到AI會自己校正 04/22 21:07
necrophagist: 我覺得這風格細節多到看得不是很舒服 而且這種要修 04/22 21:10
necrophagist: 會超痛苦 04/22 21:10
rex7788: 尾巴很奇怪,有點要強調整體出現 04/22 21:13
error405: 精細華麗風有點像midjourney 04/22 21:18
Kroner: 我也有過關節痛的經驗,真的超痛苦的啦!推薦去看醫生,早點處理比較不會拖延變嚴重。 04/22 21:18
sudekoma: https://imgpoi.com/i/P39OME.jpg 給NAI算是這樣 04/22 21:33
Supasizeit: Codex的tool call確定是2.0嗎 04/22 21:35
tsubasawolfy: 他是call skill內的imagegen內skill.md 04/22 21:52
tsubasawolfy: 不過看那堆中文 應該是2.0 04/22 21:56
Chricey: 求推薦靠譜的復健診所,小弟關節治好再來跪謝! 04/22 21:56
Jotarun: 他產的cg很多artifact感覺回到sd1.5時代了 04/23 08:04
AoWsL: 其實背景有點細緻過頭了 Midjourney 不太好做 04/23 08:05
AoWsL: 覺得應該是怎麼講 名字應該叫空間壓縮吧 剛剛查了一下 04/23 08:14
BruceChang: 風格是可以改的平滑一點..現在就是很ai味XD 04/23 19:51
Kroner: 長時間坐著工作,關節痛越來越嚴重,該怎麼辦?推薦UC2 04/23 19:51
Tosca: t2i都會有AI味 你用真人畫的圖片 再去給AI微修 就不會AI味 04/23 20:35
Bustycat: 越複雜的內容越容易有所謂「AI味」 04/23 22:09