作者error405 (流河=L)
看板AI_Art
標題[閒聊] Illustrious Z 複雜指示理解能力提升
時間Thu Apr 16 09:09:23 2026
https://www.illustrious-xl.ai/blog/17
以下是根據官方部落格文章(
https://www.illustrious-xl.ai/blog/17)以及相關資訊
整理的 Illustrious Z 相關內容:
1. 什麼是 Illustrious Z?
Illustrious Z 是 Onoma Tech 開發的新一代 AI 圖像生成模型,專注於動漫風格(Anime & Illustration
) 的高品質生成。
它不是延續之前的 Illustrious XL 系列(SDXL 架構),而是轉向全新的
S3-DiT-based 架構(Diffusion Transformer 類型),目的是大幅提升複雜提示理解和
場景級(scene-level) 的構圖能力,從「元素級生成」進化到「整體場景推理與組成」
。官方描述: “Illustrious Z is a newly developed model designed to extend
complex prompt understanding and scene-level illustration generation to a new
level.”
2. 主要特點與改進
更強的自然語言提示理解:能更好地處理長提示、敘事式描述、空間
關係和情緒氛圍。
多角色構圖與空間推理:在多人物場景中,能更準確維持位置關係、角色區分和屬性一致
性,避免混亂或屬性混合。
文字渲染(Text Rendering):文字更清晰、穩定,較少出現扭曲或錯誤字符。
支援兩種提示方式:自然語言提示:輸出更豐富、有上下文深度、電影感強(推薦用於複
雜場景)。
Tag-based 提示(類似 Danbooru tags):輸出較快、直接,但線條較軟、細節簡化、風
格較平坦。
整體從「穩定性與控制」轉向「理解與構圖能力」。
與前代(Illustrious XL v3.5 / v3.6)相比:在複雜姿勢、多角色、文字渲染上明顯進
步。
但在純角色焦點的穩定性、一致性和美學精煉上,v3.6 仍有優勢(取決於使用情境)。
3. 技術規格
架構:S3-DiT-based(全新 Diffusion Transformer)
最佳解析度:1024×1024(目前最穩定)
訓練基礎:Fine-tuned on Z-image-turbo
訓練資料截止時間:2026 年 1 月
4. 使用建議(來自官方範例)
推薦自然語言提示來發揮優勢,例如描述姿勢、空間關係
、情緒:單人複雜姿勢範例:"She is performing a dancer pose: balancing on one
leg, with her other leg lifted and bent backward..."
多角色範例:"An illustration of narita top road from umamusume and lumine
from genshin impact..."(能較好維持角色身份與位置)
文字渲染範例:女孩拿著冰淇淋杯,上面印有 "onoma" 文字,能更準確呈現。
Tag-based 適合快速、簡單控制。
目前可在 illustrious-xl.ai 官方平台直接使用(有 Illustrious-Z 選項),支援
Text-to-Image 和 Image-to-Image。
5. 目前狀態與未來
模型仍在積極開發中,官方表示會繼續改進角色一致性和輸出穩定性。
部落格發布日期:2026 年 4 月 15 日(相當新)。
開發團隊:Onoma Tech(前 Illustrious XL 系列也是他們開發,位於韓國首爾)。
聯絡方式:
[email protected]
6. 下載與開源
官方部落格目前未提供直接下載連結。
先前 Illustrious XL 系列多為開源或在 Hugging Face / Civitai 上釋出,社群猜測
Illustrious Z 未來也可能開源,但尚未確認。
目前主要透過官方網站(illustrious-xl.ai)線上生成使用。
總結
Illustrious Z 是 Illustrious 系列的一次重要架構轉型,從 SDXL 轉向 DiT 類架構,主打場景理解與複
雜提示,適合需要豐富構圖、多角色互動、精準文字或敘事性圖像的創作者。
如果追求極致穩定與角色一致性,官方仍建議搭配 v3.6 使用;若想體驗更強的「理解力
」,則推薦試用 Z。
--
Grok整理
繼新出的Anima後舊的illu方面終於也有動作
理解複雜指令似乎是個不錯的發展方向 人物重現度與構圖的美觀則看得出有待加強
只能說未來可期啦
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.36.243.215 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/AI_Art/M.1776301765.A.4BC.html
推 qiaffvvf: 哇喔 04/16 11:38
推 rex7788: 等很久了 04/16 11:55
推 rex7788: 很想試試看中日韓文 04/16 11:59
推 v86861062: 可以色色ㄇ 04/16 12:36