Home Stable Diffusion Stable Diffusion的參數解說

Stable Diffusion的參數解說

by carl

一.Checkpoint / VAE / Clip Skip

Checkpoint 為主模型,會決定產出的風格及內容

類別有:
SD1.5 – 1.5版本的模型,目前最普遍的格式,可產出512×512的圖片。
SD LCM – SD潛在一致性模型(
Latent Consistency Models),快速出圖,可4-8步完成生成,相對犧牲一些出圖質量。
SDXL – 1.0版本大模型,新出的格式,可產出1024×1024的圖片,產圖速度上比SD1.5要慢許多,外掛功能及外掛模型和SD1.5是不同的,都要用SDXL專用的版本。
SVD –
Stable Video Diffusion的縮寫,用來產出短影片。

其他類別較少用,有興趣再研究即可

SD VAE

VAE(Variable Auto Encoder),用於改善 Checkpoint Model 生成出的圖像,顏色及修復面部或手部。
通常Checkpoint就會內建VAE,SDXL則要指定專用VAE。

Clip Skip

模型在訓練時會有其偏見度,設定Clip Skip可避免一致性太高,通常會跟著模型建議設定
以下是麥橘模型的建議參數

CLIP Skip這個參數只對1.5版的衍生模組有用,到了2.1版之後的模組是無效的(產出結構已不同)

二.正向提示詞及負向提示詞

在正向提示詞中填寫圖片的特徵,通常會加上masterpiece,best quality,beauty detailed face,8K,highres來提升品質

在負向提示詞中填寫圖片不要出現的特徵,通常會加上watermark,text,logo,signature,usename,monochrome,title,nsfw

三.取樣方法Sampling method + 計畫類型Schedule type

模型的取樣方法,來逼近結果,不同的取樣會有時間及圖片細節上的差異,可以多試不同的取樣方法,以下為常用的取樣方法

DPM++ 2M:預設方法,速度品質平衡
Eular a:取樣最快
DPM++SDE Karras:會添加一些元素或細節,速度較慢
UniPC:新版取樣方法,效果不錯
LCM:用LCM模型跑圖使用
DDIM、LMS、PLMS:舊版的方法,不要再用了

每個方法產出的結果差異其實不大,依模型給的建議設定即可

四.取樣步驟Sampling step

將潛空間用多少步去除雜訊產生圖片,數字越大細節越多,但數字太大反而有反效果

步驟大於10的圖片就無缺陷,預設20已有不錯表現,可照模型建議設定

五.高解析度修正(Hires. fix)

SD出的圖片大小有其限制,設定這個就是放大輸出圖片,用演算法放大輸出圖片,其設定相對容易理解,不另行說明

要花費相當長時間運算,建議初期不要開啟其功能,跑圖抽卡滿意後再開啟

六.Refiner精修模型

可選擇另一個精修模型+切換於Switch at數字,比如設定0.8,代表在SamplingStep 20 x Swith at 0.8 = 16步時,使用精修模型跑圖

蠻花時間跑圖的,通常不使用

七.寬高 + 產生批次 + 產生數量

寬高要為8的倍數,依模型大小或參照圖片設定,SD最低為512×512,SDXL最低為1024×1024
太小會超出圖片,太大會生出多頭怪圖
人像習慣為512×768或768×512

產生批次為:一次計算要跑多少張圖
產生數量為:要跑多少次計算

通常產生批次設為1,由產生數量來設定要幾張圖

八.提示詞相關性(CFG)及 隨機種子Seed

CFG Scale代表產出的圖跟提示詞的相關性,數字小代表不相關,數字大代表完全照提示詞產圖,一般為數字7,數字太大會讓品質銳減。

Seed是初期產生潛空間的雜訊分佈,相同的Seed值可產出近乎相同的圖片,-1代表隨機數字,通常用在產圖抽卡滿意後,固定Seed再來調整細節參數。

 

You may also like

我要留言