Stable Diffusion, 好康相報順手教

Stable Diffusion-超新手使用指南第9.5篇-看卡通看到做出一個Lora篇

Lavc60.20.100

是說每天給自己放鬆的方式就是賴在床上看看Netflix,無聊看到大奧—一個講述日本某一時期瘟疫導致男性人口大幅減少,許多工作由女人開始代勞,包含建造、種田、經商,甚至是連將軍都出現了女將軍的一時代。

然後在第一集有個角色叫做杉木,他擔任男主角剛進大奧教他怎麼在大奧裡行事的學長角色,不知道為什麼我個人覺得這類配角雖然著墨雖少,卻很有魅力。因此決定挑戰這類配角,鏡頭不多,在有限的圖片資訊下如何去訓練出好的Lora就是我們今天第9.5章的課題了。

訓練圖集製作

與第九章一樣,我們要先針對角色蒐集足夠多的圖片才得以訓練Lora,最少最少是15張,30張是基礎,50~100張就可以很理想。基本圖片大小是512×512像素,但為了求更好的精度Lora,我習慣取768×768像素。

(選擇性)使用AI圖片放大工具增加圖片精度

像是使用偷客兔線上AI圖片放大工具,或是Topaz Gigapixel AI等工具,先將圖片放大,加強畫質後在使用第二個工具–Birme工具—來剪裁變成正方形768×768的圖片大小,

圖像預處理

接下來要對圖片做預處理,雖然有內建的打標工具,但內建的有點ㄎ一ㄤ,我們可以下載WD1.4打標器,這可以自動對圖片打上最契合的tag,打開WD1.4打標器,在目錄輸入圖片集的路徑,接著點擊”反推”

製作Lora有很多步驟和細節,但處理方式因人而異,如我準備好的杉木學長圖片有30張,打標後會產生30個txt文字檔,裏頭全是針對該圖片的tag。

我們現在要利用sublime文字編輯器,來一口氣變更這30個txt文字檔的tag,因為Lora通常需要一個觸發詞,這在未來使用上可以大大增加方便性,我們框取”1boy,”,這是這30個txt每個都有的提示詞,

我將”1boy,”替換成”1boy, Shamu,”然後一次替換30個txt並存檔。

講述自己在大奧的過去到現在給男主角的杉木學長,聽到學長被侵犯傻眼貓咪的主角(誤)

接著下載”Lora訓練基礎魔術包”,裡頭都已經建立好訓練該有的資料夾以及訓練係數設定集,Lora訓練使用Kohya_SS訓練器,裡頭的係數可說是非常複雜,稍微條錯你的模型訓練可能就報銷了,因此我先準備好給一般等級硬體,和6G以下顯卡的設定集給大家使用。這樣也節省大家的時間和降低Lora訓練難度。

在image方面,雖然網路教學很多都說這訓練步數要用算的,但本人就是任性喜歡每張圖都給他訓練100布,故裝著30張杉木學長的圖片和30個txt文字檔的資料夾,我將之命名為”100_Shamu”,這樣等等Kohya_SS訓練器能自己識別要訓練多少步數。

接著看你顯示卡有多少VRAM,6~8G選LowVRAM,12~24G選Basic,這樣訓練的係數就直接調整好了,省下不少時間。而Source model,選擇runwayme/stable-diffusiom-v-1-5,使用官方發佈的1.5模型,這樣Lora會有可以配合其他大部分模型較好的兼容性。當然你有時間也可以試試看用官方以外的大模型來當作Source model來訓練看看成果會變怎樣。

接著就是依據你訓練的步數進行等待…

順道看其實是美男子但不覺得自己是美男子的杉木學長被將軍捉住(誤)

發表迴響