Stable Diffusion-超新手使用指南第9.5篇-看卡通看到做出一個Lora篇

是說每天給自己放鬆的方式就是賴在床上看看Netflix，無聊看到大奧—一個講述日本某一時期瘟疫導致男性人口大幅減少，許多工作由女人開始代勞，包含建造、種田、經商，甚至是連將軍都出現了女將軍的一時代。

然後在第一集有個角色叫做杉木，他擔任男主角剛進大奧教他怎麼在大奧裡行事的學長角色，不知道為什麼我個人覺得這類配角雖然著墨雖少，卻很有魅力。因此決定挑戰這類配角，鏡頭不多，在有限的圖片資訊下如何去訓練出好的Lora就是我們今天第9.5章的課題了。

訓練圖集製作

與第九章一樣，我們要先針對角色蒐集足夠多的圖片才得以訓練Lora，最少最少是15張，30張是基礎，50~100張就可以很理想。基本圖片大小是512×512像素，但為了求更好的精度Lora，我習慣取768×768像素。

(選擇性)使用AI圖片放大工具增加圖片精度

像是使用偷客兔線上AI圖片放大工具，或是Topaz Gigapixel AI等工具，先將圖片放大，加強畫質後在使用第二個工具–Birme工具—來剪裁變成正方形768×768的圖片大小，

圖像預處理

接下來要對圖片做預處理，雖然有內建的打標工具，但內建的有點ㄎ一ㄤ，我們可以下載WD1.4打標器，這可以自動對圖片打上最契合的tag，打開WD1.4打標器，在目錄輸入圖片集的路徑，接著點擊”反推”

製作Lora有很多步驟和細節，但處理方式因人而異，如我準備好的杉木學長圖片有30張，打標後會產生30個txt文字檔，裏頭全是針對該圖片的tag。

我們現在要利用sublime文字編輯器，來一口氣變更這30個txt文字檔的tag，因為Lora通常需要一個觸發詞，這在未來使用上可以大大增加方便性，我們框取”1boy,”，這是這30個txt每個都有的提示詞，

我將”1boy,”替換成”1boy, Shamu,”然後一次替換30個txt並存檔。

講述自己在大奧的過去到現在給男主角的杉木學長，聽到學長被侵犯傻眼貓咪的主角(誤)

接著下載”Lora訓練基礎魔術包”，裡頭都已經建立好訓練該有的資料夾以及訓練係數設定集，Lora訓練使用Kohya_SS訓練器，裡頭的係數可說是非常複雜，稍微條錯你的模型訓練可能就報銷了，因此我先準備好給一般等級硬體，和6G以下顯卡的設定集給大家使用。這樣也節省大家的時間和降低Lora訓練難度。

在image方面，雖然網路教學很多都說這訓練步數要用算的，但本人就是任性喜歡每張圖都給他訓練100布，故裝著30張杉木學長的圖片和30個txt文字檔的資料夾，我將之命名為”100_Shamu”，這樣等等Kohya_SS訓練器能自己識別要訓練多少步數。

接著看你顯示卡有多少VRAM，6~8G選LowVRAM，12~24G選Basic，這樣訓練的係數就直接調整好了，省下不少時間。而Source model，選擇runwayme/stable-diffusiom-v-1-5，使用官方發佈的1.5模型，這樣Lora會有可以配合其他大部分模型較好的兼容性。當然你有時間也可以試試看用官方以外的大模型來當作Source model來訓練看看成果會變怎樣。