|
(一)安裝 Stable Diffusion 官方版本安裝: (一)模型選擇 在 Stable Diffusion WebUI 界面中,模型選擇是非常關(guān)鍵的一步。 點(diǎn)擊界面中的 “模型” 下拉菜單,會展示出你已經(jīng)下載并導(dǎo)入到系統(tǒng)中的所有模型。 二次元風(fēng)格:如果你想要生成二次元風(fēng)格的圖片,像 “Anything V4.5”“Waifu Diffusion” 等模型都是不錯(cuò)的選擇?!癆nything V4.5” 是一款通用性很強(qiáng)的二次元模型,能夠生成各種類型的二次元角色和場景,風(fēng)格多樣,無論是可愛的萌系角色還是酷炫的戰(zhàn)斗場景都能輕松駕馭?!癢aifu Diffusion” 則專注于生成二次元美少女形象,對于角色的面部表情、服裝細(xì)節(jié)等方面表現(xiàn)出色,生成的圖片具有濃郁的二次元風(fēng)格。 真實(shí)系風(fēng)格:若追求真實(shí)感強(qiáng)的圖片,“Realistic Vision”“Chilloutmix” 等模型值得一試?!癛ealistic Vision” 在生成人物、風(fēng)景等真實(shí)場景方面表現(xiàn)優(yōu)秀,能夠高度還原現(xiàn)實(shí)世界的光影和質(zhì)感,生成的圖片幾乎可以以假亂真?!癈hilloutmix” 則擅長生成逼真的人物肖像,對于人物的面部特征、皮膚紋理等細(xì)節(jié)處理得非常細(xì)膩,同時(shí)也能很好地表現(xiàn)出人物的情感和氣質(zhì)。
正向關(guān)鍵詞:用于描述你期望生成的圖像內(nèi)容。在 “提示詞(Prompt)” 輸入框中,以英文逗號分隔輸入關(guān)鍵詞。例如,如果你想生成一幅在櫻花樹下的二次元少女形象,可以輸入 “a cute anime girl under the cherry blossom tree, long hair, big eyes, wearing a pink dress”(一個(gè)可愛的二次元少女在櫻花樹下,長發(fā),大眼睛,穿著粉色連衣裙)。 關(guān)鍵詞的描述越詳細(xì)、準(zhǔn)確,生成的圖像就越接近你的預(yù)期。同時(shí),要注意關(guān)鍵詞的順序,越靠前的關(guān)鍵詞權(quán)重越高,對生成結(jié)果的影響也就越大。 反向關(guān)鍵詞:在 “負(fù)面提示詞(Negative prompt)” 輸入框中輸入不希望在生成圖像中出現(xiàn)的內(nèi)容。例如,在使用 Stable Diffusion 生成二次元圖片時(shí),為了確保生成的圖片質(zhì)量上乘且符合預(yù)期,以下這些反向提示詞能有效規(guī)避各種不理想的效果,提高生成作品的美觀度和專業(yè)性:blurry, low quality, grainy, pixelated, disfigured, malformed limbs, extra limbs, missing limbs, realistic, photorealistic, anime style mistake, off - model, messy background, cluttered scene, unrelated background, text or watermark, copyright symbol, ugly(模糊、低質(zhì)量、有顆粒感、像素化、畸形、肢體畸形、多余肢體、肢體缺失、寫實(shí)、逼真、動漫風(fēng)格錯(cuò)誤、走形、雜亂背景、擁擠場景、不相關(guān)背景、文字或水印、版權(quán)符號、丑陋)。 關(guān)鍵詞的描述越詳細(xì)、準(zhǔn)確,生成的圖像就越接近你的預(yù)期。同時(shí),要注意關(guān)鍵詞的順序,越靠前的關(guān)鍵詞權(quán)重越高,對生成結(jié)果的影響也就越大。 在 Stable Diffusion 等文本生成圖像工具中,關(guān)鍵詞加重和減少權(quán)重有以下幾種常見方法:
符號用法:注意必須是英文格式的符號 小括號:使用小括號可以提升關(guān)鍵詞權(quán)重 10%,最多可疊加三層。例如(beautiful girl)會比beautiful girl的權(quán)重更高,((beautiful girl))權(quán)重又比(beautiful girl)更高,(((beautiful girl)))則是進(jìn)一步提升權(quán)重。 大括號:大括號可提升關(guān)鍵詞權(quán)重 5%,如{handsome boy}會使 “handsome boy” 這個(gè)關(guān)鍵詞的權(quán)重有所提升。 (2)減少權(quán)重: 中括號[]用于降低關(guān)鍵詞權(quán)重 10%,同樣最多疊加三層。比如[ordinary scene]會使 “ordinary scene” 的權(quán)重降低,[[ordinary scene]]降權(quán)程度更大,[[[ordinary scene]]] 降權(quán)幅度進(jìn)一步增加。 (3)控制生效時(shí)間:將關(guān)鍵詞放入中括號并添加生效時(shí)間段比例,可控制該關(guān)鍵詞特征在圖片中的比例或權(quán)重。例如[關(guān)鍵詞:0.5]表示該關(guān)鍵詞在生成過程的前 50% 時(shí)間內(nèi)生效,后半段時(shí)間不生效,以此來靈活調(diào)整關(guān)鍵詞對生成結(jié)果的影響程度,進(jìn)而達(dá)到微調(diào)權(quán)重的目的。 (4)關(guān)鍵詞位置 :一般來說,越靠前的關(guān)鍵詞權(quán)重越高。比如a, b, c這樣的關(guān)鍵詞順序,a 的權(quán)重相對b和c會更高一些,但系統(tǒng)通常默認(rèn)最多 75 個(gè)單詞,所以要合理安排關(guān)鍵詞順序和數(shù)量來突出重點(diǎn)。 使用插件或特定語法:一些工具可能支持特定的插件或語法來更精細(xì)地調(diào)整權(quán)重。比如某些擴(kuò)展插件可能允許用戶以更復(fù)雜的表達(dá)式來設(shè)置權(quán)重,像weight(a:1.5, b:0.8)表示將關(guān)鍵詞a的權(quán)重設(shè)為 1.5,b的權(quán)重設(shè)為 0.8 等。 下面我們演示一下,單詞前后順序?qū)D片的影響: 正向提示詞: girl,cute,,long hair,big eyes,a pink dress,under THE cherry blossom tree,反向提示詞: blurry,(((The proportion of characters and background is not harmonious))),low quality,disfigured,malformed limbs,extra limbs,missing limbs,realistic,photorealistic,anime style mistake,off - model,messy background,cluttered scene,unrelated background,text or watermark,copyright symbol,ugly,參數(shù):Steps: 20, Sampler: Euler a, CFG scale: 7, Size: 512x512, Model hash: 7f96a1a9ca, Clip skip: 2, ENSD: 31337
正向提示詞:cherry blossom tree,a girl,cute,Look to one side,long hair,blue eyes, eyes,Beautiful,a pink dress反向提示詞: blurry,low quality,disfigured,malformed limbs,extra limbs,missing limbs,photorealistic,unrelated background,text or watermark,copyright symbol,ugly,參數(shù):Steps: 20, Sampler: Euler a, CFG scale: 5, Size: 768x512, Model hash: 7f96a1a9ca, Clip skip: 2, ENSD: 31337
【我們明顯可以看到:第一張圖中,提示詞a gril 在前面,人物占比會大很多。第二張圖中,cherry blossom tree 放在前面,櫻花樹和小女孩比例在畫面中就看起來比較協(xié)調(diào)了?!?/strong>
(三)參數(shù)調(diào)整 Euler:這是一種最簡單快速的采樣方法,適合在需要快速生成初步效果,對圖像質(zhì)量要求不是特別高的情況下使用。例如,在快速構(gòu)思創(chuàng)意、探索不同風(fēng)格時(shí),可以先使用 Euler 采樣方法快速生成一些草圖,然后根據(jù)草圖的效果再進(jìn)行進(jìn)一步的優(yōu)化。 Euler a:該采樣方法能夠在較少的步數(shù)下產(chǎn)生多樣的結(jié)果,但步數(shù)過高時(shí)效果提升不明顯。比如,在生成一些具有創(chuàng)意性、隨機(jī)性要求較高的圖像時(shí),可以嘗試使用 Euler a 采樣方法,通過調(diào)整步數(shù)來控制結(jié)果的多樣性。 DDIM:收斂速度較快,但效率較低,在重繪圖像時(shí)效果較好。當(dāng)你對已經(jīng)生成的圖像進(jìn)行局部修改或重新生成時(shí),DDIM 采樣方法可以更快地達(dá)到收斂,節(jié)省生成時(shí)間。 LMS:是 Euler 的衍生采樣方法,大約在 30 步左右能夠得到穩(wěn)定的結(jié)果。它在生成圖像的穩(wěn)定性方面表現(xiàn)較好,適用于對圖像質(zhì)量要求較高,需要生成較為穩(wěn)定、精細(xì)圖像的場景。 PLMS:能夠更好地處理神經(jīng)網(wǎng)絡(luò)奇異性問題,生成的圖像質(zhì)量相對較高。在生成一些復(fù)雜場景或?qū)D像細(xì)節(jié)要求較高的圖像時(shí),PLMS 采樣方法可以發(fā)揮出較好的效果。 DPM2:改進(jìn)了 DDIM 采樣方法,速度快且效果好,但在調(diào)試提示詞時(shí)速度較慢。如果你的提示詞已經(jīng)確定,只需要快速生成高質(zhì)量的圖像,DPM2 是一個(gè)不錯(cuò)的選擇。 UniPC:在平面、卡通風(fēng)格的圖像生成方面表現(xiàn)出色,速度快且效果好,非常推薦使用。無論是生成二次元卡通形象還是平面插畫風(fēng)格的圖像,UniPC 采樣方法都能生成令人滿意的結(jié)果。
2、迭代步數(shù):在 “Sampling Steps” 框中設(shè)置迭代步數(shù)。從隨機(jī)高斯噪聲開始,模型通過不斷降噪來生成目標(biāo)圖像。步數(shù)太少,圖像可能不完整或質(zhì)量低,例如,設(shè)置為 5 步時(shí),生成的圖像可能只是一些模糊的色塊,無法清晰地呈現(xiàn)出你想要的內(nèi)容;步數(shù)太多,生成時(shí)間會變長,而且邊際收益遞減,比如設(shè)置為 100 步,雖然圖像質(zhì)量可能會有一定提升,但提升的幅度并不明顯,反而會耗費(fèi)大量的時(shí)間和計(jì)算資源,或者反而會出現(xiàn)顏色過于飽和厚重 ,邊緣過于銳化等不利于圖像表達(dá)的效果。一般來說,將迭代步數(shù)設(shè)置為 20 - 30 步是一個(gè)比較合適的范圍,能夠在生成時(shí)間和圖像質(zhì)量之間取得較好的平衡。 3、提示詞相關(guān)度:在 “CFG Scale” 框中調(diào)整該參數(shù)。它控制著圖像與提示詞的匹配程度,值越高,圖像就越接近提示詞所描述的內(nèi)容,但同時(shí)也可能會降低圖像的質(zhì)量。例如,當(dāng) CFG Scale 設(shè)置為 3 時(shí),生成的圖像可能與提示詞的匹配度較低,會出現(xiàn)一些與預(yù)期不符的元素;而當(dāng)設(shè)置為 15 時(shí),雖然圖像與提示詞的匹配度很高,但可能會出現(xiàn)圖像過于生硬、缺乏自然感的問題。通常將 CFG Scale 設(shè)置為 7 - 11 之間,可結(jié)合更多采樣步驟來平衡匹配度和圖像質(zhì)量。 4、批次:“總批次數(shù)” 決定了每次生成圖像的組數(shù),“單批數(shù)量” 決定了同時(shí)生成的圖像數(shù)量。增加單批數(shù)量可以提高生成效率,但需要更多的顯存支持。如果你的電腦顯存不足 12G,建議將 “單批數(shù)量” 保持為 1,以避免出現(xiàn)顯存不足導(dǎo)致程序崩潰的情況。例如,當(dāng)你需要生成一組不同風(fēng)格的圖像來進(jìn)行對比選擇時(shí),可以適當(dāng)增加總批次數(shù);而在對顯存有限的情況下,為了保證生成過程的穩(wěn)定,要控制單批數(shù)量。 5、尺寸(high,width):在 “尺寸” 框中指定生成圖像的尺寸,如 512×512、1024×1024 等。出圖尺寸太寬可能會出現(xiàn)多個(gè)主體,而且 1024 以上尺寸的結(jié)果可能不理想,因?yàn)槌叽邕^大對計(jì)算資源的要求更高,同時(shí)模型在處理大尺寸圖像時(shí)可能會出現(xiàn)一些問題。推薦使用小尺寸分辨率加高清修復(fù)的方式來生成高質(zhì)量的圖像。例如,先以 512×512 的尺寸生成圖像,然后通過高清修復(fù)功能將圖像放大到更高的分辨率,這樣既能保證生成速度,又能獲得較好的圖像質(zhì)量。 例如:圖三和圖二,提示詞相同,但由于給的畫布尺寸不同 ,體現(xiàn)出的是完全不同的風(fēng)格和最終效果。因此,我們要根據(jù)需要體現(xiàn)的內(nèi)容,給出長寬比例和畫布大小,以及分辨率等。 正向提示詞:cherry blossom tree,a girl,cute,long hair,big eyes,Beautiful,a pink dress,反向提示詞: blurry,low quality,disfigured,malformed limbs,extra limbs,missing limbs,realistic,photorealistic,anime style mistake,off - model,messy background,unrelated background,text or watermark,copyright symbol,ugly,參數(shù):Steps: 20, Sampler: Euler a, CFG scale: 5, Size: 512x768, Model hash: 7f96a1a9ca, Clip skip: 2, ENSD: 31337
7、高清修復(fù):勾選 “Hires. fix” 啟用高清修復(fù)功能。選擇合適的放大算法,如 Latent、ESRGAN_4x、SwinR 4x 等。Latent 算法在放大圖像的同時(shí)能夠較好地保留圖像的細(xì)節(jié)和風(fēng)格;ESRGAN_4x 是一種基于深度學(xué)習(xí)的超分辨率算法,能夠有效地提高圖像的清晰度和細(xì)節(jié)表現(xiàn);SwinR 4x 則在處理復(fù)雜場景和紋理方面表現(xiàn)出色。設(shè)置 “高分迭代步數(shù)” 和 “重繪幅度”,“高分迭代步數(shù)” 決定了在高清修復(fù)過程中的迭代次數(shù),影響圖像的質(zhì)量;“重繪幅度” 控制著高清修復(fù)時(shí)對原始圖像的修改程度,值越大,修改的程度就越大。 完成上述所有設(shè)置后,點(diǎn)擊 “生成” 按鈕,Stable Diffusion 會根據(jù)你輸入的提示詞和設(shè)置的參數(shù)開始生成圖片。在生成過程中,界面上會有進(jìn)度條顯示生成的進(jìn)度,你需要耐心等待生成完成。生成完成后,圖片會顯示在界面的輸出區(qū)域。 

(五)結(jié)果調(diào)整與優(yōu)化 如果生成的圖片不符合預(yù)期,可以返回調(diào)整關(guān)鍵詞、參數(shù)等。例如,如果生成的圖像與你期望的風(fēng)格不一致,可以調(diào)整正向關(guān)鍵詞和反向關(guān)鍵詞;如果圖像的質(zhì)量不理想,可以調(diào)整采樣方法、迭代步數(shù)、CFG Scale 等參數(shù);如果圖像的尺寸不合適,可以重新設(shè)置尺寸或使用高清修復(fù)功能進(jìn)行調(diào)整。通過不斷地調(diào)整和嘗試,直到得到滿意的結(jié)果。 【總結(jié)一下】 1、對于創(chuàng)作不同風(fēng)格的二次元作品的通用格式,你可以根據(jù)具體需求進(jìn)行修改和調(diào)整: 幻想冒險(xiǎn)風(fēng):masterpiece, high - quality, best quality, (1boy:1.1), ((wearing a dark green cloak)), with messy ((brown hair)), determined ((golden eyes)), holding a glowing ((magic staff)), standing in a mysterious ((ancient forest)), surrounded by floating ((magic orbs)), (monsters lurking in the shadows:0.8), dynamic lighting, epic fantasy atmosphere, intricate details, art by Yoshitaka Amano, art by Tony DiTerlizzi杰作,高品質(zhì),最佳品質(zhì),(1 個(gè)男孩:1.1),((穿著深綠色斗篷)),有著凌亂的((棕色頭發(fā))),堅(jiān)定的((金色眼睛)),手持一根發(fā)光的((魔法權(quán)杖)),站在神秘的((古老森林))中,周圍環(huán)繞著漂浮的((魔法寶珠)),((陰影中有怪物潛伏:0.8)),動態(tài)光影,史詩般的奇幻氛圍,復(fù)雜精細(xì)的細(xì)節(jié),吉田明彥的藝術(shù)風(fēng)格,托尼?迪特里齊的藝術(shù)風(fēng)格。
日常校園風(fēng):high - quality, best quality, (1girl:1.2), ((standing in a school courtyard)), long ((pink hair)), bright ((blue eyes)), wearing a classic ((school uniform)) with a red bow tie, a gentle smile on her face, surrounded by blooming ((cherry blossoms)), soft sunlight filtering through the leaves, cute and youthful atmosphere, detailed illustrations, art by Krenz Cushart, art by WLOP, art by Greg Rutkowski高質(zhì)量,最佳質(zhì)量,(1 個(gè)女孩:1.2),((站在學(xué)校庭院中)),長長的((粉色頭發(fā))),明亮的((藍(lán)色眼睛)),穿著帶有紅色領(lǐng)結(jié)的經(jīng)典((校服)),臉上帶著溫柔的微笑,周圍是盛開的((櫻花)),柔和的陽光透過樹葉灑下,可愛而青春的氛圍,詳細(xì)的插圖,由 Krenz Cushart 創(chuàng)作,由 WLOP 創(chuàng)作,由 Greg Rutkowski 創(chuàng)作。
古風(fēng)仙俠風(fēng):ultra - high - definition, masterpiece, (1girl:1.3), ((floating in the air)), long ((black hair)), elegant ((purple eyes)), wearing a flowing ((white fairy dress)) with golden embroidery, holding a ((jade flute)), surrounded by swirling ((clouds)), blooming ((lotus flowers)) floating around, a gentle breeze blowing her hair, serene and ethereal atmosphere, traditional Chinese art style, detailed brushstrokes, art by Jinshan Tang, art by Li Gonglin(超高清,杰作,(1 個(gè)女孩:1.3),((漂浮在空中)),長長的((黑色頭發(fā))),優(yōu)雅的((紫色眼睛)),穿著帶有金色刺繡的飄逸((白色仙女裙)),手持((玉笛)),周圍環(huán)繞著旋轉(zhuǎn)的((云)),盛開的((蓮花))漂浮在周圍,微風(fēng)拂動她的頭發(fā),寧靜空靈的氛圍,中國傳統(tǒng)藝術(shù)風(fēng)格,筆觸細(xì)膩,金山唐的藝術(shù)作品,李公麟的藝術(shù)作品。)
機(jī)甲戰(zhàn)斗風(fēng):high - quality, best quality, (1boy:1.2), inside a huge ((red and blue mecha)), with short ((black hair)), fierce ((cyan eyes)), operating the mecha's controls, the mecha has sharp edges and powerful weapons, in the middle of a ((futuristic city battlefield)), with explosions and flying debris all around, dynamic poses, intense battle atmosphere, high - tech details, art by Hajime Katoki, art by Ilya Kuvshinov(高品質(zhì),最佳品質(zhì),(1 個(gè)男孩:1.2),在一個(gè)巨大的((紅藍(lán)相間的機(jī)甲))內(nèi),有著短的((黑色頭發(fā))),兇猛的((青色眼睛)),正在操作機(jī)甲的控制裝置,機(jī)甲有鋒利的邊緣和強(qiáng)大的武器,在一個(gè)((未來城市戰(zhàn)場))中央,周圍到處是爆炸和飛濺的碎片,動態(tài)的姿勢,激烈的戰(zhàn)斗氛圍,高科技細(xì)節(jié),由 Hajime Katoki 和 Ilya Kuvshinov 創(chuàng)作的藝術(shù)作品。)
萌系治愈風(fēng):masterpiece, high - quality, (1girl:1.1), sitting on a grassy ((hilltop)), with short ((blonde hair)), big ((sparkling green eyes)), wearing a cute ((yellow sundress)), holding a small ((white rabbit)), surrounded by colorful ((butterflies)), a warm sunset in the background, soft and warm colors, cute and heart - warming atmosphere, detailed illustrations, art by ReDrop, art by ennki haikara(杰作,高品質(zhì),(1 個(gè)女孩:1.1),坐在長滿青草的(山頂)上,留著短(金色頭發(fā)),有大大的(閃爍的綠色眼睛),穿著可愛的(黃色太陽裙),抱著一只?。ò淄茫車俏孱伭模ê?,背景是溫暖的夕陽,柔和溫暖的色彩,可愛而溫馨的氛圍,細(xì)節(jié)豐富的插畫,作者 ReDrop,作者 ennki haikara。)
2、創(chuàng)作二次元時(shí)的通用反向提示詞參考: blurry, low quality, grainy, pixelated, disfigured, malformed limbs, extra limbs, missing limbs, realistic, photorealistic, anime style mistake, off - model, messy background, cluttered scene, unrelated background, text or watermark, copyright symbol, ugly。(模糊、低質(zhì)量、有顆粒感、像素化、畸形、四肢畸形、多肢、缺肢、寫實(shí)、逼真、動漫風(fēng)格錯(cuò)誤、走形、雜亂背景、擁擠場景、不相關(guān)背景、文字或水印、版權(quán)符號、丑陋) 3、在創(chuàng)作的過程中充分考慮以下幾個(gè)要素: 合理選擇底膜,比如寫實(shí)型,需選擇寫實(shí)型底膜;二次元需選擇二次元底膜;當(dāng)然別忘了,還有萬像熔爐的anything系列。 合理使用正向、反向提示詞; 根據(jù)采樣器特性,和各種參數(shù)對結(jié)果的影響,進(jìn)行合理的調(diào)整和嘗試,不斷提高作品的質(zhì)量和效果。
通過以上詳細(xì)的教程,相信你應(yīng)該能夠熟練地使用Stable Diffusion進(jìn)行文生圖操作,創(chuàng)造出各種精彩的圖像作品了。在實(shí)際操作過程中,我們只要多嘗試不同的參數(shù)和設(shè)置,積累經(jīng)驗(yàn),一定能夠不斷提高生成圖像的質(zhì)量和效果! 參考資料:松澤Stable Diffusion知識庫,互聯(lián)網(wǎng)
一星期的最后的時(shí)間。原指星期六,現(xiàn)也指星期五。
|