所以,我不想直接教大家所謂的萬(wàn)能模板,而是通過(guò)一個(gè)個(gè)實(shí)際場(chǎng)景教大家如何寫好 text prompt ,因?yàn)椴煌瑘?chǎng)景,你告知給模型的信息是不一樣的。
而且我認(rèn)為,知道為什么,遠(yuǎn)比知道怎么做更重要。當(dāng)你知道為什么后,遇到新的場(chǎng)景,你也能很好地解構(gòu)出 prompt 里需要什么,而不是盲目套模板。
最后,圖片場(chǎng)景有非常多,我會(huì)盡量分享一些大家日常工作中能用上的。希望能讓 AI 提高你的工作效率,而不是用完即棄的玩具。
Text Prompt 開(kāi)篇介紹一下 Midjourney V5 提升較大的 Stock Photo 場(chǎng)景。
Stock Photo 直譯為圖庫(kù)圖片。一般你能在一些圖庫(kù)網(wǎng)站上找到,這些圖片通常來(lái)自一些攝影師或設(shè)計(jì)師。部分圖片因?yàn)榘鏅?quán)的原因,如果你需要使用則需要付費(fèi)。
大部分使用 Stock Photo 的用戶都是一些設(shè)計(jì)公司,或者廣告公司。你應(yīng)該常常能看到這類圖片,比如最經(jīng)典的兩人握手照片:
我認(rèn)為 AI 生成圖片對(duì)圖片庫(kù)沖擊非常大,V5 版本基本上滿足了我的 Stock Photo 需求。
我認(rèn)為學(xué)習(xí)圖片類的 prompt,跟學(xué)習(xí)畫畫是類似的,最好的學(xué)習(xí)方法不是直接用模板。
而是拿真圖,或者別人生成的圖來(lái)臨摹。英文不好,也可以先寫中文,然后讓 ChatGPT 翻譯。當(dāng)你臨摹了幾張后,你就會(huì)慢慢搞懂如何做出類似的圖了。
拿上面的那個(gè)握手圖為例,我們仔細(xì)觀察上面那張圖,圖中元素有什么:
再歸納總結(jié)下,大概的信息:
這時(shí)候,我們就能嘗試寫一下 prompt 了(如果你覺(jué)得自己英文水平還不太行,也可以嘗試用翻譯軟件翻譯)。
stock photo of two Asian men in suits shaking hands,say goodbye in front of the main entrance of the office building,taken with Canon
Midjourney 生成的結(jié)果如下所示:
Emm ?? 好像跟我們的預(yù)期不一樣。不要慌,剛開(kāi)始用 Midjourney 一定會(huì)遇到這種問(wèn)題,重要的是多嘗試。
我們?cè)賮?lái)分析下 Midjourney 為何生成了這樣的圖片?復(fù)盤一下:
那我們調(diào)整下 prompt,增加焦點(diǎn)和背景虛化關(guān)鍵詞:
stock photo of two Asian men in suits shaking hands,say goodbye in front of the main entrance of the office building, focus on two hands, taken with Canon, background bokeh
再來(lái)看看生成的結(jié)果,結(jié)果好很多:
圖 1 和 圖4 基本滿足需求了,圖 2 和圖 3 裁剪一下,也能滿足我們的需求。不過(guò)需要注意,Midjourney 在人手的生成上暫時(shí)還有點(diǎn)問(wèn)題,細(xì)看圖 2和圖 4,其中有一個(gè)人的手有 6 個(gè)手指 ??,但我認(rèn)為未來(lái)應(yīng)該會(huì)修復(fù)。
那我們來(lái)總結(jié)一下 prompt ,該 prompt 分成以下幾個(gè)部分:
總結(jié)下之后,你是不是就總結(jié)出了一個(gè)模板了???
上述的案例,我還想教給各位第二個(gè)技巧:多試驗(yàn)。
圖片生成遇到不符合預(yù)期的情況,不要慌,分析問(wèn)題,然后使用控制變量法,一個(gè)個(gè)調(diào)整圖片,不要急,上面我寫的 prompt 還有一個(gè)地方,不知道各位有沒(méi)有注意,就是開(kāi)頭的 stock photo,試試將這兩個(gè)詞刪掉會(huì)怎樣?
two Asian men in suits shaking hands,say goodbye in front of the main entrance of the office building, focus on two hands, taken with Canon, background bokeh
生成結(jié)果也依然滿足需求,而且手指的數(shù)量也準(zhǔn)確了,說(shuō)明這個(gè) Stock Image 對(duì)模型的影響不是很大。
在 Stock Photo 場(chǎng)景里,還有一個(gè)非常厲害的技巧,這個(gè)方法我一開(kāi)始覺(jué)得不太適合教,因?yàn)檫@個(gè)對(duì) Stock Photo 庫(kù)影響太大了 ??
但本著工具中立的原則,并且這個(gè)技巧,其實(shí)在很多場(chǎng)景都能用(比如生成頭像等),所以還是覺(jué)得有必要教給大家。
各位一般用 Stock Photo 庫(kù)會(huì)遇到以下幾個(gè)問(wèn)題:
要解決這三個(gè)問(wèn)題,最好的方式就是讓 AI 改一改原來(lái)的圖片。讓 AI 改圖,只需要用到 Image2Image(或者叫 Blend) 功能即可。操作步驟如下:
one Afican-American hand and one Asian woman hand
生成的結(jié)果是這樣的,我在 prompt 里沒(méi)有提任何西裝,以及場(chǎng)景背景信息,就說(shuō)我要一個(gè)非裔的手,一個(gè)亞裔女性的手:
拋開(kāi)6 根手指的問(wèn)題,這個(gè)技巧是不是很高效?不過(guò)需要注意,blend 功能(這個(gè)后續(xù)教程會(huì)講到)更適合兩張圖融合,圖片+文字不是很穩(wěn)定,各位要有耐心,多測(cè)試一下。
更多建議: