為什麼別人的 AI 繪圖都比較好玩?Midjourney 新手詠唱技巧教學

林育正 Riven
10 min readFeb 14, 2023

--

近日知名作家、電視主持人吳淡如在 Facebook 專頁上,分享了學習電腦繪圖的第一張作品,名為櫻花貓少女,並加上喜歡就送給你的文案,在臉書和網路上引起相當高的討論。

除了各家新聞媒體都有即時報導外,連 Wiki 維基百科頁面都被改成:電繪藝術家(但其實作品都不是出自於本人之手)、逆風封鎖家、留言刪除大師、discord繪圖程式開發工程師,吉人家。

許多網友都紛紛到貼文底下留言討論電腦繪圖和 AI 繪圖之間的差異與定義,也讓 Midjourney 再次拓展了討論圈子,虧淡如姐的福現在有更多人都對 AI 人工智慧電腦繪圖有了初步認識。

自己當 Midjourney 課金玩家快十個月了,剛好前陣子教課需要,有稍微整理了一些我對人工智慧詠唱生成的想法和心得,今天來分享一些可能比較新手向,但可以幫助到剛玩的使用者的咒文詠唱方法們,希望讓大家都可以和淡如姐一樣,都能學習電腦 (AI )繪圖的的技巧。

YouTube 有畫面和字幕字卡搭配觀看體驗較好 — https://youtu.be/OhLofsBTrHs

剛開始進入 Midjourney 的 Discord Server 後,找到 Newbies 開頭房間,點擊 chatbot 頭像傳送訊息,就可以進入私訊,不用在大群人擠人等算圖。

接著可以到 Midjourney 官網的 Community Feed 翻想要的參考範例,展開更多後選擇 Copy > Full Command,再到 Discord 輸入指令 /imagine 貼上生成,就可以拿到類似的圖。

關於咒文這是我初步的理解假設:

AI 繪圖詠唱整體來說有這個公式(或說是文法)

「主體 + 風格 + 渲染 + 指令」

一段完整的描述詞會像是這樣:

A kawaii teenage japanese girl, full of fashion, white vest pajamas, large beautiful vivid anime doe eyes, illustrative anime style, hyper detailed light watercolor art by Charlie bowater & Yaegashi Nan & Taro Kagawa, epic composition, Dynamic pose, curvaceous, sharp focus, perfect shading, deep lighting, rim lighting, super details, cinematic lighting, half body, Medium Shot — ar 3:2

大多數咒文看起來都落落長,但拆開來看就很好瞭解。

第一個是主體,可以是很簡短的一個主詞,並加上形容詞,或是將你腦海中想像的場景完整描述出來。

比如說想要科幻感一點就能補上像是賽伯格(cyborg)、半機械化(semi-mechanized)、巨大的(Gigantic)。

那如果想要畫人物,就可以比如說動漫感的女角(Anime style, girl),加上貓耳朵(cat ears)、奇幻的眼睛(odd eyes)、左眼白瞳(left eye white)、右眼橘瞳(right eye orange)、一頭長髮(long hair)、再指定微捲(curly hair),並染個灰色(gray hair)搭個橘色內側挑染(yellow innter colore)。

加上像是打電動等正在發生的動作(playing computer games)諸如此類的細節,盡量交代清楚,就可以下圖打電動的動漫少女圖。

也要記得都用英文逗號,加上一半形空格來區隔開,並且是用英文(中文偶爾可行但不是那麼好用)。

主詞這邊有個隱藏小招,在名詞後面加上兩個冒號 :: 可以去更改權重,原本預設都是 1;可以去控制畫面物件的個別佔比。

object::1, object::5

然後一些關鍵字可以在畫面細節幫上忙,比如說粒子效果(particles)、液體(Liquid) 、煙霧(Smoke)之類。

或是正在發生的事情:爆炸(exploding)、破碎(broken)、故障(glitch)等等。

再來是風格的部分,這邊可以用上以前我們藝術課本學到的,像是文藝復興(Renaissance)、浮世繪(Ukiyo-e)、普普藝術(Pop Art)等等的經典風格。

或是一些歷史上有名文化和運動,超現實主義(Surrealism)、超寫實主義(Hyperrealism)或反烏托邦(Dystopia)。

而如果是想仿名人大師的作品,比如說想做建築,也可以放柯比意(Le Corbusier)、貝聿銘(Ieoh Ming Pei),或當代的隈研吾(Kengo Kuma)、伊東豊雄(Toyo Ito)。

或是你不想像是歷史課一樣那麼嚴肅,也可用自己喜歡的動漫或卡通關鍵字,像是新海誠(Shinkai Makoto)、宮崎駿(吉卜力工作室:Ghibli),或是寶可夢(Pokémon)也都很好用。

也可以是普遍能理解的動畫風格:皮克斯(Pixar)、夢工廠(Dreamworks)、迪士尼(Disney)。

更可以是遊戲畫面風格感,比如說曠野之息(用 Zelda 效率更好)、上古捲軸(Elder Scrolls;會有一堆龍)或英雄聯盟(League of Legends;拿來做造型立繪不錯)也行。

那除了風格以外,如何去渲染這張圖也是可以動的選擇,有個小技巧是加上使用的建模或設計軟體,也可以達到類似的渲染效果,像是虛幻引擎(Unreal Engine), C4D(Maxon Cinema 4D)。

或是有個做法也滿實用的,就是加上某個指定網站,用 trending on 加上 Dribble, Behance 或 Pixiv 等大型且行之有年的藝術與設計作品網站。(不過身為設計師,還是要提醒可以多關注 AI 對於智慧產權的議題。)

那如果是對於光和畫面質感比較要求的話,想要生成真實攝影感的照片,則可以用 photography 或 photoreal。

對攝影更講究一點的朋友,也能試試柔光(soft lights)和體積光(volumetric light)。

想要電影感一點的可以用高細節(high detail)、高品質(hyper quality)、電影鏡頭(cinematic shot)。

下指令

最後是指令,這個可以說是要當高手必會的部分,在描述詞的最後加上兩個連字號(hyphen)就可以了。

最常用到的指令有:

-- ar
可以指定生成圖片為 9:16 或 2:3 之類的數值比例(記得逗號前後和中間都要空格)

-- no
可以指定不要什麼東西或顏色
例如 - no blue 或是 - no human,可以拿來可以用來剔除不必要的元素。

-- V4
現在可以透過 /setting 設定內建了
不過只有 3:2 或 2:3 的比例能用;要指定其他比例需降級為 V3 以下。
(V4 是 Midjourney Version 4,為目前最新最好的運算版本)

-- niji
指令現在可以召喚 nijijourney 的 bot
對於日式二次元動漫的運算和手部渲染有很大幅度的最佳化。

-- video
可以記錄下 AI 運算過程的影片,但 V4 不適用。
同樣的以前常玩的 - test 和 - creative 目前 V4 也無效。

人工智慧生成的隨機性

不過這邊還是要曉得 AI 繪圖一個重點,就是「隨機性」

這些圖產出的原理,來自既有作品的重新理解、解構、分析,再重新組合而成。

而每次 AI 計算渲染出來的結果,都不會相同,也就是說即便我們使用相同的描述詞,重複貼上、反覆生成,也不會有完全一樣的結果。

反過來說,一幅優秀的 AI 繪圖,也不是一次詠唱就會蹦出來的,背後可能會經過幾十次,甚至上百次反覆實驗與調教,才能得到一張滿意的圖。

而說到調教,目前版本的 Midjourney 在送出指令後,等待一下渲染出圖,會有 U1 到 U4,和 V1 到 V4 的選項。

1, 2, 3, 4 對應到產生的四張圖片順時針順序,U 是指以這張為基礎去做最佳化,V 則是去做變化,會重新 render 新的四張圖。

如果不想看到這個結果,是沒辦法刪除訊息,但這時候可以用加入反應送它一個 ❌ 就能移除訊息了。

補充 Midjourney chatbot 基礎指令

/imagine 算圖
/info 個人資訊
/invite 產生邀請連結
/ideas 取得隨機點子
/help 指導與幫助
/subscribe 訂閱方案
另外還有像 /show 可以舊圖重算
到 Midjourney 網站找到自己以前算過的圖,複製 Job ID 貼過來就可以了。
還有如果想要給參考圖,只要上傳一張圖片,然後右鍵複製連結
在詠唱的指令 /imagine 後貼上,也可以搭配前面講的描述詞
Midjourney 就會把這張圖加進運算裡,只是說結果的參考程度就非常吃人品了。

後記

試著回想一下,最初對於 AI 技術的理解是什麼時候?是刀劍神域的裏世界嗎,還是電影銀翼殺手、雲端情人,或是影集西方極樂園或黑鏡呢。

對我來說現階段的 AI 繪圖,能夠得到許多意想不到的靈感,就像當年打敗世界頂尖棋士的 AlphaGo,在下棋時總有很多很意料之外且不尋常的黃金一手。 而 AlphaGo 的爸爸 — — 也就是曾被 World Wide Web 創辦人 Timothy John Berners-Lee 稱讚為「地球上最聰明的人」的人工智慧公司 DeepMind 創辦人 Demis Hassabis 也說過 AI 打破了人類圍棋 3000 年來的盲點。

雖然說現在 AI 繪圖開始出現一些爭議,比如說用 AI 繪圖產生的作品能不能說是自己畫嗎,以及取樣自現有繪師的作品算不算抄襲,這些問題確實都是存在且有討論必要的,放上網的數位資產被當作資料庫取用,任誰都不會服氣。

不過不得不說也因為 AI 繪圖的技術出現,也會帶給人類在繪圖技術上的框架突破。而且 Midjourney 目前也還在測試版(V4),未來會有什麼更強大的功能,或是還有更厲害的工具出現都是很有可能的,且戰且走吧。

--

--

林育正 Riven
林育正 Riven

Written by 林育正 Riven

是數位遊牧型態的設計師💻 喜歡邊旅行邊工作的生活,逐網路、插座與咖啡而居。期待能夠將艱難的設計與開發技術,用麻瓜都能夠聽得懂的話,說給每一個人聽。更多關於我:riven.design