為什麼別人的 AI 繪圖都比較好玩？Midjourney 新手詠唱技巧教學

10 min readFeb 14, 2023

近日知名作家、電視主持人吳淡如在 Facebook 專頁上，分享了學習電腦繪圖的第一張作品，名為櫻花貓少女，並加上喜歡就送給你的文案，在臉書和網路上引起相當高的討論。

除了各家新聞媒體都有即時報導外，連 Wiki 維基百科頁面都被改成：電繪藝術家(但其實作品都不是出自於本人之手)、逆風封鎖家、留言刪除大師、discord繪圖程式開發工程師，吉人家。

許多網友都紛紛到貼文底下留言討論電腦繪圖和 AI 繪圖之間的差異與定義，也讓 Midjourney 再次拓展了討論圈子，虧淡如姐的福現在有更多人都對 AI 人工智慧電腦繪圖有了初步認識。

自己當 Midjourney 課金玩家快十個月了，剛好前陣子教課需要，有稍微整理了一些我對人工智慧詠唱生成的想法和心得，今天來分享一些可能比較新手向，但可以幫助到剛玩的使用者的咒文詠唱方法們，希望讓大家都可以和淡如姐一樣，都能學習電腦 (AI )繪圖的的技巧。

YouTube 有畫面和字幕字卡搭配觀看體驗較好 — https://youtu.be/OhLofsBTrHs

剛開始進入 Midjourney 的 Discord Server 後，找到 Newbies 開頭房間，點擊 chatbot 頭像傳送訊息，就可以進入私訊，不用在大群人擠人等算圖。

接著可以到 Midjourney 官網的 Community Feed 翻想要的參考範例，展開更多後選擇 Copy > Full Command，再到 Discord 輸入指令 /imagine 貼上生成，就可以拿到類似的圖。

關於咒文這是我初步的理解假設：

AI 繪圖詠唱整體來說有這個公式（或說是文法）
「主體 + 風格 + 渲染 + 指令」

一段完整的描述詞會像是這樣：

A kawaii teenage japanese girl, full of fashion, white vest pajamas, large beautiful vivid anime doe eyes, illustrative anime style, hyper detailed light watercolor art by Charlie bowater & Yaegashi Nan & Taro Kagawa, epic composition, Dynamic pose, curvaceous, sharp focus, perfect shading, deep lighting, rim lighting, super details, cinematic lighting, half body, Medium Shot — ar 3:2

大多數咒文看起來都落落長，但拆開來看就很好瞭解。

第一個是主體，可以是很簡短的一個主詞，並加上形容詞，或是將你腦海中想像的場景完整描述出來。

比如說想要科幻感一點就能補上像是賽伯格（cyborg）、半機械化（semi-mechanized）、巨大的（Gigantic）。

那如果想要畫人物，就可以比如說動漫感的女角（Anime style, girl），加上貓耳朵（cat ears）、奇幻的眼睛（odd eyes）、左眼白瞳（left eye white）、右眼橘瞳（right eye orange）、一頭長髮（long hair）、再指定微捲（curly hair），並染個灰色（gray hair）搭個橘色內側挑染（yellow innter colore）。

加上像是打電動等正在發生的動作（playing computer games）諸如此類的細節，盡量交代清楚，就可以下圖打電動的動漫少女圖。

也要記得都用英文逗號，加上一半形空格來區隔開，並且是用英文（中文偶爾可行但不是那麼好用）。

主詞這邊有個隱藏小招，在名詞後面加上兩個冒號 :: 可以去更改權重，原本預設都是 1；可以去控制畫面物件的個別佔比。

object::1, object::5

然後一些關鍵字可以在畫面細節幫上忙，比如說粒子效果（particles）、液體（Liquid）、煙霧（Smoke）之類。

或是正在發生的事情：爆炸（exploding）、破碎（broken）、故障（glitch）等等。

再來是風格的部分，這邊可以用上以前我們藝術課本學到的，像是文藝復興（Renaissance）、浮世繪（Ukiyo-e）、普普藝術（Pop Art）等等的經典風格。

或是一些歷史上有名文化和運動，超現實主義（Surrealism）、超寫實主義（Hyperrealism）或反烏托邦（Dystopia）。

而如果是想仿名人大師的作品，比如說想做建築，也可以放柯比意（Le Corbusier）、貝聿銘（Ieoh Ming Pei），或當代的隈研吾（Kengo Kuma）、伊東豊雄（Toyo Ito）。

或是你不想像是歷史課一樣那麼嚴肅，也可用自己喜歡的動漫或卡通關鍵字，像是新海誠（Shinkai Makoto）、宮崎駿（吉卜力工作室：Ghibli），或是寶可夢（Pokémon）也都很好用。

也可以是普遍能理解的動畫風格：皮克斯（Pixar）、夢工廠（Dreamworks）、迪士尼（Disney）。

更可以是遊戲畫面風格感，比如說曠野之息（用 Zelda 效率更好）、上古捲軸（Elder Scrolls；會有一堆龍）或英雄聯盟（League of Legends；拿來做造型立繪不錯）也行。

那除了風格以外，如何去渲染這張圖也是可以動的選擇，有個小技巧是加上使用的建模或設計軟體，也可以達到類似的渲染效果，像是虛幻引擎（Unreal Engine）, C4D（Maxon Cinema 4D）。

或是有個做法也滿實用的，就是加上某個指定網站，用 trending on 加上 Dribble, Behance 或 Pixiv 等大型且行之有年的藝術與設計作品網站。（不過身為設計師，還是要提醒可以多關注 AI 對於智慧產權的議題。）

那如果是對於光和畫面質感比較要求的話，想要生成真實攝影感的照片，則可以用 photography 或 photoreal。

對攝影更講究一點的朋友，也能試試柔光（soft lights）和體積光（volumetric light）。

想要電影感一點的可以用高細節（high detail）、高品質（hyper quality）、電影鏡頭（cinematic shot）。

下指令

最後是指令，這個可以說是要當高手必會的部分，在描述詞的最後加上兩個連字號（hyphen）就可以了。

最常用到的指令有：

-- ar 
可以指定生成圖片為 9:16 或 2:3 之類的數值比例（記得逗號前後和中間都要空格）

-- no
可以指定不要什麼東西或顏色
例如 - no blue 或是 - no human，可以拿來可以用來剔除不必要的元素。

-- V4
現在可以透過 /setting 設定內建了
不過只有 3:2 或 2:3 的比例能用；要指定其他比例需降級為 V3 以下。
（V4 是 Midjourney Version 4，為目前最新最好的運算版本）

-- niji
指令現在可以召喚 nijijourney 的 bot
對於日式二次元動漫的運算和手部渲染有很大幅度的最佳化。

-- video
可以記錄下 AI 運算過程的影片，但 V4 不適用。
同樣的以前常玩的 - test 和 - creative 目前 V4 也無效。

人工智慧生成的隨機性

不過這邊還是要曉得 AI 繪圖一個重點，就是「隨機性」。

這些圖產出的原理，來自既有作品的重新理解、解構、分析，再重新組合而成。

而每次 AI 計算渲染出來的結果，都不會相同，也就是說即便我們使用相同的描述詞，重複貼上、反覆生成，也不會有完全一樣的結果。

反過來說，一幅優秀的 AI 繪圖，也不是一次詠唱就會蹦出來的，背後可能會經過幾十次，甚至上百次反覆實驗與調教，才能得到一張滿意的圖。

而說到調教，目前版本的 Midjourney 在送出指令後，等待一下渲染出圖，會有 U1 到 U4，和 V1 到 V4 的選項。

1, 2, 3, 4 對應到產生的四張圖片順時針順序，U 是指以這張為基礎去做最佳化，V 則是去做變化，會重新 render 新的四張圖。

如果不想看到這個結果，是沒辦法刪除訊息，但這時候可以用加入反應送它一個 ❌ 就能移除訊息了。

補充 Midjourney chatbot 基礎指令

/imagine 算圖
/info 個人資訊
/invite 產生邀請連結
/ideas 取得隨機點子
/help 指導與幫助
/subscribe 訂閱方案

另外還有像 /show 可以舊圖重算
到 Midjourney 網站找到自己以前算過的圖，複製 Job ID 貼過來就可以了。

還有如果想要給參考圖，只要上傳一張圖片，然後右鍵複製連結
在詠唱的指令 /imagine 後貼上，也可以搭配前面講的描述詞
Midjourney 就會把這張圖加進運算裡，只是說結果的參考程度就非常吃人品了。

後記

試著回想一下，最初對於 AI 技術的理解是什麼時候？是刀劍神域的裏世界嗎，還是電影銀翼殺手、雲端情人，或是影集西方極樂園或黑鏡呢。

對我來說現階段的 AI 繪圖，能夠得到許多意想不到的靈感，就像當年打敗世界頂尖棋士的 AlphaGo，在下棋時總有很多很意料之外且不尋常的黃金一手。而 AlphaGo 的爸爸 — — 也就是曾被 World Wide Web 創辦人 Timothy John Berners-Lee 稱讚為「地球上最聰明的人」的人工智慧公司 DeepMind 創辦人 Demis Hassabis 也說過 AI 打破了人類圍棋 3000 年來的盲點。

雖然說現在 AI 繪圖開始出現一些爭議，比如說用 AI 繪圖產生的作品能不能說是自己畫嗎，以及取樣自現有繪師的作品算不算抄襲，這些問題確實都是存在且有討論必要的，放上網的數位資產被當作資料庫取用，任誰都不會服氣。

不過不得不說也因為 AI 繪圖的技術出現，也會帶給人類在繪圖技術上的框架突破。而且 Midjourney 目前也還在測試版（V4），未來會有什麼更強大的功能，或是還有更厲害的工具出現都是很有可能的，且戰且走吧。

為什麼別人的 AI 繪圖都比較好玩？Midjourney 新手詠唱技巧教學

下指令

人工智慧生成的隨機性

補充 Midjourney chatbot 基礎指令

後記

Written by 林育正 Riven