2025/06/10

用AI產生影像的技巧 - 善用客觀的資訊

 

用AI產生影像需要適當的提示詞,而這些提示詞所產生的結果變數很高,因為提示詞不一定能產生客觀的結果。換句話說,提示詞可分成兩種: 一種是客觀的資訊,另一種是屬於感覺的,比較主觀的資訊。

為了更能掌握產出的圖片,我們要盡可能地確立那些客觀的資訊,這樣就更能產生我們要的圖片。例如:

1. 照片的長寬比。是肖像構圖(直立式)或是風景構圖(橫式)。或是正方形構圖。

2. 模特兒的頭部約佔垂直畫面多少%。模特兒的頭部大小在畫面中會影響圖片的美觀性,因此是很重要的屬性。這個數值可以從參考圖中精確的量出來,不需要猜測。

3. 光源的方向性。光線如果不是柔和的就會有方向性。例如: 柔和的自然光從右上方灑入

4. 整體的構圖視角。例如整個環境與模特兒的姿勢都是正面面向鏡頭,則稱為正視角構圖。

用AI產生影像的技巧 - 少的提示詞會更好

 

為什麼提示詞越少有時反而能產生更好看的圖片?

這是一個非常有趣也很常見的現象,尤其是在使用 AI 影像生成模型時常會遇到。簡單來說,提示詞越少有時反而能產生更好看的圖片,主要原因包括以下幾點:

1. 過多提示會讓模型「分心」或產生衝突。每個提示詞(prompt)都會導向特定的視覺風格、構圖、光線、表情、場景……等。如果你加入太多形容詞或要求,模型有時會「不知道該聽誰的」,導致結果變得混亂、不協調,甚至畫面看起來過度複雜或缺乏焦點。

2. 模型內建的「潛在美學偏好」能自由發揮。當提示詞很簡單、留有彈性時,模型會根據它的大量訓練資料,選擇一個內建認為「美」或「合理」的構圖或風格。這反而會導向更自然、平衡的作品。

就像請一位專業攝影師:「幫我拍一張漂亮的人像」,他會自由發揮構圖與光影技巧;但如果你硬要他「水平分割畫面、強烈背光、紅綠藍配色、主體看左邊」,他反而難以做出好照片。

3. 減少「過擬合」的風險。在 AI 模型中,過多的指令會限制創意的發揮,造成模型僅在狹窄的路徑內探索,反而容易產生千篇一律或不自然的結果。而少量的提示詞能讓模型在概念空間中有更大的自由度,探索更創意或平衡的視覺解法。

4. 語意過度疊加導致的「語意混濁」。語言模型在處理複雜語句時會試圖建立語意圖(semantic graph),太多詞彙堆疊會導致主題不明確,或元素難以融合,讓圖像變得不夠「清楚」或「協調」。

5. 預設值其實已經「很好」。很多模型本身就有很強的預設樣式(如鏡頭語言、光線風格、人體比例),如果你沒有加干擾詞,它就會生成最「穩定」或「預期中好看的」圖像。越加提示詞,反而可能「打破」它的平衡。


因此,建議您:

  • 先用簡單提示找出「好看的基礎構圖」
  • 再逐步加入形容詞或調整語氣(如 vibrant, in the style of..., soft lighting)
  • 每加一組詞就測試一次,看是否變更好或變差
  • 使用 negative prompt(反向提示)來限制不想要的元素,會比正向堆詞更有效


2025/06/06

用AI產生影像的技巧 -模特兒的姿勢

 

如何更自然地描述模特兒的動作讓ai產生的圖片更自然? 

要讓 AI 生成的圖片中的模特兒動作更自然,有幾個關鍵原則可以遵循來撰寫提示語:


 1. 動作描述具體且連貫,不要只用單一動詞

避免只寫「she holds a camera」或「she sits」這種單一動作。改用「她雙手自然地握著相機,輕輕靠近臉龐,似乎正在觀察相機螢幕或輕按快門」,這樣 AI 才能理解肢體的目的與過程。

2. 使用「身體語言」與「動機」輔助描述

AI 在沒有理解人物情緒的情況下,很容易生成僵硬動作。例如:

❌:「她遮住臉」

✅:「她將相機舉至臉前,低頭微傾,像是在仔細檢查相片,臉龐自然被遮住。」

這樣會讓 AI 理解「為什麼她會這樣做」,使姿勢有邏輯性。

 3. 強調關節彎曲與重心轉移的細節

自然姿勢通常有 彎曲的肢體 與 重心傾斜,例如:

✅:「她坐在木椅上,身體微微前傾,右腿收起交疊,雙臂內收輕鬆地扶著相機,頭部隨著視線自然下垂。」

這樣能避免 AI 產生「死板坐直」的模特兒。

用AI產生影像的技巧 - 物件與鏡頭的對齊

 

為了讓AI產生你要的圖片,提示詞當中必須要告訴AI關於物件(比方說書桌)與拍攝者的對齊關係,這樣才比較能產生想要的構圖。 常用的描述有:


情境 1:「床、桌子等物體與鏡頭對齊」

➤ 專業術語:

正對鏡頭(On-axis / Head-on / Parallel to the camera)

與鏡頭平行擺放(Parallel alignment)

正視角構圖(Front-facing composition)

➤ 實際描述例句:

「床是正面對著鏡頭擺放的(The bed is placed front-facing to the camera)」

「桌面邊緣與畫面平行(The table edge runs parallel to the image frame)」

「這是以正視角拍攝的構圖」

情境 2:「床、桌子等物體與鏡頭呈 45 度角」

➤ 專業術語:

斜角(Angled view / 45-degree angle)

三分之一視角(Three-quarter view)

對角線構圖(Diagonal composition)

註:雖然不一定是剛好 45 度,但只要是略轉,露出正面與側面,都可稱為「三分之一視角」或「斜角拍攝」。

➤ 實際描述例句:

「桌子以約 45 度角面向鏡頭,形成立體感(The table is angled at around 45 degrees to the camera)」

「這是斜角拍攝的構圖,讓物體更有深度(The object is captured in an angled composition to enhance depth)」

「畫面中的床呈現三分之一視角,看得出床頭與側邊(The bed is shot from a three-quarter view showing both headboard and side)」

2025/06/04

用AI產生影像的技巧 - 提示詞的順序與擺放

1. 提示詞的順序會影響結果。

提示 A:「一位穿著藍色洋裝的女性模特兒,站在迷霧森林中,電影感光影」 

提示 B:「一座迷霧森林,有電影感的光影,出現一位穿著藍色洋裝的女性模特兒」

  提示 A 可能會更強調模特及其外觀,而提示 B 則更偏重場景氛圍與背景。

2. 語意區塊要放在一起(Contextual Grouping),AI 模型傾向於以「語意區塊」來理解語句,因此將相關描述放在一起(如服裝 + 姿勢 + 光線)能幫助AI 建立更清晰的圖像。

3. 避免語意錯配(Clarity of Associations)。若句子結構不夠清楚,AI 可能會將某個特徵套用到錯誤的對象身上——尤其是當形容詞與名詞相距太遠時。

提示 1:「一位年輕女性,柔和光線,沉思表情,身處藍色極簡風房間,穿著黑色背心。」

提示 2:「在一個藍色極簡風房間中,柔和的光線照亮一位穿著黑色背心、表情沉思的年輕女性。」

→ 兩者可能產出相似的圖像,但提示 2 可能會更強調背景與整體氛圍,而提示 1 則可能更集中於人物的特徵與情緒。