記事一覧へ戻るPrompt

AIイラストのプロンプトとは?基本の考え方と書き方を整理する

AIイラストで使うプロンプトの基本と、要素ごとに分けて考える書き方を整理します。

はじめに

ComfyUIで画像を生成できるようになると、次に迷いやすいのが「プロンプトに何を書くか」です。

同じモデルや同じワークフローを使っていても、プロンプトの内容によって、キャラクターの見た目、表情、服装、背景、雰囲気は大きく変わります。

ただ、最初から長いプロンプトを丸ごと覚えようとすると、どの言葉が何に効いているのか分かりにくくなります。

この記事では、AIイラストで使うプロンプトを「長い呪文」として覚えるのではなく、被写体・見た目・表情・構図・背景・画風などの要素に分けて整理する考え方を紹介します。

今回はSDXL系のイラスト向けモデルを使った作例を中心に載せていますが、基本的な考え方はSD1.5系や他のモデルでも共通して使えます。

1. プロンプトとは何か

プロンプトとは、画像生成AIに「どんな画像を作ってほしいか」を伝えるためのテキストです。

たとえば、次のような短いプロンプトでも、画像の方向性をある程度指定できます。

1girl, blue hair, blue eyes, smile, white dress, garden

このプロンプトでは、女の子、青い髪、青い目、笑顔、白い服、庭の背景といった要素を指定しています。

プロンプトは、文章として完璧に書く必要はありません。AIイラストでは、単語や短いフレーズを並べて、画像に入れたい要素を指定することが多いです。

ただし、プロンプトを書いたからといって、必ずその通りに出るとは限りません。

使用するモデル、ワークフロー、サンプラー、画像サイズ、seedなどによって、結果は変わります。

プロンプトは「完全な命令」というより、画像の方向性を伝えるための材料として考えると分かりやすくなります。

ComfyUIのpositive promptとnegative promptの入力欄
ComfyUIでは、positive promptに入れたい要素、negative promptに避けたい要素を書いて画像を生成します。

2. positive promptとnegative promptの違い

画像生成では、よく positive prompt と negative prompt を使います。

positive promptは、画像に入れたい要素を書く場所です。

1girl, blue hair, smile, white dress, garden

一方で、negative promptは、画像に出てほしくない要素や、避けたい崩れを書く場所です。

low quality, blurry, bad hands, text, watermark

たとえば、画質の低下、手の崩れ、文字、透かしのような要素を避けたいときに使います。

ただし、negative promptに書いたものが必ず完全に消えるわけではありません。「絶対に禁止する命令」というより、出にくくするための補助として考える方が近いです。

3. プロンプトは英語で書く?日本語でもいい?

プロンプトを書くときに、最初に迷いやすいのが「英語で書くべきか、日本語でもいいのか」という点です。

結論としては、基本的には英語のプロンプトを使う方が安定しやすいです。

画像生成モデルの多くは、英語の説明文や英語圏のタグ、画像につけられた英語のキャプションなどをもとに学習されています。そのため、blue hair、smile、white dress、garden のような英語の単語や短いフレーズの方が、意図が伝わりやすい場合があります。

たとえば、次のように日本語で書いたとします。

青い髪の女の子、笑顔、白いワンピース、庭

日本語でもある程度反応する場合はあります。ただ、モデルや環境によっては、意図が弱くなったり、思った通りに反映されなかったりすることがあります。

同じ内容を英語で書くと、次のようになります。

1girl, blue hair, smile, white dress, garden

AIイラスト制作では、このように英語の単語や短いフレーズをカンマで区切って並べる書き方がよく使われます。

日本語を絶対に使ってはいけないわけではありません。一部のモデルや環境では、日本語の説明でも反応することがあります。

それでも、プロンプトを自分で調整したり、他の人のプロンプトを参考にしたり、プロンプト辞書を使ったりするなら、まずは英語のタグや短い英語フレーズに慣れておく方が扱いやすいです。

4. タグ形式と自然文形式の違い

英語でプロンプトを書く場合にも、大きく分けてタグ形式と自然文形式があります。

タグ形式は、単語や短いフレーズをカンマで区切って並べる書き方です。

1girl, blue hair, blue eyes, smile, white dress, garden, soft lighting

AIイラスト系のモデルでは、このようなタグ形式のプロンプトをよく見かけます。要素ごとに分けやすく、どこを変えたのか確認しやすいのが特徴です。

一方で、自然文形式は、文章としてイメージを伝える書き方です。

A girl with blue hair and blue eyes is smiling in a bright garden, wearing a white dress.

自然文形式は、文章として読みやすく、雰囲気をまとめて伝えやすい書き方です。SDXL系のモデルでは、自然文に近い指定が使いやすい場合もあります。

ただ、最初のうちはタグ形式で考える方が、プロンプトの構造を整理しやすいです。

たとえば、髪型だけを変えたいときは、タグ形式なら short hair を long hair に変えるだけで比較しやすくなります。

書き方向いていること
タグ形式1girl, blue hair, smile要素を分けて調整しやすい
自然文形式A girl with blue hair is smiling.雰囲気を文章で伝えやすい
混合形式1girl, blue hair, smile, standing in a bright gardenタグと文章の両方を使える

5. 普通の英語とプロンプト用の言い方が違うこともある

英語でプロンプトを書くときに注意したいのは、日本語をそのまま英訳すれば、必ず思った通りに伝わるわけではないという点です。

普通の英語としては間違っていなくても、画像生成ではあまり反応しなかったり、別の意味に寄ったりすることがあります。

画像生成AIでは、学習時に使われていたタグやキャプションの表現に近い言葉の方が、反応しやすい場合があります。そのため、プロンプトでは「辞書的に正しい英語」だけでなく、実際によく使われているプロンプト表現を知っておくと便利です。

たとえば、「こちらを見ている」と指定したいとき、普通に英訳すると、

looking this way

のように考えるかもしれません。

でも、AIイラストのプロンプトでは、

looking at viewer

のような表現がよく使われます。

また、「横顔」を指定したいときも、

side face

より、

profile

side view

のような表現の方が使われることがあります。

構図でも、普通の英語とは少し違う表現があります。たとえば、太ももあたりまでを入れる構図として、

cowboy shot

というタグが使われることがあります。

さらに、モデルやタグ文化によっては、

:3

のような顔文字に近いタグが、猫っぽい口元や、少しむにっとした表情の指定として使われることもあります。普通の英単語ではありませんが、プロンプトではこうした記号に近い表現を見かける場合もあります。

このように、プロンプトでは普通の英単語だけでなく、タグとしてよく使われている表現や、少し独特な書き方が出てくることがあります。

最初から全部覚える必要はありません。まずはよく使われる表現を少しずつ見ながら、思った通りに反応しない言葉があったときに、別のタグ表現を探してみると調整しやすくなります。

日本語で言いたいこと直訳っぽい書き方プロンプトで使われやすい表現
こちらを見ているlooking this waylooking at viewer
横顔side faceprofile, side view
太ももあたりまでの構図from head to thighs などcowboy shot
猫っぽい口元・むにっとした表情通常の英単語では表しにくい:3

6. プロンプトは要素ごとに分けて考える

プロンプトを書くときは、最初から長い文章を作るより、要素ごとに分けて考えると整理しやすくなります。

たとえば、ひとつのキャラクター画像でも、次のような要素に分けられます。

要素
被写体1girl, solo
髪型short hair, long hair, twin tails
髪色blue hair, black hair, silver hair
blue eyes, green eyes
表情smile, surprised expression, serious expression
服装white blouse, blue dress, school uniform
構図upper body, full body, looking at viewer
背景simple background, garden, classroom
soft lighting, sunlight, backlight
雰囲気pastel colors, warm atmosphere, clean composition

このように分けておくと、あとから調整しやすくなります。

たとえば、表情だけ変えたいなら、表情の部分だけを差し替えます。背景だけ変えたいなら、背景の部分だけを差し替えます。

プロンプト全体を毎回作り直すより、「どの要素を変えたのか」を意識する方が、結果を比べやすくなります。

プロンプトは見やすい順番に並べると調整しやすい

プロンプトを書くときは、「どの順番で並べればいいのか」も気になるところです。

プロンプトの順番には、すべてのモデルで共通する絶対的なルールがあるわけではありません。モデルや環境によっては、前の方に書いた要素が少し意識されやすいと感じる場合もありますが、毎回はっきり同じ結果になるとは限りません。

そのため、最初のうちは「効き方を細かく調整するための順番」よりも、「あとから見直しやすい順番」で並べるのがおすすめです。

たとえば、次のように要素ごとにまとめると、どこを変えたのか分かりやすくなります。

  • 被写体
  • 見た目
  • 表情
  • 服装
  • 構図
  • 背景
  • 光や雰囲気
  • 品質・仕上げ

例としては、次のような並びです。

1girl, solo,
blue hair, blue eyes, long hair,
gentle smile,
white blouse, light blue ribbon,
upper body, looking at viewer,
simple background, soft lighting,
clean composition, high quality

このように並べておくと、「髪型だけ変えたい」「背景だけ変えたい」と思ったときに、変更する場所を見つけやすくなります。

順番そのものにこだわりすぎるより、まずは自分が見て分かりやすい形に整理しておくことが大切です。

7. まず指定したい基本要素

最初からすべての要素を細かく指定する必要はありません。

まずは、次のような基本要素だけでも画像の方向性を決められます。

1girl, blue hair, blue eyes, smile, white blouse, upper body, simple background

このプロンプトでは、

  • 被写体
  • 髪色
  • 目の色
  • 表情
  • 服装
  • 構図
  • 背景

を指定しています。

慣れないうちは、ここに少しずつ要素を足していくのがおすすめです。

たとえば、背景を変えたいなら、

simple background

bright classroom

に変えます。

髪型を変えたいなら、

short hair

long hair

に変えます。

このように、ひとつずつ変えると、どの言葉がどの変化につながったのか確認しやすくなります。

8. 作例:一部だけ変えると画像はどう変わる?

ここでは、同じ条件に近づけて、髪型・表情・背景など一部の指定を変えた作例を見ていきます。

作例はSDXL系のイラスト向けモデルで生成しています。同じプロンプトでも、使用するモデルやseed、設定によって仕上がりは変わります。ここでは「プロンプトの考え方を見るための一例」として見てください。

8-1. 髪型だけ変える

まずは、髪型だけを変えた例です。

共通部分はなるべく同じにして、髪型の指定だけを変えています。

short hair
bob cut
long hair
twin tails

髪型の指定を変えると、キャラクターの印象も変わります。ただし、顔立ちや服装まで少し変わることもあるため、完全に髪型だけが変わるとは限りません。

それでも、同じ構図・同じ背景に近づけて比較すると、プロンプトの変化が見えやすくなります。

short hairの作例
short hair
bob cutの作例
bob cut
long hairの作例
long hair
twin tailsの作例
twin tails
髪型の指定だけを変えた例です。基本の構図や服装を揃えると、どの部分が変わったのか比較しやすくなります。

8-2. 表情だけ変える

次に、表情だけを変えた例です。

smile
surprised expression
serious expression
embarrassed expression

表情の指定を変えると、目や口、眉の印象が変わります。

ただし、表情によっては顔の角度や雰囲気まで少し変わることがあります。完全に同じ構図で表情だけを変えるのは難しい場合もあるため、最初は大まかな違いを見るくらいで大丈夫です。

smileの作例
smile
surprisedの作例
surprised
seriousの作例
serious
embarrassedの作例
embarrassed
表情の指定だけを変えた例です。smile、surprised、serious、embarrassed のように分けると、表情差分を確認しやすくなります。

8-3. 背景だけ変える

最後に、背景だけを変えた例です。

simple studio background
cozy bright workspace
bright flower garden
bright classroom

背景を変えると、画像全体の雰囲気も大きく変わります。

同じキャラクターでも、作業部屋なら記事や制作メモの印象に、花畑なら明るいイラストの印象に、教室なら日常シーンの印象に寄せやすくなります。

studioの作例
studio
workspaceの作例
workspace
gardenの作例
garden
classroomの作例
classroom
背景の指定だけを変えた例です。背景は画像全体の雰囲気に大きく影響します。

9. 強調指定は最初から使いすぎなくていい

プロンプトでは、特定の単語を少し強めるために、次のような書き方を使うことがあります。

(black hair:1.1)

これは、black hair の指定を少し強める書き方です。

ざっくり言うと、1.0 が通常に近く、1.1 や 1.2 のように数字を上げると、その要素を少し強く意識させる指定になります。

ただし、強調指定は便利な反面、最初から多用すると分かりにくくなります。

たとえば、いろいろな単語に強調を入れすぎると、どの指定が効いているのか分かりにくくなったり、絵が不自然になったりする場合があります。

最初は通常の単語で試して、それでも弱いと感じた部分だけ少し強めるくらいで十分です。

10. モデルによってプロンプトの効き方は変わる

同じプロンプトを書いても、使うモデルによって結果は変わります。

たとえば、同じ blue hair や white dress でも、モデルによって色の出方、顔立ち、服のデザイン、背景の描き方は違います。

そのため、うまくいかないときに「プロンプトが全部悪い」と考える必要はありません。

画像の仕上がりには、プロンプト以外にも次のような要素が関わります。

  • モデルとの相性
  • 画像サイズ
  • サンプラー
  • CFG
  • negative prompt
  • seed

この記事ではSDXL系の作例を使っていますが、SD1.5系でも「要素ごとに分けて考える」という流れは同じです。

モデルの違いについては、前回の記事でSD1.5系とSDXL系の違いを整理しています。プロンプトの効き方が気になったら、モデル側の特徴もあわせて確認してみてください。

関連記事画像生成AIのモデルとは?SD1.5・SDXLの違いと選び方

画像生成AIで使うモデルの基本と、SD1.5系・SDXL系の違いを整理します。

11. プロンプトの言葉が思いつかないときは?

プロンプトの基本的な考え方が分かっても、実際に書こうとすると「この髪型は英語で何て書けばいいんだろう」「この表情はどんな単語で指定するんだろう」と迷うことがあります。

たとえば、髪型を変えたいと思っても、

short hair
long hair
twin tails
bob cut
ponytail

のような単語を知らないと、プロンプトに入れるのが難しくなります。

表情やポーズも同じです。

smile
surprised expression
serious expression
looking at viewer
standing
upper body

こうした言葉を毎回ゼロから探すのは、少し大変です。

そこで役に立つのが、プロンプト辞書です。

プロンプト辞書は、長いプロンプトを丸ごとコピーするためだけのものではありません。むしろ、「髪型を変えたい」「表情を変えたい」「ポーズを変えたい」と思ったときに、使えそうな単語を探す場所として使うと便利です。

たとえば、基本のプロンプトがある状態で髪型だけ変えたいなら、

short hair

long hair

twin tails

に差し替えるような使い方ができます。

プロンプトを要素ごとに分けて考えられるようになると、辞書の使い方も分かりやすくなります。

LULINAworksでも、今後は髪型・表情・ポーズなど、制作に使いやすいプロンプト辞書を少しずつ追加していく予定です。

12. まとめ

この記事では、AIイラストで使うプロンプトの基本的な考え方を整理しました。

プロンプトは、画像生成AIに「どんな画像を作りたいか」を伝えるためのテキストです。

最初から長いプロンプトを覚える必要はありません。まずは、被写体・髪型・表情・服装・構図・背景など、要素ごとに分けて考えることが大切です。

今回のポイントをまとめると、次のようになります。

  • positive promptには入れたい要素を書く
  • negative promptには避けたい要素を書く
  • 日本語でも反応する場合はあるが、基本は英語の方が安定しやすい
  • タグ形式は要素を分けて調整しやすい
  • 自然文形式は雰囲気を文章で伝えやすい
  • 普通の英訳とプロンプトで使われやすい表現が違うこともある
  • プロンプトは要素ごとに整理しておくと見直しやすい
  • 最初は短めのプロンプトから始める
  • 一度に変える要素は少なめにする
  • 強調指定は必要な部分だけ少し使う
  • 同じプロンプトでもモデルによって仕上がりは変わる
  • 辞書は必要な要素を探して差し替える場所として使う

プロンプトは、最初から完璧に書こうとしなくても大丈夫です。まずは短いプロンプトを作り、変えたい部分を少しずつ差し替えながら、自分の作りたい画像に近づけていきましょう。