ChatGPTの「DALL・E 3」やAdobeの「FireFly」ですと、日本語での入力も対応しているので、それらの画像生成AIと比べると、難しいと感じてしまいそうなStable Diffusion
私もプロンプトについて調べるのにかなりの時間を要しました。
このブログではなるべくわかりやすくスムーズにデータをまとめたいと考えていますが、
まず、初心者が一番最初に覚えたいプロンプトの作り方についてまとめました。
ここで全てを覚える必要はありません。しかし型を知ることで、何を調べればいいのかもわかるようになります。
まずは「どういうものか」を知るところから始めてください。
後半には「とりあえず入れておきたいプロンプト」も用意しましたので、コピーして使ってください。
また、Stable Diffusionのプロンプトは他の画像生成AIでも使えるワードもありますので参考にしてみてください。
こんな方におすすめ
- Stable Diffusion初心者
- Stable Diffusionのプロンプトについて知りたい方
- プロンプトが難しいからとりあえずコピペで使いたい方
プロンプトには2種類ある
Stable Diffusionのプロンプトには2種類あります。
- プロンプト(通常のプロンプト)
- ネガティブプロンプト(除外したいプロンプト)
確実にテキスト通りの生成ができるわけではないので、自身が納得するものができるまで生成します。
同じプロンプトを使うと、どんどん改善されることもありますし、プロンプト内容を見直す(文章、順番など)と生成のクオリティもあがります。
通常のプロンプトには絵の内容
人、服装、背景、カメラアングルなどを入力します
ネガティブプロンプトには「描いてほしくない内容」を入力します。
プロンプトのルール
プロンプトは普通に文章を入力してもいいですが、以下のルールを使用して作ると生成効率があがります。
英語で入力
Stable Diffusionでは英語で入力しましょう。
日本語でも生成はできましたが、同じ内容でもクオリティが違います。
英語が苦手な場合は、Deep Lで翻訳するか、ChatGPTで日本語で作成し、英文の画像生成用プロンプトになおしてもらいましょう。
関連記事
-
-
【初心者にもやさしく】ChatGPTについて。無料版の登録手順
続きを見る
単語の数
Stable Diffusionの単語の数は、トークンという単位で数えます。
プロンプトの入力欄に、[0/75]と表示されていますが、75以上も入力はできます。
しかし、画像が生成されにくくなるため75以内で納めるようにしましょう。
カンマで区切る
複数文章を使う場合はカンマで区切ります
順番
- 前のテキストが優先度高め、後ろのテキストは無視されることも
- テキストの順番で生成も変わる
上手くいかない場合は、テキストの順番を変えてみる
強調・重要度
- ( )で囲った文章を重視する
- ((( )))で囲った文章をより重視する
重要度が高いものに使う
後ろの文で、重視してほしいテキストがある場合( )で囲うと重要だと判断してもらえる
( )内にはいくつもテキストを入れられる。
- [ ]で囲った文章を軽視する
- [[[ ]]]で囲った文章をより軽視する
生成後の微調整として、テキスト指示を和らげたいときに使うとよい
均等
() AND ()
AND構文は、()内のどちらも両立、均等にさせるという指示になる。
混ぜたくない要素に対しても使える。
- ANDは大文字
- サンプラーの DDIM と PLMSでは使用できないようです。
モデル推奨プロンプトを使う
使用する「モデル」によっては推奨されているプロンプトもあります。
モデルをダウンロード際に詳細を確認するようにしましょう。
高クオリティを狙う必須プロンプト
プロンプトに挿入すると、クオリティの高い画像が生成できる必須とも呼べる単語を紹介します。
通常のプロンプト
通常のプロンプトに挿入したい必須ワードは以下の通り
ワード | 意味 |
masterpiece | 「最高傑作」「代表作」「名人芸」「絶品」 |
best quality | 最高品質 |
detailed | 詳細な |
masterpiece(マスターピース)は多くの人が使用している鉄板プロンプト。
しかし、AIは大量のデータを学習してアップデートしていくので、使用頻度が高いこの単語に関して「いつもの」感を覚えたのか、指示者は違えど似たような顔が生成されるようになった。
このことから「マスターピース顔」という言葉も聞かれるようになる。
基本的に使うとして、似たような生成画像にしたくない時は使わないなどしています。
上記の3つはセットとしてこのように並べてメモしてもいいでしょう
とりあえず入れておきたいプロンプト
masterpiece, best quality, detailed
このように、クオリティに関するプロンプトは他にもたくさんあります。
※通常プロンプトについては別記事でさらにまとめる予定です。
ネガティブプロンプト
描いてほしくない内容を入力するので、クオリティに関するワードを入力することが多いです。
ここではよく使われる必須をまず紹介しています。
ワード | 意味 |
low quality | 品質が低い |
worst quality | 最悪の品質 |
out of focus/blurry/bokeh | ぼやけた、ピンぼけ |
ugly | 醜い、酷い |
error | エラー |
lowres | 低い画質 |
上記をネガティブプロンプトに入力するときはこのようになります
とりあえず入れておきたいプロンプト
worst quality,bokeh,ugly,error,lowres
人に関すること、テキストなど入れないようにするなどネガティブプロンプトはワード数も非常に多いので、生成する画像に合わせて何パターンか作っておくとよいでしょう。
ネガティブプロンプトで使う単語はこちらの記事でチェックできます。
関連記事
-
-
【Stable Diffusion】ネガティブプロンプト辞典
続きを見る
目的別プロンプト
背景・風景に使えるプロンプトまとめ
シンプルな背景や、自然や建物に関するプロンプトはこちら
-
-
【Stable Diffusion】背景・風景に使えるプロンプトまとめ
続きを見る
まとめ
プロンプトはワード数も多いので、特に人物画像の生成では使用したいワードも増えます。
プロンプトは「しっかり1から学ぼう!」とするより、作業がラクになるツールを導入する方が画像生成に時間をまわせます。
1回で成功させようとせず(ほぼ無理です)最初はデータ取りと思ってトライする方が自分好みのプロンプトに近づけるでしょう。
関連記事
ネガティブプロンプトは「Embedding」という画像生成クオリティをアップ、また作業効率化を図れるツールを導入するだけで簡単に作れます。
プロンプトを覚えるには時間がかかりますので、こちらを先に入れる方がラクになるでしょう。
-
-
【StableDiffusion】Embedding導入方法・おすすめについて
続きを見る
ぼやけた感じや薄い色をもう少し彩度を上げたいなど画質向上には「VAE」というツールを使います。
-
-
【Stable Diffusion】VAEとは何か。使い方や便利な設定について
続きを見る
通常プロンプトも初心者には作成が難しいと感じるでしょう。勉強も兼ねてプロンプトそのものをランダムで作成してくれるツールもあります。
-
-
【Stable Diffusion】プロンプトをランダムに作成「OneButtonPrompt」
続きを見る
Stable Diffusion関連書籍
Stable Diffusionを本で学ぶならこれ
ゲーム系画像が作りたい方におすすめ