
ChatGPTの「DALL・E 3」や。Adobeの「Firefly」などの画像生成AIですと、日本語入力もできたり、プロンプト入力も簡単。
これに慣れていると、Stable Diffusionはプロンプトの入力も難しく感じてしまいます。
まずは機能に慣れたいのに、プロンプトに悩む時間がもったいないと思い、今回「プロンプトを自動作成してくれる拡張機能」を導入してみました。
こんな方におすすめ
- Stable Diffusionを導入して間もない人
- Stable Diffusion初心者
- プロンプト作成に慣れていない人
- 拡張機能を使ってみたい人
「OneButtonPrompt」とは何か
「OneButtonPrompt」とはStable Diffusionの拡張機能の一つで、
プロンプトを自動で作成してくれる機能です。
プロンプトを入力なしでも作成してくれますし、画のテイストを選択できる機能もついていますので、プロンプト作成に慣れていない方は、まずこの機能を使ってプロンプトの作りを学ぶと、使う単語やイメージが身に付きやすいと思います。
ChatGPTに1から例文作成を頼まなくても、Stable Diffusionでランダムな画像があっという間に作れます。
「OneButtonPrompt」の導入方法
「OneButtonPrompt」を追加するには、GithubリポジトリのページからURLをコピーして貼り付けます。
URLはこちらのページから入手
-
-
GitHub - AIrjen/OneButtonPrompt: One Button Prompt
github.com
CodeをクリックするとURLが表示されます。
コピーしたらWebUIを開き、
Extensions>Install from URL を開きます。
「URL for Extensions git repository」と書かれたボックスにURLを入力して、Installボタンを押せば数秒でインストール完了です。
インストール後は、WebUIをリロードするのを忘れないでください。
「OneButtonPrompt」の使い方、プロンプト設定
WebUIの「text2img」を開きます。
プロンプト、ネガティブプロンプトには何も入力しないでください。
「text2img」画面下の「Script」のプルダウンから「OneButtonPrompt」を選択します。
「OneButtonPrompt」の詳細設定
プロンプトをお任せと言っても、画のタッチや人なのか動物なのかなどの指定ができるようになっています。
項目上の方から使う所だけ(機能が多いのでまだテスト中です)説明します。
Higher levels increases complexity and randomness of generated prompt
(生成されるプロンプトの複雑性とランダム性の値)
ランダムで挿入されるプロンプトの数を設定します。
公式の推奨値は 3 ~ 7 程度、通常 5(デフォルト) から 7 を使うようです。
Subject Types
生成する主要な件名タイプを選択できます。
- all
- object
- animal
- fumanoid
- landscape
- concept
Artists
アーティストと言っても作家ではなく、画のタイプを選択します。3483人のアーティストから画風が選択されます。
- all(全て)
- none(使わない)
もしくは、以下のようなタイプも指定できます。
- アニメ
- 3D
- ファンタジー
- フォトグラフィ
- イラスト
など
公式ではアーティストは結果に大きな影響を与えると書いてあります。
ただ組み合わせとしては運もあるようです。
Type of concept
画の方向性を設定できます。
type of image
画像の種類
プロンプトのオプション
Overwrite subject
おまかせとしつつもテーマがある場合はここで入力します。
例えば人の数(1 girlなど)や服のイメージなどをタイトルのようにつけます。
Prompt fields
プロンプトで使って欲しい単語をここで入力します。
Place this in front of generated prompt (prefix)
→ポジティブプロンプト内で使う単語
Use this negative prompt
→ネガティブプロンプト内で使う単語
Place this at back of generated prompt (suffix)
→(LoRAを使う時に使用するようです)
実際に使ってみた
基本設定として、
モデル:dreamshaper_8
VAE : vae-ft-mse-840000-ema-pruned
Sampling method:DPM++2N Karras
サイズ:512×512
seed:-1
「OneButtonPrompt」のプロンプト
Place this in front of generated prompt (prefix)
masterpiece, best quality
Use this negative prompt
(worst quality, low quality:1.4),EasyNegative, text, logo,
として、いろいろ試してみました。
1.all設定
プロンプト数もデフォルトの5
allで設定できるものは全てall
画像右のプロンプト
masterpiece, best quality, fashion art stylized by Mario Testino and (Geof Kern:1.1) , petroglyph of a Gorgeous (Girl:1.3) Woodcarver, dressed in Offensive tunic, her tunic has (zipper;button;buttons;zippers) , Pointing at you, her hair is Chestnut and styled as Fringe, background is Tool shed, Lustful, Mushroomcore, Cold Lighting, Hypersaturated
2.風景画
Higher levels increases complexity and randomness of generated prompt
こちらは[7]に
Subject Types:landscape
Artist : all(wide)
type of image : digital art
画像右のプロンプト
masterpiece, best quality, (dark art by George Hurrell:1.3) and (Jasper Johns:1.3) , Raw digital photo, Glad street and space, masterpiece, landscape of a Aubergine, Copper and Cream (Birmingham:1.3) and Giant's Stairs, Horrid and 1800'S, at Overcast, Sad, Gloomcore, dynamic, film camera, Depth of field 270mm, expressive brush strokes, moody, Concept Art World, arthouse
Subject Typesを[landscape]にするだけで、風景画を作成してくれたので、風景画を作りたいときには[landscape]を選択するようにするといいでしょう。
3.人物
Higher levels increases complexity and randomness of generated prompt
こちらは[7]に
Subject Types:humanoid
Artists : space
type of image : anime key visual
「humanoid」を選ぶと項目が増えました。
- Type of humanoidos
- gender
今回は以下の設定にしてみました
Type of humanoidos : all
gender : female
画像右のプロンプト
masterpiece, best quality, anime key visual, Compelling Feline thin Ecuadorian (a bunch of women:1.3) , they are feeling very disappointed, Pirate, in [Flaming|Messy] higher class Neon High-neck top from the 70's, their hair is Light, Space Age deep red Dashed Eyes, Spartan background, Azure flora, at Twilight, shallow depth of field, Vivid, Wonder, (deep yellow theme:0.7) , Modern Art, dramatic lighting, F/14
女性を指定しても、男性も生成されますし、テキストもバラバラです。
しかし、試してみるといろんなポーズや服などが見れるので気に入ったのは単語をメモして応用できるヒントが沢山ありました。
まとめ
試しにやった感覚から言うと、ネガティブプロンプトは前もってしっかり入力しておいた方が良さそうです。
Stable Diffusion web UI用のembeddings、「EasyNegative」も入れてみたのですが、歪みの確率が高かったので、指は特に指示を入れておいた方が良さそうです。
プロンプト作りに慣れていないとなかなか細かなシチュエーションを英語で作るのは難しいですし、ChatGPTを介しても手間がかかるので、
作成に時間がかかっていましたが、「OneButtonPrompt」を導入して生成の数をとにかく上げることができました。
プロンプトも参考になるので、「これいいな」と思ったものを改良してブラッシュアップしています。見慣れない単語も多々あり、これが使えるのかの判断も初心者の私には難しいですが、それも含め勉強になると思います。
おまかせで作れるにしても設定項目も豊富なので、これを試すだけでも時間を要することになりそう。「OneButtonPrompt」を参考にしつつ、プロンプトを別途覚えていきたいなと思います。
導入して間もない方にはおすすめの機能。プロンプトを考える時間をランダムに生成の回数に変えることはできます。
ネガティブプロンプトを簡単挿入
-
-
【Stable Diffusion】「EasyNegative」の導入・使い方
続きを見る
Stable Diffusion関連書籍
Stable Diffusionを本で学ぶならこれ
ゲーム系画像が作りたい方におすすめ