Stable Diffusionでは何も設定しないと、正方形の画像が生成されます。
縦長や横長にサイズを変更することも可能ですが、適当なサイズで生成すると崩れた画像が作られる場合が多いです。
今回はStable Diffusionの画像生成に適したサイズの数値の紹介と、
普段の作業効率に役立つ拡張機能など「サイズ」についてまとめましたので参考にしてみてください。
Stable Diffusionの画像が正方形の理由
Stable Diffusionのデフォルト画像サイズは基本「512×512」
正方形で生成されるようになっているのには理由があります。
それは、使用される多くのモデルが「512×512」のサイズで学習しているからです。
学習した「512×512」の正方形サイズを得意としています。
なので、学習していない範囲のサイズになると生成が崩れる、プロンプト指示通りにいかない場合がでてきます。
また、画像サイズを大きくするということは、ファイルのデータも重くなります。
重くなると生成する時間もいつもよりかかってしまうのです。
例えば同じ正方形でも2倍の大きさで生成してみるとこのようになりました。
(プロンプトは同じのまま、画像サイズだけ変更)
2倍にした画像の方が身体のバランスが悪くなっています。ファイルサイズも、
512×512:431KB
1024×1024:1,691KB
となりました。
このことから「512×512」の正方形サイズ画像が1番綺麗に、効率よく、負担なく生成できます。
とはいっても縦長、横長画像は作りたいですよね?
次の項目から目安のサイズについて説明します。
Stable Diffusionの縦長、横長に適した画像サイズ
生成クオリティや、ファイルの重さ、時間などにこだわらなければ、好きなサイズにしてOKです。
画像サイズは最大で「2048」までありますが、
「512~768」ぐらいが許容範囲とされているようです。
「1000」までが限度とも言われています。このことから、
縦長:512×768
横長:768×512
このサイズで生成してみましょう。
比率で考えたい場合は、「1:2」か「3:4」で調整しましょう。
Stable Diffusionの画像サイズ設定
次にStable Diffusionでの操作について。画像サイズの数値の変更の仕方です。
[txt2img]で説明します。
[Generation]タブ内に「Width(横)」「Height(縦)」のバー、また数値が表示されたボックスがあります。
ここで、バーか直接サイズ数値を入力することで、生成画像のサイズを設定できます。
また右にある上下矢印のボタンは「Width」「Height」の数値を入れ替えることができます。
「Hires.fix」で高画質化、高解像度にする
「Hires.fix」は生成の破綻を回避して、高画質、高解像度の画像が生成できるStable Diffusionのオプション機能です。
簡単に言うと、高画質、高解像度の状態で画像サイズを2倍にできます。
Stable Diffusionの「Width(横)」「Height(縦)」のバー上にある「Hires.fix」の「◀(三角形)」をクリックすると、Hires.fixの詳細設定項目が表示されます。
「Upscal by」が倍率です。
「Denoising strength」は[0.5]ぐらいにしておきます。
(0.6以上になると、生成画像のバランスの崩れが見られます)
「Hires.fix」を使ったとしても、画像サイズは先程説明したサイズにしておきましょう。
正方形:512×512
縦長:512×768
横長:768×512
アスペクト比率を変更できる拡張機能を使う
また簡単にアスペクト比で画像サイズを設定できる拡張機能もあります。
「Aspect Ratio selector」というもので、クリック一つであらかじめ設定した比率に画像サイズを変更することができます。
カスタマイズも可能で、よく使うサイズや比率はボタンとして作成することもでき大変便利です。
導入方法や使いかたについてはこちらの記事をごらんください。
関連記事
-
Aspect Ratio selectorで画像サイズを一発変更
Stable Diffusionの画像サイズは基本「512×512」ですが、縦長や横長で画像を作りたいと考える方も多いのではないでしょうか。 サイズの変更はバーを動かすか数 ...
続きを見る
まとめ
Stable Diffusionの生成画像サイズについて説明しました。
サイズの数値に迷っている方は、この記事を参考に生成してみてください。
他にもStable Diffusionの機能やモデルなどを記事で説明しています。
気になる方はこちらの一覧から見てくださいね!
Stable Diffusionガイド
Stable Diffusionで大事なグラボ
画像生成において、グラボは妥協せずに用意しましょう。
最低でも「RTX 3060」を用意すると、生成もスムーズに行えます
Stable Diffusion関連書籍
Stable Diffusionスタートから応用まで学べる1冊
Stable Diffusion LORAの使い方までしっかりカバー
ゲーム系画像が作りたい方におすすめ