img2imgアイキャッチ

※ 当サイトは、プロモーションが含まれます

広告 Stable Diffusion

Stable Diffusionの「img2img」基本的な使い方

 

AIで画像から画像を生成することってできるの?

 

Stable Diffusionと言えば、テキストを入力すると画像を生成できるツールと思う方が多いかと思いますが、

テキストだけでなく「画像」からも画像が生成できます。

 

今回は、そのツールである「img2img」について、

使用用途や基本的な使い方について説明します。

 

Stable Diffusionの導入についてはこちらで説明していますので、

参考にしてみてください。

 

Stable Diffusion web UI(AUTOMATIC1111版)インストール_アイキャッチ
【初心者OK】Stable Diffusion web UI(AUTOMATIC1111版)インストール手順

    Stable Diffusionを自身のPCで使うための準備について。   ただ「Stable Diffusion」というソフトをインストールするだけというような ...

続きを見る

 

 

Stable Diffusionの「img2img」とは何か

 

Stable Diffusionの「img2img」とは、画像から画像を生成できる機能

「Image to Image」の略です。

 

テキストから画像を生成するのではなく

 

  • 生成した画像を変化させたいとき
  • 写真をイラストにしたいとき
  • ラフの線画をちゃんとした画像に生成したいとき

 

などに使います。

 

「img2img」の基本的な使い方

 

基本的な使い方の手順は以下の通り

 

  • 生成に使う元となる画像をアップロード
  • プロンプト(テキスト)で指示
  • サイズの設定
  • 「Denoising strength」を設定

 

プロンプトを入力するのは、「txt2img」と同じですが、「img2img」の場合、参照元となる画像を元に出すプロンプトとなるので、1からテキストで作るよりはイメージに近い画像が「txt2img」より早く生成できるでしょう。

 

「Denoising strength」とは、生成する際の変化量の設定になります。

 

生成した画像のフォルダは

Stable Diffusion/outputs/img2img-images

になります。

 

 

この流れに沿って実際に「img2img」の使い方をステップごとに見ていきましょう。

 

生成に使う元となる画像をアップロード

Monosnap Stable Diffusion パラメーター全体画面

 

Stable Diffusionを立ち上げます。

最初の画面は「txt2img」の画面になります。

 

画面上部にあるタブに「img2img」があるのでクリックします。

 

sd_img2img_画面全体

 

プロンプト入力欄の下にある「Generation」タブ内が最初開かれます。

この「img2img」にあるエリアに画像をドロップ、またはクリックしてアップロードします。

 

画像サイズが大きいとエラーがでるので、サイズを調整してから再度アップロードしてみてください

 

プロンプト(テキスト)で指示

プロンプトの入力欄にテキストを入力します。

元画像のクオリティが良くても、高クオリティするためのプロンプトは入力しておきましょう。

 

プロンプトについてはこちらをご覧ください。

関連記事

プロンプトのルール_アイキャッチ
【Stable Diffusion】まず最初に覚えたいプロンプトのルール

  ChatGPTの「DALL・E 3」やAdobeの「FireFly」ですと、日本語での入力も対応しているので、それらの画像生成AIと比べると、難しいと感じてしまいそうなStable Di ...

続きを見る

 

「txt2img」と同じく、Embeddingも使用できます。

「Generation」の隣にある「Textual Inversion」のタブを開くと、導入済みのEmbeddingを利用できます。

 

Embeddingについてはこちらをご覧ください。

関連記事

EMBEDDINGSについて_アイキャッチ
【StableDiffusion】Embedding導入方法・おすすめについて

    今回はStableDiffusionでの画像生成クオリティをアップ、また作業効率化を図れる「Embedding」について説明します。   モデルをダウンロードする ...

続きを見る

 

サイズの設定

画面を下にスクロールすると、サイズに関する項目があります。

 

Stable Diffusion_Resize_to

 

ここでサイズを変更すると、縦伸び、横伸びなどする場合があります。

基本的にはアップロードした画像と同じサイズにしましょう。

 

📐三角定規のアイコンをクリックすると、アップロードした画像サイズに自動で合わせてくれます。

 

「Denoising strength」を設定

Denoising strength

 

「Denoising strength」で、生成する際の変化量の設定をします。

数値については

 

  • 小さい数値(最小値:0)ほど元画像から似た画像を生成
  • 大きい数値(最大値:1)ほど元画像から離れた画像を生成

 

「0」では変化は見られないので、以下の数字で比較してみました。

 

Denoising strength数値比較

 

生成の回数は複数回試した方がいいです。

数値が上がるにつれ、背景など含めだいぶ変わっていきます。

 

デフォルトで「0.75」となっていますが、あまりニュアンスを変えたくない場合は0.5以下から試した方がいいでしょう。

「1」にするともはや別画像です。

 

ここまでの手順で準備ができたら、右上にある「Generate」ボタンを押すと画像が生成されます。

 

応用①:画像サイズを2倍にする

resize_by

 

先程の画像サイズの設定の場所にタブで「Resize by」というものがあります。

 

スケールの数値を設定します。

例えば「2」にすると、元画像の2倍のサイズで生成されます。

 

応用②:Resize mode

 

img2imgにはリサイズ用のモードとして、

 

  • Just resize
  • Crop and resize
  • Resize and fill
  • latent upscale

という4種があります。

 

元画像のサイズ512×512を

512×800(高さを変更)にして4つを比較してみましょう

 

Resize mode比較

 

「Just resize」は画像が一見綺麗に見えるのですが、画像が伸びてしまっています。

 

「Crop and resize」がこの中で一番綺麗なのですが、元画像は肩や腕まで見えるのに対し、寄ってトリミングされています。

 

「Resize and fill」と「Resize and fill」は画像がぼやけたり、伸びてしまっているのですが、

 

「Resize and fill」と「Resize and fill」を使う場合は、

[Denoising strength]の数値を0.5以上にして生成しましょう。

 

Resize and fill比較

 

「Resize and fill」で「Denoising strength」の数値を変えてみました。

[0.3]だとまだ引き延ばした感じが残ります。

[0.5]から服も生成し、引き延ばされた感じのぼやけたのは取れました。

 

画像によって出来は変わるので、色々試してみてください。

 

まとめ

 

「img2img」は「txt2img」で生成した画像の手や指などの修正をしたい時などにも使えますし、

落書きの画像からも生成してくれます。

 

また、実写画像をアニメ画にすることもできます。

使用用途はたくさんありますので、また「img2img」については追記で更新していきます。

 

始めたばかりの方は、「txt2img」でプロンプトを色々試してからやる方が、どの単語でどのような指示を出せるか分かるので、まずはテキストで生成していくのをおすすめします。

 

関連記事

指や手の生成に関するネガティブプロンプトを簡単に挿入できる

bad-hands-5アイキャッチ
「bad-hands-5」で生成の手や指の崩れを抑える【Stable Diffusion】

    画像生成AIの苦手な部分に手や指の生成があります。 通常のプロンプト指示だけでは生成の成功率が低いため、Stable Diffusionでは「指や手の指示」に特化した機能が ...

続きを見る

 

拡張機能を導入すると作業効率がUPします。

Stable Diffusion拡張機能アイキャッチ
【Stable Diffusion】拡張機能の導入方法・おすすめ【Extensions】

    Stable Diffusion拡張機能は、画像生成作業を効率的かつ簡単に行えるようサポートする強力なツールです。 初心者の方は特に、拡張機能を使うことで効率よく画像生成が ...

続きを見る

 

ぼやけた感じや薄い色をもう少し彩度を上げたいなど画質向上には「VAE」というツールを使います。

VAE_アイキャッチ
【Stable Diffusion】VAEとは何か。使い方や便利な設定について

    Stable Diffusionの「VAE(ブイエーイー)」とは、簡単に言うと画質のクオリティを上げるツールで、導入するだけで   ぼやけた画像がクリアになる 彩 ...

続きを見る

 

 

Stable Diffusionガイド

Stable Diffusionカバー

Stable Diffusionを導入から、
プロンプト、モデルなど項目別に初心者にもわかりやすく解説しています。

記事一覧はこちらからチェックしてみてください

詳しくはコチラ

 

Stable Diffusionで大事なグラボ

画像生成において、グラボは妥協せずに用意しましょう。

最低でも「RTX 3060」を用意すると、生成もスムーズに行えます

 

Stable Diffusion関連書籍

Stable Diffusionスタートから応用まで学べる1冊

 

Stable Diffusion LORAの使い方までしっかりカバー

 

ゲーム系画像が作りたい方におすすめ

created by Rinker
秀和システム
¥2,640 (2024/04/17 17:25:24時点 Amazon調べ-詳細)

関連記事

-Stable Diffusion
-