Stable Diffusionでimg2imgを使って画像を生成する方法

＼Amazonプライム感謝祭開催中！／

ポチップ

img2imgで画像を生成する手順

img2imgの生成元となる画像を用意する

まずはimg2imgで読み込む画像を用意します。
今回はフリー素材サイトで入手できる以下の花畑の実写を用意しました。

入手先サイトは以下となります。たくさんの画像素材がありますので、好きな画像をダウンロードしてください。

Just a moment…

Stable Diffusion AI画像生成ガイドブック

著:今村勇輔, 著:比嘉康雄, 著:五十嵐良平

¥2,200 （2024/09/19 20:41時点 | Amazon調べ）

＼Amazonプライム感謝祭開催中！／

物体検出とGAN、オートエンコーダー、画像処理入門 PyTorch/TensorFlow2による発展的・実装ディープラーニング

ポチップ

著:チーム・カルポ

¥2,851 （2024/09/19 20:41時点 | Amazon調べ）

＼Amazonプライム感謝祭開催中！／

MSI GeForce RTX 4060 Ti VENTUS 2X BLACK 16G OC グラフィックカード – RTX 4060 Ti GPU 16GB GDDR6

ポチップ

AUTOMATIC1111でimg2imgを使って画像を生成する

ここからは実際にAUTOMATIC1111で先ほど用意した画像を読み込み、img2imgで画像を生成する手順を解説します。

まずAUTOMATIC1111のWebUIを起動したら、「img2img」のタブをクリックします。

タブを切り替えると以下の赤枠の画像をアップロードする画面が表示されます。この赤枠の中に読み込みたい画像ファイルをドラッグ&ドロップします。

アップロードが完了すると、以下のように読み込んだ画像が表示されます。

続いて、使用する学習済みモデルを選択しプロンプトを入力します。

プロンプトの作成が難しいと思われている方には、AIでプロンプトを自動生成するのがおすすめです。「StableDiffusionのプロンプト（呪文）を自然言語処理モデルGPT-3（Catchy）で自動生成する方法」で詳細を解説しています。

最後に以下の赤枠のパラメータを入力します。

パラメータの内容については、以下の記事で解説していますので、参考にしてください。

あわせて読みたい

Stable Diffusionを自在に操る！パラメータの使い方を解説｜ Pythonでの実装方法今回はStableDiffusionの主要なパラメータの使い方と、Pythonでの実装方法を解説します。パラメータがどのような影響を与えるかを理解することで、生成される画像をコン…

入力が終わったら「Generate」ボタンをクリックします。これで画像が生成されます。

あわせて読みたい

img2imgで生成された画像を保存する

画像の生成が完了すると、右側の赤枠の部分に生成された画像のプレビューが表示されます。

保存したいが像をクリックすると、以下のように大きなプレビュー画像が表示されます。
ダウンロードしたい画像が選択されている状態で「Save」ボタンをクリックすると、ダウンロードリンクが表示されます。
ダウンロードリンクをクリックしてファイルを保存してください。

Stable Diffusionでの画像生成に最適！ VRAM16GB搭載モデル！

¥91,485 （2024/09/19 20:41時点 | Amazon調べ）

＼Amazonプライム感謝祭開催中！／

MSI GeForce RTX 4060 Ti VENTUS 2X BLACK 16G OC グラフィックカード – RTX 4060 Ti GPU 16GB GDDR6

ポチップ

img2imgの実行結果

今回行った具体例を解説します。

img2imgの元画像

まず、元となる画像は先ほどのフリー素材の花畑の写真です。

風景だけで人物は写っていません。

使用したプロンプト

今回は風景写真に人物を追加するため、以下のようなプロンプトを用意しました。

プロンプト

(best quality)+,(masterpiece)++,(ultra detailed)++, (happy laughing:1.3), a girl

ネガティブプロンプト

(low quality, worst quality)1.4, (bad anatomy)+, (inaccurate limb)1.3,bad composition, inaccurate eyes, extra digit,fewer digits,(extra arms)1.2,logo,text

実行結果

生成時間を速くするため、Step数を低く設定しているのであまり精細に描画できていませんが、読み込んだ画像とほぼ同じ構図の花畑に、少女が立っているイラストを生成することができました。

全く同じ画像、プロンプトでシード値が違う画像です。

このように、img2imgを使うことで、絵の構図を細かく指定してイラストを生成できることが確認できました。

あわせて読みたい

img2imgのパラメータの設定方法

ここからはimg2imgのパラメータ設定方法について解説します。

img2imgでは、以下のようにResize modeとDenoising strengthのパラメータが追加されます。

Resize mode

Stable Diffusionのimg2imgには、リサイズモードとして4つのオプションが存在します。これらのオプションは以下の通りです。

Resize modeの機能

Just resize: このモードでは、指定されたサイズに画像をリサイズします。例えば、512×500の画像を1024×1024に生成するよう指示した場合、アスペクト比を無視して画像をストレッチします。
Crop and resize: このモードでは、まず画像を一定のサイズ（例えば500×500）にクロップし、その後指定されたサイズ（例えば1024×1024）にリサイズします。アスペクト比は維持されますが、画像の左右の一部が失われる場合があります。
Resize and fill: このモードでは、新しいノイズを追加して画像を一定のサイズ（例えば512×512）にパディングし、その後指定されたサイズ（例えば1024×1024）にリサイズします。
Just resize (latent upscale): このモードは最初のオプションと同じですが、latent upscaling（潜在的なアップスケーリング）を使用します。

アスペクト比が異なるサイズで出力したい場合は、Resize and fillがおすすめです。

以下が各モードでの出力結果の比較です。
512*512サイズの元画像を、img2imgでアスペクト比の異なる1200*1000サイズで出力します。

元画像

Just resize

Corp and resize

Resize and fill

Just resize(latent upscale)

Stable Diffusionでの画像生成に最適！ VRAM16GB搭載モデル！

¥91,485 （2024/09/19 20:41時点 | Amazon調べ）

＼Amazonプライム感謝祭開催中！／

MSI GeForce RTX 4060 Ti VENTUS 2X BLACK 16G OC グラフィックカード – RTX 4060 Ti GPU 16GB GDDR6

ポチップ

Denoising strength

img2imgでの生成時に使用できるパラメータDenoising Strengthについて解説します。

このパラメータは、入力画像にどれだけのノイズを加えるかを制御します。具体的には以下のように動作します。

Denoising Strengthの効果

Denoising Strengthの値が0の場合：この設定では、ノイズは一切加えられず、出力画像は入力画像と全く同じになります。
Denoising Strengthの値が1の場合：この設定では、入力画像は完全にノイズに置き換えられます。

Denoising Strengthの値が小さいほど、元画像に近くなり、値が大きいほど自由度が上がる（元画像と乖離した画像が出力される）という効果があります。

Denoising strengthの影響度を比較した例を以下に示します。

元画像

こちらが元画像です。この画像をimg2imgで２倍のサイズ（1024*1024）に拡張する際のDenoising strengthのパラメータの影響度を比較します。

Denoising strength：0.75（デフォルト）

Denoising strengthをデフォルト値の0.75に設定した場合の出力結果です。
構図はおおむね維持されていますが、キャラクターの防止が増えていたり、服装にリボンが付いたといった変化が確認できます。

Denoising strength：1

Denoising strengthを最大値の1に設定した場合の出力結果です。
服装だけでなく地形も変化し、キャラクター横の家も消えています。

あわせて読みたい

Denoising strength：0.2

Denoising strengthを最小値に近い0.2に設定した場合の出力結果です。
元画像からほとんど変化がない状態で、画像サイズだけを拡大することができました。

このようにDenoising strengthのパラメータの値によって、元の画像からどの程度の自由度を持たせて画像を生成するかを制御できることが確認できました。

Denoising strengthの値が小さいほど、元画像に忠実に構図が再現される。

img2imgで画像の一部を修正するInpaint

WebUIの標準機能であるInpaintを使って、img2imgの画像生成時に一部だけを修正することが可能です。Inpaintの詳細な使い方は、以下の記事で解説しています。

あわせて読みたい

Stable Diffusion WebUIのInpaintを使って画像の一部を修正する方法今回はStable DiffusionのWebUIに搭載されているInpaintの機能について解説します。この機能は、画像の一部を選択し、その部分をAIが自動的に修正することを可能にしま…

Stable Diffusionでの画像生成に最適！ VRAM16GB搭載モデル！

¥91,485 （2024/09/19 20:41時点 | Amazon調べ）

＼Amazonプライム感謝祭開催中！／

ジェネレーティブAI（画像生成AI）入門【Stable Diffusion】-プロンプトでハイクオリティな画像制作が可能

ポチップ

img2imgで画像生成時にアップスケーラで画像を高精細化する

今回はimg2imgの使用方法を解説しましたが、AUTOMATIC1111の拡張機能であるMultiDiffusionを使用することで、画像をアップスケールすることが可能です。

ベースの画像の構図を維持したまま、サイズを拡大、書き込み量を増やして高精細化することができます。

MultiDiffusionの使い方は以下の記事で解説しています。

あわせて読みたい

img2imgで高画質化できるMultiDiffusionの使い方｜ Stable Diffusion拡張機能の活用法グラボのVRAMが少ないから、サイズの小さい画像しか生成できないのがつらい… 小さいサイズだとキャラの顔が崩れちゃうんだよね今回はこんな時に便利なStable Diffusion…

Stable Diffusionのテクニックを効率よく学ぶには？

カピパラのエンジニア

Stable Diffusionを使ってみたいけど、ネットで調べた情報を試してもうまくいかない…

猫のエンジニア

そんな時は、操作方法の説明が動画で見られるUdemyがおすすめだよ！

動画学習プラットフォームUdemyでは、画像生成AIで高品質なイラストを生成する方法や、AIの内部で使われているアルゴリズムについて学べる講座が用意されています。

Udemyは講座単体で購入できるため安価で（セール時1500円くらいから購入できます）、PCが無くてもスマホでいつでもどこでも手軽に学習できます。

Stable Diffusionに特化して学ぶ

Stable Diffusionに特化し、クラウドコンピューティングサービスPaperspaceでの環境構築方法から、モデルのマージ方法、ControlNetを使った構図のコントロールなど、中級者以上のレベルを目指したい方に最適な講座です。

画像生成AIの仕組みを学ぶ

画像生成AIの仕組みについて学びたい方には、以下の講座がおすすめです。
画像生成AIで使用される変分オートエンコーダやGANのアーキテクチャを理解することで、よりクオリティの高いイラストを生成することができます。

AIによる画像生成を学ぼう！【VAE / GAN】 -Google ColabとPyTorchで基礎から学ぶ生成モデル-

まとめ

今回はAUTOMATIC1111でimg2imgを使ってイラスト生成する方法を紹介してみました。img2imgを使用することで生成する画像の構図を細かく指示することが可能ですので、ぜひ活用してみてください。

また、以下の記事で効率的にPythonのプログラミングスキルを学べるプログラミングスクールの選び方について解説しています。最近ではほとんどのスクールがオンラインで授業を受けられるようになり、仕事をしながらでも自宅で自分のペースで学習できるようになりました。

スキルアップや副業にぜひ活用してみてください。

あわせて読みたい

Pythonが学べるプログラミングスクール5選｜初心者にもおすすめプログラミングスクールってたくさんあって、どのスクールを選んだらいいのかな？自分のキャリアアップに必要なカリキュラムがあるプログラミングスクールを探したいん…

スクールではなく、自分でPythonを習得したい方には、いつでもどこでも学べる動画学習プラットフォームのUdemyがおすすめです。

講座単位で購入できるため、スクールに比べ非常に安価（セール時1200円程度～）に学ぶことができます。私も受講しているおすすめの講座を以下の記事でまとめていますので、ぜひ参考にしてみてください。

あわせて読みたい

Python初心者におすすめ！いつでもどこでもスマホで学べるUdemy講座6選 Udemyってどんなサービスなの？仕事の案件で機械学習を扱うことになったけど、どうやって勉強したらしいんだろう？こんな悩みを解決します。この記事でわかること Ud…

それでは、また次の記事でお会いしましょう。

画像生成系AI Stable Diffusionゲームグラフィックス自動生成ガイド

著:クロノス・クラウン, 著:柳井政和

¥2,138 （2024/09/20 02:44時点 | Amazon調べ）

＼Amazonプライム感謝祭開催中！／

ポチップ

AIで好きな絵をつくる！「Stable Diffusion」

興陽館

¥1,540 （2024/09/18 08:59時点 | Amazon調べ）

＼Amazonプライム感謝祭開催中！／

ポチップ

図解ポケット画像生成AIがよくわかる本

秀和システム

¥1,210 （2024/09/21 19:39時点 | Amazon調べ）

＼Amazonプライム感謝祭開催中！／