今回はStable DiffusionのWebUI、AUTOMATIC1111の拡張機能として使えるMultiDiffusionを紹介します。
MultiDiffusionはimg2imgで画像生成する際にも使用できるアップスケーラで、元の画像の構図を保ったまま画像サイズを拡大、高精細化することができます。
今回はアニメ調画像を例に解説しますが、アップスケーラの種類を変更することでフォトリアル系の画像にも使えますので、ぜひ活用してみてください。
img2imgで元の構図を維持したまま高精細化が可能。
また、当ブログのStable Diffusionに関する記事を以下のページでまとめていますので、あわせてご覧ください。

Stable Diffusionとは
Stable Diffusion(ステーブル・ディフュージョン)は2022年8月に無償公開された描画AIです。ユーザーがテキストでキーワードを指定することで、それに応じた画像が自動生成される仕組みとなっています。
NVIDIAのGPUを搭載していれば、ユーザ自身でStable Diffusionをインストールし、ローカル環境で実行することも可能です。
(出典:wikipedia)
AUTOMATIC1111はStable Diffusionをブラウザから利用するためのWebアプリケーションです。AUTOMATIC1111を使用することで、プログラミングを一切必要とせずにStable Diffusionで画像生成を行うことが可能になります。
AUTOMATIC1111の公式リポジトリは以下となります。
ローカル環境
GPUを搭載したローカルPCでAUTOMATIC1111を使用する方法について、以下の記事で解説しています。

Google Colaboratory
Googleのクラウドコンピューティングサービス、Google ColaboratoryでAUTOMATIC1111を使用する方法については、以下の記事で解説しています。
2023年5月現在、Google Colaboratoryの利用規約が改訂され、Stable Diffusionなどの画像AIの利用が可能なのは有料のProプランのみとなりました。
無料プランでStable Diffusionを使用すると、アカウント停止等の措置が取られる可能性がありますのでご注意ください。(詳細はGoogle Colaboratoryの利用規約をご確認ください。

Paperspase
定額制で高性能GPUを利用できるクラウドコンピューティングサービス、PaperspaceでAUTOMATIC1111を使用する方法については、以下の記事で解説しています。

img2imgとは
今回使用するimg2imgについては以下の記事で詳細を解説しています。

MultiDiffusionのインストール
AUTOMATIC1111のWebUIにMultiDiffusionをインストールする手順を解説します。
AUTOMATIC1111のWebUIを起動したら、Extensions
タブをクリックします。

Install from URL
タブをクリックします。

URL for extension's git repository
に以下のURLを入力してください。
https://github.com/pkuliyi2015/multidiffusion-upscaler-for-automatic1111

URLを入力したらInstall
をクリックします。

以下のようにメッセージが表示されたらインストールが完了です。

MultiDiffusionを使ってアップスケール(高画質)する
MultiDiffusionをインストール後、WebUIを再起動すると以下のようにTiled Diffusion
とTiled VAE
の項目が追加されています。

今回はimg2imgでのアップスケールを試しますので、まずはtxt2imgで画像を生成します。
プロンプトとパラメータを入力したら、Generate
をクリックして画像を生成します。

画像生成が完了したら、気に入った画像を選択し、Send to img2img
をクリックします。

img2imgの画面に先ほどの画像が転送されたら、画面を下にスクロールします。

まずは通常通りSampling method
を選択します。今回はimg2imgの元画像と同様にDPM++ 2M Karras
を選択します。

続いてSampling steps
を設定します。今回は30に設定しました。

Tiled Diffusion
の項目をクリックします。

以下のようにMultiDiffusionの設定項目が展開されます。

Enable Tiled Diffusion
とKeep input image size
にチェックを入れます。

Method
はデフォルトのMultiDiffusion
のままに設定します。

Upscaler
は今回はR-ESRGAN 4x+ Anime6B
を選択しました。フォトリアル系ではR-ESRGAN 4x+
など必要に応じて変更してください。

Scale Factor
は元の入力画像に対して、何倍に拡張するかを設定する項目になります。今回は元画像が512*512
のサイズであるため、2
に設定しました。
出力画像は2倍の1024*1024
となります。

それ以外の項目は今回はデフォルト値のままとしました。
設定が完了したら、Generate
をクリックして画像を生成します。

以下のようにMultiDiffusionによってアップスケールされた画像が生成されました。

img2imgで画像生成時のMultiDiffusionアップスケール実行結果
j実際にMultiDiffusionを使ったアップスケール前後の画像を比較してみます。
アップスケール前の画像
アップスケール前の画像は512*512のサイズの画像です。
プロンプト
(best quality)+,(masterpiece)++,(ultra detailed)++, ((Add layer)),A girl in school uniform is standing, on her way home at dusk, alley, evening, dusk
ネガティブプロンプト
(worst quality:1.4), (low quality:1.4), (monochrome:1.3), (3D:0.9), lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, normal quality, jpeg artifacts, signature, watermark, username, blurry, artist name, bad_prompt, bad_prompt2
モデル
今回、画像生成に使用したモデルはBreakDomain_m2000です。
モデルの入手先は以下のページで解説しています。

生成された画像

MultiDiffusionでアップスケール後の画像
こちらがMultiDiffusionでアップスケールした画像です。
画像サイズが大きくなっただけでなく、書き込み量も増えて高精細な画像になりました。

Stable Diffusionのローカル環境
Stable Diffusionを使用する際にGoogle ColaboratoryやWebサービスを利用されている方も多いかと思います。しかし、最近Google Colabの無料での使用範囲が大きく制限されたり、Webサービスでは月額費用がかかったりします。
欲しいイラストを生成するにはかなりの回数をトライする必要があるため、これらの制約に縛られることなく使用できるローカル環境を構築するのがおすすめです。
ローカルのPCに搭載するグラフィックボード
ローカルマシンで実行する上で重要になってくるのがグラフィックボードです。
Stable Diffusionでイラストを生成するために実行される推論処理を、グラフィックボード上のGPUを使って大幅に高速化することができます。
トライする回数が増えれば品質の高いイラストが生成される可能性が上がりますので、グラフィックボードは重要です。Stable Diffusionで使用するためのGPUは2022年に新たにNVIDIAから発売されたRTX4000シリーズのGPUとVRAM12GB以上のものがおすすめです。最近は半導体不足も一服したこともあり、新しい製品ながら価格が下がりつつあります。
エントリーモデルのGPU
予算を安く抑えたい方向けにはRTX4070を搭載したグラフィックボードがおすすめです。
予算に余裕がある方向け ミドル~ハイエンド
予算に余裕がある方向けにおすすめのRTX 4080、ビデオメモリ16GB以上搭載のモデルです。
大サイズの画像を高速に生成したい方向けのハイエンドGPU、RTX 4090 ビデオメモリ24GB搭載モデルです。
予算とパフォーマンスに合わせて選んでみてください。
画像生成AIについて学ぶ
動画学習プラットフォームUdemyでは、画像生成AIで高品質なイラストを生成する方法や、AIの内部で使われているアルゴリズムについて学べる講座が用意されています。
Udemyは講座単体で購入できるため安価で(セール時1500円くらいから購入できます)、PCが無くてもスマホでいつでもどこでも手軽に学習できます。
画像生成AIの使い方を学ぶ
Stable DiffusionやMidjourneyの使い方や活用方法を勉強したい方には、以下の講座がおすすめです。

画像生成AIの仕組みを学ぶ
画像生成AIの仕組みについて学びたい方には、以下の講座がおすすめです。
画像生成AIで使用される変分オートエンコーダやGANのアーキテクチャを理解することで、よりクオリティの高いイラストを生成することができます。

UdemyのStable Diffusionなど、AIアート関連の講座は海外のものも多いですが、ブラウザのリアルタイム翻訳機能を使うことで日本語字幕付きで視聴できます。
Udemyの海外講座の字幕を日本語化する方法
まとめ
今回はStable DiffusionのWebUI、AUTOMATIC1111の拡張機能として使えるMultiDiffusionを紹介しました。
AUTOMATIC1111では、今回紹介したMultiDiffusion以外にもアップスケールする拡張機能が用意されています。


用途に応じた拡張機能を選択してみてください。
また、以下の記事で効率的にPythonのプログラミングスキルを学べるプログラミングスクールの選び方について解説しています。最近ではほとんどのスクールがオンラインで授業を受けられるようになり、仕事をしながらでも自宅で自分のペースで学習できるようになりました。
スキルアップや副業にぜひ活用してみてください。

スクールではなく、自分でPythonを習得したい方には、いつでもどこでも学べる動画学習プラットフォームのUdemyがおすすめです。
講座単位で購入できるため、スクールに比べ非常に安価(セール時1200円程度~)に学ぶことができます。私も受講しているおすすめの講座を以下の記事でまとめていますので、ぜひ参考にしてみてください。

それでは、また次の記事でお会いしましょう。