今回はStable Diffusionで生成した画像を高精細化するAUTOMATIC1111の機能、hires.fixについて使い方を解説します。
最初から大サイズで出力するよりも、小さいサイズで生成した画像をhires.fixでアップスケールした方が高精細な画像を作ることができますので、ぜひ活用してみてください。
また、当ブログのStable Diffusionに関する記事を以下のページでまとめていますので、あわせてご覧ください。

Stable Diffusionとは
Stable Diffusion(ステーブル・ディフュージョン)は2022年8月に無償公開された描画AIです。ユーザーがテキストでキーワードを指定することで、それに応じた画像が自動生成される仕組みとなっています。
NVIDIAのGPUを搭載していれば、ユーザ自身でStable Diffusionをインストールし、ローカル環境で実行することも可能です。
(出典:wikipedia)
AUTOMATIC1111はStable Diffusionをブラウザから利用するためのWebアプリケーションです。AUTOMATIC1111を使用することで、プログラミングを一切必要とせずにStable Diffusionで画像生成を行うことが可能になります。
AUTOMATIC1111の公式リポジトリは以下となります。
ローカル環境
GPUを搭載したローカルPCでAUTOMATIC1111を使用する方法について、以下の記事で解説しています。

Google Colaboratory
Googleのクラウドコンピューティングサービス、Google ColaboratoryでAUTOMATIC1111を使用する方法については、以下の記事で解説しています。
2023年5月現在、Google Colaboratoryの利用規約が改訂され、Stable Diffusionなどの画像AIの利用が可能なのは有料のProプランのみとなりました。
無料プランでStable Diffusionを使用すると、アカウント停止等の措置が取られる可能性がありますのでご注意ください。(詳細はGoogle Colaboratoryの利用規約をご確認ください。

Paperspase
定額制で高性能GPUを利用できるクラウドコンピューティングサービス、PaperspaceでAUTOMATIC1111を使用する方法については、以下の記事で解説しています。

hires.fixとは(AUTOMATIC1111標準機能)
hires.fixは画像をアップスケールする機能で、AUTOMATIC1111に標準搭載されています。
アップスケーラーを使用して画像サイズの拡大、及び高精細化をすることができます。

アップスケーラーはかなりの種類が用意されており、以下の記事で紹介したLLuLと同じLatentも使用可能です。

AUTOMATIC1111でhires.fixを使用する手順
ここからは実際にhires.fixを使用する手順を解説します。
AUTOMATIC1111のWebUIを起動します。
UIが起動したらプロンプトとパラメータを入力します。この際、画像サイズは小さめのサイズを設定してください。(後程アップスケールでサイズを大きくするため)
今回はデフォルトの512 × 512で作成しました。

画像が生成された、その中からアップスケールしたい画像を選びます。

アップスケールしたい画像のSeed値をコピーし、パラメータに設定します。
今回はこちらの川の前で立っている絵にしました。

「hires.fix」のチェックボックスをクリックしてONにします。

チェックボックスをONすると、以下のようにhires.fixに関するパラメータのUIが展開されます。

まず使用するアップスケーラーを選択します。今回はデフォルトのLatentを使用します。
どれを選んだらよいかわからない方はデフォルトでOKです。

「Hires steps」と「Denoising strength」を設定します。
「Hires steps」は0を設定すると元の絵を生成した時の「Sampling steps」と同じ値が適用されるようです。
「Denoising strength」はノイズ除去の度合いを設定するパラメータです。今回はデフォルトのまま使用します。

最後に「Upscale by」の値を設定します。
ここは元の絵を何倍にスケールするかを指定します。元の絵が512 ×512ですので、デフォルトの2倍に設定しました。右上の「resize:from」の項目にアップスケール後のサイズが表示されます。

以上の内容を入力後、「Generate」ボタンをクリックすると以下のようにアップスケールされた画像が生成されました。


実行結果
実際に元画像とアップスケールされた画像を比較してみます。
hires.fixの設定パラメータは以下の通りです。
Upscale:Latent
Hires steps:40(元画像と同じ)
Denoising strength:0.7
Upscale by:2
元画像
こちらが元画像です。サイズは512 ×512で生成しました。

アップスケールされた画像
こちらがhires.fixを使ってアップスケールした画像です。
画像サイズは1024×1024に拡大されており、背景の書き込み量も増えて高精細化されていることが確認できました。

Stable Diffusionのローカル環境
Stable Diffusionを使用する際にGoogle ColaboratoryやWebサービスを利用されている方も多いかと思います。しかし、最近Google Colabの無料での使用範囲が大きく制限されたり、Webサービスでは月額費用がかかったりします。
欲しいイラストを生成するにはかなりの回数をトライする必要があるため、これらの制約に縛られることなく使用できるローカル環境を構築するのがおすすめです。
ローカルのPCに搭載するグラフィックボード
ローカルマシンで実行する上で重要になってくるのがグラフィックボードです。
Stable Diffusionでイラストを生成するために実行される推論処理を、グラフィックボード上のGPUを使って大幅に高速化することができます。
トライする回数が増えれば品質の高いイラストが生成される可能性が上がりますので、グラフィックボードは重要です。Stable Diffusionで使用するためのGPUは2022年に新たにNVIDIAから発売されたRTX4000シリーズのGPUとVRAM12GB以上のものがおすすめです。最近は半導体不足も一服したこともあり、新しい製品ながら価格が下がりつつあります。
エントリーモデルのGPU
予算を安く抑えたい方向けにはRTX4070を搭載したグラフィックボードがおすすめです。
予算に余裕がある方向け ミドル~ハイエンド
予算に余裕がある方向けにおすすめのRTX 4080、ビデオメモリ16GB以上搭載のモデルです。
大サイズの画像を高速に生成したい方向けのハイエンドGPU、RTX 4090 ビデオメモリ24GB搭載モデルです。
予算とパフォーマンスに合わせて選んでみてください。
画像生成AIについて学ぶ
動画学習プラットフォームUdemyでは、画像生成AIで高品質なイラストを生成する方法や、AIの内部で使われているアルゴリズムについて学べる講座が用意されています。
Udemyは講座単体で購入できるため安価で(セール時1500円くらいから購入できます)、PCが無くてもスマホでいつでもどこでも手軽に学習できます。
画像生成AIの使い方を学ぶ
Stable DiffusionやMidjourneyの使い方や活用方法を勉強したい方には、以下の講座がおすすめです。

画像生成AIの仕組みを学ぶ
画像生成AIの仕組みについて学びたい方には、以下の講座がおすすめです。
画像生成AIで使用される変分オートエンコーダやGANのアーキテクチャを理解することで、よりクオリティの高いイラストを生成することができます。

UdemyのStable Diffusionなど、AIアート関連の講座は海外のものも多いですが、ブラウザのリアルタイム翻訳機能を使うことで日本語字幕付きで視聴できます。
Udemyの海外講座の字幕を日本語化する方法
まとめ
今回はAUTOMATIC1111で画像をアップケールすることができるhires.fixの使い方について解説しました。hires.fixの場合元の小さい画像をアップスケールするためキャラクターが大きくなってしまうという特徴があるようですので、背景を精細に描きたい場合はLLuLと使い分けるのが良さそうです。
また、以下の記事で効率的にPythonのプログラミングスキルを学べるプログラミングスクールの選び方について解説しています。最近ではほとんどのスクールがオンラインで授業を受けられるようになり、仕事をしながらでも自宅で自分のペースで学習できるようになりました。
スキルアップや副業にぜひ活用してみてください。

スクールではなく、自分でPythonを習得したい方には、いつでもどこでも学べる動画学習プラットフォームのUdemyがおすすめです。
講座単位で購入できるため、スクールに比べ非常に安価(セール時1200円程度~)に学ぶことができます。私も受講しているおすすめの講座を以下の記事でまとめていますので、ぜひ参考にしてみてください。

それでは、また次の記事でお会いしましょう。