Stable Diffusionで生成した画像をReal-ESRGANを使って高画質化する方法

ポチップ

先読み！IT×ビジネス講座　画像生成AI

著:深津貴之, 著:水野祐, 著:酒井麻里子

¥1,485 （2025/06/26 08:24時点 | Amazon調べ）

ポチップ

Real-ESRGANのインストール

GitHubからReal-ESRGANのリポジトリをダウンロードします。

git clone https://github.com/xinntao/Real-ESRGAN.git
cd Real-ESRGAN

続いて以下を1つづつインストールします。

pip install basicsr
pip install facexlib
pip install gfpgan
pip install -r requirements.txt
python setup.py develop

人工知能は人間を超えるか (角川ＥＰＵＢ選書)

著:松尾豊

¥891 （2023/09/11 22:12時点 | Amazon調べ）

AIとコラボして神絵師になる　論文から読み解くStable Diffusion (技術の泉シリーズ（NextPublishing）)

ポチップ

学習済みモデルの取得

続いてReal-ESRGANで推論を実行するための学習済みモデルをダウンロードします。以下のURLからダウンロードしてください。

1つ目はデフォルトのモデル。

https://github.com/xinntao/Real-ESRGAN/releases/download/v0.1.0/RealESRGAN_x4plus.pth

2つ目はアニメ画像に特化したモデルです。

https://github.com/xinntao/Real-ESRGAN/releases/download/v0.2.2.4/RealESRGAN_x4plus_anime_6B.pth

ダウンロードした学習済みモデルを以下のディレクトリに配置します。

（Real-ESRGANが格納されているディレクトリ）\Real-ESRGAN\weights

あわせて読みたい

Real-ESRGANの推論を実行する

先ほどダウンロードしたReal-ESRGANのリポジトリと学習済みモデルを使って実際に高画質化を行います。

推論を実行するためのコマンドは以下となります。オプションの「-i」は入力したい画像ファイルが格納されるディレクトリ、「-n」が使用するモデルとなります。

./realesrgan-ncnn-vulkan.exe -i input -n model_name

その他のパラメータについては以下を参照してください。
https://github.com/xinntao/Real-ESRGAN-ncnn-vulkan#computer-usages

また、私の環境では以下のようなエラーが発生したため、解決方法も記載しておきます。

発生したエラー　1つ目

AttributeError: 'NoneType' object has no attribute 'shape'

こちらは初期状態で「input」の中にフォルダが含まれているため発生するようです。
input内のフォルダを削除すると解消されました。

発生したエラー　2つ目

Error "slow_conv2d_cpu" not implemented for 'Half'
If you encounter CUDA out of memory, try to set --tile with a smaller number.

CUDAが使用できないノートPCなどで実行すると発生するようです。
CPUのみで処理する場合は「–fp32」のオプションを指定してください。

python inference_realesrgan.py -n RealESRGAN_x4plus_anime_6B -i inputs --fp32

著:白井暁彦

¥880 （2025/06/26 08:24時点 | Amazon調べ）

ポチップ

先読み！IT×ビジネス講座　画像生成AI

著:深津貴之, 著:水野祐, 著:酒井麻里子

¥1,485 （2025/06/26 08:24時点 | Amazon調べ）

AIとコラボして神絵師になる　論文から読み解くStable Diffusion (技術の泉シリーズ（NextPublishing）)

ポチップ

実行結果

まずはReal-ESRGANにデフォルトで入っているサンプルを試してみます。
サンプルは2次元キャラなので「RealESRGAN_x4plus_anime_6B」を使用します。

python inference_realesrgan.py -n RealESRGAN_x4plus_anime_6B -i inputs --fp32

実行前

Real-ESRGANでの高解像度化前の画像がこちらです。
画像サイズが小さく、圧縮されているため画像が劣化しています。

実行後

Real-ESRGANで推論を実行し、高解像度化された後の画像です。
画像サイズが大きくなり、綺麗になっています。特に猫の輪郭周りの劣化していた部分を比較すると良くわかるかと思います。

Stable Diffusion（Waifu Diffusion）で生成した画像を高解像度化

最後にStable Diffusionを使って生成した画像を、Real-ESRGANで実際に高画質化してみます。
今回、使用する画像はStable Diffusionの2次元用モデル、Waifu Diffusionを使って生成しています。Waifu Diffusionの使い方は以下の記事で解説しています。

あわせて読みたい

Stable Diffusion 2.xで2次元キャラ特化モデルWaifu Diffusionを使ってイラストを生成する方法今回は2次元キャラクターに特化したモデルWaifu Diffusionを、イラスト描画AIであるStable Diffusionの最新バージョン2.xで動作させる方法を解説します。ローカル環境や…

実行前

こちらが実行前の画像です。Stable Diffusionのデフォルトサイズの512×512となっています。

実行後

こちらが実行後の画像です。
サイズが2048×2048まで拡大されました。拡大による画質の劣化もなく非常に奇麗です。

著:白井暁彦

¥880 （2025/06/26 08:24時点 | Amazon調べ）

ポチップ

先読み！IT×ビジネス講座　画像生成AI

著:深津貴之, 著:水野祐, 著:酒井麻里子

¥1,485 （2025/06/26 08:24時点 | Amazon調べ）