ControlNetでおすすめモデル４選｜モデルの効果から使用方法までを解説

2023年9月20日2023年10月4日

URLをコピーしました！

今回は、画像生成AI Stable Diffusionの拡張機能である、ControlNetで使用できる最もおすすめのモデルを4つを紹介します。

ControlNetでは、日々様々なモデルがリリースされていますが、ControlNetインストールしたら最初に合わせて導入しておきたいモデルとして以下の4つをピックアップしました。

ControlNetでおすすめのモデル

openpose
depth（Depth map library and poser）
reference_only
tile_resample

構図のコントロールやディティールの追加など、基本的な機能でありつつも、画像のクオリティを大幅に向上させることができる機能となっていますので、ぜひ試してみてください。

この記事でわかること

ControlNetで必須となるおすすめのモデル
各モデルの効果
各モデルの導入方法と使用方法

ControlNet本体の導入方法についても、以下の記事で解説していますので、あわせてご覧ください。

あわせて読みたい

ControlNetをAUTOMATIC1111にインストールする方法｜ Stable Diffusionの構図を自在にコントロール今回はAUTOMATIC1111の機能を拡張する、ControlNetのインストールする方法を解説します。ControlNetを使用することで、Stable Diffusionで生成するイラストの自由度が大…

また、当ブログのStable Diffusionに関する記事を以下のページでまとめていますので、あわせてご覧ください。

あわせて読みたい

Stable Diffusionの使い方を解説！｜ AIで画像生成する方法最近、Stable Diffusionっていう画像系AIが話題だよね使ってみたいけど、どうすればいいんだろう？ Stable Diffusionはオープンソースだから、自分でPythonのコードをダ…

Stable Diffusionの導入方法から応用テクニックまでを動画を使って習得する方法についても以下のページで紹介しています。

あわせて読みたい

Stable Diffusion 初心者から中級者が画像生成のテクニックを効率良く学べる方法を紹介 Stable Diffusionって最近話題だけど、専門用語が難しいしどこから手を付けていいかわからない… 家にゲーミングPCないし、環境のセットアップ方法を調べるのが面倒なん…

openpose

まず１つ目に紹介するのはopenposeです。

おそらくControlNetの中でも最もよく利用されているポーズを指定することができるモデルです。

OpenPoseEditorというツールと連携させることで、以下のようにWebUI上で棒人間をマウスで操作してポーズを作成することが可能になります。

openposeという骨格検出が可能な機械学習モデルを使い、棒人間のポーズを読み込み、その情報をStable Diffusionで読み込んで画像を生成します。

実際に画像左のようなポーズを作成し、それを元にStable Diffusionで画像生成を行った結果です。

このように、openposeを使用することでキャラクターのポーズを自在にコントロールできるようになります。

openposeの詳細な使い方については、以下の記事で解説しています。

あわせて読みたい

Openpose Editorのデータを元にControlNetで構図やキャラのポーズを指定する方法今回はAUTOMATIC1111の拡張機能として公開されたOpenpose Editorのインストールと使い方について解説します。ControlNetでOpenposeのモデルを使って画像生成をする場合…

MSI GeForce RTX 4060 Ti VENTUS 2X BLACK 16G OC グラフィックカード – RTX 4060 Ti GPU 16GB GDDR6

Stable Diffusionでの画像生成に最適！ VRAM16GB搭載モデル！

¥113,101 （2025/07/17 12:21時点 | Amazon調べ）

口コミを見る

Amazon

楽天市場

Yahooショッピング

メルカリ

ポチップ

depth（Depth map library and poser）

depth（Depth map library and poser）は深度情報を使って、Stable Diffusionで生成される人物の手のポーズをコントロールします。

depth（Depth map library and poser）をWebUIのインストールすると、以下のようにWebUI上でキャラクターのハンドポーズを選択して配置できるようになります。

ハンドポーズを指定すると、そのポーズの深度情報を読み込み、生成画像の配置した位置に適用されます。

実際に画像生成時にdepthを適用すると、失敗した手の部分だけを指定したハンドポーズを適用して修復することができます。

depthの詳細な使い方については、以下の記事で解説しています。

あわせて読みたい

Stable Diffusionで生成したキャラクターの不自然な手を修正する方法｜ DepthライブラリとControlNetの… 今回はStable Diffusionで生成したイラストの不自然な手を修正する方法を解説します。Stable DiffusionのWebUIであるAUTOMATIC1111に、c and poser（深度ライブラリ）と…

あわせて読みたい

reference_only

reference_onlyは一枚の画像を元に類似の画像を生成するモデルです。

通常、ある画像を元に違うポーズやアングルから撮影したような画像を生成するにはLoRA（Low-Rank Adaptation）というモデルを局所的に追加学習する仕組みを利用します。

しかし、LoRAでの追加学習には、元となるキャラクターやコスチューム、風景など模倣させたい特徴を含んだ画像を最低２０枚以上用意する必要があります。

しかし、ControlNetのモデルであるreference_onlyを使用すると、たった一枚の画像から、その特徴を模擬した画像が生成できます。

以下がサンプルとなる元画像です。（東北ずん子データセット）

そして以下がreference_onlyを使って生成した画像です。元画像のキャラクターの髪型や色、服装などの特徴が継承されているのが確認できます。

このように、reference_onlyを使用すると、手軽に類似の画像を手軽に量産することが可能です。

学習元となるデータを大量に用意しなければならないLoRAによる追加学習でも、reference_onlyを使用することにより学習用のデータセットを簡単に生成することもできます。

reference_onlyの詳細な使い方については、以下の記事で解説しています。

あわせて読みたい

Stable DiffusionでControlNetのreference_onlyでキャラを固定して画像生成する方法今回はControlNetの機能として利用できるreference_onlyについて解説します。reference_onlyを使用すると、1枚の参照画像を用いて生成する画像のスタイルや特徴をより細…

MSI GeForce RTX 4060 Ti VENTUS 2X BLACK 16G OC グラフィックカード – RTX 4060 Ti GPU 16GB GDDR6

Stable Diffusionでの画像生成に最適！ VRAM16GB搭載モデル！

¥113,101 （2025/07/17 12:21時点 | Amazon調べ）

口コミを見る

Amazon

楽天市場

Yahooショッピング

メルカリ

ポチップ

tile_resample

tile_resampleは、元の絵のタッチや構図を維持したままアップスケールすることができるモデルです。

Stable Diffusionで使用できるアップスケーラと言えば、hires.fixやDetail Tweaker LoRAなどが良く使われるかと思います。tile_resampleはこれらのアップスケーラよりも元の絵の特徴を維持したまま、大幅に書き込み量を増やすことが可能です。

以下がtile_resampleを適用する前と後の比較です。

このように、元の画像の良さを維持しつつディティールを追加したい場合におすすめです。

tile_resampleの詳細な使い方については、以下の記事で解説しています。

あわせて読みたい

ControlNetのtile_resampleで書き込み量を増やす方法 ControlNetで使用できるプリプロセッサ、tile_resampleを使って、元の画像の絵柄を保ったまま書き込み量を増やす方法について解説します。Hires.fix等でアップスケール…

Stable Diffusionのテクニックを効率よく学ぶには？

カピパラのエンジニア

Stable Diffusionを使ってみたいけど、ネットで調べた情報を試してもうまくいかない…

猫のエンジニア

そんな時は、操作方法の説明が動画で見られるUdemyがおすすめだよ！

動画学習プラットフォームUdemyでは、画像生成AIで高品質なイラストを生成する方法や、AIの内部で使われているアルゴリズムについて学べる講座が用意されています。

Udemyは講座単体で購入できるため安価で（セール時1500円くらいから購入できます）、PCが無くてもスマホでいつでもどこでも手軽に学習できます。

Stable Diffusionに特化して学ぶ

Stable Diffusionに特化し、クラウドコンピューティングサービスPaperspaceでの環境構築方法から、モデルのマージ方法、ControlNetを使った構図のコントロールなど、中級者以上のレベルを目指したい方に最適な講座です。

ジェネレーティブAI（画像生成AI）入門【Stable Diffusion】-プロンプトでハイクオリティな画像制作が可能

画像生成AIの仕組みを学ぶ

画像生成AIの仕組みについて学びたい方には、以下の講座がおすすめです。
画像生成AIで使用される変分オートエンコーダやGANのアーキテクチャを理解することで、よりクオリティの高いイラストを生成することができます。

AIによる画像生成を学ぼう！【VAE / GAN】 -Google ColabとPyTorchで基礎から学ぶ生成モデル-

まとめ

今回はControlNetを導入したら必ず入れておきたいモデル4選を紹介しました。

私自身も良く使用しており、どれもControlNetを使用する上では鉄板となるモデルばかりですので、ぜひ実際の効果を確認してみてください。

ControlNetの使用方法については、以下の記事で解説していますので、あわせてご覧ください。

あわせて読みたい

Stable Diffusion拡張機能、ControlNetのインストールと活用方法を解説画像生成AIであるStable Diffusionでは、プロンプト（呪文）によって画像の内容指示することで意図した構図、画風に近づけることが重要でした。実際に生成される画像は…

また、ハイクオリティな画像を生成するためのプロンプトを、自然言語モデルを使って生成する方法について、以下の記事で解説していますので、あわせてご覧ください。

あわせて読みたい

StableDiffusionのプロンプト（呪文）を自然言語処理モデルGPT-3（Catchy）で自動生成する方法今回はStable Diffusionなどの画像AIに生成するための指示を与えるPromptを、GPT-3を使ったライティングツールCatchyで自動生成する方法について解説します。私のように…

それでは、また次の記事でお会いしましょう。