Stable Diffusionの使い方を解説！｜ AIで画像生成する方法

2022年10月26日2023年10月27日

URLをコピーしました！

猫のサラリーマン

最近、Stable Diffusionっていう画像系AIが話題だよね
使ってみたいけど、どうすればいいんだろう？

猫のエンジニア

Stable Diffusionはオープンソースだから、自分でPythonのコードをダウンロードして自宅のPCやGoogle Colabで使えるんだよ。

画像を描画できるAI、Stable Diffusionについて、当ブログでも過去に何度か取り上げてきました。

今回はStable Diffusionのインストールから拡張機能の使い方まで、それらの使用方法についてまとめたいと思います。

この記事でわかること

Stable Diffusionの概要
Stable Diffusionの導入方法
Stable Diffusionの拡張機能の使い方
Stable Diffusionで使えるモデルとプロンプト（呪文）

Stable Diffusionとは

Stable Diffusion（ステーブル・ディフュージョン）は2022年8月に無償公開された描画AIです。ユーザーがテキストでキーワードを指定することで、それに応じた画像が自動生成される仕組みとなっています。
GPUを搭載していれば、ユーザ自身でStable Diffusionをインストールしローカル環境で実行することも可能です。
（出典：wikipedia）

AIとコラボして神絵師になる　論文から読み解くStable Diffusion (技術の泉シリーズ（NextPublishing）)

著:白井暁彦

¥1,584 （2025/08/03 23:28時点 | Amazon調べ）

口コミを見る

Amazon

＼楽天ポイント4倍セール！／

楽天市場

Yahooショッピング

メルカリ

ポチップ

先読み！IT×ビジネス講座　画像生成AI

著:深津貴之, 著:水野祐, 著:酒井麻里子

¥1,485 （2025/08/03 23:28時点 | Amazon調べ）

口コミを見る

Amazon

＼楽天ポイント4倍セール！／

楽天市場

Yahooショッピング

メルカリ

ポチップ

高機能WebUI AUTOMATIC1111

Stable Diffusionの主要機能をほとんど網羅している超高機能Web UI、AUTOMATIC1111。

Pythonなどプログラミングを一切必要とせず、GUIからモデルの変更やパラメータ設定など、Steble Diffusionの機能を使用できます。

猫のエンジニア

Stable Diffusionを始めるなら、まずはAUTOMATIC1111のインストールからだね。

AUTOMATIC1111のインストール

WebUI AUTOMATIC1111は主にローカルPC、Paperspace、Google Colaboratoryなどの環境で使用することができます。

カピパラのエンジニア

自宅に高性能なPCが無くても、クラウドコンピューティングサービスを利用すればStable Diffusionが使えるよ。

各環境でのインストール方法を以下の記事で解説しています。

あわせて読みたい

Stable Diffusion Web UI のインストールから使い方までを解説｜ AUTOMATIC1111のの活用法今回は、Stable DiffusionのWeb UIであるAUTOMATIC1111の使い方について解説します。Web UIはブラウザから利用できるGUIで、画像AI Stable Diffusionの機能を直感的に操…

ControlNet Stable Diffusionの拡張機能

AUTOMATIC1111で使用できるStable Diffusionの代表的な拡張機能にControlNetがあります。

Stable Diffusionの推論の前段に別のニューラルネットワークを組み合わせることにより、生成される画像を細かくコントロールすることができます。

ControlNetの主要な機能

人間のポーズの指定: ControlNetを使用して特定の人間のポーズを生成できます。
他の画像からの構図のコピー: 既存の画像から構図をコピーして新しい画像を生成することができます。
類似画像の生成: 既存の画像に似た新しい画像を生成することができます。
ラフな下書きをプロフェッショナルな画像に変換: ラフな下書きを高品質な画像に変換することができます。
プリプロセッサとモデルの選択: OpenPose, CannyDepth, Line Artなど、多数のプリプロセッサとモデルから選択できます。

猫のエンジニア

ControlNetを導入することで、絵のクオリティが劇的に向上するよ。

ControlNetの各機能の使い方について、以下の記事で詳しく解説していきます。

あわせて読みたい

Stable Diffusion拡張機能、ControlNetのインストールと活用方法を解説画像生成AIであるStable Diffusionでは、プロンプト（呪文）によって画像の内容指示することで意図した構図、画風に近づけることが重要でした。実際に生成される画像は…

ControlNet以外の拡張機能

ControlNet以外にも、AUTOMATIC1111には様々な拡張機能がリリースされています。

生成した画像のブラウジングや、WebUIの日本語化など、便利な機能を以下の記事で解説しています。

あわせて読みたい

Stable diffusion Web UI Extensions ｜おすすめ拡張機能を紹介 Stable Diffusionは、AIを用いて画像を生成するための強力なツールです。そのWebUI、AUTOMATIC1111には、画像生成の作業をより効率的に、そしてより簡単に行うための様…

画像をアップスケールして高精細化する

Web上で公開されている有名なAI絵師さんの超高精細の画像をよく見かけると思います。

そういったAI絵師さんの画像は、一度生成した画像をアップスケーラを使って高解像度化したり、ディティールアップ（書き込み量を増やす）していることが多いです。

以下はtile_resampleというアップスケーラを使用した例です。

全く同じモデル、プロンプトを使って生成した画像ですが、アップスケール前後で劇的に書き込み量が増えているのが確認できます。

カピパラのエンジニア

書き込み量の違いは一目瞭然だね！

以下の記事でおすすめのアップスケーラを紹介しています。

あわせて読みたい

StableDiffusionでUpscaler（アップスケーラー）を使って高画質化する方法今回はStable Diffusionで使えるUpscaler（アップスケーラー）について解説します。Upscalerを使うことにより画像のサイズを拡大するだけではなく、書き込み量を増やす…

追加学習LoRA（Low-Rank Adaptation）

LoRAとは、Stable Diffusionの学習済みモデルを追加学習させることにより局所的にチューニングを行う仕組みです。

LoRAの主要な特徴

新しいコンセプトの追加: LoRAは既存のStable Diffusionモデルに新しいコンセプトを追加することができます。これには、特定の人物や服装、絵のタッチなどが含まれます。
効率的なファインチューニング: LoRAは大規模な言語モデルや画像生成モデルを効率的にファインチューニングするために開発されました。
ハードウェア要件が低い: LoRAは小さいファイルサイズであり、ハードウェア要件が低いため、短時間で訓練することができます。
プロンプトでの使用: LoRAはプロンプトに特定のテキスト（トリガーワード）を追加することで、出力に影響を与えることができます。
複数のLoRAの組み合わせ: 一つのプロンプトで複数のLoRAを使用することができます。

猫のエンジニア

LoRAを使うことで、キャラクターの顔や服装を固定して生成することができるよ。

また、LoRAは自分で環境構築して追加学習を行わなくても、他のユーザーが学習させたLoRAファイルをCivitaiなどのモデル共有サイトからダウンロードすることで、すぐにその効果を使用できます。

追加学習の手順や、AUTOMATIC1111のWebUIでLoRAファイルを使用する方法を以下の記事で解説しています。

あわせて読みたい

LoRAの使い方：Stable Diffusionとsd-scriptsを活用した画像生成の全手順今回はStable Diffusionのモデルに対し局所的なチューニングを行うことにより、キャラクターや衣装を固定した画像生成を可能にするLoRA（Low-Rank Adaptation）について…

マージモデルを作成する

AUTOMATIC1111のCheckpoint Mergerを使うと、お気に入りのモデルを組み合わせてマージモデルを作成することが可能です。

Checkpoint Mergerの使用方法を以下の記事で解説しています。

あわせて読みたい

Stable Diffusion用のマージモデルを作成する方法｜ AUTOMATIC1111 Checkpoint Mergerの使い方今回はStable Diffusionで使用できるマージモデルの作り方ついて解説します。AUTOMATIC1111のCheckpoint Mergerという機能を使うと、簡単に好みのモデルを組み合わせて…

Stable Diffusionで使用できるモデル

Stable Diffusionでは、アニメ系、フォトリアル系など様々なモデルが日々作成され、公開されています。

どのモデルを使うかによって、同じプロンプト（呪文）パラメータを使用しても、生成される画像は大きく変わります。

Stable Diffusionで使用できるおすすめのモデルを、以下の記事でジャンルごとに紹介しています。

あわせて読みたい

Stable Diffusionで使えるおすすめモデル一覧今回はStable Diffusionで利用可能なハイクオリティモデルの一覧を紹介します。Stable Diffusionでは、事前にどのようなデータを学習したモデルを使用するかによって、…

Stable Diffusionで使用できるプロンプト（呪文）

Stable Diffusionでどのような画像を生成するかを指示する文章をプロンプト、または呪文と呼びます。

このプロンプトをどのように使うかによって、生成される画像のクオリティが大きく変わります。また、アニメ系、フォトリアル系などのジャンルによってもキーワードが大きく異なります。

生成したい画像に近づけるためのプロンプト作成テクニックを以下の記事で解説しています。

あわせて読みたい

Stable Diffusionで使える呪文集（プロンプト集）画像生成AIでは、どのような画像を生成したいかを指示する呪文（プロンプト）によって、生成される画像のクオリティが大きく左右されます。今回はこれまで当ブログで紹…

自然言語モデル（LLM）によるプロンプト生成

英文の呪文を一から考えるのは大変ですが、自然言語モデルを使ったAIに日本語で作成したい画像のイメージを伝えると、それを元に呪文を自動生成することが可能です。

OpenAIの自然言語モデルGPT-3を生成AIのプロンプト用にチューニングされたモデルを使った生成方法を以下で解説しています。

あわせて読みたい

StableDiffusionのプロンプト（呪文）を自然言語処理モデルGPT-3（Catchy）で自動生成する方法今回はStable Diffusionなどの画像AIに生成するための指示を与えるPromptを、GPT-3を使ったライティングツールCatchyで自動生成する方法について解説します。私のように…

Catchyを使って生成したプロンプトのサンプル集を以下の記事で紹介しています。

あわせて読みたい

Stable Diffusionで使える呪文を紹介｜美少女イラストの呪文をCatchyで自動生成する方法画像を生成できるAI、StableDiffusionに絵を描かせるための指示（プロンプト）は呪文と呼ばれ、どのような呪文を指示するかによって出力されるイラストが大きく変わりま…

Stable Diffusionのテクニックを効率よく学ぶには？

カピパラのエンジニア

Stable Diffusionを使ってみたいけど、ネットで調べた情報を試してもうまくいかない…

猫のエンジニア

そんな時は、操作方法の説明が動画で見られるUdemyがおすすめだよ！

動画学習プラットフォームUdemyでは、画像生成AIで高品質なイラストを生成する方法や、AIの内部で使われているアルゴリズムについて学べる講座が用意されています。

Udemyは講座単体で購入できるため安価で（セール時1500円くらいから購入できます）、PCが無くてもスマホでいつでもどこでも手軽に学習できます。