AUTOMATIC1111をGoogle Colabで使用する方法｜ Stable Diffusion高機能Web UIの活用法

2023年2月10日2023年10月4日

URLをコピーしました！

今回はGoogleのクラウドコンピューティングサービス、Google ColabratoryでStable DiffusionのWeb UIであるAUTOMATIC1111を使って画像生成する方法を解説します。
自宅にゲーミングPCなど、高性能なグラフィックボードを搭載したPCを持っていない方でも利用することができます。

2023年4月現在、Google Colabratoryの無料版ではStable Diffusionが使用できなくなりました。無料版で使用した場合、アカウント停止などの措置が取られる可能性がありますのでご注意ください。
（有料版のGoogle Colaboratory Proでは引き続き使用できるようです）

前回のローカル環境同様、Pythonのプログラミングを一切必要とせず画像を生成することができますので、ぜひ活用してみてください。
ローカル環境でAUTOMATIC1111を使用する方法については、以下の記事で解説しています。

あわせて読みたい

AUTOMATIC1111のセットアップから使い方までを解説｜ Stable Diffusion高機能Web UIの活用法 Stable Diffusionの高機能UIであるAUTOMATIC1111をローカル環境（自宅のゲーミングPCなど）に導入する方法を解説します。AUTOMATIC1111を使用することで、プログラミン…

また、当ブログ内のStable Diffusionに関する記事を以下のページでまとめていますので、あわせてご覧ください。

あわせて読みたい

Stable Diffusionの使い方を解説！｜ AIで画像生成する方法最近、Stable Diffusionっていう画像系AIが話題だよね使ってみたいけど、どうすればいいんだろう？ Stable Diffusionはオープンソースだから、自分でPythonのコードをダ…

Stable Diffusionとは

Stable Diffusion（ステーブル・ディフュージョン）は2022年8月に無償公開された描画AIです。ユーザーがテキストでキーワードを指定することで、それに応じた画像が自動生成される仕組みとなっています。
NVIDIAのGPUを搭載していれば、ユーザ自身でStable Diffusionをインストールし、ローカル環境で実行することも可能です。
（出典：wikipedia）

あわせて読みたい

StableDiffusionのプロンプト（呪文）を自然言語処理モデルGPT-3（Catchy）で自動生成する方法今回はStable Diffusionなどの画像AIに生成するための指示を与えるPromptを、GPT-3を使ったライティングツールCatchyで自動生成する方法について解説します。私のように…

AUTOMATIC1111

GitHubのAUTOMATIC1111公式リポジトリで、Google Colabで使用するためのcolabノートが公開されています。
AUTOMATIC1111の公式リポジトリは以下となります。

GitHub

Online Services Stable Diffusion web UI. Contribute to AUTOMATIC1111/stable-diffusion-webui development by creating an account on GitHub.

ページにアクセスするとGoogle Colabの項目にリストがあります。
今回は「maintained by Akaibu」を使って構築する方法を解説します。

リンクをクリックして、「StableDiffusionUI-Voldemort V1.3.ipynb」ファイルのコピーを自分のGoogle Driveに保存しておいてください。

Stable Diffusion AI画像生成ガイドブック

著:今村勇輔, 著:比嘉康雄, 著:五十嵐良平

¥2,200 （2024/09/19 20:41時点 | Amazon調べ）

口コミを見る

Amazon

楽天市場

Yahooショッピング

メルカリ

ポチップ

物体検出とGAN、オートエンコーダー、画像処理入門 PyTorch/TensorFlow2による発展的・実装ディープラーニング

著:チーム・カルポ

¥2,851 （2024/09/19 20:41時点 | Amazon調べ）

口コミを見る

Amazon

楽天市場

Yahooショッピング

メルカリ

ポチップ

学習済みモデルの入手

続いてStable Diffusionで使用するモデルを入手します。
今回はVすき焼きさんが公開されているSukiyakiMixV1を例に解説します。

pastel-mix をベースに AbyssOrangeMix2 を単純マージしたモデル #SukiyakiMixV1 公開しました。↓https://t.co/lLvWYZIkMN pic.twitter.com/wsjctsMoFU
— Vすき焼き@AIart（AIイラスト） (@Vsukiyaki_AIArt) February 4, 2023

以下のHugging Faceのページへアクセスします。

あわせて読みたい

404 – Hugging Face We’re on a journey to advance and democratize artificial intelligence through open source and open science.

「Files and versions」のタブをクリックします。

ファイルの一覧に表示されている「.ckpt」と「.safetensors」という拡張子のファイルがモデルファイルです。
AUTOMATIC1111ではどちらの拡張子も読み込むことができます。

fp16とfp32はモデルサイズが変わりますので、Colabなどストレージとメモリに制約がある環境ではfp16がおすすめです。今回はfp16を選択しました。

ファイル名をクリックすると、ダウンロードリンクが表示されますので、クリックしてダウンロードしてください。

以上でモデルの入手は完了です。

私が使用しているおすすめのモデルについても以下の記事で紹介していますので、あわせてご覧ください。

あわせて読みたい

StableDiffusionのアニメ調モデルを紹介今回はStable Diffusionで使えるおすすめの学習済みモデルを紹介します。Stable Diffusionでは、同じプロンプトを入力しても、モデルを入れ替えることで出力されるイラ…

あわせて読みたい

Stable Diffusion 初心者から中級者が画像生成のテクニックを効率良く学べる方法を紹介 Stable Diffusionって最近話題だけど、専門用語が難しいしどこから手を付けていいかわからない… 家にゲーミングPCないし、環境のセットアップ方法を調べるのが面倒なん…

学習済みモデルのアップロード

続いて先ほど入手したモデルをGoogle Driveにアップロードします。
今回はマイドライブ/StableDiffusion/modelというディレクトリを作成しました。

作成したディレクトリに移動したら、先ほどダウンロードしたモデルファイルをGoogle Driveのウィンドウにドラッグアンドドロップします。

しばらく待つとアップロードが完了し、ファイル名が表示されます。

これでモデルのアップロードは完了です。

MSI GeForce RTX 4060 Ti VENTUS 2X BLACK 16G OC グラフィックカード – RTX 4060 Ti GPU 16GB GDDR6

Stable Diffusionでの画像生成に最適！ VRAM16GB搭載モデル！

¥91,485 （2024/09/19 20:41時点 | Amazon調べ）

口コミを見る

Amazon

楽天市場

Yahooショッピング

メルカリ

ポチップ

Google ColabでPythonファイルを編集する

先ほどGitHubからコピーしたJupyterNotebook用Pythonファイル「StableDiffusionUI-Voldemort V1.3.ipynb」をGoogle Colabで開きます。

Google Driveへの接続

開いたら一番上のセルの中央あたりの枠線にマウスを乗せると「＋コード」が表示されるため、それをクリックします。

セルが表示されたら以下のコードを入力してください。

from google.colab import drive
drive.mount('/content/drive')

これで、Google Driveに接続するコードが実装されました。

あわせて読みたい

モデルダウンロード処理の削除

続いて不要なコードをコメントアウトします。
「SD1.5」と書かれたセルの赤枠の部分は、使用するモデルをダウンロードする処理ですが、今回はGoogle Driveから読み込むため不要です。

下から３行のコードを以下のようにコメントアウトしてください。

!git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui
%cd stable-diffusion-webui
#@title SD1.5
# get a token from https://huggingface.co/settings/tokens
#user_token = "" #@param {type:"string"}
#user_header = f"\"Authorization: Bearer {user_token}\""
#!wget --header={user_header} https://huggingface.co/runwayml/stable-diffusion-v1-5/resolve/main/v1-5-pruned.ckpt -O /content/stable-diffusion-webui/model.ckpt

編集後は以下のようになりました。

あわせて読みたい

Stable Diffusionでの画像生成におすすめのグラフィックボード（GPU）を紹介今回は画像生成AIであるStable Diffusionを、ローカル環境で使用する際におすすめのグラフィックボードについて解説します。Stable Diffusionのような画像AIでは、画像…

Google Driveからモデルをコピーする

先ほどGoogle Driveにアップロードしたモデルを、アプリ起動前に読み込む処理を追加します。
SD1.5のセルの下枠の部分にマウスを移動し、「＋コード」をクリックします。

追加したセルに以下のコードを追加指定ください。
cpコマンドの引数の1つ目にGoogle Driveのコピーしたいモデルのパスを指定します。2目の引数にはコピー先のディレクトリを指定します。（AUTMATIC1111側でモデルを配置する場所が決まっているので、下のパスをそのままコピーしてください）

モデルを複数使いたい場合は、cpコマンドを複数行追加してください。

!cp /content/drive/MyDrive/StableDiffusion/model/SukiyakiMix-v1.0-fp16.ckpt  /content/stable-diffusion-webui/models/Stable-diffusion/

以下のように追加したら完了です。

スクリプトを実行する

最後に作成したスクリプトを実行します。
以下の①～④のすべてのセルの実行ボタン（▶）をクリックして上から順番に実行してください。

アプリケーションが起動すると以下のようにリンクが表示されます。
「Running on public URL:」と書かれている方をクリックしてUIを起動してください。

起動に成功すると、以下のようなログイン画面が表示されます。
初期設定では、「ユーザー名：me」、「パスワード：qwerty」となっていますので、入力してログインしてください。

以下の画面が表示されたら準備完了です。

あわせて読みたい

VAE（Auto-Encoder）を変更する

VAE（Variational Autoencoder、変分自己符号化器）は、データの次元圧縮や生成、および特徴抽出に利用される深層学習の手法の一つです。

イラストを生成する際、各モデルごとに推奨されているVAEに変更することで、イラストのクオリティを大幅に向上させることができます。（モデル配布サイトの解説に記載されています）

VAEを変更したい場合は、設定方法を以下の記事で解説しています。

あわせて読みたい

Stable DiffusionでVAEを使用する方法｜ AUTOMATIC1111高機能Web UIの活用法今回はStable DiffusionのWebUIであるAUTOMATIC1111で、VAE（Variational Auto Encoder）を使用する方法について解説します。Stable Diffusionで画像を生成する際…

Settingsの変更内容を次回から自動で読み込む方法については、以下の記事で解説しています。

あわせて読みたい

AUTOMATIC1111の設定内容を起動時に自動で読み込む方法｜ Stable Diffusion高機能Web UIの活用法今回はAUTOMATIC1111で事前にSettingsで設定しておいた情報を、起動時に自動で読み込む方法を解説します。Google Colabでは毎回AUTOMATIC1111をインストールするため、S…

あわせて読みたい

画像を生成する

AUTOMATIC1111の画面の解説と使い方については以下の記事で解説しています。
（ローカル環境での説明ですが、AUTOMATIC1111の機能自体は同じです）

あわせて読みたい

また、GPT-3を使ってプロンプトを自動生成する方法を以下の記事で解説していますので、あわせてご覧ください。

あわせて読みたい

構図やキャラクターのポーズを指定して生成する

これまで解説してきた手順で、プロンプトから画像を生成できるようになりました。しかし、プロンプトだけでは、どのようなポーズのキャラクターが出力されるかはガチャ的な要素であり、かなり試行回数を踏まなければ理想的なイラストは出力できません。

そこで、AUTOMATIC1111の拡張機能でControlNetというツールを使用することで、イラストの構図やキャラクターのポーズを指定して生成できるようになります。
ControlNetを使った生成方法は以下のページで解説しています。

あわせて読みたい

Stable DiffusionでControlNetを使ってキャラクターのポーズを指定する方法今回はStable Diffusionで画像を生成する際に、ControlNetでイラストの構図を指定して実行する方法について解説します。ControlNetはStable DiffusionのWebUIであるAUTO…

AUTOMATIC1111の拡張機能として使用できるOpenPose Editorがリリースされ、AUTOMATIC1111のUI内でポーズデータの作成から画像生成までを一貫して実行できるようになりました。

あわせて読みたい

Openpose Editorのデータを元にControlNetで構図やキャラのポーズを指定する方法今回はAUTOMATIC1111の拡張機能として公開されたOpenpose Editorのインストールと使い方について解説します。ControlNetでOpenposeのモデルを使って画像生成をする場合…

あわせて読みたい

Stable Diffusionのテクニックを効率よく学ぶには？

カピパラのエンジニア

Stable Diffusionを使ってみたいけど、ネットで調べた情報を試してもうまくいかない…

猫のエンジニア

そんな時は、操作方法の説明が動画で見られるUdemyがおすすめだよ！

動画学習プラットフォームUdemyでは、画像生成AIで高品質なイラストを生成する方法や、AIの内部で使われているアルゴリズムについて学べる講座が用意されています。

Udemyは講座単体で購入できるため安価で（セール時1500円くらいから購入できます）、PCが無くてもスマホでいつでもどこでも手軽に学習できます。

Stable Diffusionに特化して学ぶ

Stable Diffusionに特化し、クラウドコンピューティングサービスPaperspaceでの環境構築方法から、モデルのマージ方法、ControlNetを使った構図のコントロールなど、中級者以上のレベルを目指したい方に最適な講座です。

ジェネレーティブAI（画像生成AI）入門【Stable Diffusion】-プロンプトでハイクオリティな画像制作が可能

画像生成AIの仕組みを学ぶ

画像生成AIの仕組みについて学びたい方には、以下の講座がおすすめです。
画像生成AIで使用される変分オートエンコーダやGANのアーキテクチャを理解することで、よりクオリティの高いイラストを生成することができます。

AIによる画像生成を学ぼう！【VAE / GAN】 -Google ColabとPyTorchで基礎から学ぶ生成モデル-

まとめ

今回はGoogle ColabでAUTOMATIC1111を使用する方法について解説しました。ストレージやメモリの制約もありますが、Colabで環境構築しておけば24時間外出さっきからでもAUTOMATIC1111で画像生成をすることができます。
無料プランでも利用できますので、ぜひ活用してみてください。

また、以下の記事で効率的にPythonのプログラミングスキルを学べるプログラミングスクールの選び方について解説しています。最近ではほとんどのスクールがオンラインで授業を受けられるようになり、仕事をしながらでも自宅で自分のペースで学習できるようになりました。

スキルアップや副業にぜひ活用してみてください。

あわせて読みたい

Pythonが学べるプログラミングスクール5選｜初心者にもおすすめプログラミングスクールってたくさんあって、どのスクールを選んだらいいのかな？自分のキャリアアップに必要なカリキュラムがあるプログラミングスクールを探したいん…

スクールではなく、自分でPythonを習得したい方には、いつでもどこでも学べる動画学習プラットフォームのUdemyがおすすめです。

講座単位で購入できるため、スクールに比べ非常に安価（セール時1200円程度～）に学ぶことができます。私も受講しているおすすめの講座を以下の記事でまとめていますので、ぜひ参考にしてみてください。

あわせて読みたい