今回は2次元キャラクターに特化したモデルWaifu Diffusionを、イラスト描画AIであるStable Diffusionの最新バージョン2.xで動作させる方法を解説します。
ローカル環境やGoogle ColabでPythonコードから使用できますので、ぜひトライしてみてください。
また、StableDiffusionに関連する記事を以下のページでまとめていますので、あわせてご覧ください。
data:image/s3,"s3://crabby-images/8013d/8013dd22e4ff320b9efdcdfa2a1d52989792db2a" alt=""
以下のページで自然言語処理モデルGPT-3を使ったライティングツールCatchyで、Stable DiffusionのPromptを自動生成する方法について解説していますので、あわせてご覧ください。
data:image/s3,"s3://crabby-images/e9f2c/e9f2cf3b30b44529c60055255d08a4c0ac01e892" alt=""
Stable Diffusionとは
Stable Diffusion(ステーブル・ディフュージョン)は2022年8月に無償公開された描画AIです。ユーザーがテキストでキーワードを指定することで、それに応じた画像が自動生成される仕組みとなっています。
NVIDIAのGPUを搭載していれば、ユーザ自身でStable Diffusionをインストールし、ローカル環境で実行することも可能です。
(出典:wikipedia)
2023年1月現在、Stable DiffusionはVersion 2.x系がリリースされていますので、今回はStable Diffusion 2.0を使用します。Stable Diffusion 2.0の使い方については、以下のページでも解説しています。
data:image/s3,"s3://crabby-images/d2ff7/d2ff78921336842e5ed620d9c998a644ec8d35e8" alt=""
data:image/s3,"s3://crabby-images/24996/24996bfceb80b2887b08ce0e07e368e708015a0e" alt=""
data:image/s3,"s3://crabby-images/24996/24996bfceb80b2887b08ce0e07e368e708015a0e" alt=""
Waifu Diffusionとは
ハイクオリティなイラストを生成できるお絵かきAI、Stable Diffusionをさらに2次元イラストに特化させるためのチューニングが行われたモデルがWaifu Diffusionです。
2023年1月現在のWaifu Diffusionのバージョンはv1.4となります。
Waifu Diffuisonのリポジトリは以下となります。今回はこのモデルを使って2次元キャラクターを描かせてみようと思います。
data:image/s3,"s3://crabby-images/9c883/9c883e634a6243e65770f0ea1bcae0aa8b4ef6de" alt=""
StableDiffusion 2.xのセットアップ
以下のコマンドを実行してパッケージをインストールします。
pip install diffusers[torch]==0.9 transformers
pip install --upgrade --pre triton
StableDiffusionのリポジトリを取得してインストールします。
pip install --upgrade git+https://github.com/huggingface/diffusers.git transformers accelerate scipy
以上でStableDiffusion 2.0のセットアップは完了です。
作成したソースコード
Waifu Diffusionのモデルを指定
Waifu Diffusionを使用する方法は、モデルの指定箇所を変更するだけです。
model_id = "hakurei/waifu-diffusion" #waifu diffusionのモデルを指定
作成した全体のソースコード
作成した全体のソースコードは以下の通りです。
モデルIDの指定箇所以外は通常のStable Diffusion 2.0と同じです。
from diffusers import StableDiffusionPipeline, EulerDiscreteScheduler
import torch
from datetime import datetime
#model_id = "stabilityai/stable-diffusion-2"
model_id = "hakurei/waifu-diffusion" #waifu diffusionのモデルを指定
# Use the Euler scheduler here instead
scheduler = EulerDiscreteScheduler.from_pretrained(model_id, subfolder="scheduler")
pipe = StableDiffusionPipeline.from_pretrained(model_id, scheduler=scheduler, revision="fp16", torch_dtype=torch.float16)
pipe = pipe.to("cuda") #GPUがない場合は「cpu」を指定
#画像生成の指示(呪文)
prompt = "(イラストに対する指示を設定)"
#描画する回数を設定
num_images = 5
#イラスト生成
for i in range(num_images):
#推論実行
image = pipe(prompt, height=768, width=768).images[0]
#生成日時をファイル名にして保存
date = datetime.now().strftime("%Y%m%d_%H%M%S")
path = date + ".png"
image.save(path)
実行結果
今回は動作確認のため、chiliさんがTwitterで公開されているPrompt(呪文)をお借りしました。
(画像の「ALT」をクリックするとPromptが確認できます)
お借りしたPromptで先ほどのPythonプログラムを実行したところ以下のような画像が生成されました。
data:image/s3,"s3://crabby-images/f30aa/f30aac5433be584b668c619a86617d9eb3b72e63" alt=""
以下のページで自然言語処理モデルGPT-3を使ったライティングツールCatchyで、Stable DiffusionのPromptを自動生成する方法について解説していますので、あわせてご覧ください。
data:image/s3,"s3://crabby-images/e9f2c/e9f2cf3b30b44529c60055255d08a4c0ac01e892" alt=""
Stable Diffusionのテクニックを効率よく学ぶには?
data:image/s3,"s3://crabby-images/24832/248321bd1e157cfd3dfb0d0691e0e4d55edfeb5f" alt=""
Stable Diffusionを使ってみたいけど、ネットで調べた情報を試してもうまくいかない…
data:image/s3,"s3://crabby-images/62dcd/62dcdf2cd1ba9818d39cdaa4b172aef5677eae36" alt=""
data:image/s3,"s3://crabby-images/62dcd/62dcdf2cd1ba9818d39cdaa4b172aef5677eae36" alt=""
data:image/s3,"s3://crabby-images/62dcd/62dcdf2cd1ba9818d39cdaa4b172aef5677eae36" alt=""
そんな時は、操作方法の説明が動画で見られるUdemyがおすすめだよ!
動画学習プラットフォームUdemyでは、画像生成AIで高品質なイラストを生成する方法や、AIの内部で使われているアルゴリズムについて学べる講座が用意されています。
Udemyは講座単体で購入できるため安価で(セール時1500円くらいから購入できます)、PCが無くてもスマホでいつでもどこでも手軽に学習できます。
Stable Diffusionに特化して学ぶ
Stable Diffusionに特化し、クラウドコンピューティングサービスPaperspaceでの環境構築方法から、モデルのマージ方法、ControlNetを使った構図のコントロールなど、中級者以上のレベルを目指したい方に最適な講座です。
data:image/s3,"s3://crabby-images/04747/04747d25c9941a56a307354c4eee75c6f365435c" alt="icon"
data:image/s3,"s3://crabby-images/04747/04747d25c9941a56a307354c4eee75c6f365435c" alt="icon"
画像生成AIの仕組みを学ぶ
画像生成AIの仕組みについて学びたい方には、以下の講座がおすすめです。
画像生成AIで使用される変分オートエンコーダやGANのアーキテクチャを理解することで、よりクオリティの高いイラストを生成することができます。
data:image/s3,"s3://crabby-images/c4e95/c4e95bfa1478910ca485e363bb9c5ec4b2ea0dae" alt="icon"
data:image/s3,"s3://crabby-images/c4e95/c4e95bfa1478910ca485e363bb9c5ec4b2ea0dae" alt="icon"
まとめ
Stable Diffusion 2.xでもWaifu Diffusionを使ってイラストを生成することができました。
現在Stable Diffusion 1.xは動作しなくなってしまっているようですので、2.x系で活用してみてください。
以下のページで自然言語処理モデルGPT-3を使ったライティングツールCatchyで、Stable DiffusionのPromptを自動生成する方法について解説していますので、あわせてご覧ください。
data:image/s3,"s3://crabby-images/e9f2c/e9f2cf3b30b44529c60055255d08a4c0ac01e892" alt=""
data:image/s3,"s3://crabby-images/e9f2c/e9f2cf3b30b44529c60055255d08a4c0ac01e892" alt=""
また、以下の記事で効率的にPythonのプログラミングスキルを学べるプログラミングスクールの選び方について解説しています。最近ではほとんどのスクールがオンラインで授業を受けられるようになり、仕事をしながらでも自宅で自分のペースで学習できるようになりました。
スキルアップや副業にぜひ活用してみてください。
data:image/s3,"s3://crabby-images/2c47c/2c47c2de1c3a1b71c25b13c013e7a704c33cc607" alt=""
data:image/s3,"s3://crabby-images/2c47c/2c47c2de1c3a1b71c25b13c013e7a704c33cc607" alt=""
スクールではなく、自分でPythonを習得したい方には、いつでもどこでも学べる動画学習プラットフォームのUdemyがおすすめです。
講座単位で購入できるため、スクールに比べ非常に安価(セール時1200円程度~)に学ぶことができます。私も受講しているおすすめの講座を以下の記事でまとめていますので、ぜひ参考にしてみてください。
data:image/s3,"s3://crabby-images/ce377/ce3773e0a287b204737603bf1fe760dfa7b25917" alt=""
data:image/s3,"s3://crabby-images/ce377/ce3773e0a287b204737603bf1fe760dfa7b25917" alt=""
それでは、また次の記事でお会いしましょう。
data:image/s3,"s3://crabby-images/24996/24996bfceb80b2887b08ce0e07e368e708015a0e" alt=""
data:image/s3,"s3://crabby-images/24996/24996bfceb80b2887b08ce0e07e368e708015a0e" alt=""
data:image/s3,"s3://crabby-images/24996/24996bfceb80b2887b08ce0e07e368e708015a0e" alt=""
data:image/s3,"s3://crabby-images/24996/24996bfceb80b2887b08ce0e07e368e708015a0e" alt=""
data:image/s3,"s3://crabby-images/24996/24996bfceb80b2887b08ce0e07e368e708015a0e" alt=""
data:image/s3,"s3://crabby-images/24996/24996bfceb80b2887b08ce0e07e368e708015a0e" alt=""
コメント