今回はStable Diffusionで画像を生成する際に、書き込み量を大幅に増やすことができるDetail Tweaker LoRAの使い方について解説します。
Detail Tweaker LoRAを適用するだけで、ディティールがアップしますのでぜひ試してみてください。
また、当ブログのStable Diffusionに関する記事を以下のページでまとめていますので、あわせてご覧ください。
Stable Diffusionの導入方法から応用テクニックまでを動画を使って習得する方法についても以下のページで紹介しています。
Stable Diffusionとは
Stable Diffusion(ステーブル・ディフュージョン)は2022年8月に無償公開された描画AIです。ユーザーがテキストでキーワードを指定することで、それに応じた画像が自動生成される仕組みとなっています。
NVIDIAのGPUを搭載していれば、ユーザ自身でStable Diffusionをインストールし、ローカル環境で実行することも可能です。
(出典:wikipedia)
Stable DiffusionのWeb UI AUTOMATIC1111
AUTOMATIC1111はStable Diffusionをブラウザから利用するためのWebアプリケーションです。
AUTOMATIC1111を使用することで、プログラミングを一切必要とせずにStable Diffusionで画像生成を行うことが可能になります。
Web UI AUTOMATIC1111のインストール方法
Web UIであるAUTOMATIC1111を実行する環境は、ローカル環境(自宅のゲーミングPCなど)を使用するか、クラウドコンピューティングサービスを利用する2通りの方法があります。
以下の記事ではそれぞれの環境構築方法について詳し解説していますので、合わせてご覧ください。
LoRA(Low-Rank Adaptation)とは
LoRA(Low-Rank Adaptation)は、既存のStable Diffusionモデルを20枚程度の画像を用いて追加学習させることにより微調整することができる仕組みです。LoRAを用いることにより、キャラクターや服装などの特徴を固定して画像生成することが可能になります。
LoRAの詳細については以下の記事で解説していますので、あわせてご覧ください。
Detail Tweaker LoRA
アニメ調のイラストで書き込み量を簡単に増やす手段として、LoRAを使う方法があります。
Detail Tweaker LoRAは適用するだけで、そのイラストの構図はそのままに書き込み量を大幅に増やすことが可能です。Civitaiで公開されています。
以下のページからLoRAファイルをダウンロードしてください。
Detail Tweaker LoRAの使い方
LoRAファイルを入手したら、実際にDetail Tweaker LoRAを使って画像を生成していきます。
LoRAファイルの配置方法と、使用方法については以下の記事で解説していますので、こちらを見ながら進めてください。
LoRAファイルを配置したら、AUTOMATIC1111 Web UIを起動し、LoRAの設定画面を開きます。
Detail Tweaker LoRAはadd_detail
という名前で表示されていますので選択してください。
LoRAのトリガーワードを追加したら、その他のパラメータとプロンプトを入力し、Generate
をクリックして画像生成を実行します。
実行結果
同じモデル、プロンプト、パラメータでDetail Tweaker LoRAの適用有り、無しで画像を比較します。
生成条件
生成時のパラメータは以下のように設定しました。
プロンプト
(best quality)+,(masterpiece)++,(ultra detailed)++, ((Add layer)), sunny lighting, BREAK,
a cute little girl in school uniform is standing, on her way home at dusk, alley, evening, dusk
nice hands, perfect hands,
ネガティブプロンプト
EasyNegativeV2 (worst quality, low quality:1.4) bad anatomy:1.0 (extra fingers, deformed hands, polydactyl:1.5) simple background:1.0 (logo,word,text,watermark)
パラメータ
Steps:40
Scale:7
Seed:3311620427
Sampler:DPM++ 2M SDE Karras
Model:Shungiku-Mix_v1-better-vae-fp16.safetensors
Shungiku-Mix_v1-better-vae-fp16.safetensorsの入手先については、以下の記事で記載しています。
プロンプトの作成が難しいと思われている方には、AIでプロンプトを自動生成するのがおすすめです。「StableDiffusionのプロンプト(呪文)を自然言語処理モデルGPT-3(Catchy)で自動生成する方法」で詳細を解説しています。
比較結果
Detail Tweaker LoRAの適用前、後で比較した結果、以下のように画像が出力されました。
適用後の方が大幅に書き込み量が増え、ディティールがアップしていることが確認できました。
Detail Tweaker LoRA非適前
Detail Tweaker LoRA適用後
Stable Diffusionのテクニックを効率よく学ぶには?
Stable Diffusionを使ってみたいけど、ネットで調べた情報を試してもうまくいかない…
そんな時は、操作方法の説明が動画で見られるUdemyがおすすめだよ!
動画学習プラットフォームUdemyでは、画像生成AIで高品質なイラストを生成する方法や、AIの内部で使われているアルゴリズムについて学べる講座が用意されています。
Udemyは講座単体で購入できるため安価で(セール時1500円くらいから購入できます)、PCが無くてもスマホでいつでもどこでも手軽に学習できます。
Stable Diffusionに特化して学ぶ
Stable Diffusionに特化し、クラウドコンピューティングサービスPaperspaceでの環境構築方法から、モデルのマージ方法、ControlNetを使った構図のコントロールなど、中級者以上のレベルを目指したい方に最適な講座です。
画像生成AIの仕組みを学ぶ
画像生成AIの仕組みについて学びたい方には、以下の講座がおすすめです。
画像生成AIで使用される変分オートエンコーダやGANのアーキテクチャを理解することで、よりクオリティの高いイラストを生成することができます。
まとめ
今回はStable DiffusionでDetail Tweaker LoRAを使って書き込み量を増やす方法について解説しました。
LoRAを適用するだけで、生成されるイラストのクオリティを大幅に向上させることが可能ですので、ぜひ試してみてください。
また、以下の記事で効率的にPythonのプログラミングスキルを学べるプログラミングスクールの選び方について解説しています。最近ではほとんどのスクールがオンラインで授業を受けられるようになり、仕事をしながらでも自宅で自分のペースで学習できるようになりました。
スキルアップや副業にぜひ活用してみてください。
スクールではなく、自分でPythonを習得したい方には、いつでもどこでも学べる動画学習プラットフォームのUdemyがおすすめです。
講座単位で購入できるため、スクールに比べ非常に安価(セール時1200円程度~)に学ぶことができます。私も受講しているおすすめの講座を以下の記事でまとめていますので、ぜひ参考にしてみてください。
それでは、また次の記事でお会いしましょう。
コメント