今回はStable Diffusionで使用される「ネガティブプロンプト」について詳しく解説します。
ネガティブプロンプトは、生成される画像から排除または抑制したい要素を指定するためのキーワードやフレーズです。特に、フォトリアル(実写に近い)系の画像生成で有効なネガティブプロンプトとその使用例について、具体的なサンプルとともに紹介します。
ネガティブプロンプトを使いこなすことで、生成される画像のクオリティを大幅に向上させることができますので、ぜひ今回紹介するネガティブプロンプト組み合わせて活用してみてください。
- フォトリアル系で有効なネガティブプロンプトの概要
- ケースごとに有効なネガティブプロンプト
- コピペですぐに利用できるネガティブプロンプトのサンプル
また、当ブログのStable Diffusionに関する記事を以下のページでまとめていますので、あわせてご覧ください。
Stable Diffusionの導入方法から応用テクニックまでを動画を使って習得する方法についても以下のページで紹介しています。
Stable Diffusionとは
Stable Diffusion(ステーブル・ディフュージョン)は2022年8月に無償公開された描画AIです。ユーザーがテキストでキーワードを指定することで、それに応じた画像が自動生成される仕組みとなっています。
NVIDIAのGPUを搭載していれば、ユーザ自身でStable Diffusionをインストールし、ローカル環境で実行することも可能です。
(出典:wikipedia)
Stable DiffusionのWeb UI AUTOMATIC1111
AUTOMATIC1111はStable Diffusionをブラウザから利用するためのWebアプリケーションです。
AUTOMATIC1111を使用することで、プログラミングを一切必要とせずにStable Diffusionで画像生成を行うことが可能になります。
Web UI AUTOMATIC1111のインストール方法
Web UIであるAUTOMATIC1111を実行する環境は、ローカル環境(自宅のゲーミングPCなど)を使用するか、クラウドコンピューティングサービスを利用する2通りの方法があります。
以下の記事ではそれぞれの環境構築方法について詳し解説していますので、合わせてご覧ください。
ネガティブプロンプト(Negative Prompt)とは
ネガティブプロンプト(Negative Prompt)は、生成される画像から排除または抑制したい要素を指定するためのキーワードやフレーズです。
例えば、生成される画像に特定のオブジェクトや特性(如何なる形のテキスト、特定の色、不自然な形状など)を含めたくない場合、ネガティブプロンプトを使用してそれらを制御することができます。
ネガティブプロンプトで含めたくない要素や絵の破綻を防ぐための指示をあらかじめ与えることで、生成される画像のクオリティをさらに向上させることができます。
フォトリアル系には実写に近い画像を再現するための特化したネガティブプロンプトが必要。
生成する画像のジャンルにより、使用するネガティブプロンプトが変わってきますので、本記事ではフォトリアル(実写)系の画像生成で有効なテクニックを解説します。
また、画像に含めたい要素を定義するポジティブプロンプトについても以下の記事で解説していますので、あわせてご覧ください。
フォトリアル系で使えるネガティブプロンプト紹介
ここからは、実際にフォトリアル系で有効なネガティブプロンプトを紹介します。
基本プロンプト
画像全体のクオリティを上げるためのプロンプトです。身体の形状からライティング、背景などのオブジェクトなど全ての要素に影響します。
(worst quality:2), (low quality:2), (normal quality:2), lowers normal quality, ((monochrome)), ((grayscale))
身体の構造上の破綻を防ぐ
体の形状の異常に有効なプロンプトです。腕や足の本数が多い、生えている位置がおかしいといった人体の構造上の異常を抑えます。
(bad anatomy, bad limb, bad body perspective :1.2), long neck, long body,
手、足の破綻を防ぐ
Stable Diffusionでは手足の指の本数が多い、少ない、形状がおかしいなど、腕や足に関する破綻が失敗の上位の要因となります。そのような破綻を防ぐのに有効です。
missing fingers, extra fingers, extra arms, extra legs,
肌のシミなどを防ぐ
人物の肌のシミ、アザ、ほくろなどを除外し、綺麗な肌を描画します。
skin spots,acnes,skin blemishes,age spot,
透かし、ロゴ、文字を除外
画面下に出現することがおおいサインやロゴ、透かしなどを防ぐプロンプトです。
text, name, watermark, logo, username,
EasyNegativeV2
EasyNegativeV2は、アニメ調モデルであるCounterfeit
向けに作られたembeddingsです。
アニメ調モデル用に作られたembeddingsですが、フォトリアル系ででも有効です。
ネガティブプロンプトに以下のトリガーワードを追加することで、画像全体の品質を向上させることができます。
EasyNegativeV2
EasyNegativeの詳細な使い方については、以下の記事で解説しています。
negative_hand
negative_handは手の破綻を抑えることができるembeddingsです。
ネガティブプロンプトに以下のトリガーワードを加えるだけで、指の本数がおかしい、手がつぶれているなど手の描画に関する失敗を大幅に減らすことができます。
negative_hand-neg
negative_handの詳細な使用方法については、以下の記事で解説しています。
フォトリアル系ネガティブプロンプト作成例(サンプル)
私が普段フォトリアル系画像の生成でよく使うネガティブプロンプトの例を掲載します。
ネガティブプロンプトサンプル
EasyNegative2 (worst quality:2) (low quality:2) (normal quality:2) lowers normal quality ((monochrome)) ((grayscale)),skin spots,acnes,skin blemishes,age spot,ugly face,fat,missing fingers, extra fingers, extra arms,thick eyebrows,
生成された画像
こちらのネガティブプロンプトを使って生成された画像が以下となります。
今回紹介したネガティブプロンプトと組み合わせて使ってみてください。
Stable Diffusionのテクニックを効率よく学ぶには?
Stable Diffusionを使ってみたいけど、ネットで調べた情報を試してもうまくいかない…
そんな時は、操作方法の説明が動画で見られるUdemyがおすすめだよ!
動画学習プラットフォームUdemyでは、画像生成AIで高品質なイラストを生成する方法や、AIの内部で使われているアルゴリズムについて学べる講座が用意されています。
Udemyは講座単体で購入できるため安価で(セール時1500円くらいから購入できます)、PCが無くてもスマホでいつでもどこでも手軽に学習できます。
Stable Diffusionに特化して学ぶ
Stable Diffusionに特化し、クラウドコンピューティングサービスPaperspaceでの環境構築方法から、モデルのマージ方法、ControlNetを使った構図のコントロールなど、中級者以上のレベルを目指したい方に最適な講座です。
画像生成AIの仕組みを学ぶ
画像生成AIの仕組みについて学びたい方には、以下の講座がおすすめです。
画像生成AIで使用される変分オートエンコーダやGANのアーキテクチャを理解することで、よりクオリティの高いイラストを生成することができます。
まとめ
この記事では、ネガティブプロンプトの基本的な使い方から、特定のジャンルやケースで有効なプロンプトまでを解説しました。
どのような画像を生成したいかによって、必要なネガティブプロンプトは変わってきます。今回紹介したプロンプトを組み合わせたり、改変したりして理想の画像に近づけてみてください。
フォトリアル系ネガティブプロンプト以外のプロンプトの作成方法については、以下の記事で解説しています。
また、以下の記事で効率的にPythonのプログラミングスキルを学べるプログラミングスクールの選び方について解説しています。最近ではほとんどのスクールがオンラインで授業を受けられるようになり、仕事をしながらでも自宅で自分のペースで学習できるようになりました。
スキルアップや副業にぜひ活用してみてください。
スクールではなく、自分でPythonを習得したい方には、いつでもどこでも学べる動画学習プラットフォームのUdemyがおすすめです。
講座単位で購入できるため、スクールに比べ非常に安価(セール時1200円程度~)に学ぶことができます。私も受講しているおすすめの講座を以下の記事でまとめていますので、ぜひ参考にしてみてください。
それでは、また次の記事でお会いしましょう。
コメント