画像生成AIであるStable Diffusionは、アーキテクチャとモデルの進化により非常にクオリティの高い画像を生成できるようになりました。
しかしその一方で、ユーザーが望まない要素を画像に含めてしまう可能性があります。ネガティブプロンプトは、そのような不要な要素を事前に排除または抑制するための有用な手段です。
今回はこのネガティブプロンプトでアニメ調画像を生成する際の具体的にどのような指示を与えたらよいのかを、ケースごとに解説します。サンプルも掲載していますので、まずはコピー、改良することから始めてみてください。
- アニメ系で有効なネガティブプロンプトの概要
- ケースごとに有効なネガティブプロンプト
- コピペですぐに利用できるネガティブプロンプトのサンプル
Stable Diffusionのプロンプトに関する情報を以下の記事でまとめていますので、こちらもあわせてご覧ください。
また、当ブログのStable Diffusionに関する記事を以下のページでまとめていますので、あわせてご覧ください。
Stable Diffusionの導入方法から応用テクニックまでを動画を使って習得する方法についても以下のページで紹介しています。
Stable Diffusionとは
Stable Diffusion(ステーブル・ディフュージョン)は2022年8月に無償公開された描画AIです。ユーザーがテキストでキーワードを指定することで、それに応じた画像が自動生成される仕組みとなっています。
NVIDIAのGPUを搭載していれば、ユーザ自身でStable Diffusionをインストールし、ローカル環境で実行することも可能です。
(出典:wikipedia)
Stable DiffusionのWeb UI AUTOMATIC1111
AUTOMATIC1111はStable Diffusionをブラウザから利用するためのWebアプリケーションです。
AUTOMATIC1111を使用することで、プログラミングを一切必要とせずにStable Diffusionで画像生成を行うことが可能になります。
Web UI AUTOMATIC1111のインストール方法
Web UIであるAUTOMATIC1111を実行する環境は、ローカル環境(自宅のゲーミングPCなど)を使用するか、クラウドコンピューティングサービスを利用する2通りの方法があります。
以下の記事ではそれぞれの環境構築方法について詳し解説していますので、合わせてご覧ください。
ネガティブプロンプト(Negative Prompt)とは
ネガティブプロンプト(Negative Prompt)は、生成される画像から排除または抑制したい要素を指定するためのキーワードやフレーズです。
例えば、生成される画像に特定のオブジェクトや特性(如何なる形のテキスト、特定の色、不自然な形状など)を含めたくない場合、ネガティブプロンプトを使用してそれらを制御することができます。
ネガティブプロンプトで含めたくない要素や絵の破綻を防ぐための指示をあらかじめ与えることで、生成される画像のクオリティをさらに向上させることができます。
また、画像に含めたい要素を定義するポジティブプロンプトについても以下の記事で解説していますので、あわせてご覧ください。
アニメ系で使えるネガティブプロンプト紹介
ここからは除外したい要素ごとに、具体的にどのようなネガティブプロンプトを使用すればよいのかを解説していきます。
基本プロンプト
画像全体のクオリティを上げるためのプロンプトです。ディティールが荒い画像や色彩が低い画像を防ぎます。
(worst quality:1.4), (low quality:1.4), (monochrome:1.3),
3D、実写よりのタッチを防ぐ
完全な2次元のアニメ調のタッチにしたい場合に有効なプロンプトです。ゲームのような3Dキャラや実写的な要素を除外します。
3D, realistic,
指の破綻を防ぐ
Stable Diffusionでは指の本数が多い、少ない、形状がおかしいなど、指に関する破綻が失敗の上位の要因となります。そのような指の破綻を防ぐのに有効です。
extra fingers, deformed hands, polydactyl,
異常な体の形状を防ぐ
体の形状の異常に有効なプロンプトです。腕や足の本数が多い、生えている位置がおかしいといった人体の構造上の異常を抑えます。
bad anatomy, inaccurate limb, bad composition, inaccurate eyes, extra arms,
書き込み量の少ない背景を防ぐ
シンプルな背景を抑えるのに有効なプロンプトです。背景への書き込み量を増やすのに有効です。
simple background,
透かし、ロゴ、文字を除外
画面右下に出現することがおおいサインやロゴ、透かしなどを防ぐプロンプトです。
logo,word,text,watermark, username, blurry, artist name,
EasyNegativeV2
EasyNegativeV2は、アニメ調モデルであるCounterfeit
向けに作られたembeddingsです。
Counterfeit用に作られたembeddingsですが、フォトリアル系ででも有効です。
EasyNegativeV2を導入することで、ネガティブプロンプトにEasyNegativeV2
というキーワードを入力することで画像全体の品質を向上させることができます。
EasyNegativeV2
EasyNegativeの詳細な使い方については、以下の記事で解説しています。
アニメ系ネガティブプロンプト作成例(サンプル)
私が普段アニメ調画像の生成でよく使うネガティブプロンプトの例を掲載します。
EasyNegativeV2 (worst quality, low quality:1.4) bad anatomy:1.0 (extra fingers, deformed hands, polydactyl:1.5) simple background:1.0 (logo,word,text,watermark),
こちらのネガティブプロンプトを使って生成された画像が以下となります。
Stable Diffusionのテクニックを効率よく学ぶには?
Stable Diffusionを使ってみたいけど、ネットで調べた情報を試してもうまくいかない…
そんな時は、操作方法の説明が動画で見られるUdemyがおすすめだよ!
動画学習プラットフォームUdemyでは、画像生成AIで高品質なイラストを生成する方法や、AIの内部で使われているアルゴリズムについて学べる講座が用意されています。
Udemyは講座単体で購入できるため安価で(セール時1500円くらいから購入できます)、PCが無くてもスマホでいつでもどこでも手軽に学習できます。
Stable Diffusionに特化して学ぶ
Stable Diffusionに特化し、クラウドコンピューティングサービスPaperspaceでの環境構築方法から、モデルのマージ方法、ControlNetを使った構図のコントロールなど、中級者以上のレベルを目指したい方に最適な講座です。
画像生成AIの仕組みを学ぶ
画像生成AIの仕組みについて学びたい方には、以下の講座がおすすめです。
画像生成AIで使用される変分オートエンコーダやGANのアーキテクチャを理解することで、よりクオリティの高いイラストを生成することができます。
まとめ
ネガティブプロンプトは、AI画像生成ツールStable Diffusionで生成される画像から特定の要素を排除または抑制するための重要な機能です。
このプロンプトを適切に使用することで、ユーザーは不要な要素を事前に排除し、より高品質で制御された画像を生成することができます。
この機能を理解し、適切に活用することで、AIによる画像生成の精度とクオリティを一層高めることができますので、ぜひ本記事で紹介したサンプルを活用してみてください。
アニメ系ネガティブプロンプト以外のプロンプトの作成方法については、以下の記事で解説しています。
また、以下の記事で効率的にPythonのプログラミングスキルを学べるプログラミングスクールの選び方について解説しています。最近ではほとんどのスクールがオンラインで授業を受けられるようになり、仕事をしながらでも自宅で自分のペースで学習できるようになりました。
スキルアップや副業にぜひ活用してみてください。
スクールではなく、自分でPythonを習得したい方には、いつでもどこでも学べる動画学習プラットフォームのUdemyがおすすめです。
講座単位で購入できるため、スクールに比べ非常に安価(セール時1200円程度~)に学ぶことができます。私も受講しているおすすめの講座を以下の記事でまとめていますので、ぜひ参考にしてみてください。
それでは、また次の記事でお会いしましょう。
コメント