画像生成AIでは、どのような画像を生成したいかを指示する呪文(プロンプト)によって、生成される画像のクオリティが大きく左右されます。
今回はこれまで当ブログで紹介してきたStable Diffusionの呪文(プロンプト)の作り方やサンプルをまとめました。
Stable Diffusionではフォトリアル系、アニメ系それぞれに特化した呪文の作成方法があります。カテゴリごとにまとめていますので、ぜひ活用してみてください。
また、当ブログのStable Diffusionに関する記事を以下のページでまとめていますので、あわせてご覧ください。


Stable Diffusionとは
Stable Diffusion(ステーブル・ディフュージョン)は2022年8月に無償公開された描画AIです。ユーザーがテキストでキーワードを指定することで、それに応じた画像が自動生成される仕組みとなっています。
NVIDIAのGPUを搭載していれば、ユーザ自身でStable Diffusionをインストールし、ローカル環境で実行することも可能です。
(出典:wikipedia)
Stable DiffusionのWeb UI AUTOMATIC1111
AUTOMATIC1111はStable Diffusionをブラウザから利用するためのWebアプリケーションです。
AUTOMATIC1111を使用することで、プログラミングを一切必要とせずにStable Diffusionで画像生成を行うことが可能になります。
Web UI AUTOMATIC1111のインストール方法
Web UIであるAUTOMATIC1111を実行する環境は、ローカル環境(自宅のゲーミングPCなど)を使用するか、クラウドコンピューティングサービスを利用する2通りの方法があります。
以下の記事ではそれぞれの環境構築方法について詳し解説していますので、合わせてご覧ください。

プロンプトの作成方法(呪文の基礎)
Stable Diffusionで呪文(プロンプト)を作成する上で基礎となるキーワードをフォトリアル系、アニメ系それぞれについて解説しています。
この項目で紹介するキーワードをテンプレートにしてカスタマイズすることで、クオリティの高い画像を生成することが可能です。
フォトリアル系
フォトリアル系で使える呪文のテンプレートを以下の記事で解説しています。

AIコスプレイヤーの作成に使える呪文についても、以下の記事で解説しています。

アニメ系
2次元のアニメ系で使える呪文のテンプレートを以下の記事で解説しています。

複数キャラクター
Stable Diffusionの拡張機能であるLatent Coupleを使用して複数キャラクターを生成するためのプロンプト作成方法を、以下の記事で解説します。


ネガティブプロンプトの作成方法
Stable Diffusionで生成される画像の中から、排除したい要素を定義するネガティブプロンプトの作成方法について解説します。
フォトリアル系ネガティブプロンプト
フォトリアル系画像を生成する際に使用できる基本的なネガティブプロンプトの使い方を、以下の記事で解説しています。

アニメ系ネガティブプロンプト
基本的なネガティブプロンプト
アニメ系画像を生成する際に使用できる基本的なネガティブプロンプトの使い方を、以下の記事で解説しています。

EasyNegative
アニメ系で使用できるEasyNegativeの使い方について、以下の記事で解説しています。
「EasyNegative」という短いキーワードをネガティブプロンプトに追加するだけで、生成されるイラストのクオリティを大幅に向上させることが可能です。

呪文集(プロンプトサンプル集)
建築物、人物などに使える呪文のサンプル集を以下の記事で解説しています。

建築物、風景に関する呪文集を以下の記事で解説しています。


自然言語モデル(LLM)によるプロンプト生成
英文の呪文を一から考えるのは大変ですが、自然言語モデルを使ったAIに日本語で作成したい画像のイメージを伝えると、それを元に呪文を自動生成することが可能です。
OpenAIの自然言語モデルGPT-3を生成AIのプロンプト用にチューニングされたモデルを使った生成方法を以下で解説しています。

Catchyを使って生成したプロンプトのサンプル集を以下の記事で紹介しています。

Stable Diffusionの理想的な環境を構築する
Stable Diffusionを使用する際にGoogle ColaboratoryやWebサービスを利用されている方も多いかと思います。しかし、最近Google Colabの無料での使用範囲が大きく制限されたり、Webサービスでは月額費用がかかったりします。
欲しいイラストを生成するにはかなりの回数をトライする必要があるため、これらの制約に縛られることなく使用できるローカル環境を構築するのがおすすめです。
ローカルのPCに搭載するグラフィックボード
ローカルマシンで実行する上で重要になってくるのがグラフィックボードです。
グラフィックボードの性能によって画像の生成速度や最大生成サイズが決まります。Stable Diffusionで使用するのにおすすめのグラフィックボードを以下の記事で解説していますので、あわせてご覧ください。

Stable Diffusionで生成される画像のクオリティを上げる
動画学習プラットフォームUdemyでは、画像生成AIで高品質なイラストを生成する方法や、AIの内部で使われているアルゴリズムについて学べる講座が用意されています。
Udemyは講座単体で購入できるため安価で(セール時1500円くらいから購入できます)、PCが無くてもスマホでいつでもどこでも手軽に学習できます。
画像生成AIの使い方を学ぶ
Stable DiffusionやMidjourneyなどを使ったAIアート全般について勉強したい方には、以下の講座がおすすめです。

Stable Diffusionに特化して学ぶ
Stable Diffusionに特化し、クラウドコンピューティングサービスPaperspaceでの環境構築方法から、モデルのマージ方法、ControlNetを使った構図のコントロールなど、中級者以上のレベルを目指したい方に最適な講座です。

画像生成AIの仕組みを学ぶ
画像生成AIの仕組みについて学びたい方には、以下の講座がおすすめです。
画像生成AIで使用される変分オートエンコーダやGANのアーキテクチャを理解することで、よりクオリティの高いイラストを生成することができます。

まとめ
今回はこれまで当ブログで紹介してきた呪文作成に関するノウハウをまとめてみました。
今後も各記事に新しいノウハウを追加していきますので、ぜひ画像生成AIを使用する際に活用してみてください。
また、以下の記事で効率的にPythonのプログラミングスキルを学べるプログラミングスクールの選び方について解説しています。最近ではほとんどのスクールがオンラインで授業を受けられるようになり、仕事をしながらでも自宅で自分のペースで学習できるようになりました。
スキルアップや副業にぜひ活用してみてください。

スクールではなく、自分でPythonを習得したい方には、いつでもどこでも学べる動画学習プラットフォームのUdemyがおすすめです。
講座単位で購入できるため、スクールに比べ非常に安価(セール時1200円程度~)に学ぶことができます。私も受講しているおすすめの講座を以下の記事でまとめていますので、ぜひ参考にしてみてください。

それでは、また次の記事でお会いしましょう。


