Stable Diffusionのプロンプトエンジニアリングについて解説 | 神絵を生成する呪文の作り方

  • URLをコピーしました!

今回は画像生成AIであるStable Diffusionで、2次元のアニメ調イラストを生成するために使っているプロンプト(呪文)を紹介します。単体で使ってもなるべく効果のわかりやすいものを選んでいますので、ぜひ試してみてください。

実写のようなフォトリアル系モデルで使用するプロンプトの作成方法については以下の記事で解説しています。

また、当ブログのStable Diffusionに関する記事を以下のページでまとめていますので、あわせてご覧ください。

目次

Stable Diffusionとは

Stable Diffusion(ステーブル・ディフュージョン)は2022年8月に無償公開された描画AIです。ユーザーがテキストでキーワードを指定することで、それに応じた画像が自動生成される仕組みとなっています。
NVIDIAのGPUを搭載していれば、ユーザ自身でStable Diffusionをインストールし、ローカル環境で実行することも可能です。
(出典:wikipedia)

AUTOMATIC1111はStable Diffusionをブラウザから利用するためのWebアプリケーションです。AUTOMATIC1111を使用することで、プログラミングを一切必要とせずにStable Diffusionで画像生成を行うことが可能になります。

AUTOMATIC1111の公式リポジトリは以下となります。

ローカル環境

GPUを搭載したローカルPCでAUTOMATIC1111を使用する方法について、以下の記事で解説しています。

Google Colaboratory

Googleのクラウドコンピューティングサービス、Google ColaboratoryでAUTOMATIC1111を使用する方法については、以下の記事で解説しています。

2023年5月現在、Google Colaboratoryの利用規約が改訂され、Stable Diffusionなどの画像AIの利用が可能なのは有料のProプランのみとなりました。
無料プランでStable Diffusionを使用すると、アカウント停止等の措置が取られる可能性がありますのでご注意ください。(詳細はGoogle Colaboratoryの利用規約をご確認ください。

Paperspase

定額制で高性能GPUを利用できるクラウドコンピューティングサービス、PaperspaceでAUTOMATIC1111を使用する方法については、以下の記事で解説しています。

イラスト全体に影響するプロンプト

イラスト全体のクオリティを上げるプロンプトです。絵の内容にかかわらずとりあえず入れておけばOKです。

(best quality)++,(masterpiece)++,(ultra detailed)++

背景に影響するプロンプト

背景の描画に関するプロンプトです。

奥行きを出す

奥行きのある背景を生成します。特に「Add layer」は複雑な構造物などを描きたい場合に有効です。

((Add layer)), dynamic angle, 

星空を綺麗に描きたい時に使用します。

beautiful starry sky, sky full of stars,

街並み

都会の街並みを綺麗に描きたい時に使用します。

cityscape, tokyo scenery,

DOF(depth of field)

一眼レフカメラで撮影したような背景がぼけたDOFの効いたイラストを生成できます。被写界深度(depth of field、DOF)とは、写真撮影において、被写体の前後方向でピントが合っている範囲のことを指します。

sense of depth, depth of field,

人物(キャラクター)に影響するプロンプト

人物の描画に関するプロンプトです。

表情

キャラクターの表情を笑顔にします。口を開いて思いっきり笑わせたいときに使用します。

(happy laughing:1.3),

アングル

キャラクターの上半身をアップで書きたい時に使用します。

(closeup to viewer:1.3),

Stable Diffusionのローカル環境

Stable Diffusionを使用する際にGoogle ColaboratoryやWebサービスを利用されている方も多いかと思います。しかし、最近Google Colabの無料での使用範囲が大きく制限されたり、Webサービスでは月額費用がかかったりします。

欲しいイラストを生成するにはかなりの回数をトライする必要があるため、これらの制約に縛られることなく使用できるローカル環境を構築するのがおすすめです。

ローカルのPCに搭載するグラフィックボード

ローカルマシンで実行する上で重要になってくるのがグラフィックボードです。
Stable Diffusionでイラストを生成するために実行される推論処理を、グラフィックボード上のGPUを使って大幅に高速化することができます。
トライする回数が増えれば品質の高いイラストが生成される可能性が上がりますので、グラフィックボードは重要です。

Stable Diffusionで使用するためのGPUは2022年に新たにNVIDIAから発売されたRTX4000シリーズのGPUとVRAM12GB以上のものがおすすめです。最近は半導体不足も一服したこともあり、新しい製品ながら価格が下がりつつあります。

エントリーモデルのGPU

予算を安く抑えたい方向けにはRTX4070を搭載したグラフィックボードがおすすめです。

予算に余裕がある方向け ミドル~ハイエンド

予算に余裕がある方向けにおすすめのRTX 4080、ビデオメモリ16GB以上搭載のモデルです。

大サイズの画像を高速に生成したい方向けのハイエンドGPU、RTX 4090 ビデオメモリ24GB搭載モデルです。

予算とパフォーマンスに合わせて選んでみてください。

画像生成AIについて学ぶ

動画学習プラットフォームUdemyでは、画像生成AIで高品質なイラストを生成する方法や、AIの内部で使われているアルゴリズムについて学べる講座が用意されています。
Udemyは講座単体で購入できるため安価で(セール時1500円くらいから購入できます)、PCが無くてもスマホでいつでもどこでも手軽に学習できます。

画像生成AIの使い方を学ぶ

Stable DiffusionやMidjourneyの使い方や活用方法を勉強したい方には、以下の講座がおすすめです。

icon icon 【文字からイラスト画像を生成】素人でもプロ並みの絵を作れる画像生成AIツール講座【ChatGPTも活用】 icon

画像生成AIの仕組みを学ぶ

画像生成AIの仕組みについて学びたい方には、以下の講座がおすすめです。
画像生成AIで使用される変分オートエンコーダやGANのアーキテクチャを理解することで、よりクオリティの高いイラストを生成することができます。

icon icon AIによる画像生成を学ぼう!【VAE / GAN】 -Google ColabとPyTorchで基礎から学ぶ生成モデル- icon

UdemyのStable Diffusionなど、AIアート関連の講座は海外のものも多いですが、ブラウザのリアルタイム翻訳機能を使うことで日本語字幕付きで視聴できます。

Udemyの海外講座の字幕を日本語化する方法

まとめ

今回はStable Diffusionで私が使用しているプロンプト(呪文)の一部を紹介しました。今後もこのページにおすすめのプロンプトを追加していく予定です。

また、以下の記事で効率的にPythonのプログラミングスキルを学べるプログラミングスクールの選び方について解説しています。最近ではほとんどのスクールがオンラインで授業を受けられるようになり、仕事をしながらでも自宅で自分のペースで学習できるようになりました。

スキルアップや副業にぜひ活用してみてください。

スクールではなく、自分でPythonを習得したい方には、いつでもどこでも学べる動画学習プラットフォームのUdemyがおすすめです。

講座単位で購入できるため、スクールに比べ非常に安価(セール時1200円程度~)に学ぶことができます。私も受講しているおすすめの講座を以下の記事でまとめていますので、ぜひ参考にしてみてください。

それでは、また次の記事でお会いしましょう。

よかったらシェアしてね!
  • URLをコピーしました!
目次