StableDiffusionのプロンプト(呪文)を自然言語処理モデルGPT-3(Catchy)で自動生成する方法

  • URLをコピーしました!

※本ページはアフィリエイト広告を利用しています

今回はStable Diffusionなどの画像AIに生成するための指示を与えるPromptを、GPT-3を使ったライティングツールCatchyで自動生成する方法について解説します。

私のように英語が苦手でStable DiffusionのPromptを考えるのが面倒という方には非常におすすめの方法ですので、ぜひ試してみてください。

生成画像に入れたい要素を単語で入力するだけで、ハイクオリティなプロンプトを自動生成できる。

また、当ブログのStable Diffusionに関する記事を以下のページでまとめていますので、あわせてご覧ください。

Stable Diffusionの導入方法から応用テクニックまでを動画を使って習得する方法についても以下のページで紹介しています。

目次

Stable Diffusionとは

Stable Diffusion(ステーブル・ディフュージョン)は2022年8月に無償公開された描画AIです。ユーザーがテキストでキーワードを指定することで、それに応じた画像が自動生成される仕組みとなっています。
NVIDIAのGPUを搭載していれば、ユーザ自身でStable Diffusionをインストールし、ローカル環境で実行することも可能です。
(出典:wikipedia)

GPT-3を使ったAIライティングツールCatchy

出典:Catchy公式
今回、Stable DiffusionのPrompt生成に使用するのは、AIライティングツールCatchy です。

Catchyは自然言語処理モデルGPT-3を使って様々な文章を生成できるサービスです。

Catchyには様々な文章を作成する機能がありますが、その中にはMidjourneyやStable Diffusionのような画像生成AIに対するPrompt(指示)を生成するのに特化した機能が用意されています。
今回はこの画像AI用のPrompt生成機能を使ってStable DiffusionのPromptを生成してみます。

また、Catchyは無料枠が用意されており毎月無料クレジットが割り当てられますので、課金せずに使うことも可能です。ぜひ気軽に試してみてください。

英語でPromptを考えるのが苦手な方にもおすすめですし、Catchyで生成したPromptで良さそうなものを手作業でカスタマイズして使用すれば、Promptを考える時間の節約にもなります。

2023年3月現在、料金プランが改訂され、月額制以外にもスポットでクレジットの単発購入が可能になりました。必要な分だけ購入して使いたい方におすすめです。

GPT-3とは

GPT-3 (Generative Pre-trained Transformer 3)は、OpenAIによって開発された大規模な自然言語処理の人工知能モデルです。GPT-3は1700億個のパラメータを持ち、自然言語生成、文章の翻訳、Q&Aなど様々なタスクに対応することができます。

GPT-3は、非常に高い精度で人間による文章を生成することができ、GPT-3を外部のアプリケーションから使用するためのAPIとして提供されていますので、開発者はGPT-3を活用してアプリケーションを開発することができます。

Catchyの使い方

まず以下のCatchyの公式サイトにアクセスします。

Catchyのユーザー登録が完了すると、以下のようなメニュー画面が表示されます。左のメニューの「生成ツール」をクリックします。

生成機能の一覧が表示されたら、下の方にスクロールしていきます。
「画像生成AI用の英文」という項目がPrompt生成機能ですので、こちらをクリックします。

Promptを生成するための情報を入力する画面が開きますので、この赤枠の部分にどんな絵を描いてほしいかを日本語で記述します。
今回は例として「近未来的な大都市に佇む一人の少女。サイバーパンクな風景。」と入力してみました。

続いて絵のスタイルと文章の雰囲気を入力します。
今回はスタイルは「アニメ」、文章の雰囲気は「カジュアル」を選んでみました。

最後に、入力欄の下にある「作成する」のボタンをクリックします。

数秒待つと以下の画面の赤枠の部分に英語のPromptが生成されました。これをStable Diffusionに入力し、イラストを生成させます。

画像生成AI用の英文生成ツール

Stable Diffusionでイラストを生成するための準備

ここからは、Catchyで生成したプロンプトを使用するための、Stable Diffusionの環境構築方法について解説します。

Stable DiffusionのWeb UI AUTOMATIC1111

AUTOMATIC1111はStable Diffusionをブラウザから利用するためのWebアプリケーションです。AUTOMATIC1111を使用することで、プログラミングを一切必要とせずにStable Diffusionで画像生成を行うことが可能になります。

AUTOMATIC1111の公式リポジトリは以下となります。

Web UI AUTOMATIC1111のインストール方法

Web UIであるAUTOMATIC1111を実行する環境は、ローカル環境(自宅のゲーミングPCなど)を使用するか、クラウドコンピューティングサービスを利用する2通りの方法があります。

以下の記事ではそれぞれの環境構築方法について詳し解説していますので、合わせてご覧ください。

画像生成AI用の英文生成ツール

Catchyのプロンプト使用例

ここからは実際にCatchyで生成したプロンプトの使用例を紹介します。

先ほど紹介したように、Catchyで生成したプロンプトをそのまま使ってもイラストを生成できますが、さらにプロンプトに少し手を加えることでイラストの精度をグッと向上させることができます。

以下にテンプレートの例を示します。(ここにCatchyで生成したプロンプトを追加)と書かれている部分にCatchyで生成した文字列を付け加えてみてください。

ポジティブプロンプトのテンプレート

(best quality)+,(masterpiece)++,(ultra detailed)++, ((Add layer)), sunny lighting, BREAK,
One girl sitting,
(ここにCatchyで生成したプロンプトを追加)
nice hands, perfect hands,

ネガティブプロンプトのテンプレート

  EasyNegativeV2 (worst quality, low quality:1.4) bad anatomy:1.0 (extra fingers, deformed hands, polydactyl:1.5) simple background:1.0 (logo,word,text,watermark)

使用するモデル

今回、例として使用するモデルはVすき焼きさんが公開されているShungiku-Mixです。ハイクオリティなキャラクターと背景を両立できるモデルです。

その他にも色々なモデルがありますので、以下の記事で一覧で紹介しています。

Catchyの使用例①

港町の風景を描画するためのプロンプトを生成します。

Catchyへの入力文

海が見える港町。美しい建物。青い空。

Catchyで生成されたプロンプト

Create an animation of a port town with stunning cityscape, clear blue sky, and the sea in the background. The town should be shown as bustling and active, with boats sailing in and out of the port.

改良したプロンプト

Catchyで生成されたプロンプトを先ほどのテンプレートに当てはめ、最終的に以下のプロンプトで画像生成を行いました。

(best quality)+,(masterpiece)++,(ultra detailed)++, ((Add layer)), sunny lighting, BREAK,
One girl standing,
Create an animation of a port town with stunning cityscape, clear blue sky, and the sea in the background. The town should be shown as bustling and active, with boats sailing in and out of the port.
nice hands, perfect hands,

生成された画像

特に背景をきれいに描きたい場合は構図を細かく指示した方がうまくいく場合が多いため、Catchyで生成した長文のプロンプトが効いてきます。

こちらは先ほどのプロンプトを使い、さらに書き込み量を増やすことができるDetail Tweaker LoRAを併用した場合の画像です。
人物、背景共にディティールがアップしていることが確認できます。

Detail Tweaker LoRAの使い方は以下の記事で解説していますので、興味のある方はあわせてご覧ください。

画像生成AI用の英文生成ツール

Catchyの使用例②

砂漠の中にあるオアシスの風景を描画するためのプロンプトを生成します。

Catchyへの入力文

広い砂漠。砂漠の中にあるオアシス。咲き誇る花。美しい湖。

Catchyで生成されたプロンプト

In animation style, show a vast desert flourishing with blooming flowers, an oasis with palm trees, and a beautiful lake in the center

改良したプロンプト

(best quality)+,(masterpiece)++,(ultra detailed)++, ((Add layer)), sunny lighting, BREAK,
One girl standing,
In animation style, show a vast desert flourishing with blooming flowers, an oasis with palm trees, and a beautiful lake in the center,
nice hands, perfect hands,

生成された画像

Detail Tweaker LoRAを使用した場合の画像です。

画像生成AI用の英文生成ツール

Catchyの使用例③

おしゃれなカフェの風景を描画するためのプロンプトを生成します。

Catchyへの入力文

おしゃれなカフェ。カフェの店内の風景。メニューが書かれたボード。棚に並んだコーヒー豆、ボトル。観葉植物。

Catchyで生成されたプロンプト

A stylish cafe with a view of the interior, board with menu, coffee beans and bottles on shelf and houseplants, all in fun animation style.

改良したプロンプト

(best quality)+,(masterpiece)++,(ultra detailed)++, ((Add layer)), sunny lighting, BREAK,
One girl sitting,
A stylish cafe with a view of the interior, board with menu, coffee beans and bottles on shelf and houseplants, all in fun animation style,
nice hands, perfect hands,

生成された画像

Detail Tweaker LoRAを使用した場合の画像です。

画像生成AI用の英文生成ツール

Catchyの使用例④

Catchyへの入力文

一人の少女が立っている。暑い夏の日。晴れた青い空。豊かな自然。夏を感じさせる風景。

長い文章でプロンプトを生成してください。

Catchyで生成されたプロンプト

A young girl stands in the midst of a summer landscape, surrounded by rich nature, as a clear blue sky stretches above her. The bright and colorful animated style brings out the warmth and joy of the vibrant summer day.

改良したプロンプト

(best quality)+,(masterpiece)++,(ultra detailed)++, ((Add layer)), sunny lighting, BREAK,
A young girl stands in the midst of a summer landscape, surrounded by rich nature, as a clear blue sky stretches above her. The bright and colorful animated style brings out the warmth and joy of the vibrant summer day.
nice hands, perfect hands, 

生成された画像

画像生成AI用の英文生成ツール

Catchyで生成したプロンプトのサンプル集

Catchyを使ってハイクオリティな長文プロンプトを生成する手順と、Catchyで作成したプロンプトのサンプル集を以下の記事で解説しています。

まとめ

今回はStable DiffusionのPromptをGPT-3を使ったライティングツールCatchyで生成する方法について解説してみました。

モデルが優秀であることもあって、非常にクオリティの高いイラストを生成することができました。Catchyは無料で利用できるクレジットが用意されていますので、画像AIでもぜひ活用してみてください。

また、以下の記事で効率的にPythonのプログラミングスキルを学べるプログラミングスクールの選び方について解説しています。最近ではほとんどのスクールがオンラインで授業を受けられるようになり、仕事をしながらでも自宅で自分のペースで学習できるようになりました。

スキルアップや副業にぜひ活用してみてください。

スクールではなく、自分でPythonを習得したい方には、いつでもどこでも学べる動画学習プラットフォームのUdemyがおすすめです。

講座単位で購入できるため、スクールに比べ非常に安価(セール時1200円程度~)に学ぶことができます。私も受講しているおすすめの講座を以下の記事でまとめていますので、ぜひ参考にしてみてください。

それでは、また次の記事でお会いしましょう。

よかったらシェアしてね!
  • URLをコピーしました!

コメント

コメントする

CAPTCHA


目次