Stable Diffusionで使えるグラフィックボード RTX A4000をレビュー | 画像生成時間のパフォーマンス計測

  • URLをコピーしました!

※本ページはアフィリエイト広告を利用しています

今回は、画像生成AIであるStable Diffusionで使用するのにおすすめのグラフィックボード、NVIDIA RTX A4000をレビューしていきたいと思います。

RTX A4000はプロフェッショナル向けGPUです。機械学習で必要となる計算を高速化する第三世代Tensorコアと16GBの大容量VRAMを搭載しており、価格は2023年6月現在で実売13万円前後という非常にコストパフォーマンスに優れた製品です。

Stable Diffusion生成サイズや使用するアップスケーラを変更し、画像一枚当たりの生成にかかる時間を計測します。
グラフィックボードの選定に迷っている方は是非参考にしてみてください。

この記事でわかること
  • NVIDIA RTX A4000の性能と価格
  • NVIDIA RTX A4000の条件ごとの画像生成時間
  • NVIDIA RTX A4000の入手方法

また、当ブログのStable Diffusionに関する記事を以下のページでまとめていますので、あわせてご覧ください。

Stable Diffusionの導入方法から応用テクニックまでを動画を使って習得する方法についても以下のページで紹介しています。

目次

NVIDIA RTX A4000とは

NVIDIA RTX A4000というグラフィックボードの名前は聞きなれない方も多いかと思います。

ゲーム用途のGeForce系とは異なり、RTX A4000はプロフェッショナル向けの機械学習(AI)やグラフィック処理に特化した高性能なグラフィックボードです。多くのCUDAコア、特に機械学習の計算処理を高速に実行できるTensorコアと、大容量16GBのビデオメモリを備えており、Stable Diffusionのような画像生成AIの処理には最適です。

RTX A4000の特徴は以下の通りです。

RTX A4000の特徴
  • 高速な処理能力: RTX A4000は、複雑なAIアルゴリズムを高速で処理する能力を持っています。
  • 大容量メモリ: このグラボは、16GBのGDDR6メモリを搭載しており、大規模なデータセットも容易に扱うことができます。
  • 効率的な冷却システム: 高負荷の作業でも、冷却システムが優れているため、安定した性能を発揮します。

グラフィックボードは以下の画像のように、冷却ファンも含めてバススロット1つ分のサイズとなっており、非常にコンパクトです。

画像出展元:ELSA公式

RTX A4000のスペック

RTX A4000の主なスペックは以下の通りです。

GPU: NVIDIA RTX A4000
CUDAコア数: 6144
Tensorコア数: 192 (第3世代)
RTコア数: 48 (第2世代)
メモリ容量: 16GB
メモリ帯域幅: 448GB/s
ブーストクロック: 1.56GHz
ベースクロック: 0.735GHz
フローティングポイント性能: 19.2TFLOPS
TDP: 140W

詳細な仕様はNVIDIA公式のデータシートで確認してください。

RTX A4000データシート

Stable Diffusionで使用するGPUの選び方

Stable Diffusionで使用するグラフィックボードを選ぶ際のポイントと、グラフィックボードのスペック比較を以下の記事で解説しています。

RTX A4000性能テスト条件

今回、RTX A4000を使ってStable Diffusionで画像生成にかかる時間を計測します。
テストする際に使用するプロンプトとモデルについて解説します。

テスト用プロンプト(呪文)

今回のパフォーマンステスト用に以下のようなプロンプトを用意しました。
プロンプトの生成には、AIライティングサービスCatchyを使用しています。

プロンプト

ポジティブプロンプトは以下となります。

(best quality)+,(masterpiece)++,(ultra detailed)++, ((Add layer)), sunny lighting, BREAK,
A girl with long brown hair wearing a flowing dress stands on a bridge, gazing at the beautiful river and city scenery. Her face radiates joy and wonder, with a bright smile and sparkling eyes. Her hair is gently swaying in the breeze. She is dressed in a vibrant, colorful outfit that complements the lively atmosphere. The weather is sunny with a clear blue sky, casting warm sunlight on everything around her. The buildings are tall and modern, showcasing a lively urban setting, while the terrain features lush greenery and a charming meandering river. The lighting accentuates the scene, creating a soft glow that enhances the enchanting ambiance of the animation style.
nice hands, perfect hands,
Negative prompt: EasyNegativeV2 (worst quality, low quality:1.4) bad anatomy:1.0 (extra fingers, deformed hands, polydactyl:1.5) simple background:1.0 (logo,word,text,watermark)

ネガティブプロンプト

ネガティブプロンプトは以下となります。

EasyNegativeV2 (worst quality, low quality:1.4) bad anatomy:1.0 (extra fingers, deformed hands, polydactyl:1.5) simple background:1.0 (logo,word,text,watermark)

モデル

今回のパフォーマンステストに使用するモデルは、Vすき焼きさんのShiratakiMixをお借りしました。

SiratakiMixは以下のページからダウンロードできます。

[アップスケーラー無し]生成時間の計測

まず最初にアップスケーラなしの場合の、各画像サイズの画像生成時間を計測します。

条件 512×512

パラメータ設定

Steps: 40
Sampler: DPM++ 2M SDE Karras
CFG scale: 7
Seed: 161803283
Size: 512×512
Model hash: cd8732bdc3
Model: ShiratakiMix-add-VAE
Version: v1.3.2

生成ログ

Model loaded in 13.0s (load weights from disk: 5.0s, create model: 1.6s, apply weights to model: 3.3s, apply half(): 0.5s, load VAE: 2.3s, move model to device: 0.3s).
  0%|                                                    | 0/40 [00:00<?, ?it/s]
  2%|█                                           | 1/40 [00:04<02:47,  4.29s/it]
  8%|███▎                                        | 3/40 [00:04<00:39,  1.07s/it]
 12%|█████▌                                      | 5/40 [00:04<00:17,  2.02it/s]
 15%|██████▌                                     | 6/40 [00:04<00:12,  2.69it/s]
 18%|███████▋                                    | 7/40 [00:05<00:09,  3.44it/s]
 20%|████████▊                                   | 8/40 [00:05<00:07,  4.21it/s]
 22%|█████████▉                                  | 9/40 [00:05<00:06,  4.96it/s]
 25%|██████████▊                                | 10/40 [00:05<00:05,  5.61it/s]
 28%|███████████▊                               | 11/40 [00:05<00:04,  6.17it/s]
 30%|████████████▉                              | 12/40 [00:05<00:04,  6.64it/s]
 32%|█████████████▉                             | 13/40 [00:05<00:03,  7.06it/s]
 35%|███████████████                            | 14/40 [00:05<00:03,  7.23it/s]
 38%|████████████████▏                          | 15/40 [00:06<00:03,  7.23it/s]
 40%|█████████████████▏                         | 16/40 [00:06<00:03,  7.08it/s]
 42%|██████████████████▎                        | 17/40 [00:06<00:03,  7.11it/s]
 45%|███████████████████▎                       | 18/40 [00:06<00:03,  7.05it/s]
 48%|████████████████████▍                      | 19/40 [00:06<00:02,  7.02it/s]
 50%|█████████████████████▌                     | 20/40 [00:06<00:02,  7.22it/s]
 52%|██████████████████████▌                    | 21/40 [00:06<00:02,  7.26it/s]
 55%|███████████████████████▋                   | 22/40 [00:07<00:02,  7.43it/s]
 57%|████████████████████████▋                  | 23/40 [00:07<00:02,  7.58it/s]
 60%|█████████████████████████▊                 | 24/40 [00:07<00:02,  7.41it/s]
 62%|██████████████████████████▉                | 25/40 [00:07<00:02,  7.07it/s]
 65%|███████████████████████████▉               | 26/40 [00:07<00:01,  7.23it/s]
 68%|█████████████████████████████              | 27/40 [00:07<00:01,  7.31it/s]
 70%|██████████████████████████████             | 28/40 [00:07<00:01,  7.31it/s]
 72%|███████████████████████████████▏           | 29/40 [00:08<00:01,  7.43it/s]
 75%|████████████████████████████████▎          | 30/40 [00:08<00:01,  7.23it/s]
 78%|█████████████████████████████████▎         | 31/40 [00:08<00:01,  7.36it/s]
 80%|██████████████████████████████████▍        | 32/40 [00:08<00:01,  7.49it/s]
 82%|███████████████████████████████████▍       | 33/40 [00:08<00:00,  7.40it/s]
 85%|████████████████████████████████████▌      | 34/40 [00:08<00:00,  7.45it/s]
 88%|█████████████████████████████████████▋     | 35/40 [00:08<00:00,  7.58it/s]
 90%|██████████████████████████████████████▋    | 36/40 [00:08<00:00,  7.48it/s]
 92%|███████████████████████████████████████▊   | 37/40 [00:09<00:00,  7.54it/s]
 95%|████████████████████████████████████████▊  | 38/40 [00:09<00:00,  7.68it/s]
 98%|█████████████████████████████████████████▉ | 39/40 [00:09<00:00,  7.88it/s]
100%|███████████████████████████████████████████| 40/40 [00:09<00:00,  4.23it/s]

Total progress: 100%|███████████████████████████| 40/40 [00:05<00:00,  7.46it/s]

生成された画像

生成にかかった時間

00:05

条件 768×768

パラメータ設定

Steps: 40
Sampler: DPM++ 2M SDE Karras
CFG scale: 7
Seed: 3679360488
Size: 768×768
Model hash: cd8732bdc3
Model: ShiratakiMix-add-VAE
Version: v1.3.2

生成ログ

0%|                                                    | 0/40 [00:00<?, ?it/s]
  2%|█                                           | 1/40 [00:00<00:13,  2.82it/s]
  5%|██▏                                         | 2/40 [00:00<00:13,  2.84it/s]
  8%|███▎                                        | 3/40 [00:01<00:13,  2.85it/s]
 10%|████▍                                       | 4/40 [00:01<00:12,  2.85it/s]
 12%|█████▌                                      | 5/40 [00:01<00:12,  2.85it/s]
 15%|██████▌                                     | 6/40 [00:02<00:11,  2.85it/s]
 18%|███████▋                                    | 7/40 [00:02<00:11,  2.85it/s]
 20%|████████▊                                   | 8/40 [00:02<00:11,  2.84it/s]
 22%|█████████▉                                  | 9/40 [00:03<00:10,  2.85it/s]
 25%|██████████▊                                | 10/40 [00:03<00:10,  2.85it/s]
 28%|███████████▊                               | 11/40 [00:03<00:10,  2.86it/s]
 30%|████████████▉                              | 12/40 [00:04<00:09,  2.86it/s]
 32%|█████████████▉                             | 13/40 [00:04<00:09,  2.86it/s]
 35%|███████████████                            | 14/40 [00:04<00:09,  2.86it/s]
 38%|████████████████▏                          | 15/40 [00:05<00:08,  2.86it/s]
 40%|█████████████████▏                         | 16/40 [00:05<00:08,  2.86it/s]
 42%|██████████████████▎                        | 17/40 [00:05<00:08,  2.86it/s]
 45%|███████████████████▎                       | 18/40 [00:06<00:07,  2.86it/s]
 48%|████████████████████▍                      | 19/40 [00:06<00:07,  2.86it/s]
 50%|█████████████████████▌                     | 20/40 [00:07<00:07,  2.85it/s]
 52%|██████████████████████▌                    | 21/40 [00:07<00:06,  2.85it/s]
 55%|███████████████████████▋                   | 22/40 [00:07<00:06,  2.85it/s]
 57%|████████████████████████▋                  | 23/40 [00:08<00:05,  2.85it/s]
 60%|█████████████████████████▊                 | 24/40 [00:08<00:05,  2.85it/s]
 62%|██████████████████████████▉                | 25/40 [00:08<00:05,  2.85it/s]
 65%|███████████████████████████▉               | 26/40 [00:09<00:04,  2.85it/s]
 68%|█████████████████████████████              | 27/40 [00:09<00:04,  2.85it/s]
 70%|██████████████████████████████             | 28/40 [00:09<00:04,  2.85it/s]
 72%|███████████████████████████████▏           | 29/40 [00:10<00:03,  2.86it/s]
 75%|████████████████████████████████▎          | 30/40 [00:10<00:03,  2.86it/s]
 78%|█████████████████████████████████▎         | 31/40 [00:10<00:03,  2.86it/s]
 80%|██████████████████████████████████▍        | 32/40 [00:11<00:02,  2.85it/s]
 82%|███████████████████████████████████▍       | 33/40 [00:11<00:02,  2.86it/s]
 85%|████████████████████████████████████▌      | 34/40 [00:11<00:02,  2.86it/s]
 88%|█████████████████████████████████████▋     | 35/40 [00:12<00:01,  2.86it/s]
 90%|██████████████████████████████████████▋    | 36/40 [00:12<00:01,  2.86it/s]
 92%|███████████████████████████████████████▊   | 37/40 [00:12<00:01,  2.86it/s]
 95%|████████████████████████████████████████▊  | 38/40 [00:13<00:00,  2.86it/s]
 98%|█████████████████████████████████████████▉ | 39/40 [00:13<00:00,  2.87it/s]
100%|███████████████████████████████████████████| 40/40 [00:14<00:00,  2.86it/s]

Total progress: 100%|███████████████████████████| 40/40 [00:14<00:00,  2.84it/s]

生成された画像

生成にかかった時間

00:14

条件 1024×1024

パラメータ設定

Steps: 40
Sampler: DPM++ 2M SDE Karras
CFG scale: 7
Seed: 3679360488
Size: 1024×1024
Model hash: cd8732bdc3
Model: ShiratakiMix-add-VAE
Version: v1.3.2

生成ログ

  0%|                                                    | 0/40 [00:00<?, ?it/s]
  2%|█                                           | 1/40 [00:00<00:35,  1.11it/s]
  5%|██▏                                         | 2/40 [00:01<00:34,  1.11it/s]
  8%|███▎                                        | 3/40 [00:02<00:33,  1.11it/s]
 10%|████▍                                       | 4/40 [00:03<00:32,  1.11it/s]
 12%|█████▌                                      | 5/40 [00:04<00:31,  1.11it/s]
 15%|██████▌                                     | 6/40 [00:05<00:30,  1.11it/s]
 18%|███████▋                                    | 7/40 [00:06<00:29,  1.11it/s]
 20%|████████▊                                   | 8/40 [00:07<00:28,  1.11it/s]
 22%|█████████▉                                  | 9/40 [00:08<00:27,  1.11it/s]
 25%|██████████▊                                | 10/40 [00:09<00:27,  1.11it/s]
 28%|███████████▊                               | 11/40 [00:09<00:26,  1.11it/s]
 30%|████████████▉                              | 12/40 [00:10<00:25,  1.11it/s]
 32%|█████████████▉                             | 13/40 [00:11<00:24,  1.11it/s]
 35%|███████████████                            | 14/40 [00:12<00:23,  1.11it/s]
 38%|████████████████▏                          | 15/40 [00:13<00:22,  1.11it/s]
 40%|█████████████████▏                         | 16/40 [00:14<00:21,  1.11it/s]
 42%|██████████████████▎                        | 17/40 [00:15<00:20,  1.11it/s]
 45%|███████████████████▎                       | 18/40 [00:16<00:19,  1.11it/s]
 48%|████████████████████▍                      | 19/40 [00:17<00:18,  1.11it/s]
 50%|█████████████████████▌                     | 20/40 [00:18<00:18,  1.11it/s]
 52%|██████████████████████▌                    | 21/40 [00:18<00:17,  1.10it/s]
 55%|███████████████████████▋                   | 22/40 [00:19<00:16,  1.10it/s]
 57%|████████████████████████▋                  | 23/40 [00:20<00:15,  1.10it/s]
 60%|█████████████████████████▊                 | 24/40 [00:21<00:14,  1.10it/s]
 62%|██████████████████████████▉                | 25/40 [00:22<00:13,  1.10it/s]
 65%|███████████████████████████▉               | 26/40 [00:23<00:12,  1.10it/s]
 68%|█████████████████████████████              | 27/40 [00:24<00:11,  1.10it/s]
 70%|██████████████████████████████             | 28/40 [00:25<00:10,  1.10it/s]
 72%|███████████████████████████████▏           | 29/40 [00:26<00:09,  1.10it/s]
 75%|████████████████████████████████▎          | 30/40 [00:27<00:09,  1.10it/s]
 78%|█████████████████████████████████▎         | 31/40 [00:28<00:08,  1.10it/s]
 80%|██████████████████████████████████▍        | 32/40 [00:28<00:07,  1.10it/s]
 82%|███████████████████████████████████▍       | 33/40 [00:29<00:06,  1.10it/s]
 85%|████████████████████████████████████▌      | 34/40 [00:30<00:05,  1.10it/s]
 88%|█████████████████████████████████████▋     | 35/40 [00:31<00:04,  1.10it/s]
 90%|██████████████████████████████████████▋    | 36/40 [00:32<00:03,  1.10it/s]
 92%|███████████████████████████████████████▊   | 37/40 [00:33<00:02,  1.10it/s]
 95%|████████████████████████████████████████▊  | 38/40 [00:34<00:01,  1.10it/s]
 98%|█████████████████████████████████████████▉ | 39/40 [00:35<00:00,  1.10it/s]
100%|███████████████████████████████████████████| 40/40 [00:36<00:00,  1.10it/s]

Total progress: 100%|███████████████████████████| 40/40 [00:36<00:00,  1.11it/s]

生成された画像

生成にかかった時間

00:36

[hires.fix 使用時]生成時間の計測

条件 (512×512)アップスケーラー×2

パラメータ設定

Steps: 40
Sampler: DPM++ 2M SDE Karras
CFG scale: 7
Seed: 3679360488
Size: 512×512
Model hash: cd8732bdc3
Model: ShiratakiMix-add-VAE
Denoising strength: 0.7
Hires upscale: 2
Hires upscaler: R-ESRGAN 4x+ Anime6B
Version: v1.3.2

生成ログ

  0%|                                                    | 0/40 [00:00<?, ?it/s]
  2%|█                                           | 1/40 [00:00<00:05,  7.57it/s]
  5%|██▏                                         | 2/40 [00:00<00:04,  7.70it/s]
  8%|███▎                                        | 3/40 [00:00<00:04,  7.63it/s]
 10%|████▍                                       | 4/40 [00:00<00:04,  7.60it/s]
 12%|█████▌                                      | 5/40 [00:00<00:04,  7.60it/s]
 15%|██████▌                                     | 6/40 [00:00<00:04,  7.65it/s]
 18%|███████▋                                    | 7/40 [00:00<00:04,  7.67it/s]
 20%|████████▊                                   | 8/40 [00:01<00:04,  7.68it/s]
 22%|█████████▉                                  | 9/40 [00:01<00:04,  7.74it/s]
 25%|██████████▊                                | 10/40 [00:01<00:03,  7.73it/s]
 28%|███████████▊                               | 11/40 [00:01<00:03,  7.74it/s]
 30%|████████████▉                              | 12/40 [00:01<00:03,  7.75it/s]
 32%|█████████████▉                             | 13/40 [00:01<00:03,  7.70it/s]
 35%|███████████████                            | 14/40 [00:01<00:03,  7.71it/s]
 38%|████████████████▏                          | 15/40 [00:01<00:03,  7.71it/s]
 40%|█████████████████▏                         | 16/40 [00:02<00:03,  7.64it/s]
 42%|██████████████████▎                        | 17/40 [00:02<00:02,  7.70it/s]
 45%|███████████████████▎                       | 18/40 [00:02<00:02,  7.74it/s]
 48%|████████████████████▍                      | 19/40 [00:02<00:02,  7.77it/s]
 50%|█████████████████████▌                     | 20/40 [00:02<00:02,  7.80it/s]
 52%|██████████████████████▌                    | 21/40 [00:02<00:02,  7.65it/s]
 55%|███████████████████████▋                   | 22/40 [00:02<00:02,  7.53it/s]
 57%|████████████████████████▋                  | 23/40 [00:02<00:02,  7.56it/s]
 60%|█████████████████████████▊                 | 24/40 [00:03<00:02,  7.67it/s]
 62%|██████████████████████████▉                | 25/40 [00:03<00:01,  7.70it/s]
 65%|███████████████████████████▉               | 26/40 [00:03<00:01,  7.51it/s]
 68%|█████████████████████████████              | 27/40 [00:03<00:01,  7.45it/s]
 70%|██████████████████████████████             | 28/40 [00:03<00:01,  7.28it/s]
 72%|███████████████████████████████▏           | 29/40 [00:03<00:01,  7.24it/s]
 75%|████████████████████████████████▎          | 30/40 [00:03<00:01,  7.17it/s]
 78%|█████████████████████████████████▎         | 31/40 [00:04<00:01,  7.21it/s]
 80%|██████████████████████████████████▍        | 32/40 [00:04<00:01,  7.32it/s]
 82%|███████████████████████████████████▍       | 33/40 [00:04<00:00,  7.37it/s]
 85%|████████████████████████████████████▌      | 34/40 [00:04<00:00,  7.44it/s]
 88%|█████████████████████████████████████▋     | 35/40 [00:04<00:00,  7.40it/s]
 90%|██████████████████████████████████████▋    | 36/40 [00:04<00:00,  7.51it/s]
 92%|███████████████████████████████████████▊   | 37/40 [00:04<00:00,  7.61it/s]
 95%|████████████████████████████████████████▊  | 38/40 [00:05<00:00,  7.77it/s]
 98%|█████████████████████████████████████████▉ | 39/40 [00:05<00:00,  7.91it/s]
100%|███████████████████████████████████████████| 40/40 [00:05<00:00,  7.61it/s]
	Tile 1/9
	Tile 2/9
	Tile 3/9
	Tile 4/9
	Tile 5/9
	Tile 6/9
	Tile 7/9
	Tile 8/9
	Tile 9/9
  0%|                                                    | 0/40 [00:00<?, ?it/s]
  2%|█                                           | 1/40 [00:00<00:35,  1.10it/s]
  5%|██▏                                         | 2/40 [00:01<00:34,  1.10it/s]
  8%|███▎                                        | 3/40 [00:02<00:33,  1.10it/s]
 10%|████▍                                       | 4/40 [00:03<00:32,  1.10it/s]
 12%|█████▌                                      | 5/40 [00:04<00:31,  1.11it/s]
 15%|██████▌                                     | 6/40 [00:05<00:30,  1.11it/s]
 18%|███████▋                                    | 7/40 [00:06<00:29,  1.11it/s]
 20%|████████▊                                   | 8/40 [00:07<00:28,  1.11it/s]
 22%|█████████▉                                  | 9/40 [00:08<00:28,  1.10it/s]
 25%|██████████▊                                | 10/40 [00:09<00:27,  1.10it/s]
 28%|███████████▊                               | 11/40 [00:09<00:26,  1.11it/s]
 30%|████████████▉                              | 12/40 [00:10<00:25,  1.10it/s]
 32%|█████████████▉                             | 13/40 [00:11<00:24,  1.10it/s]
 35%|███████████████                            | 14/40 [00:12<00:23,  1.10it/s]
 38%|████████████████▏                          | 15/40 [00:13<00:22,  1.10it/s]
 40%|█████████████████▏                         | 16/40 [00:14<00:21,  1.10it/s]
 42%|██████████████████▎                        | 17/40 [00:15<00:20,  1.10it/s]
 45%|███████████████████▎                       | 18/40 [00:16<00:19,  1.10it/s]
 48%|████████████████████▍                      | 19/40 [00:17<00:19,  1.10it/s]
 50%|█████████████████████▌                     | 20/40 [00:18<00:18,  1.10it/s]
 52%|██████████████████████▌                    | 21/40 [00:19<00:17,  1.10it/s]
 55%|███████████████████████▋                   | 22/40 [00:19<00:16,  1.10it/s]
 57%|████████████████████████▋                  | 23/40 [00:20<00:15,  1.10it/s]
 60%|█████████████████████████▊                 | 24/40 [00:21<00:14,  1.10it/s]
 62%|██████████████████████████▉                | 25/40 [00:22<00:13,  1.10it/s]
 65%|███████████████████████████▉               | 26/40 [00:23<00:12,  1.10it/s]
 68%|█████████████████████████████              | 27/40 [00:24<00:11,  1.10it/s]
 70%|██████████████████████████████             | 28/40 [00:25<00:10,  1.10it/s]
 72%|███████████████████████████████▏           | 29/40 [00:26<00:10,  1.10it/s]
 75%|████████████████████████████████▎          | 30/40 [00:27<00:09,  1.10it/s]
 78%|█████████████████████████████████▎         | 31/40 [00:28<00:08,  1.10it/s]
 80%|██████████████████████████████████▍        | 32/40 [00:29<00:07,  1.10it/s]
 82%|███████████████████████████████████▍       | 33/40 [00:29<00:06,  1.10it/s]
 85%|████████████████████████████████████▌      | 34/40 [00:30<00:05,  1.10it/s]
 88%|█████████████████████████████████████▋     | 35/40 [00:31<00:04,  1.10it/s]
 90%|██████████████████████████████████████▋    | 36/40 [00:32<00:03,  1.10it/s]
 92%|███████████████████████████████████████▊   | 37/40 [00:33<00:02,  1.10it/s]
 95%|████████████████████████████████████████▊  | 38/40 [00:34<00:01,  1.10it/s]
 98%|█████████████████████████████████████████▉ | 39/40 [00:35<00:00,  1.10it/s]
100%|███████████████████████████████████████████| 40/40 [00:36<00:00,  1.10it/s]

Total progress: 100%|███████████████████████████| 80/80 [00:58<00:00,  1.36it/s]

生成された画像

生成にかかった時間

[元画像 00:05]+[アップスケール 00:58]
Total 01:03

条件 (768×768)アップスケーラー×2

パラメータ設定

Steps: 40
Sampler: DPM++ 2M SDE Karras
CFG scale: 7
Seed: 3679360488
Size: 768×768
Model hash: cd8732bdc3
Model: ShiratakiMix-add-VAE
Denoising strength: 0.7
Hires upscale: 2
Hires upscaler: R-ESRGAN 4x+ Anime6B
Version: v1.3.2

生成ログ

  0%|                                                    | 0/40 [00:00<?, ?it/s]
  2%|█                                           | 1/40 [00:00<00:13,  2.84it/s]
  5%|██▏                                         | 2/40 [00:00<00:13,  2.86it/s]
  8%|███▎                                        | 3/40 [00:01<00:12,  2.86it/s]
 10%|████▍                                       | 4/40 [00:01<00:12,  2.87it/s]
 12%|█████▌                                      | 5/40 [00:01<00:12,  2.87it/s]
 15%|██████▌                                     | 6/40 [00:02<00:11,  2.87it/s]
 18%|███████▋                                    | 7/40 [00:02<00:11,  2.87it/s]
 20%|████████▊                                   | 8/40 [00:02<00:11,  2.86it/s]
 22%|█████████▉                                  | 9/40 [00:03<00:10,  2.86it/s]
 25%|██████████▊                                | 10/40 [00:03<00:10,  2.86it/s]
 28%|███████████▊                               | 11/40 [00:03<00:10,  2.85it/s]
 30%|████████████▉                              | 12/40 [00:04<00:09,  2.85it/s]
 32%|█████████████▉                             | 13/40 [00:04<00:09,  2.85it/s]
 35%|███████████████                            | 14/40 [00:04<00:09,  2.85it/s]
 38%|████████████████▏                          | 15/40 [00:05<00:08,  2.85it/s]
 40%|█████████████████▏                         | 16/40 [00:05<00:08,  2.85it/s]
 42%|██████████████████▎                        | 17/40 [00:05<00:08,  2.86it/s]
 45%|███████████████████▎                       | 18/40 [00:06<00:07,  2.86it/s]
 48%|████████████████████▍                      | 19/40 [00:06<00:07,  2.86it/s]
 50%|█████████████████████▌                     | 20/40 [00:06<00:07,  2.86it/s]
 52%|██████████████████████▌                    | 21/40 [00:07<00:06,  2.86it/s]
 55%|███████████████████████▋                   | 22/40 [00:07<00:06,  2.86it/s]
 57%|████████████████████████▋                  | 23/40 [00:08<00:05,  2.85it/s]
 60%|█████████████████████████▊                 | 24/40 [00:08<00:05,  2.85it/s]
 62%|██████████████████████████▉                | 25/40 [00:08<00:05,  2.85it/s]
 65%|███████████████████████████▉               | 26/40 [00:09<00:04,  2.84it/s]
 68%|█████████████████████████████              | 27/40 [00:09<00:04,  2.85it/s]
 70%|██████████████████████████████             | 28/40 [00:09<00:04,  2.85it/s]
 72%|███████████████████████████████▏           | 29/40 [00:10<00:03,  2.85it/s]
 75%|████████████████████████████████▎          | 30/40 [00:10<00:03,  2.85it/s]
 78%|█████████████████████████████████▎         | 31/40 [00:10<00:03,  2.85it/s]
 80%|██████████████████████████████████▍        | 32/40 [00:11<00:02,  2.85it/s]
 82%|███████████████████████████████████▍       | 33/40 [00:11<00:02,  2.85it/s]
 85%|████████████████████████████████████▌      | 34/40 [00:11<00:02,  2.85it/s]
 88%|█████████████████████████████████████▋     | 35/40 [00:12<00:01,  2.86it/s]
 90%|██████████████████████████████████████▋    | 36/40 [00:12<00:01,  2.86it/s]
 92%|███████████████████████████████████████▊   | 37/40 [00:12<00:01,  2.86it/s]
 95%|████████████████████████████████████████▊  | 38/40 [00:13<00:00,  2.86it/s]
 98%|█████████████████████████████████████████▉ | 39/40 [00:13<00:00,  2.86it/s]
100%|███████████████████████████████████████████| 40/40 [00:14<00:00,  2.86it/s]
	Tile 1/25
	Tile 2/25
	Tile 3/25
	Tile 4/25
	Tile 5/25
	Tile 6/25
	Tile 7/25
	Tile 8/25
	Tile 9/25
	Tile 10/25
	Tile 11/25
	Tile 12/25
	Tile 13/25
	Tile 14/25
	Tile 15/25
	Tile 16/25
	Tile 17/25
	Tile 18/25
	Tile 19/25
	Tile 20/25
	Tile 21/25
	Tile 22/25
	Tile 23/25
	Tile 24/25
	Tile 25/25
  0%|                                                    | 0/40 [00:00<?, ?it/s]
  2%|█                                           | 1/40 [00:04<03:01,  4.67s/it]
  5%|██▏                                         | 2/40 [00:09<02:53,  4.56s/it]
  8%|███▎                                        | 3/40 [00:13<02:47,  4.53s/it]
 10%|████▍                                       | 4/40 [00:18<02:42,  4.51s/it]
 12%|█████▌                                      | 5/40 [00:22<02:37,  4.50s/it]
 15%|██████▌                                     | 6/40 [00:27<02:33,  4.50s/it]
 18%|███████▋                                    | 7/40 [00:31<02:28,  4.50s/it]
 20%|████████▊                                   | 8/40 [00:36<02:24,  4.50s/it]
 22%|█████████▉                                  | 9/40 [00:40<02:19,  4.50s/it]
 25%|██████████▊                                | 10/40 [00:45<02:15,  4.50s/it]
 28%|███████████▊                               | 11/40 [00:49<02:10,  4.50s/it]
 30%|████████████▉                              | 12/40 [00:54<02:06,  4.50s/it]
 32%|█████████████▉                             | 13/40 [00:58<02:01,  4.50s/it]
 35%|███████████████                            | 14/40 [01:03<01:57,  4.51s/it]
 38%|████████████████▏                          | 15/40 [01:07<01:52,  4.51s/it]
 40%|█████████████████▏                         | 16/40 [01:12<01:48,  4.51s/it]
 42%|██████████████████▎                        | 17/40 [01:16<01:43,  4.51s/it]
 45%|███████████████████▎                       | 18/40 [01:21<01:39,  4.51s/it]
 48%|████████████████████▍                      | 19/40 [01:25<01:34,  4.51s/it]
 50%|█████████████████████▌                     | 20/40 [01:30<01:30,  4.51s/it]
 52%|██████████████████████▌                    | 21/40 [01:34<01:25,  4.51s/it]
 55%|███████████████████████▋                   | 22/40 [01:39<01:21,  4.51s/it]
 57%|████████████████████████▋                  | 23/40 [01:43<01:16,  4.51s/it]
 60%|█████████████████████████▊                 | 24/40 [01:48<01:12,  4.51s/it]
 62%|██████████████████████████▉                | 25/40 [01:52<01:07,  4.51s/it]
 65%|███████████████████████████▉               | 26/40 [01:57<01:03,  4.51s/it]
 68%|█████████████████████████████              | 27/40 [02:01<00:58,  4.51s/it]
 70%|██████████████████████████████             | 28/40 [02:06<00:54,  4.51s/it]
 72%|███████████████████████████████▏           | 29/40 [02:10<00:49,  4.51s/it]
 75%|████████████████████████████████▎          | 30/40 [02:15<00:45,  4.51s/it]
 78%|█████████████████████████████████▎         | 31/40 [02:19<00:40,  4.51s/it]
 80%|██████████████████████████████████▍        | 32/40 [02:24<00:36,  4.51s/it]
 82%|███████████████████████████████████▍       | 33/40 [02:28<00:31,  4.51s/it]
 85%|████████████████████████████████████▌      | 34/40 [02:33<00:27,  4.51s/it]
 88%|█████████████████████████████████████▋     | 35/40 [02:37<00:22,  4.51s/it]
 90%|██████████████████████████████████████▋    | 36/40 [02:42<00:18,  4.51s/it]
 92%|███████████████████████████████████████▊   | 37/40 [02:46<00:13,  4.51s/it]
 95%|████████████████████████████████████████▊  | 38/40 [02:51<00:09,  4.51s/it]
 98%|█████████████████████████████████████████▉ | 39/40 [02:55<00:04,  4.51s/it]
100%|███████████████████████████████████████████| 40/40 [03:00<00:00,  4.51s/it]

Total progress: 100%|███████████████████████████| 80/80 [03:18<00:00,  2.48s/it]

生成された画像

生成にかかった時間

[元画像 00:14]+[アップスケール 03:18]
Total 03:32

条件 (1024×1024)アップスケーラー×2

パラメータ設定

Steps: 40
Sampler: DPM++ 2M SDE Karras
CFG scale: 7
Seed: 3679360488
Size: 1024×1024
Model hash: cd8732bdc3
Model: ShiratakiMix-add-VAE
Denoising strength: 0.7
Hires upscale: 2
Hires upscaler: R-ESRGAN 4x+ Anime6B
Version: v1.3.2

生成ログ

  0%|                                                    | 0/40 [00:00<?, ?it/s]
  2%|█                                           | 1/40 [00:00<00:35,  1.11it/s]
  5%|██▏                                         | 2/40 [00:01<00:34,  1.10it/s]
  8%|███▎                                        | 3/40 [00:02<00:33,  1.10it/s]
 10%|████▍                                       | 4/40 [00:03<00:32,  1.10it/s]
 12%|█████▌                                      | 5/40 [00:04<00:31,  1.10it/s]
 15%|██████▌                                     | 6/40 [00:05<00:30,  1.10it/s]
 18%|███████▋                                    | 7/40 [00:06<00:29,  1.10it/s]
 20%|████████▊                                   | 8/40 [00:07<00:29,  1.10it/s]
 22%|█████████▉                                  | 9/40 [00:08<00:28,  1.10it/s]
 25%|██████████▊                                | 10/40 [00:09<00:27,  1.10it/s]
 28%|███████████▊                               | 11/40 [00:09<00:26,  1.10it/s]
 30%|████████████▉                              | 12/40 [00:10<00:25,  1.10it/s]
 32%|█████████████▉                             | 13/40 [00:11<00:24,  1.10it/s]
 35%|███████████████                            | 14/40 [00:12<00:23,  1.10it/s]
 38%|████████████████▏                          | 15/40 [00:13<00:22,  1.10it/s]
 40%|█████████████████▏                         | 16/40 [00:14<00:21,  1.10it/s]
 42%|██████████████████▎                        | 17/40 [00:15<00:20,  1.10it/s]
 45%|███████████████████▎                       | 18/40 [00:16<00:20,  1.10it/s]
 48%|████████████████████▍                      | 19/40 [00:17<00:19,  1.10it/s]
 50%|█████████████████████▌                     | 20/40 [00:18<00:18,  1.10it/s]
 52%|██████████████████████▌                    | 21/40 [00:19<00:17,  1.10it/s]
 55%|███████████████████████▋                   | 22/40 [00:19<00:16,  1.10it/s]
 57%|████████████████████████▋                  | 23/40 [00:20<00:15,  1.10it/s]
 60%|█████████████████████████▊                 | 24/40 [00:21<00:14,  1.10it/s]
 62%|██████████████████████████▉                | 25/40 [00:22<00:13,  1.10it/s]
 65%|███████████████████████████▉               | 26/40 [00:23<00:12,  1.10it/s]
 68%|█████████████████████████████              | 27/40 [00:24<00:11,  1.10it/s]
 70%|██████████████████████████████             | 28/40 [00:25<00:10,  1.10it/s]
 72%|███████████████████████████████▏           | 29/40 [00:26<00:10,  1.10it/s]
 75%|████████████████████████████████▎          | 30/40 [00:27<00:09,  1.10it/s]
 78%|█████████████████████████████████▎         | 31/40 [00:28<00:08,  1.10it/s]
 80%|██████████████████████████████████▍        | 32/40 [00:29<00:07,  1.10it/s]
 82%|███████████████████████████████████▍       | 33/40 [00:30<00:06,  1.10it/s]
 85%|████████████████████████████████████▌      | 34/40 [00:30<00:05,  1.10it/s]
 88%|█████████████████████████████████████▋     | 35/40 [00:31<00:04,  1.09it/s]
 90%|██████████████████████████████████████▋    | 36/40 [00:32<00:03,  1.09it/s]
 92%|███████████████████████████████████████▊   | 37/40 [00:33<00:02,  1.09it/s]
 95%|████████████████████████████████████████▊  | 38/40 [00:34<00:01,  1.09it/s]
 98%|█████████████████████████████████████████▉ | 39/40 [00:35<00:00,  1.09it/s]
100%|███████████████████████████████████████████| 40/40 [00:36<00:00,  1.10it/s]
	Tile 1/36
	Tile 2/36
	Tile 3/36
	Tile 4/36
	Tile 5/36
	Tile 6/36
	Tile 7/36
	Tile 8/36
	Tile 9/36
	Tile 10/36
	Tile 11/36
	Tile 12/36
	Tile 13/36
	Tile 14/36
	Tile 15/36
	Tile 16/36
	Tile 17/36
	Tile 18/36
	Tile 19/36
	Tile 20/36
	Tile 21/36
	Tile 22/36
	Tile 23/36
	Tile 24/36
	Tile 25/36
	Tile 26/36
	Tile 27/36
	Tile 28/36
	Tile 29/36
	Tile 30/36
	Tile 31/36
	Tile 32/36
	Tile 33/36
	Tile 34/36
	Tile 35/36
	Tile 36/36
  0%|                                                    | 0/40 [00:00<?, ?it/s]
  2%|█                                           | 1/40 [00:13<08:50, 13.59s/it]
  5%|██▏                                         | 2/40 [00:27<08:34, 13.54s/it]
  8%|███▎                                        | 3/40 [00:40<08:20, 13.52s/it]
 10%|████▍                                       | 4/40 [00:54<08:06, 13.52s/it]
 12%|█████▌                                      | 5/40 [01:07<07:53, 13.52s/it]
 15%|██████▌                                     | 6/40 [01:21<07:39, 13.51s/it]
 18%|███████▋                                    | 7/40 [01:34<07:25, 13.51s/it]
 20%|████████▊                                   | 8/40 [01:48<07:12, 13.51s/it]
 22%|█████████▉                                  | 9/40 [02:01<06:59, 13.52s/it]
 25%|██████████▊                                | 10/40 [02:15<06:45, 13.52s/it]
 28%|███████████▊                               | 11/40 [02:28<06:31, 13.52s/it]
 30%|████████████▉                              | 12/40 [02:42<06:18, 13.52s/it]
 32%|█████████████▉                             | 13/40 [02:55<06:04, 13.52s/it]
 35%|███████████████                            | 14/40 [03:09<05:51, 13.52s/it]
 38%|████████████████▏                          | 15/40 [03:22<05:37, 13.52s/it]
 40%|█████████████████▏                         | 16/40 [03:36<05:24, 13.52s/it]
 42%|██████████████████▎                        | 17/40 [03:49<05:10, 13.52s/it]
 45%|███████████████████▎                       | 18/40 [04:03<04:57, 13.52s/it]
 48%|████████████████████▍                      | 19/40 [04:16<04:43, 13.52s/it]
 50%|█████████████████████▌                     | 20/40 [04:30<04:30, 13.52s/it]
 52%|██████████████████████▌                    | 21/40 [04:43<04:16, 13.51s/it]
 55%|███████████████████████▋                   | 22/40 [04:57<04:03, 13.52s/it]
 57%|████████████████████████▋                  | 23/40 [05:10<03:49, 13.52s/it]
 60%|█████████████████████████▊                 | 24/40 [05:24<03:36, 13.52s/it]
 62%|██████████████████████████▉                | 25/40 [05:37<03:22, 13.52s/it]
 65%|███████████████████████████▉               | 26/40 [05:51<03:09, 13.51s/it]
 68%|█████████████████████████████              | 27/40 [06:04<02:55, 13.51s/it]
 70%|██████████████████████████████             | 28/40 [06:18<02:42, 13.51s/it]
 72%|███████████████████████████████▏           | 29/40 [06:31<02:28, 13.51s/it]
 75%|████████████████████████████████▎          | 30/40 [06:45<02:15, 13.51s/it]
 78%|█████████████████████████████████▎         | 31/40 [06:59<02:01, 13.51s/it]
 80%|██████████████████████████████████▍        | 32/40 [07:12<01:48, 13.51s/it]
 82%|███████████████████████████████████▍       | 33/40 [07:26<01:34, 13.51s/it]
 85%|████████████████████████████████████▌      | 34/40 [07:39<01:21, 13.51s/it]
 88%|█████████████████████████████████████▋     | 35/40 [07:53<01:07, 13.51s/it]
 90%|██████████████████████████████████████▋    | 36/40 [08:06<00:54, 13.51s/it]
 92%|███████████████████████████████████████▊   | 37/40 [08:20<00:40, 13.51s/it]
 95%|████████████████████████████████████████▊  | 38/40 [08:33<00:27, 13.51s/it]
 98%|█████████████████████████████████████████▉ | 39/40 [08:47<00:13, 13.51s/it]
100%|███████████████████████████████████████████| 40/40 [09:00<00:00, 13.52s/it]

Total progress: 100%|███████████████████████████| 80/80 [09:44<00:00,  7.31s/it]
​

生成された画像

生成にかかった時間

[元画像 00:36]+[アップスケール 09:44]
Total 10:20

[tile_resample 使用時]生成時間の計測

条件 (512×512)アップスケーラー×2

パラメータ設定

Steps: 40
Sampler: DPM++ 2M SDE Karras
CFG scale: 7
Seed: 3679360488
Size: 1024×1024
Model hash: cd8732bdc3
Model: ShiratakiMix-add-VAE
ControlNet: “preprocessor: tile_resample, model: control_v11f1e_sd15_tile [a371b31b], weight: 1, starting/ending: (0, 1), resize mode: Crop and Resize, pixel perfect: True, control mode: Balanced, preprocessor params: (512, 1, 64)”

生成ログ

Loading model: control_v11f1e_sd15_tile [a371b31b]
Loaded state_dict from [/notebooks/stable-diffusion-webui/extensions/sd-webui-controlnet/models/control_v11f1e_sd15_tile.pth]
Loading config: /notebooks/stable-diffusion-webui/extensions/sd-webui-controlnet/models/control_v11f1e_sd15_tile.yaml
ControlNet model control_v11f1e_sd15_tile [a371b31b] loaded.
Loading preprocessor: tile_resample
Pixel Perfect Mode Enabled.
resize_mode = ResizeMode.INNER_FIT
raw_H = 512
raw_W = 512
target_H = 1024
target_W = 1024
estimation = 1024.0
preprocessor resolution = 1024
  0%|                                                    | 0/40 [00:00<?, ?it/s]
  2%|█                                           | 1/40 [00:01<00:49,  1.26s/it]
  5%|██▏                                         | 2/40 [00:02<00:47,  1.26s/it]
  8%|███▎                                        | 3/40 [00:03<00:46,  1.26s/it]
 10%|████▍                                       | 4/40 [00:05<00:45,  1.26s/it]
 12%|█████▌                                      | 5/40 [00:06<00:43,  1.26s/it]
 15%|██████▌                                     | 6/40 [00:07<00:42,  1.26s/it]
 18%|███████▋                                    | 7/40 [00:08<00:41,  1.26s/it]
 20%|████████▊                                   | 8/40 [00:10<00:40,  1.26s/it]
 22%|█████████▉                                  | 9/40 [00:11<00:38,  1.26s/it]
 25%|██████████▊                                | 10/40 [00:12<00:37,  1.26s/it]
 28%|███████████▊                               | 11/40 [00:13<00:36,  1.26s/it]
 30%|████████████▉                              | 12/40 [00:15<00:35,  1.26s/it]
 32%|█████████████▉                             | 13/40 [00:16<00:33,  1.26s/it]
 35%|███████████████                            | 14/40 [00:17<00:32,  1.26s/it]
 38%|████████████████▏                          | 15/40 [00:18<00:31,  1.26s/it]
 40%|█████████████████▏                         | 16/40 [00:20<00:30,  1.26s/it]
 42%|██████████████████▎                        | 17/40 [00:21<00:28,  1.26s/it]
 45%|███████████████████▎                       | 18/40 [00:22<00:27,  1.26s/it]
 48%|████████████████████▍                      | 19/40 [00:23<00:26,  1.26s/it]
 50%|█████████████████████▌                     | 20/40 [00:25<00:25,  1.26s/it]
 52%|██████████████████████▌                    | 21/40 [00:26<00:23,  1.26s/it]
 55%|███████████████████████▋                   | 22/40 [00:27<00:22,  1.26s/it]
 57%|████████████████████████▋                  | 23/40 [00:28<00:21,  1.26s/it]
 60%|█████████████████████████▊                 | 24/40 [00:30<00:20,  1.26s/it]
 62%|██████████████████████████▉                | 25/40 [00:31<00:18,  1.27s/it]
 65%|███████████████████████████▉               | 26/40 [00:32<00:17,  1.27s/it]
 68%|█████████████████████████████              | 27/40 [00:34<00:16,  1.27s/it]
 70%|██████████████████████████████             | 28/40 [00:35<00:15,  1.27s/it]
 72%|███████████████████████████████▏           | 29/40 [00:36<00:13,  1.27s/it]
 75%|████████████████████████████████▎          | 30/40 [00:37<00:12,  1.27s/it]
 78%|█████████████████████████████████▎         | 31/40 [00:39<00:11,  1.27s/it]
 80%|██████████████████████████████████▍        | 32/40 [00:40<00:10,  1.27s/it]
 82%|███████████████████████████████████▍       | 33/40 [00:41<00:08,  1.27s/it]
 85%|████████████████████████████████████▌      | 34/40 [00:42<00:07,  1.27s/it]
 88%|█████████████████████████████████████▋     | 35/40 [00:44<00:06,  1.27s/it]
 90%|██████████████████████████████████████▋    | 36/40 [00:45<00:05,  1.27s/it]
 92%|███████████████████████████████████████▊   | 37/40 [00:46<00:03,  1.27s/it]
 95%|████████████████████████████████████████▊  | 38/40 [00:47<00:02,  1.27s/it]
 98%|█████████████████████████████████████████▉ | 39/40 [00:49<00:01,  1.27s/it]
100%|███████████████████████████████████████████| 40/40 [00:50<00:00,  1.26s/it]

Total progress: 100%|███████████████████████████| 40/40 [00:50<00:00,  1.26s/it]

生成された画像

生成にかかった時間

00:50(元画像の生成時間は含まず)

条件 (768×768)アップスケーラー×2

パラメータ設定

Steps: 40
Sampler: DPM++ 2M SDE Karras
CFG scale: 7
Seed: 3679360488
Size: 1536×1536
Model hash: cd8732bdc3
Model: ShiratakiMix-add-VAE
ControlNet: “preprocessor: tile_resample, model: control_v11f1e_sd15_tile [a371b31b], weight: 1, starting/ending: (0, 1), resize mode: Crop and Resize, pixel perfect: True, control mode: Balanced, preprocessor params: (512, 1, 64)”
Version: v1.3.2

生成ログ

Loading model from cache: control_v11f1e_sd15_tile [a371b31b]
Loading preprocessor: tile_resample
Pixel Perfect Mode Enabled.
resize_mode = ResizeMode.INNER_FIT
raw_H = 768
raw_W = 768
target_H = 1536
target_W = 1536
estimation = 1536.0
preprocessor resolution = 1536
  0%|                                                    | 0/40 [00:00<?, ?it/s]
  2%|█                                           | 1/40 [00:06<04:04,  6.27s/it]
  5%|██▏                                         | 2/40 [00:12<03:58,  6.27s/it]
  8%|███▎                                        | 3/40 [00:18<03:52,  6.27s/it]
 10%|████▍                                       | 4/40 [00:25<03:46,  6.28s/it]
 12%|█████▌                                      | 5/40 [00:31<03:39,  6.28s/it]
 15%|██████▌                                     | 6/40 [00:37<03:33,  6.28s/it]
 18%|███████▋                                    | 7/40 [00:43<03:27,  6.29s/it]
 20%|████████▊                                   | 8/40 [00:50<03:21,  6.29s/it]
 22%|█████████▉                                  | 9/40 [00:56<03:15,  6.29s/it]
 25%|██████████▊                                | 10/40 [01:02<03:08,  6.30s/it]
 28%|███████████▊                               | 11/40 [01:09<03:02,  6.30s/it]
 30%|████████████▉                              | 12/40 [01:15<02:56,  6.30s/it]
 32%|█████████████▉                             | 13/40 [01:21<02:50,  6.31s/it]
 35%|███████████████                            | 14/40 [01:28<02:44,  6.31s/it]
 38%|████████████████▏                          | 15/40 [01:34<02:37,  6.31s/it]
 40%|█████████████████▏                         | 16/40 [01:40<02:31,  6.31s/it]
 42%|██████████████████▎                        | 17/40 [01:47<02:25,  6.31s/it]
 45%|███████████████████▎                       | 18/40 [01:53<02:18,  6.32s/it]
 48%|████████████████████▍                      | 19/40 [01:59<02:12,  6.32s/it]
 50%|█████████████████████▌                     | 20/40 [02:06<02:06,  6.32s/it]
 52%|██████████████████████▌                    | 21/40 [02:12<02:00,  6.32s/it]
 55%|███████████████████████▋                   | 22/40 [02:18<01:53,  6.32s/it]
 57%|████████████████████████▋                  | 23/40 [02:24<01:47,  6.32s/it]
 60%|█████████████████████████▊                 | 24/40 [02:31<01:41,  6.32s/it]
 62%|██████████████████████████▉                | 25/40 [02:37<01:34,  6.32s/it]
 65%|███████████████████████████▉               | 26/40 [02:43<01:28,  6.32s/it]
 68%|█████████████████████████████              | 27/40 [02:50<01:22,  6.32s/it]
 70%|██████████████████████████████             | 28/40 [02:56<01:15,  6.32s/it]
 72%|███████████████████████████████▏           | 29/40 [03:02<01:09,  6.32s/it]
 75%|████████████████████████████████▎          | 30/40 [03:09<01:03,  6.32s/it]
 78%|█████████████████████████████████▎         | 31/40 [03:15<00:56,  6.32s/it]
 80%|██████████████████████████████████▍        | 32/40 [03:21<00:50,  6.32s/it]
 82%|███████████████████████████████████▍       | 33/40 [03:28<00:44,  6.32s/it]
 85%|████████████████████████████████████▌      | 34/40 [03:34<00:37,  6.32s/it]
 88%|█████████████████████████████████████▋     | 35/40 [03:40<00:31,  6.32s/it]
 90%|██████████████████████████████████████▋    | 36/40 [03:47<00:25,  6.32s/it]
 92%|███████████████████████████████████████▊   | 37/40 [03:53<00:18,  6.32s/it]
 95%|████████████████████████████████████████▊  | 38/40 [03:59<00:12,  6.32s/it]
 98%|█████████████████████████████████████████▉ | 39/40 [04:06<00:06,  6.32s/it]
100%|███████████████████████████████████████████| 40/40 [04:12<00:00,  6.31s/it]

Total progress: 100%|███████████████████████████| 40/40 [04:08<00:00,  6.21s/it]

生成された画像

生成にかかった時間

04:08(元画像の生成時間は含まず)

条件 (1024×1024)アップスケーラー×2

パラメータ設定

Steps: 40
Sampler: DPM++ 2M SDE Karras
CFG scale: 7
Seed: 3679360488
Size: 2048×2048
Model hash: cd8732bdc3
Model: ShiratakiMix-add-VAE
ControlNet: “preprocessor: tile_resample, model: control_v11f1e_sd15_tile [a371b31b], weight: 1, starting/ending: (0, 1), resize mode: Crop and Resize, pixel perfect: True, control mode: Balanced, preprocessor params: (512, 1, 64)”
Version: v1.3.2

生成ログ

Loading model from cache: control_v11f1e_sd15_tile [a371b31b]
Loading preprocessor: tile_resample
Pixel Perfect Mode Enabled.
resize_mode = ResizeMode.INNER_FIT
raw_H = 1024
raw_W = 1024
target_H = 2048
target_W = 2048
estimation = 2048.0
preprocessor resolution = 2048
  0%|                                                    | 0/40 [00:00<?, ?it/s]
  2%|█                                           | 1/40 [00:18<12:14, 18.84s/it]
  5%|██▏                                         | 2/40 [00:37<11:56, 18.85s/it]
  8%|███▎                                        | 3/40 [00:56<11:37, 18.86s/it]
 10%|████▍                                       | 4/40 [01:15<11:19, 18.88s/it]
 12%|█████▌                                      | 5/40 [01:34<11:01, 18.89s/it]
 15%|██████▌                                     | 6/40 [01:53<10:42, 18.90s/it]
 18%|███████▋                                    | 7/40 [02:12<10:23, 18.91s/it]
 20%|████████▊                                   | 8/40 [02:31<10:05, 18.91s/it]
 22%|█████████▉                                  | 9/40 [02:50<09:46, 18.91s/it]
 25%|██████████▊                                | 10/40 [03:08<09:27, 18.92s/it]
 28%|███████████▊                               | 11/40 [03:27<09:08, 18.92s/it]
 30%|████████████▉                              | 12/40 [03:46<08:49, 18.92s/it]
 32%|█████████████▉                             | 13/40 [04:05<08:30, 18.92s/it]
 35%|███████████████                            | 14/40 [04:24<08:11, 18.92s/it]
 38%|████████████████▏                          | 15/40 [04:43<07:53, 18.92s/it]
 40%|█████████████████▏                         | 16/40 [05:02<07:34, 18.92s/it]
 42%|██████████████████▎                        | 17/40 [05:21<07:15, 18.92s/it]
 45%|███████████████████▎                       | 18/40 [05:40<06:56, 18.92s/it]
 48%|████████████████████▍                      | 19/40 [05:59<06:37, 18.92s/it]
 50%|█████████████████████▌                     | 20/40 [06:18<06:18, 18.92s/it]
 52%|██████████████████████▌                    | 21/40 [06:37<05:59, 18.92s/it]
 55%|███████████████████████▋                   | 22/40 [06:56<05:40, 18.92s/it]
 57%|████████████████████████▋                  | 23/40 [07:14<05:21, 18.92s/it]
 60%|█████████████████████████▊                 | 24/40 [07:33<05:02, 18.92s/it]
 62%|██████████████████████████▉                | 25/40 [07:52<04:43, 18.92s/it]
 65%|███████████████████████████▉               | 26/40 [08:11<04:24, 18.92s/it]
 68%|█████████████████████████████              | 27/40 [08:30<04:05, 18.92s/it]
 70%|██████████████████████████████             | 28/40 [08:49<03:46, 18.92s/it]
 72%|███████████████████████████████▏           | 29/40 [09:08<03:28, 18.92s/it]
 75%|████████████████████████████████▎          | 30/40 [09:27<03:09, 18.92s/it]
 78%|█████████████████████████████████▎         | 31/40 [09:46<02:50, 18.92s/it]
 80%|██████████████████████████████████▍        | 32/40 [10:05<02:31, 18.92s/it]
 82%|███████████████████████████████████▍       | 33/40 [10:24<02:12, 18.92s/it]
 85%|████████████████████████████████████▌      | 34/40 [10:43<01:53, 18.92s/it]
 88%|█████████████████████████████████████▋     | 35/40 [11:01<01:34, 18.92s/it]
 90%|██████████████████████████████████████▋    | 36/40 [11:20<01:15, 18.92s/it]
 92%|███████████████████████████████████████▊   | 37/40 [11:39<00:56, 18.92s/it]
 95%|████████████████████████████████████████▊  | 38/40 [11:58<00:37, 18.92s/it]
 98%|█████████████████████████████████████████▉ | 39/40 [12:17<00:18, 18.92s/it]
100%|███████████████████████████████████████████| 40/40 [12:36<00:00, 18.91s/it]

Total progress: 100%|███████████████████████████| 40/40 [12:21<00:00, 18.55s/it]

生成された画像

生成にかかった時間

12:21(元画像の生成時間は含まず)

まとめ

今回はStableDiffusionで画像生成するのにおすすめのグラフィックボード NVIDIA RTX A4000のパフォーマンステストを実施してみました。

ControlNetのtile_resampleを使って2048×2048という高解像度の画像生成でも13分以内という、非常に高いパフォーマンスを出せることが確認できました。
画像サイズ2048×2048についてはVRAM16GBをフルに使っていますので、GeForse RTX 4070を上回っています。

RTX A4000は、価格もGeForse RTX 4070Tiと同価格帯の13万前後ですので、ゲームなどでレイトレーシング性能を使わない場合は非常におすすめです。
ぜひ、Stable Diffusionで使用するグラフィックボードの候補に加えてみてください。

それでは、また次の記事でお会いしましょう。

よかったらシェアしてね!
  • URLをコピーしました!

コメント

コメントする

CAPTCHA


目次