画像生成AI「Stable Diffusion」を「NMKD Stable Diffusion GUI」で簡単にWindows11にインストールする

Stable Diffusion

概要

「Stable Diffusion」とは

与えられたプロンプト(単語や文章の組み合わせ)と元となる画像(任意)からAIが画像を生成してくれる機能。イギリスのStability AIと、RunwayのPatrick Esser氏、LMU MunichのMachine Vision & Learning研究グループのRobin Rombach氏によって開発・公開されています。

公開されたままの「Stable Diffusion」を使用するためにはMiniconda、Pythonなどのインストールや設定が必要で基本的にCUI(Character-based User Interface:Windowsで言うところのコマンドプロンプトやPowerShellで文字を入力して使用するインターフェース)ベースになります。

「NMKD Stable Diffusion GUI」とは

「NMKD Stable Diffusion GUI」はそんな使い勝手がちょっとな「Stable Diffusion」の環境構築(Miniconda、Pythonなどのインストールや設定もまとめたもの)を最初のインストールで全て自動で行い、さらにGUI(Graphical User Interface:アイコンなどをマウスでクリックしたりできるインターフェース)ベースで操作可能にしたものです。

「NMKD Stable Diffusion GUI」を使用するにあたっての注意点

使用するにあたって最低限必要な条件があります。インストールの最初や起動時にも以下のポップアップで注意を促されます。

  • このソフトウェアはまだ開発途中であるため、いくつかのバグ(不具合)が含まれている可能性があります。
  • 使用するには最近の (GTX 10 シリーズ以降の) NVIDIAグラフィックス カードが必須です。
  • できるだけ多くのVRAM(ビデオメモリ)が必要です。8GB未満の場合は自己責任でお願いします。まったく機能しない可能性があります。
  • 解像度設定は非常に多くのVRAMを消費します。12GB以上ない限り、512x512ピクセルを超える設定はおすすめしません。
  • このGUIツールにはツールチップが埋め込まれているため、アイコン、バー、ドロップダウンリストなどにマウスをあてると説明が出てきます。(英語)

NVIDIAのグラフィックボードについてざっくりとまとめると以下の通り、一番右の値がメモリ容量になります。30シリーズであればどの製品でも動きそうです。逆に16シリーズは8GBを超えているものがないので厳しそうです。

■30(30xx)シリーズ
製品名 コアクロック定格(MHz) コアクロックブースト(MHz) メモリクロック(GT/s) メモリ容量(GB)
RTX 3090 Ti 1560 1860 21 24
RTX 3090 1395 1695 19.5 24
RTX 3080 1260 1710 19 12
RTX 3080 1440 1710 19 10
RTX 3070 Ti 1580 1770 19 8
RTX 3070 1500 1725 14 8
RTX 3060 Ti 1410 1665 14 8
RTX 3060 1320 1777 15 12
RTX 3050 1552 1777 14 8
■20(20xx)シリーズ
製品名 コアクロック定格(MHz) コアクロックブースト(MHz) メモリクロック(GT/s) メモリ容量(GB)
TITAN RTX◆ 1350 1770 14 24
RTX 2080 Ti 1350 1545 14 11
RTX 2080 SUPER 1650 1815 15.5 8
RTX 2080 1515 1710 14 8
RTX 2070 SUPER 1605 1770 14 8
RTX 2070 1410 1620 14 8
RTX 2060 SUPER 1470 1650 14 8
RTX 2060 1470 1650 14 12
RTX 2060 1365 1680 14 6
■16(16xx)シリーズ
製品名 コアクロック定格(MHz) コアクロックブースト(MHz) メモリクロック(GT/s) メモリ容量(GB)
GTX 1660 Ti 1500 1770 12 6
GTX 1660 SUPER 1530 1785 14 6
GTX 1660 1530 1785 8 6
GTX 1650 SUPER 1530 1725 12 4
GTX 1650 (TU116) 1410 1590 12 4
GTX 1650 (TU117) 1410 1590 12 4
GTX 1650 (TU117) 1485 1665 8 4
■10(10xx)シリーズ
製品名 コアクロック(MHz) ブーストクロック(MHz) メモリクロック(MHz) メモリ容量(MB)
TITAN Xp◆ 1405 1582 11408 12288(12GB)
TITAN X◆ 1417 1531 10000 12288(12GB)
GTX 1080 Ti 1480 1582 11000 11264(11GB)
GTX 1080 1607 1773 11000 8192(8GB)
GTX 1070 Ti 1607 1683 8000 8192(8GB)
GTX 1070 1506 1683 8000 8192(8GB)
GTX 1060 1506 1708 9000 6144(6GB)
GTX 1060 1506 1708 8000 3072(3GB)
GTX 1050 Ti 1290 1392 7008 4096(4GB)
GTX 1050 1354 1455 7008 2048(2GB)
GT 1030 1227 1468 6008 2048(2GB)

「NMKD Stable Diffusion GUI」のインストール

「NMKD Stable Diffusion GUI」のダウンロードと解凍

下の画像をクリックもしくは「https://icedrive.net/s/21xjhaj13kGY499jPvk4taa1ZN9N」をクリックして配布サイトを開き、

  1. 「StableDiffusionGui-v1.2.0.zip」をクリックして選択
  2. 上に出てくるダウンロードボタンをクリックしてダウンロード

を行います。

配布サイト

ダウンロードした「StableDiffusionGui-v1.2.0.zip」をWindows標準でも別のアプリでも良いので解凍して任意の場所に置きます。

解凍後の「StableDiffusionGui-v1.2.0」フォルダの中身

「NMKD Stable Diffusion GUI」のインストール

解凍してできた「StableDiffusionGui-v1.2.0」フォルダの中にあるStableDiffusionGui.exeを実行します。

まず最初にチェックが走ります。一度もStable Diffusionをインストールしていなければ以下のようなメッセージが出てきます。内容としては、Stable Diffusionの完全なインストールが見つからないため、GUIがインストーラを開くので、「Install」ボタンをクリックして必要なファイルをインストールしてくださいという感じです。ここは素直に「OK」ボタンで閉じてインストーラーを起動してもらいます。

インストーラーが開いたところです。Minicondaのみチェックが入りインストール済みの状態ですので、言われた通りに「Install」をクリックしてその他のファイルをインストールします。

この画面から次のコマンドプロンプトが開くまで、しばらく時間がかかりました。我慢して待ちます。左上の緑の円は動いたり動かなかったりしています。

コマンドプロンプトが開き、インストール内容を出力しています。ここもひたすら待ちます。

完了するとインストーラー画面はMiniconda以外のチェックも入った状態となり、以下のような状態になります。

本体の方の左下を見てみると、「Finished. Everything is installed.」の表示が出ており、全てのインストールが完了した状態になっています。

以上で「NMKD Stable Diffusion GUI」のインストールは完了となります。

使い方については別記事にしたいと思いますが、少しだけお伝えすると、

Prompt:作成してほしい画像をイメージできる英単語、文章をこの欄に入力する。

Load Image:元画像を指定する場合はここから任意の画像を選択する。

Resolution(Width x Height):生成する画像の幅と高さ。512x512を超えるサイズの場合は12GB以上のVRAMが必要。

Generate!:画像生成実行ボタン

<>:生成された画像を順番に見るための戻り・送りボタン

「Genarate!」ボタンで実行ししばらく待っているとその上の「The generated images will be shown here.」領域に生成された画像が5枚順番に表示されていきます。生成中は「Genarate!」ボタンは「Cancel」ボタンに変わります。


コメント

タイトルとURLをコピーしました