概要
「Stable Diffusion」とは
与えられたプロンプト(単語や文章の組み合わせ)と元となる画像(任意)からAIが画像を生成してくれる機能。イギリスのStability AIと、RunwayのPatrick Esser氏、LMU MunichのMachine Vision & Learning研究グループのRobin Rombach氏によって開発・公開されています。
公開されたままの「Stable Diffusion」を使用するためにはMiniconda、Pythonなどのインストールや設定が必要で基本的にCUI(Character-based User Interface:Windowsで言うところのコマンドプロンプトやPowerShellで文字を入力して使用するインターフェース)ベースになります。
「NMKD Stable Diffusion GUI」とは
「NMKD Stable Diffusion GUI」はそんな使い勝手がちょっとな「Stable Diffusion」の環境構築(Miniconda、Pythonなどのインストールや設定もまとめたもの)を最初のインストールで全て自動で行い、さらにGUI(Graphical User Interface:アイコンなどをマウスでクリックしたりできるインターフェース)ベースで操作可能にしたものです。
「NMKD Stable Diffusion GUI」を使用するにあたっての注意点
使用するにあたって最低限必要な条件があります。インストールの最初や起動時にも以下のポップアップで注意を促されます。
- このソフトウェアはまだ開発途中であるため、いくつかのバグ(不具合)が含まれている可能性があります。
- 使用するには最近の (GTX 10 シリーズ以降の) NVIDIAグラフィックス カードが必須です。
- できるだけ多くのVRAM(ビデオメモリ)が必要です。8GB未満の場合は自己責任でお願いします。まったく機能しない可能性があります。
- 解像度設定は非常に多くのVRAMを消費します。12GB以上ない限り、512x512ピクセルを超える設定はおすすめしません。
- このGUIツールにはツールチップが埋め込まれているため、アイコン、バー、ドロップダウンリストなどにマウスをあてると説明が出てきます。(英語)
NVIDIAのグラフィックボードについてざっくりとまとめると以下の通り、一番右の値がメモリ容量になります。30シリーズであればどの製品でも動きそうです。逆に16シリーズは8GBを超えているものがないので厳しそうです。
製品名 | コアクロック定格(MHz) | コアクロックブースト(MHz) | メモリクロック(GT/s) | メモリ容量(GB) |
---|---|---|---|---|
RTX 3090 Ti | 1560 | 1860 | 21 | 24 |
RTX 3090 | 1395 | 1695 | 19.5 | 24 |
RTX 3080 | 1260 | 1710 | 19 | 12 |
RTX 3080 | 1440 | 1710 | 19 | 10 |
RTX 3070 Ti | 1580 | 1770 | 19 | 8 |
RTX 3070 | 1500 | 1725 | 14 | 8 |
RTX 3060 Ti | 1410 | 1665 | 14 | 8 |
RTX 3060 | 1320 | 1777 | 15 | 12 |
RTX 3050 | 1552 | 1777 | 14 | 8 |
製品名 | コアクロック定格(MHz) | コアクロックブースト(MHz) | メモリクロック(GT/s) | メモリ容量(GB) |
---|---|---|---|---|
TITAN RTX◆ | 1350 | 1770 | 14 | 24 |
RTX 2080 Ti | 1350 | 1545 | 14 | 11 |
RTX 2080 SUPER | 1650 | 1815 | 15.5 | 8 |
RTX 2080 | 1515 | 1710 | 14 | 8 |
RTX 2070 SUPER | 1605 | 1770 | 14 | 8 |
RTX 2070 | 1410 | 1620 | 14 | 8 |
RTX 2060 SUPER | 1470 | 1650 | 14 | 8 |
RTX 2060 | 1470 | 1650 | 14 | 12 |
RTX 2060 | 1365 | 1680 | 14 | 6 |
製品名 | コアクロック定格(MHz) | コアクロックブースト(MHz) | メモリクロック(GT/s) | メモリ容量(GB) |
---|---|---|---|---|
GTX 1660 Ti | 1500 | 1770 | 12 | 6 |
GTX 1660 SUPER | 1530 | 1785 | 14 | 6 |
GTX 1660 | 1530 | 1785 | 8 | 6 |
GTX 1650 SUPER | 1530 | 1725 | 12 | 4 |
GTX 1650 (TU116) | 1410 | 1590 | 12 | 4 |
GTX 1650 (TU117) | 1410 | 1590 | 12 | 4 |
GTX 1650 (TU117) | 1485 | 1665 | 8 | 4 |
製品名 | コアクロック(MHz) | ブーストクロック(MHz) | メモリクロック(MHz) | メモリ容量(MB) |
---|---|---|---|---|
TITAN Xp◆ | 1405 | 1582 | 11408 | 12288(12GB) |
TITAN X◆ | 1417 | 1531 | 10000 | 12288(12GB) |
GTX 1080 Ti | 1480 | 1582 | 11000 | 11264(11GB) |
GTX 1080 | 1607 | 1773 | 11000 | 8192(8GB) |
GTX 1070 Ti | 1607 | 1683 | 8000 | 8192(8GB) |
GTX 1070 | 1506 | 1683 | 8000 | 8192(8GB) |
GTX 1060 | 1506 | 1708 | 9000 | 6144(6GB) |
GTX 1060 | 1506 | 1708 | 8000 | 3072(3GB) |
GTX 1050 Ti | 1290 | 1392 | 7008 | 4096(4GB) |
GTX 1050 | 1354 | 1455 | 7008 | 2048(2GB) |
GT 1030 | 1227 | 1468 | 6008 | 2048(2GB) |
「NMKD Stable Diffusion GUI」のインストール
「NMKD Stable Diffusion GUI」のダウンロードと解凍
下の画像をクリックもしくは「https://icedrive.net/s/21xjhaj13kGY499jPvk4taa1ZN9N」をクリックして配布サイトを開き、
- 「StableDiffusionGui-v1.2.0.zip」をクリックして選択
- 上に出てくるダウンロードボタンをクリックしてダウンロード
を行います。
ダウンロードした「StableDiffusionGui-v1.2.0.zip」をWindows標準でも別のアプリでも良いので解凍して任意の場所に置きます。
「NMKD Stable Diffusion GUI」のインストール
解凍してできた「StableDiffusionGui-v1.2.0」フォルダの中にあるStableDiffusionGui.exeを実行します。
まず最初にチェックが走ります。一度もStable Diffusionをインストールしていなければ以下のようなメッセージが出てきます。内容としては、Stable Diffusionの完全なインストールが見つからないため、GUIがインストーラを開くので、「Install」ボタンをクリックして必要なファイルをインストールしてくださいという感じです。ここは素直に「OK」ボタンで閉じてインストーラーを起動してもらいます。
インストーラーが開いたところです。Minicondaのみチェックが入りインストール済みの状態ですので、言われた通りに「Install」をクリックしてその他のファイルをインストールします。
この画面から次のコマンドプロンプトが開くまで、しばらく時間がかかりました。我慢して待ちます。左上の緑の円は動いたり動かなかったりしています。
コマンドプロンプトが開き、インストール内容を出力しています。ここもひたすら待ちます。
完了するとインストーラー画面はMiniconda以外のチェックも入った状態となり、以下のような状態になります。
本体の方の左下を見てみると、「Finished. Everything is installed.」の表示が出ており、全てのインストールが完了した状態になっています。
以上で「NMKD Stable Diffusion GUI」のインストールは完了となります。
使い方については別記事にしたいと思いますが、少しだけお伝えすると、
Prompt:作成してほしい画像をイメージできる英単語、文章をこの欄に入力する。
Load Image:元画像を指定する場合はここから任意の画像を選択する。
Resolution(Width x Height):生成する画像の幅と高さ。512x512を超えるサイズの場合は12GB以上のVRAMが必要。
Generate!:画像生成実行ボタン
<>:生成された画像を順番に見るための戻り・送りボタン
「Genarate!」ボタンで実行ししばらく待っているとその上の「The generated images will be shown here.」領域に生成された画像が5枚順番に表示されていきます。生成中は「Genarate!」ボタンは「Cancel」ボタンに変わります。
コメント