【まとめ】StableDiffusion WebUI(SDXL)v1.6.0リリース速報/新機能とパフォーマンスの全体像AUTOMATIC1111v1.6

公式サイト・StableDiffusion WebUI　AUTOMATIC1111の情報を元に、StableDiffusion WebUI/AUTOMATIC1111バージョン1.6.0を独自の視点で解説していきます

原文は以下のリンクから確認できます

SD Web UIの新バージョン、1.6.0がついにリリースされました。

バージョン1.6.0で特に注目すべきは、StableDiffusionの新バージョン・SDXLの全面的なサポートと、多数の新機能・改善が行われたことです。

以前のStableDiffusion WebUI/ AUTOMATIC1111 バージョン1.5でもSDXLは使用できましたが、大量のメインメモリを消費するなどの問題がありました。

バージョン1.6では多くの改善が見られます。

StableDiffusion WebUI/ AUTOMATIC1111バージョン1.6.0主な特徴

これまで、画像のディテールを向上させる「Refiner」機能を使用するためには拡張機能と二度の手動操作が必要でしたが、現在はWebUIだけでこの機能が動作するようになりました。

StableDiffusionのバージョンが、1.x台から、SDXLに変更。

以前の、StableDiffusionのバージョンが、1.x台では学習されたデータは512px × 512pxでしたが、SDXLでは1024px × 1024pxになったので生成される画質の向上が期待される

AUTOMATIC1111v1.6で使用メモリ改善とパフォーマンス

この新バージョンのv1.6では、メモリの使用方法が大幅に改善されました。

特にRAM使用量を削減したほか、モデルのローディングに関するオプションが追加され、複数のモデルを効率的にメモリ内に保持することができるようになりました。

これにより、16GBのメインメモリでも問題なく動作するレベルになっています。

もしアップデートでエラーが発生した場合、venvフォルダを削除して再インストールすることで解決する可能性があります。

v1.6でSDXLになったのでVRAM不足でエラーが出る場合

まず、webui-user.batのファイルを右クリックで開き、編集をクリック。

メモ帳が開き、編集できる様になりますので、set COMMANDLINE_ARGS=の後に「–medvram」と書き込めばVRAM不足を解消できます

それでも、エラーが出る場合には、set COMMANDLINE_ARGS=の後に「–lowvram」と書き込めばVRAM不足を解消できます

ただ、–lowvramはかなりパフォーマンスが下がります

@echo off

set PYTHON=
set GIT=
set VENV_DIR=
set COMMANDLINE_ARGS=--medvram --xformers

call webui.bat

GitHub

Optimizations Stable Diffusion web UI. Contribute to AUTOMATIC1111/stable-diffusion-webui development by creating an account on GitHub.

コマンドライン引数のプレフィックスに関しては、一般的にはシングルハイフン（-）が短いオプション（例：-v）に、ダブルハイフン（–）が長いオプション（例：–medvram）に使用されます。ただし、これはプログラムやライブラリによって異なる場合があります。

StableDiffusion WebUI/ AUTOMATIC1111　UIの改善

1.6.0ではUIも一新されました。

特に目を引くのは、スタイルエディターの新たな実装と、それまで画面をスクロールする際に邪魔だったネットワークタブが改善され、常に表示されるようになりました。

さらに、テキストと画像の生成に関する設定がより簡単に行えるよう、UI上でのオプションが増加しています。

この点で注目すべきは、LoRAのUIが大幅に変更され、選択方法がより直感的になったことです。

ただ、SDXL以前のLoRAファイルの互換性がないなどの問題があるようです

style editorやメモ機能の実装は嬉しいですね

画像とプロンプト管理が大変ですからね

因みに私は、【Eagle-pnginfo】画像やプロンプトを自動で一括管理してます

v1.6での新しいサンプラーと数値オプション: new samplers

新バージョンでは、DPM++ 2M SDE系列やDPM++ 3M SDE系列など、新しいサンプラーも多数追加されました。

DPM++ 2M SDE Exponential
DPM++ 2M SDE Heun
DPM++ 2M SDE Heun Karras
DPM++ 2M SDE Heun Exponential
DPM++ 3M SDE
DPM++ 3M SDE Karras
DPM++ 3M SDE Exponential

これにより、より高品質な画像が生成できると期待されます。

また、ランダム数値生成の設定にNVオプションが追加され、CPU/AMD/MacでもNVIDIAビデオカードと同じ結果が出力されるようになりました。

ハイレゾフィックスとリファイナー

ハイレゾフィックスとリファイナーにもいくつかの変更がありました。

ハイレゾフィックスは折りたたみ表示が可能となり、展開と折りたたみで状態が切り替わります。

リファイナーでは、新たにチェックポイントの選択が可能となり、

さらにサポート番号 #12371 が追加されています。

StableDiffusion SDXLでの画像生成

SDXLでの画像生成も試してみましたが、メモリー消費は特に増加せず、生成速度も向上しています。

具体的には、グラフィックメモリは約9GBしか使われていません。

また、テキスト逆変換推論（textual inversion inference）もSDXLでサポートされています。

生成した画像のメタデータには、使用したVAEの情報が記載されるようになりました。

それでもVRAM容量10GBですと、チョット容量不足になるかもです

SDXLとは

Stable Diffusionの最新で、高性能版のStable Diffusion XLの略称

研究用途に限定されたSDXL 0.9が先行リリースされ、7月27日正式版のSDXL 1.0がリリースされた

0.9と1.0では、数字的には近いモノの、中身は別物のよう

SDXLは、短い指示からAIが高解像度の画像を生成する技術として開発されました。

以前はベータテスト段階で一部の利用者や研究者に限られていましたが、SDXL 1.0はオープンソースプラットフォームで公開されています。

この新バージョン、SDXL 1.0は、前のバージョンよりも大きな3.5B（35億）と6.6B（66億）のパラメータ数を持つ二つのモデル構造を採用しています。

初めに基礎モデルがノイズ混じりの画像を出力し、その後にリファインメントモデルがノイズを取り除く作業を行います。

この二段階の設計によって、処理が高速化し、計算資源も効率よく使われます。

SDXL 1.0は、8GBのVRAMを有する一般消費者向けのGPUや、低コストのクラウドサービスでもしっかりと動作します。

Clipdropでデモが利用でき、ソースコードはGitHubで見ることができます。

また、AWSのSageMakerやBedrockでもクラウド上で使用可能です。

以前のStable Diffusionとは互換性が限定的なので、不具合が起こっている人も多い様なので、バージョンアップは慎重にしたいですね

ちなみに、SSDの容量に問題がなければ、1つのパソコンにStableDiffusion WebUIをいくつでもインストールできるので、わたしは、バージョンアップさせることもありますが、最速で使う時には追加で入れて様子見しています

プロンプト保存機能　Style Editor

画像生成作業を行う際、同じ設定で何度も試すことがありますよね。

そのたびに同じプロンプトを入力するのは、なかなか大変です。

そんな時に便利なのが、StableDifussion WebUIのStyle Editor機能です。

このStyle Editor機能って何？

この機能を使えば、一度入力したプロンプトを名前をつけて保存できます。

たとえば「猫耳少女」など、特定の条件を設定したプロンプトを記録しておけば、次に使う時はその名前を選ぶだけで、同じ条件で画像を作成できるんですよ

保存する時には以下の手順で行えます

プロンプトの保存方法としては、まず保存したいプロンプトを入力します。
次に、「Generate」ボタンの下にあるフロッピーディスクのアイコンをクリック
保存するプロンプトには、分かりやすい名前をつけましょう。
そのプロンプトは「stable-diffusion-webui」フォルダ内の「styles.csv」というファイルに保存されます。

保存されたプロンプトを使う時には以下の通りです

Generateボタンの下にあるStylesタブを開き、保存したプロンプトの名前を選んでください。
選択すると、そのプロンプトに設定された条件で画像を生成することができます。
Stylesを選んでいる間にGenerateボタンの下にあるクリップボードの形をしたアイコンをクリックすると、選択したプロンプトがもう一度入力されます。

Styleの編集や、削除するときには

保存したプロンプトを変更したい、または削除したい場合は、直接styles.csvファイルを編集します。

このファイルは、「stable-diffusion-webui」フォルダ内にあります。

styles.csvファイルは、テキストエディタ（メモ帳）やExcelなどで編集できます。

StableDifussion WebUIの外でも、【Eagle-pnginfo】という拡張機能を使うと、生成された画像やプロンプトを自動で一括保存・管理することも可能です

なぎのブログとYouTube/AI＆web3.0

図解/動画【Eagle-pnginfo】画像やプロンプトを自動で一括保存・管理できるStableDiffusion webUI拡張機能… StableDiffusion webUIで生成したAIイラストのプロンプトや、生成時のメタタグを記録を残すのは少し手間ですよね？画像生成AIの強い味方!画像や生成時のパラメータを自動で…

以前のStable Diffusionから、SDXLする現時点でのデメリット

以前のStable Diffusionをベースに作られたLoRA等が使えない

~~ControlNet等がSDXLに対応していない~~

ControlNetは、ControlNet v1.14にすると、StableDiffusion WebUI/ AUTOMATIC1111 バージョン1.6で動作するようになりました

画像はきれいになったが、以前のモデルの方が好みのテイストが出る場合も…

また、良いか悪いかは判断が分かれるかもしれませんが、センシティブな画像生成が抑えられました

StableDiffusion WebUI 1.6.0へのバージョンアップの注意点

また、git pullコマンドでのバージョンアップですと、不具合が出ることも多いので、新しい場所にリポジトリをgit cloneでクローンし、必要な設定やデータを古いリポジトリから新しいリポジトリにコピーという方法の方が良さそうです

言っている意味が分からない…

更新するんじゃなくて、新しいフォルダを作って、そちらに新規でStableDiffusion WebUI 1.6.0をインストールした方がいいってこと

ちょっと面倒なんですが、必要な物だけを、以前のStableDiffusion WebUIインストールフォルダから取り出して、新しい方にコピペです

git pull　も問題が起きないケースもあります。

どこのバージョンからアップデートするかにもよります

例えば、1.4から1.6にgit pullでバージョンの更新なら問題なくても、1.2から1.6にgit pullでバージョンの更新なら問題が出てしまう様なケースがあるようです

分からない時には、既に環境構築してあるStableDiffusion WebUI のほかに、もう1つStableDiffusion WebUI 1.6.0をインストール（git clone）してもいいカモです（容量に余裕があれば）

git cloneについてのワンポイント解説

「git clone」とは、簡単に言うと、インターネット上にあるプロジェクトのコピーを自分のパソコンにダウンロードするコマンドです。このコマンドを使うことで、GitHubなどのリモートリポジトリ（プロジェクトが保存されている場所）にあるファイルやフォルダを、簡単に自分のローカル環境（自分のパソコン）にコピーできます。

git pullについてのワンポイント解説

「git pull」とは、リモートリポジトリから最新の変更を取得して、それを自分のローカルリポジトリに統合するためのコマンドです。このコマンドを使うと、リモート（例えばGitHub）で行われた更新を自分のローカル環境に反映できます。

具体的には、「git pull」は「git fetch」（リモートリポジトリの変更をローカルに取得する）と「git merge」（その変更を現在のローカルブランチに統合する）の二つの操作を一つのコマンドで実行します。