【OpenSea】nagiblog みてね!

【まとめ】StableDiffusion WebUI(SDXL)v1.6.0リリース速報/新機能とパフォーマンスの全体像AUTOMATIC1111v1.6

公式サイト・StableDiffusion WebUI AUTOMATIC1111の情報を元に、StableDiffusion WebUI/AUTOMATIC1111バージョン1.6.0を独自の視点で解説していきます

原文は以下のリンクから確認できます

SD Web UIの新バージョン、1.6.0がついにリリースされました。

バージョン1.6.0で特に注目すべきは、StableDiffusionの新バージョン・SDXLの全面的なサポートと、多数の新機能・改善が行われたことです。

以前のStableDiffusion WebUI/ AUTOMATIC1111 バージョン1.5でもSDXLは使用できましたが、大量のメインメモリを消費するなどの問題がありました。

バージョン1.6では多くの改善が見られます。

目次

StableDiffusion WebUI/ AUTOMATIC1111バージョン1.6.0主な特徴

これまで、画像のディテールを向上させる「Refiner」機能を使用するためには拡張機能と二度の手動操作が必要でしたが、現在はWebUIだけでこの機能が動作するようになりました。

StableDiffusionのバージョンが、1.x台から、SDXLに変更。

以前の、StableDiffusionのバージョンが、1.x台では学習されたデータは512px × 512pxでしたが、SDXLでは1024px × 1024pxになったので生成される画質の向上が期待される

AUTOMATIC1111v1.6で使用メモリ改善とパフォーマンス


この新バージョンのv1.6では、メモリの使用方法が大幅に改善されました。

特にRAM使用量を削減したほか、モデルのローディングに関するオプションが追加され、複数のモデルを効率的にメモリ内に保持することができるようになりました。

これにより、16GBのメインメモリでも問題なく動作するレベルになっています。

もしアップデートでエラーが発生した場合、venvフォルダを削除して再インストールすることで解決する可能性があります。

v1.6でSDXLになったのでVRAM不足でエラーが出る場合

まず、webui-user.batのファイルを右クリックで開き、 編集をクリック。

メモ帳が開き、編集できる様になりますので、set COMMANDLINE_ARGS=の後に「–medvram」と書き込めばVRAM不足を解消できます

それでも、エラーが出る場合には、set COMMANDLINE_ARGS=の後に「–lowvram」と書き込めばVRAM不足を解消できます

ただ、–lowvramはかなりパフォーマンスが下がります

@echo off

set PYTHON=
set GIT=
set VENV_DIR=
set COMMANDLINE_ARGS=--medvram --xformers

call webui.bat

コマンドライン引数のプレフィックスに関しては、一般的にはシングルハイフン(-)が短いオプション(例:-v)に、ダブルハイフン(–)が長いオプション(例:–medvram)に使用されます。ただし、これはプログラムやライブラリによって異なる場合があります。

StableDiffusion WebUI/ AUTOMATIC1111 UIの改善


1.6.0ではUIも一新されました。

特に目を引くのは、スタイルエディターの新たな実装と、それまで画面をスクロールする際に邪魔だったネットワークタブが改善され、常に表示されるようになりました。

さらに、テキストと画像の生成に関する設定がより簡単に行えるよう、UI上でのオプションが増加しています。

この点で注目すべきは、LoRAのUIが大幅に変更され、選択方法がより直感的になったことです。

ただ、SDXL以前のLoRAファイルの互換性がないなどの問題があるようです

style editorやメモ機能の実装は嬉しいですね

画像とプロンプト管理が大変ですからね

v1.6での新しいサンプラーと数値オプション: new samplers


新バージョンでは、DPM++ 2M SDE系列やDPM++ 3M SDE系列など、新しいサンプラーも多数追加されました。

  • DPM++ 2M SDE Exponential
  • DPM++ 2M SDE Heun
  • DPM++ 2M SDE Heun Karras
  • DPM++ 2M SDE Heun Exponential
  • DPM++ 3M SDE
  • DPM++ 3M SDE Karras
  • DPM++ 3M SDE Exponential

これにより、より高品質な画像が生成できると期待されます。

また、ランダム数値生成の設定にNVオプションが追加され、CPU/AMD/MacでもNVIDIAビデオカードと同じ結果が出力されるようになりました。

ハイレゾフィックスとリファイナー


ハイレゾフィックスとリファイナーにもいくつかの変更がありました。

ハイレゾフィックスは折りたたみ表示が可能となり、展開と折りたたみで状態が切り替わります。

リファイナーでは、新たにチェックポイントの選択が可能となり、

さらにサポート番号 #12371 が追加されています。

StableDiffusion SDXLでの画像生成


SDXLでの画像生成も試してみましたが、メモリー消費は特に増加せず、生成速度も向上しています。

具体的には、グラフィックメモリは約9GBしか使われていません。

また、テキスト逆変換推論(textual inversion inference)もSDXLでサポートされています。

生成した画像のメタデータには、使用したVAEの情報が記載されるようになりました。

それでもVRAM容量10GBですと、チョット容量不足になるかもです

SDXLとは

Stable Diffusionの最新で、高性能版のStable Diffusion XLの略称

研究用途に限定されたSDXL 0.9が先行リリースされ、7月27日正式版のSDXL 1.0がリリースされた

0.9と1.0では、数字的には近いモノの、中身は別物のよう

SDXLは、短い指示からAIが高解像度の画像を生成する技術として開発されました。

以前はベータテスト段階で一部の利用者や研究者に限られていましたが、SDXL 1.0はオープンソースプラットフォームで公開されています。

この新バージョン、SDXL 1.0は、前のバージョンよりも大きな3.5B(35億)と6.6B(66億)のパラメータ数を持つ二つのモデル構造を採用しています。

初めに基礎モデルがノイズ混じりの画像を出力し、その後にリファインメントモデルがノイズを取り除く作業を行います。

この二段階の設計によって、処理が高速化し、計算資源も効率よく使われます。

SDXL 1.0は、8GBのVRAMを有する一般消費者向けのGPUや、低コストのクラウドサービスでもしっかりと動作します。

Clipdropでデモが利用でき、ソースコードはGitHubで見ることができます。

また、AWSのSageMakerやBedrockでもクラウド上で使用可能です。

以前のStable Diffusionとは互換性が限定的なので、不具合が起こっている人も多い様なので、バージョンアップは慎重にしたいですね

ちなみに、SSDの容量に問題がなければ、1つのパソコンにStableDiffusion WebUIをいくつでもインストールできるので、わたしは、バージョンアップさせることもありますが、最速で使う時には追加で入れて様子見しています

プロンプト保存機能 Style Editor

画像生成作業を行う際、同じ設定で何度も試すことがありますよね。

そのたびに同じプロンプトを入力するのは、なかなか大変です。

そんな時に便利なのが、StableDifussion WebUIのStyle Editor機能です。

このStyle Editor機能って何?

この機能を使えば、一度入力したプロンプトを名前をつけて保存できます。

たとえば「猫耳少女」など、特定の条件を設定したプロンプトを記録しておけば、次に使う時はその名前を選ぶだけで、同じ条件で画像を作成できるんですよ

保存する時には以下の手順で行えます

  • プロンプトの保存方法としては、まず保存したいプロンプトを入力します。
  • 次に、「Generate」ボタンの下にあるフロッピーディスクのアイコンをクリック
  • 保存するプロンプトには、分かりやすい名前をつけましょう。
  • そのプロンプトは「stable-diffusion-webui」フォルダ内の「styles.csv」というファイルに保存されます。

保存されたプロンプトを使う時には以下の通りです

  • Generateボタンの下にあるStylesタブを開き、保存したプロンプトの名前を選んでください。
  • 選択すると、そのプロンプトに設定された条件で画像を生成することができます。
  • Stylesを選んでいる間にGenerateボタンの下にあるクリップボードの形をしたアイコンをクリックすると、選択したプロンプトがもう一度入力されます。

Styleの編集や、削除するときには

保存したプロンプトを変更したい、または削除したい場合は、直接styles.csvファイルを編集します。

このファイルは、「stable-diffusion-webui」フォルダ内にあります。

styles.csvファイルは、テキストエディタ(メモ帳)やExcelなどで編集できます。

StableDifussion WebUIの外でも、【Eagle-pnginfo】という拡張機能を使うと、生成された画像やプロンプトを自動で一括保存・管理することも可能です

以前のStable Diffusionから、SDXLする現時点でのデメリット

以前のStable Diffusionをベースに作られたLoRA等が使えない

ControlNet等がSDXLに対応していない

ControlNetは、ControlNet v1.14にすると、StableDiffusion WebUI/ AUTOMATIC1111 バージョン1.6で動作するようになりました

画像はきれいになったが、以前のモデルの方が好みのテイストが出る場合も…

また、良いか悪いかは判断が分かれるかもしれませんが、センシティブな画像生成が抑えられました

StableDiffusion WebUI 1.6.0へのバージョンアップの注意点

また、git pullコマンドでのバージョンアップですと、不具合が出ることも多いので、新しい場所にリポジトリをgit cloneでクローンし、必要な設定やデータを古いリポジトリから新しいリポジトリにコピーという方法の方が良さそうです

言っている意味が分からない…

更新するんじゃなくて、新しいフォルダを作って、そちらに新規でStableDiffusion WebUI 1.6.0をインストールした方がいいってこと

ちょっと面倒なんですが、必要な物だけを、以前のStableDiffusion WebUIインストールフォルダから取り出して、新しい方にコピペです

git pull も問題が起きないケースもあります。

どこのバージョンからアップデートするかにもよります

例えば、1.4から1.6にgit pullでバージョンの更新なら問題なくても、1.2から1.6にgit pullでバージョンの更新なら問題が出てしまう様なケースがあるようです

分からない時には、既に環境構築してあるStableDiffusion WebUI のほかに、もう1つStableDiffusion WebUI 1.6.0をインストール(git clone)してもいいカモです(容量に余裕があれば)

git cloneについてのワンポイント解説

「git clone」とは、簡単に言うと、インターネット上にあるプロジェクトのコピーを自分のパソコンにダウンロードするコマンドです。このコマンドを使うことで、GitHubなどのリモートリポジトリ(プロジェクトが保存されている場所)にあるファイルやフォルダを、簡単に自分のローカル環境(自分のパソコン)にコピーできます。

git pullについてのワンポイント解説

「git pull」とは、リモートリポジトリから最新の変更を取得して、それを自分のローカルリポジトリに統合するためのコマンドです。このコマンドを使うと、リモート(例えばGitHub)で行われた更新を自分のローカル環境に反映できます。

具体的には、「git pull」は「git fetch」(リモートリポジトリの変更をローカルに取得する)と「git merge」(その変更を現在のローカルブランチに統合する)の二つの操作を一つのコマンドで実行します。

StableDiffusion WebUI AUTOMATIC1111v1.6の嬉しい機能

個人的に地味に嬉しい機能は、ブラウザが自動的に立ち上がるようになりました。

設定は必要です

Settings → System → Automatically open webui in browser on startupを、Localにしてね

同様のプロンプトを使っても再現できない問題が改善されたようです

自分が作ったAIイラストのプロンプトやパラメーターがあれば、再現できたと思いますが、他者のプロンプトを作っても同様のAiイラストを生成することが出来ませんでしたよね…

Settings → Stable Diffusionの中にあるRandom number generator sourceを、NVに設定してください

まとめとリンク集

SD Web UIバージョン1.6.0は、SDXL言語の全面的なサポートと多くのUI改善を通じて、画像生成の効率と実用性が大幅に向上しました。

特に、SDXLでの画像生成が以前よりも一般的になる可能性が高く、新機能や改善点の追加によって今後のバージョンアップが非常に期待されます。

加えて、近いうちに更なる機能追加やバグフィックスが行われるでしょう。

コントロールネットについても注目すべき進展があり、今後はSDXLに対応する予定です。

新しいコントロールネットのバージョンがリリースされた際には、SDXLを用いたステーブルな画像生成がさらに容易になると期待されます。

この記事が皆さんにとって参考になれば、非常に幸いです。

StableDiffusion WebUI v1.6.0(随時更新リサーチ中)

StableDiffusion WebUI や拡張機能のダウングレード

StableDiffusion webUI基本設定

【学習モデル・checkpoint】

プロンプト

【ControlNet】

【その他 拡張機能について】

画像生成で収益化方法

【その他AI最新情報】

AIをとりまく社会問題

人気ブログランキング参加中 応援してね

NoImageなぎのブログ

この記事が気に入ったら
フォローしてね!

よかったらシェアしてね♪
  • URLをコピーしました!

web3 時代に必要なスキルを磨く!

なにかやりたい作業があって短時間で身に着けたいのであれば、オンラインで授業を受けたり質問できるサービスもあるよ

SHElikesは女性限定ですが、幅広く学べて、業界最安値(それでもそこそこなお値段しますが)

Withマーケは、私も参加してて、マーケティングに特化していまして、マーケティングスクールとしては最安値で、内容も濃くお値段以上です

副業に役立つツール・まとめ

副業に役立つツール最強ツールは、みなさんもご存じのAdobeのアプリ。

画像加工のPhotoshop 動画編集のpremiereなどでおなじみですが、単体プラン(2728円/月)を2つ以上契約するなら、全てのアプリを使えるAdobeクリエイティブクライド(6248円/月)がお得

さらに、社会人でも買えるアカデミック版(39980円/年 月当たり3,331円)は公式サイトのセール価格と同等価格のうえに、アカデミックの講義も付いてくるお得プラン

Adobe CCをアカデミック版で買うとセール価格より安い

副業に役立つ本まとめ

ブログで5億稼いだ方法/きぐち著

ブログサイト運営するなら、バイブル的な本です

なかなか知れない裏情報もばっちり載ってます

ブログ歴17年のプロが教える売れる文章術 ブログライティングの教科書/(中島大介)なかじ

現在、ブログ系の情報発信者のトップクラスのインフルエンサーです

私もなかじさんの情報にはかなり助けられました

目次