【CFGスケール】とは?
CFGスケールは、Stable Diffusionにおける重要な設定の一つです。
これは「Classifier Free Guidance」の略で、AIが生成する画像がどれだけ入力されたプロンプトに忠実になるかを調整するために使用されます。
CFGスケールを調整することにより、AIがプロンプトをどれくらい重視するかを決めることができます。
StableDiffusion WebUIの1つAUTOMATIC1111では、デフォルトで7となっています
CFGスケールの効果
CFGスケールの値を高く設定すると、プロンプトにより忠実な画像が生成される傾向があります。
しかし、数値が高すぎると、画像が不自然になるリスクもあります。
逆に、CFGスケールの数値を低く設定すると、プロンプトや入力画像から逸脱しやすくなりますが、画質は向上する傾向があります
全く意図してないモノができてしまうこともあるよね
逆に、AIはプロンプトから逸脱しやすくなりますが、より抽象的で創造的な画像が得られる可能性が高まります。
CFGスケールを設定するメリット
CFGスケールを使用するメリットは、カスタマイズ性と柔軟性です。
ユーザーはCFGスケールを調整することで、生成する画像の特性をコントロールでき、忠実度と画像品質のバランスを取ることが可能になります。
これにより、さまざまな要望や目的に応じた画像を生成することができます。
CFGスケールのおすすめな数値
一般的にCFGスケールは7から8が標準値とされており、これはほとんどの画像にとってバランスが良いとされています。
多くのモデルや、作品を見ると7~11程度の数値で生成されることが多いですね
参考:https://decentralizedcreator.com/cfg-scale-in-stable-diffusion-and-how-to-use-it/
モデルによるCFGスケールの違い
使用するモデルによってCFGスケールの影響も異なります。
一部のモデルは、より高いCFGスケールを好むことがあり、抽象的な結果を生み出すために低いCFGスケールを好むこともあります。
これは実験を重ねることで、より理解を深めることができます
CFGスケールとSampling Steps、Sampling Methodの相互関係と画像生成への影響
Stable Diffusionにおける画像生成には、CFGスケール、Sampling Steps、およびSampling Methodという3つの重要な要素が深く関わっています。
これらの要素の相互作用は、生成される画像の品質とスタイルに大きな影響を及ぼします。
Sampling Stepsとの関係
Sampling Stepsは、画像生成プロセス中に行われるフィードバック工程の回数を指します。
CFGスケールが高い場合、より多くのSampling Stepsを使用することで、プロンプトに忠実でありながらも詳細かつ高品質な画像を生成することが可能です。
一方で、Sampling Stepsの数が少ないと、CFGスケールが高くても、画像の品質が低下する可能性があります
Sampling Methodとの関係
Sampling Methodは、画像生成プロセス中に使用される具体的なアルゴリズムや手法です。
CFGスケールが高い場合、特定のSampling Methodを使用することで、高い忠実度を維持しつつも、画像の品質を向上させることができます。
異なるSampling Methodは、CFGスケールの設定によって、画像の収束速度や品質に異なる影響を与えます
Sampling Steps、Sampling Methodとの相互関係
CFGスケール、Sampling Steps、およびSampling Methodの相互関係は、画像生成の結果に直接影響します。
CFGスケールが高い場合、適切なSampling Stepsの数と適切なSampling Methodを選択することで、忠実度と品質のバランスを取りながら、望ましい結果を得ることが可能です。逆
に、CFGスケールが低い場合は、より少ないSampling Stepsや異なるSampling Methodを選択することで、創造的で抽象的な画像を効果的に生成できます。
参考:
- https://onceuponanalgorithm.org/guide-stable-diffusions-cfg-scale-explained/
- https://stable-diffusion-art.com/samplers/
CFGスケールと画像生成:要点のまとめ
Stable Diffusionを用いた画像生成においてCFGスケールは重要な役割を果たします。
この記事を通じて、CFGスケールの基本から、その効果、適切な設定値、さらにはSampling StepsやSampling Methodとの相互関係に至るまで、様々な側面を探求しました。
ここで、重要なポイントを振り返りましょう。
- CFGスケール: 画像がプロンプトにどれだけ忠実になるかを制御する設定。
- 高いCFGスケールの効果: プロンプト忠実度が高いが、画像品質低下のリスクあり。
- 低いCFGスケールの効果: より創造的で抽象的な画像。
- おすすめ設定値: 一般的には7〜11の範囲。
- モデルによる違い: 使用するモデルによってCFGスケールの影響が異なる。
- Sampling Steps関係: CFGスケールが高い場合、多くのステップで高品質な画像が可能。
- Sampling Method関係: CFGスケールに応じた最適なサンプリング方法の選択が重要。
これらのポイントは、CFGスケールを適切に利用し、Stable Diffusionを用いた画像生成を最適化するためのガイドとして機能します。