【OpenSea】nagiblog みてね!

【ADetailer】Detectionで検出範囲を設定し複数人を検出。パラメータを解説画像生成AIイラストをStableDiffusion WebUIで /AUTOMATIC1111

ADetailerで、手や顔の修正をしようとするときに、検出され過ぎて過剰に修正が入る時ってありますよね

背景に映る人物を全て検出し、補正してくれるのはありがたいのですが、求めてない範囲の修正を行われて時間がかかり過ぎてしまうこともあります

本記事では、検出する範囲を決めることが出来るADetailerのパラメータのDetectionについて解説していきます

Detectionパラメータを調節することで、求める箇所だけの修正を自動で行ってくれるようになりますよ

本記事は、StableDiffusion WebUIの環境構築と、ADetailerのインストールが済んでいることをが前提となっております。

環境構築の型がまだの方は、上記リンクから先にお読みください

目次

【ADetailer】のDetectionのパラメータ

ADetailerのDetectionで設定できる項目は4つあります

  • Detection model confidence threshold
  • Mask only the top k largest (0 to disable)
  • Mask min area ratio
  • Mask max area ratio

それぞれどのような働きを するか見ていきましょう

まずは、ADetailerのスイッチオンであるEnable ADetailerにチェックをいれましょう


ADetailer modelは顔を補正するので、フェイス yoloV8を選択します

ネガティブプロンプトには、イージーネガティブV2を入れておきます

Detectionのところをクリックすると、上記した、4つのパラメータの項目が現れます

Detection model confidence threshold 検出モデルの信頼しきい値

Detection model confidence thresholdから説明していきますね

Detection model confidence thresholdは、検出するしきい値となります

ADetailerで自動検出しますと、対象のエリアにこの様な数字が付きます

画像に追記された数値は、AIが顔と判断している信頼度となります

高ければ、自信をもって顔だ。低ければ、顔なのかな?ってくらいに検出してるって事だね

人間に例えるとそんな感じだね

Detection model confidence thresholdは、検出する最低ラインを決める数値です

デフォルトでは0.3になっています。

つまり0.3以下の対象は検出されないようにしてあるって事ですね

試しに、0.7にしてみますね

0.66の検出場所が、反応しなくなったね

Detection model confidence thresholdを0.3未満にすると、信頼度が低い対象物も顔として検出してしまうので、目的の場所が検出されない時以外には0.3未満にする必要はなさそうです

Mask only the top k largest (0 to disable)

Mask only the top k largestは、入力する数字で「面積が大きいものから何個までを検出するか?」を決めるパラメータです

たとえば、「3」と入力したら、面積が大きい方から3個の対象物だけを検出して、それ以外は検出しないようにできます

例えば、ADetailerプロンプトに、angryと入れて怒らせてみます

Mask only the top k largestをデフォルトのままですと、2人とも怒りました

Mask only the top k largestを、1にしてみます

数値が大きい順に対象が決まり、左の袴の女の子だけが怒った表情に変化しました

Mask min area ratio

Mask min area ratioは、検出する対象物の大きさの最低ラインを決める数字になります

0.05にすると、画像全体の5%未満は補正をしないようにするパラメータです

たとえば、以下の原画にを補正してみます

Mask min area ratioは、0.04設定しにしました

ます、検出が行われます

修正は両サイドの2人だけが対象となり表情が変化しました

Mask max area ratio

逆に、Mask max area ratio検出する対象物の大きさの最大のラインを決める数字になります

Mask min area ratioは、0に戻し
Mask max area ratioを0.04にしました

真ん中の2人が表情が変わり、両サイドの2人は表情が変わりません

ちなみに、Detectionをデフォルトに戻すと、4人とも表情が変化しました

以下は、私が参加させて頂いているプロジェクトです

おまけ 動画版【ADetailer】

StableDiffusion WebUI v1.6.0(随時更新リサーチ中)

StableDiffusion WebUI や拡張機能のダウングレード

StableDiffusion webUI基本設定

【学習モデル・checkpoint】

プロンプト

【ControlNet】

【その他 拡張機能について】

画像生成で収益化方法

StableDiffusion WebUIに必要なPythonやGitHubまわりのお悩み

【その他AI最新情報】

AIをとりまく社会問題

人気ブログランキング参加中 応援してね

この記事が気に入ったら
フォローしてね!

よかったらシェアしてね♪
  • URLをコピーしました!

web3 時代に必要なスキルを磨く!

なにかやりたい作業があって短時間で身に着けたいのであれば、オンラインで授業を受けたり質問できるサービスもあるよ

SHElikesは女性限定ですが、幅広く学べて、業界最安値(それでもそこそこなお値段しますが)

Withマーケは、私も参加してて、マーケティングに特化していまして、マーケティングスクールとしては最安値で、内容も濃くお値段以上です

副業に役立つツール・まとめ

副業に役立つツール最強ツールは、みなさんもご存じのAdobeのアプリ。

画像加工のPhotoshop 動画編集のpremiereなどでおなじみですが、単体プラン(2728円/月)を2つ以上契約するなら、全てのアプリを使えるAdobeクリエイティブクライド(6248円/月)がお得

さらに、社会人でも買えるアカデミック版(39980円/年 月当たり3,331円)は公式サイトのセール価格と同等価格のうえに、アカデミックの講義も付いてくるお得プラン

Adobe CCをアカデミック版で買うとセール価格より安い

副業に役立つ本まとめ

ブログで5億稼いだ方法/きぐち著

ブログサイト運営するなら、バイブル的な本です

なかなか知れない裏情報もばっちり載ってます

ブログ歴17年のプロが教える売れる文章術 ブログライティングの教科書/(中島大介)なかじ

現在、ブログ系の情報発信者のトップクラスのインフルエンサーです

私もなかじさんの情報にはかなり助けられました

目次