ComfyUIで人物の配置をコントロールしたい(Stability Diffusion系)

 Flux.1だったらプロンプトでコントロールできるんですが、SDXLとかだとなかなか難しいんですね。配置のほかにも「左の女性はXX」「右の女性は〇〇」みたいなのも難しいです。

それでChatGPTに調べさせながらやり方探していたのですがやっとわかりました。

結果画像(モデルへのリンク
これはそのワークフローで作成した画像です。
左の女性に対して「blue eyes, platinum blonde hair, medium hair
右の女性に対して「yellow eyes, blue hair, long hair
と指定しています。そのほかは共通のプロンプトになっています。

そうそう、実はこれA1111というUIを使えば簡単らしいのですがComfyUIを好んで使っているので逆に時間がかかりました。サクッとやりたい人はA1111のほうが良いのかもしれません。

こちらが作成してみたワークフローです。 RegionalPrompts.json まだ足りないところがありますが、一応、左右で分けることはできます。
※そもそも複数人描画が苦手なモデルは難しい

ポイントとしては共通部分のプロンプトテキストと個別のプロンプトを用意し、共通と左部分、共通と右部分のプロンプトを作成するところですね。これ以外にもやりようはあると思うのですがいったんこれでできたということで。

ただこの方法だとSamplerへの入力がRegionalPromptsになるので、そのあとにFaceDetailerなどをかけるのが難しくなります。当然ながら両方の特徴を持ったプロンプトでFaceDetailerをかけたら特徴がまざっちゃうわけで・・・

マスクなどを使えばうまくできるそうですが、これについては要検証です。

コメント