最近は1回目でベースを作成し、2回アップスケールをかけて最終的に3倍から4倍にしているのですが、Tiled Diffusionを使った時に人物のへそが増える。のようなことに出くわします。
GPT-5に聞いてみたところタイルの重なりを増やす、そもそも2回にしないで1回で済ます。など提案があったので試してみます。
パターン
- 2回アップスケール(Tiled Diffusion不使用)
- 2回アップスケール(Tiled Diffusion使用)
- 1回アップスケール(Tiled Diffusion使用)
結果
2回アップスケール(Tiled Diffusion使用)
うーん、2回のほうがいいような気もしますが、1回でもいいかなって感じですね。比べてみればって感じです。全身写真とかなら変わるかもしれません。
拡大するとわかるのですが、1回アップスケールは顔がぼやけている感じがします。サムネイルレベルだとこれでいいって感じなのですが。好みの問題ですが、出てきたものとしてはいいと思います。これにFaceDetailerを追加するとどうでしょうか。
・・・顔が変わりましたね。
denoiseを0.2から0.3に変更してみましょう。
悪くないですね。すべてのケースでうまくいくかはわかりませんが、今回の512x768の3倍アップスケールは1回の処理でも対応できそうです。
ちなみに時間ですが
- 2回アップスケール(Tiled Diffusion不使用)約35秒
- 2回アップスケール(Tiled Diffusion使用)約80秒
- 1回アップスケール(Tiled Diffusion使用)約80秒
なので、Tiled Diffusionを使った場合は1回でも2回でもさほど時間に差はないという感じですね。そう考えると通常のサンプリングの絵は大きく変えず、書き込みを増やしたいなどの場合は2回、多少変わっても良い。むしろそれを狙う場合は1回とかのほうが面白そうです。
なお、今回の時間はDPM++ SDE Karrasを使用した時間なのでほかのサンプラーであれば時間は変わるかと思います。
今回のワークフロー:3 patern Upsacle Test.json
今回のモデル:XXMix_9realistic
コメント
コメントを投稿