アップスケールは分けたほうが良いか、1回で済ませたほうが良いか

 最近は1回目でベースを作成し、2回アップスケールをかけて最終的に3倍から4倍にしているのですが、Tiled Diffusionを使った時に人物のへそが増える。のようなことに出くわします。

GPT-5に聞いてみたところタイルの重なりを増やす、そもそも2回にしないで1回で済ます。など提案があったので試してみます。

パターン

  1. 2回アップスケール(Tiled Diffusion不使用)
  2. 2回アップスケール(Tiled Diffusion使用)
  3. 1回アップスケール(Tiled Diffusion使用)

結果

2回アップスケール(Tiled Diffusion不使用)

2回アップスケール(Tiled Diffusion使用)

1回アップスケール(Tiled Diffusion使用)

うーん、2回のほうがいいような気もしますが、1回でもいいかなって感じですね。比べてみればって感じです。全身写真とかなら変わるかもしれません。

2回アップスケール(Tiled Diffusion不使用)

2回アップスケール(Tiled Diffusion使用)

1回アップスケール(Tiled Diffusion使用)

拡大するとわかるのですが、1回アップスケールは顔がぼやけている感じがします。サムネイルレベルだとこれでいいって感じなのですが。好みの問題ですが、出てきたものとしてはいいと思います。これにFaceDetailerを追加するとどうでしょうか。

・・・顔が変わりましたね。

denoiseを0.2から0.3に変更してみましょう。

悪くないですね。すべてのケースでうまくいくかはわかりませんが、今回の512x768の3倍アップスケールは1回の処理でも対応できそうです。

ちなみに時間ですが

  1. 2回アップスケール(Tiled Diffusion不使用)約35秒
  2. 2回アップスケール(Tiled Diffusion使用)約80秒
  3. 1回アップスケール(Tiled Diffusion使用)約80秒
なので、Tiled Diffusionを使った場合は1回でも2回でもさほど時間に差はないという感じですね。そう考えると通常のサンプリングの絵は大きく変えず、書き込みを増やしたいなどの場合は2回、多少変わっても良い。むしろそれを狙う場合は1回とかのほうが面白そうです。

なお、今回の時間はDPM++ SDE Karrasを使用した時間なのでほかのサンプラーであれば時間は変わるかと思います。

今回のワークフロー:3 patern Upsacle Test.json
今回のモデル:XXMix_9realistic

コメント