1:1以外のアスペクト比で画像が崩れる場合の対処

サムネ用
 

SD1.5系のモデルはもとより、SDXL系のモデルでも縦横どちらかが1,024pxを超えると崩れることがあります。単体ならまだしも複数人とかだと発生しやすいかなって気がします。モデルにもよりますが。

そこでやるとしたら縦横1,024px以内に収まるサイズで画像を生成して拡大するってパターンだと思いますが、普通に拡大するとこんな感じです。

元画像


4xClearRealityで拡大


はい。綺麗に拡大するものの書き込みを足したりはしないですよね。のっぺりとしたところはいいかもしれませんが、顔は無理ですね。

というわけでどうするかというと複数回サンプリングします。

まず、特にモデルなどは使わず2倍に拡大した画像をノイズを調整して再サンプリングします。

拡大1回目

まだ不足は感じるものの悪くはないです。質感がちょっと違うのはVAEのせいですかね。

拡大2回目

このモデルらしい画像が出てきました。ここまでで16GBのVRAMで40秒くらいです。
まぁ、ちょっと遅いかなって気もしますがまぁ、良いでしょう。なお、Tiled Upscaleを試したほうが時間がかかりました。設定ミスっぽいですが。

ちなみに最初に崩れるという話をしたケースは以下のような感じです。

脚が余分

今回使用したモデル:SSmixIllustrious
サンプルワークフロー:3sampling_sample.json



コメント