今の学習の仕組みからしてそういう事は起こらないように思える
単純にそのモデルがnsfwワードに該当する学習情報に乏しいんでないかね
あと二次のbooru系と三次の独自キャプション系だと反応するワードが違うから
違う体系のワードで学習した奴を混ぜたモデルだと、それぞれに対応するワードを入れないと
アルゴリズム的に推論がうまくいかんのではないかと思う(ワードに対する反応が弱い)
例えば足開くポーズを二次側はspread legs、三次側はlegs spreadで覚えてるとかだと
両方指定しないとピクセル情報が求めにくいみたいな