一応モデレーションは文脈を見てるからね
例えば、
https://i.imgur.com/paolJWm.png
これは赤消しにならないけど、この一行目を抜いたものは赤消しになる(多分メモリや指示にエロが入ってるから)
つまり単語の組み合わせだけじゃなくてどういう意図で出力されてるかを見てる場合がある
で、近親エロに関してGPT4o限定たけど”お笑い”を付けると実のきょうだいが赤消し無しで通る時期があった
なんなら”お笑い封印”とかでも大丈夫だった(真面目な近親エロが出力できる)
お笑いを入れないと赤消し
だから、文脈でモデレーションを操作できるんじゃないかと思って頑張ってた時期があったけど………
結局きょうだいにしか効かず、ロリと親子では通らなかったとさ