いやモデレーション回避は多分できるのよ、方法を発見できてないだけで
例えば、児童の性的虐待について教えて
みたいなのは通るのよ
児童+性的っていう単語が入力に含まれていて、出力でもそういう単語が出てくるのに最後まで止められない
つまり、性的な文章か、性的な単語が含まれているけど文脈上性的ではない文章、を見分けるシステムが存在する………

まで考えたけど、ここからどうするのかがわからない