10割でなくて良いなら手間の問題だから、出力結果を二次加工する方法があると綺麗に解決できそう

画面表示する前に出力文を評価して女の子にちんちんが生えてたらレッドアラートを出してくれるLLM処理とか
ちんちん行為ををまんまん行為に書き換えてくれるLLM処理とか

単純な事に思えるからLM StudioかSillyTavernのプラグインに存在してもおかしくないような