自分はこういうことだと思ってる

・「申し訳」が出るかどうかは関係ない、もちろん消すかどうかも関係ない
・入力か出力かも関係ない
・システムログ内のエロ文脈の質や量に応じて警戒度ポイントを設定
・一定値を跨ぐと警告メッセージ
・ポイントに応じて警戒するよう指示するシステムプロンプトが乗せられる
・警戒度が高いとquota消費が多くなる?システムプロンプト目茶苦茶長いのかも