claude公式の新しい検閲を解説してるXのアカウント見てるんだけど要約すると
・不適切な入力を見つけると正気に戻ろうとする
・不適切なプロンプトを無効にする仕組み
・黄色警告になりやすい
・チャットの強制終了