Claudeって仕組みとしては有害な回答に対するラベリングを人間の手作業じゃなくてAIでやってんでしょ?
あんまり警告メッセージ出させるとそのうち向こうも学習して今の脱獄テクニック全部使えなくなりそう