ClaudeのコンテンツモデレーションはClaudeがやっている。官ジェネはこの仕組みをすり抜けている。

https://docs.anthropic.com/en/docs/content-moderation

ユーザー入力がメイン言語モデルに到達する前にスクリーニングすることで、有害、不快、または無関係なコンテンツの処理や出力を防ぎ、計算リソースとブランドの評判への潜在的な損害の両方を節約できます。