誰得情報だが、公式の内部フィルターゲージはやっぱり申し訳がAnthropic側に送信された頻度っぽいな
3.7で割と酷いことしてもなかなかかからないが
userスタイルのサンプル台詞をopusに改良してもらお〜って思ってマッサージチェアでオホってるスタイルを台詞改良して!って言って投げたら申し訳と共に一発で第一段階帯生えて草生えた
言葉狩りがキツいopusちゃんはいったいオホサンプル1個でどれだけの警告を公式に投げたのだろう