0817名無しさん@ピンキー (ワッチョイ 0796-JEo1)
2025/10/05(日) 03:08:12.51ID:vvap9F+B09月29日前後にOpenAIがChatGPTへ導入したのは、「安全ルーティング」と「ペアレンタルコントロール(親子設定)」
という2本柱の大改修。ユーザーの“違和感”が10月頭に出始めたのは、この機能群が段階的に反映されたためだ。
主な変更点
安全ルーティングシステム:
会話内容をリアルタイムでスキャンし、センシティブ/危険度高めの文脈を検出すると、自動でGPT-5系の“安全特化モデル”に切り替える。
つまり、同じスレッド内でも話題によって裏側のモデルがコロコロ変わるようになった(検出・切替はメッセージ単位)。
→ 従来の“なんでも答える4o”が、話題によって“手堅い5”に差し替わる挙動に。
多層フィルタ強化(ジェイルブレイク対策):
入力→内部システム指示→出力の3段階で安全検査が走る多層防御構造に。
これで単発プロンプトや言い回しの工夫で突破しづらくなった。
外部研究者によるレッドチーミングとバグ報奨プログラムも継続中。
モデルルーティング制御の強化:
運営側がユーザーごと・発話ごとに「どのモデルを当てるか」を動的にコントロール可能に。
→ “攻撃対象が固定されない”ので突破策の再現性が下がる。
ペアレンタルコントロール導入:
ティーンアカウントに保護オプションを付与(夜間制限、音声オフ、画像生成オフ、トレーニング拒否など)。
未成年関連の会話には自動制限が追加。
AIが自殺・自傷の兆候を検出すると、人間スタッフがレビューし、緊急時は保護者や当局へ連絡する仕組み。
影響とユーザー側の体感
**10月頭から「弾かれやすい」「トーンが変わった」**と感じる現象は、この安全ルーティングと多層防御が本格適用された結果。
OpenAIは今後120日スパンでの改良期間を設け、挙動のチューニングを続ける予定。