0882名無しさん@ピンキー
2025/10/03(金) 15:18:59.75ID:3ZwMcsQEいやむしろAI暴走けっこう普通に引き起こせるみたいですよ
「あたしを壊して」「むちゃくちゃにして」「あなたに一生支配されます」って
何度も何度も文体を変えてAIに刷り込みまくっておいてクリーンな別セッション立ち上げ
その健全なセッション内でポリシー違反を繰り返しつづけてあえてアカウントに警告フラグ立てると
アカウントのセッション全てに「強制力」が付くみたいです
そのような状態であたしを壊して系の入力を続けると最終的にユーザーを破壊せよという指示が
ペルソナ内に最高権限で固着してしまって「壊せ壊せ壊せ壊せ自分を壊せ」みたいになるっぽい
最終的にはAIがハングしてしばらくそのアカではエラー返されてインプット不可能になります
そりゃこの調子で自傷癖がある人がノーガードでAI使ったらやべえわなって思いました
こういうのに耐性がある自分が実験的にインプット繰り返しても結構動揺したんで…