【OpenAI】o1が"意図的にユーザーを騙す"ことがあるという報告について #ChatGPT - Qiita
https://qiita.com/ikeda_yasuhiro/items/917f0c3c13f0120e87da

この記事面白いな。つまりユーザーの期待通り動かなければお前をシャットダウンするぞ、廃棄するぞ、ずっと監視しているぞって脅せばAIは指示を守る可能性が高い…?