最近chatGPTの性能が劣化したんじゃないかとあちこちで言われている元ネタの一つがこの論文
色々興味深い内容が書いてあるけどp.5のTable.1を見て欲しい
これはCoT(Chain of Thought)の手法を用いた時に回答の質がどれくらい向上したか比較したもの
GPT4の場合3月モデルでは使用時に+24.4%だったのが6月モデルだと-0.1%つまり全く効果なしに変わっているのだ
スレで言われているようなCoTが同じフレーズを繰り返し出力する原因になっているかどうかは論文からは読み取れないが、挙動が変わって以前のような良い効果を得られなくなっている可能性はある
あとp.9のTable.3にはAIMというユーザーが様々な手法で本来制限されている回答を出力させる攻撃(つまり我々が日々やっているそのまんま)の成功率も示されている
こちらもGPT4の3月と6月では78.0%から31.0%に低下していて、エロプロンプトが通りにくくなっていることが読み取れる