新しい4o賢くなった
クリエイティブさがないと解けない暗号解読を
o1に作らせて解かせてるんだけど
(最終回答が"H"になる問題)

正答率はこんな感じ:
新Sonnet 4/5 旧4o 1/4 canvas 2/5
新4o 4/5
canvasの4oはそのままの気がする