DeepScaleR-1.5BがAIMEスコアでo1-Preview超えとか、強化学習が強化されまくっててもう何が起こるかわからんな。