結局ロリできないし所詮GPTだからなぁ
モデル比較でも難しいタスク以外は4oでよくねどころか4oのが良いって検証でてきてるし