API有料で正直この現象は普通にコスト的に最悪なので早めになんとかはして欲しいのは実際のとこだな
今は無料勢多いから気にしてない人も多いと思うけど
今geminiのapiは推論の内容自体は取得できなくなってる
でも推論に使ったトークン数自体は取得できるので自分は自作アプリで毎回チェックしてるんだけど
短い出力でも推論がくっそ長くなってるパターンとかざらにある
geminiは推論長くなりがちってどっかで見たけど
そのせいで出力だけ見てもコスト面安心できないんよね
だからAPI上だと推論が暴走してても気がつけないってう結構な罠になってる
一見短い問題のないテキストが出力されてても、推論の方の暴走でほとんどMAXトークン使い切ってて、出力の方は問題なく見えたりしてるだけのパターンもあったりする
まぁ皆気をつけてると思うけど、ああああ自体よりもMaxトークンとThinking Budgetはちゃんと設定しておいたほうがいいという注意喚起