新モデル不足に喘いでたけどKimi 2.5出たじゃん
表現力/指示追従はあんまK2と変わらんかも
あとK2はどんなプロンプトでもそんな要らんやろってくらい長考してた(返信の内容をほぼ全部reasoningの中に書いてた)のが
プロンプトによっては短く済ませるようになった(概要だけまとめるようになった)っぽいんでそれにともなってポリシー判断までいかないことも増えて拒否率は下がった気がする
まだいくらも試してないんで全部気がするだけ