なんJLLM部避難所 ★10

978コメント384KB

なんJLLM部避難所 ★10

レス数が950を超えています。1000を超えると書き込みができなくなります。

2026/02/12(木) 11:29:56.42ID:4uao824Lr

単独で使うものではないんでは
アシスタントで使うかオーケストレーションで使うかでないの
Vide codingの時代から事前プランニングの時代に一気に変化しつつあるから、合否/採点が容易なタスクは全部切り出して安いコーディングLLMでループさせる形になりそう

SOTAモデルで採点カンストするまで回したカンストSkillsをGLMに使わせる、とかになるのかな

0975名無しさん＠ピンキー (ﾜｯﾁｮｲ f636-81f9)

2026/02/12(木) 12:31:17.54ID:blfUyIva0

コーディングは一度でもClaudeかCodexの手軽さを味わったらローカルに戻れないよ
ほんとに小さいスクリプト単位なら使用の余地はあるんだろうけど
ローカルがClaudeに追いつける日はくるのだろうか
中華LLM + openclawに期待するしかなさそう

0976名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr37-S1MQ)

2026/02/12(木) 13:21:48.09ID:fvChrZS2r

安いので試してだめだったら高いの使う、という手間がもうめんどいので最初から高いやつ使うよね

0977名無しさん＠ピンキー (ﾜｯﾁｮｲ b2ec-lZWY)

2026/02/12(木) 13:24:07.94ID:q5Z4ATkX0

誰か >>966にアドバイスしてクレメンス・・・
空きが無いと話がループして止まらないとかVRAMとモデル選択のバランスがようわからんのや

0978名無しさん＠ピンキー (ﾜｯﾁｮｲ 1259-S3dw)

2026/02/12(木) 13:44:14.31ID:PwEbN11/0

>>977
待てるならvramいっぱいにモデルを詰めていいし、そうでないならkvキャッシュ用に空けておくべき
モデルによってkv量子化だったりオフロードしなかった時の精度や速度が違うから試しながら調節してみ

新着レスの表示

レスを投稿する

レス数が950を超えています。1000を超えると書き込みができなくなります。