なんJLLM部 避難所 ★10
レス数が950を超えています。1000を超えると書き込みができなくなります。
0975名無しさん@ピンキー (ワッチョイ f636-81f9)2026/02/12(木) 12:31:17.54ID:blfUyIva0
コーディングは一度でもClaudeかCodexの手軽さを味わったらローカルに戻れないよ
ほんとに小さいスクリプト単位なら使用の余地はあるんだろうけど
ローカルがClaudeに追いつける日はくるのだろうか
中華LLM + openclawに期待するしかなさそう
0976名無しさん@ピンキー (オッペケ Sr37-S1MQ)2026/02/12(木) 13:21:48.09ID:fvChrZS2r
安いので試してだめだったら高いの使う、という手間がもうめんどいので最初から高いやつ使うよね
0978名無しさん@ピンキー (ワッチョイ 1259-S3dw)2026/02/12(木) 13:44:14.31ID:PwEbN11/0
>>977
待てるならvramいっぱいにモデルを詰めていいし、そうでないならkvキャッシュ用に空けておくべき
モデルによってkv量子化だったりオフロードしなかった時の精度や速度が違うから試しながら調節してみ
0984名無しさん@ピンキー (ワッチョイ b2ec-lZWY)2026/02/12(木) 16:54:46.72ID:q5Z4ATkX0
>>978
サンガツやで
これcontext長=kvキャッシュなんやろか
事前に確保するとVRAM量が増えるからkvキャッシュと思ったんやが会話が長くしたいなら12GB(model)+4GB(KVcache)
数回のやりとりで良いなら15GB(model)+1GB(KVcache)なんかなと思ったけど考え方はあってるやろか
レスを投稿する

レス数が950を超えています。1000を超えると書き込みができなくなります。

ニューススポーツなんでも実況