なんJLLM部 避難所 ★10
レス数が950を超えています。1000を超えると書き込みができなくなります。
0958名無しさん@ピンキー (スッププ Sdd2-v0/K)2026/02/11(水) 17:37:03.98ID:ctMDnveAd
>>957
Qwen3 235Bはひと昔前のGeminiやClaudeに迫る性能だが
現行バージョンほどのプロンプト追従性は無いな

GeminiやClaude向けのRPプロンプトがまともに動くこともあればダメな時もある

Qwen3 Next 235Bが待たれる
0959名無しさん@ピンキー (スッププ Sdd2-v0/K)2026/02/11(水) 17:44:16.28ID:ctMDnveAd
俺のVRAM40GB環境では70B〜80BならギリVRAMに乗るが
235BはVRAM128GB級でないとVRAMに乗り切らない

⚙70B〜80B…チャット、リアルタイムアプリ
⚙235B〜…バッチ処理

と用途別に使い分けるのが現実解
MoEのエキスパート配置が賢くなればVRAM32GB以下でも235Bがサクサク動きそうだが現状では夢物語
0960名無しさん@ピンキー (ワッチョイ 9f21-MYmM)2026/02/11(水) 17:48:41.51ID:FDNSgGOl0
見栄張んなよ
本当は8GBとかのグラボ使ってんだろw?
0962名無しさん@ピンキー (ワッチョイ 9f21-MYmM)2026/02/11(水) 18:02:21.40ID:FDNSgGOl0
>>961
>>960
0964名無しさん@ピンキー (ワッチョイ 76a9-cHUB)2026/02/11(水) 18:18:49.85ID:DcHcFl3L0
量子化のビット数小さくするのは元々パラメータ数小さいのとはまた違ったところが劣化する感覚があるんよな
パラメータ数小さいのはドジっ子なんだけど量子化で小さくしすぎると認知症みたいな
なんかうまく説明できないんだけど

コーディング用だとこの辺が結構聞いてくるんよなぁ
パラメータ数にかかわらずQ4はどのモデルもコーディングで使えない
0966名無しさん@ピンキー (ワッチョイ b2ec-lZWY)2026/02/11(水) 18:56:42.22ID:X0y/9hKJ0
VRAM12GB+LM Studio(RAM96GB)環境で16GBに交換したんやが
モデルのサイズはVRAMに全部入る容量を選ぶべきか、gguf版で少しVRAMの空きを残した方が良いのかどっちなんやろか
会話のやり取りがそこそこ続くようならVRAMは数GB開けた方が良いんやろか
数回限りのやりとりならギリギリ15GBぐらいのモデルとかのほうが精度優先にしたほうが良い?
0967名無しさん@ピンキー (ワッチョイ 1224-soK/)2026/02/11(水) 19:20:18.63ID:KPjbPQAh0
>>964
パラメータ数小さいけど量子化ビット数は大きいモデルはアホの子なんだけどやってることは納得できるしガイドしてやればちゃんと仕事してくれるイメージ
QWEN3ぐらい小説書ける100B〜150BぐらいのMoEモデルがあればQ6とかでいい感じの文章をストレス無く書いてくれそうなんだけどなぁ
0970名無しさん@ピンキー (ワッチョイ 32b1-ulj2)2026/02/12(木) 03:02:12.39ID:ejMhmS6d0
GLM5きたぞ
0972名無しさん@ピンキー (オッペケ Sr37-S1MQ)2026/02/12(木) 10:30:51.96ID:fvChrZS2r
安いコーディングaiて意味あんの?
0973名無しさん@ピンキー (ワッチョイ 32b1-ulj2)2026/02/12(木) 11:17:21.43ID:ejMhmS6d0
安いのが需要無くなることある?
0974名無しさん@ピンキー (オッペケ Sr37-rGR4)2026/02/12(木) 11:29:56.42ID:4uao824Lr
単独で使うものではないんでは
アシスタントで使うかオーケストレーションで使うかでないの
Vide codingの時代から事前プランニングの時代に一気に変化しつつあるから、合否/採点が容易なタスクは全部切り出して安いコーディングLLMでループさせる形になりそう

SOTAモデルで採点カンストするまで回したカンストSkillsをGLMに使わせる、とかになるのかな
0975名無しさん@ピンキー (ワッチョイ f636-81f9)2026/02/12(木) 12:31:17.54ID:blfUyIva0
コーディングは一度でもClaudeかCodexの手軽さを味わったらローカルに戻れないよ
ほんとに小さいスクリプト単位なら使用の余地はあるんだろうけど
ローカルがClaudeに追いつける日はくるのだろうか
中華LLM + openclawに期待するしかなさそう
0976名無しさん@ピンキー (オッペケ Sr37-S1MQ)2026/02/12(木) 13:21:48.09ID:fvChrZS2r
安いので試してだめだったら高いの使う、という手間がもうめんどいので最初から高いやつ使うよね
0978名無しさん@ピンキー (ワッチョイ 1259-S3dw)2026/02/12(木) 13:44:14.31ID:PwEbN11/0
>>977
待てるならvramいっぱいにモデルを詰めていいし、そうでないならkvキャッシュ用に空けておくべき
モデルによってkv量子化だったりオフロードしなかった時の精度や速度が違うから試しながら調節してみ
レスを投稿する

レス数が950を超えています。1000を超えると書き込みができなくなります。

ニューススポーツなんでも実況