なんJLLM部 避難所 ★9
0620名無しさん@ピンキー (ワッチョイ 3ba9-s4CX)2025/10/14(火) 05:10:50.01ID:SMX+5n3O0
最近はMoEモデルが増えたせいでGPUもだがメインRAM256GBだの384GB積めるXeonかスリッパが欲しくなる問題。デスクトップRyzenの限界近い192GBでもGLM4.5あたりだとQ3ぐらいまでが限界で
0621名無しさん@ピンキー (ワッチョイ 3ba9-s4CX)2025/10/14(火) 05:18:17.08ID:SMX+5n3O0
>>814
Qwen3-Next-80B-A3BはぶっちゃけコアのA3BさえVRAMに収まってりゃそこそこの速度で動く。上の方でlammacppより先にQwen3-Next対応したfastllmで試したニキいるけどA3Bだけ置いてVRAM8GBも使わずに20tok/s出たって言ってたはず
レスを投稿する


ニューススポーツなんでも実況