なんJLLM部 避難所 ★9
レス数が950を超えています。1000を超えると書き込みができなくなります。
>>985
iQ1ならGLM4.6じゃなくても日本語ボロボロかなぁ 128GBでQ2だとまあまあちゃんとしゃべる
Air準備してるらしいからそっちも期待やな MoEってdenseより量子化に敏感って印象
無理してi1を動かすよりglm airかqwen nextあたり動かしたほうがええやろな 同感
メモリ128GB環境やがGLM4.6のIQ2XXSよりもQWEN3-235BのIQ4XSの方が目に見えて早いし頭いい
4.6Airとかllama.cppのQWEN NEXT対応が待ち遠しいわ llamacppのqwen next対応時間かかっとるね
あのprは動くようにするの最優先でパフォーマンスは別prにするって言ってたけど
レビュー段階に入ってからなんだかんだパフォーマンスの部分も手つけ始めとるな nemotron-nanoも計算に細かいバグがあるんじゃない?って言われてるみたいだし
ハイブリッドモデルは全体を正しく計算できるように設計するのが難しいみたいだね レス数が950を超えています。1000を超えると書き込みができなくなります。