なんJLLM部 避難所 ★9
レス数が950を超えています。1000を超えると書き込みができなくなります。
>>980
量子化どのサイズ使ってる?
winならiQ4_xsがギリと思うけど >>985
いま外にいるからモデル名までは分からんけど
俺が試してみたのはUbuntu Linuxでメモリ80GB/VRAM16GB環境だから
かなり無理して圧縮したやつ
メモリ256GBくらいあればマシになるんだろうな >>985
iQ1ならGLM4.6じゃなくても日本語ボロボロかなぁ 128GBでQ2だとまあまあちゃんとしゃべる
Air準備してるらしいからそっちも期待やな MoEってdenseより量子化に敏感って印象
無理してi1を動かすよりglm airかqwen nextあたり動かしたほうがええやろな 同感
メモリ128GB環境やがGLM4.6のIQ2XXSよりもQWEN3-235BのIQ4XSの方が目に見えて早いし頭いい
4.6Airとかllama.cppのQWEN NEXT対応が待ち遠しいわ レス数が950を超えています。1000を超えると書き込みができなくなります。