>>171
どの量子化モデル使ってる?
llama.cppの対応が5月くらいまでいろいろあったから、古いのは使わないほうがいいかも(あるいは自分で量子化する)

dranger003/c4ai-command-r-plus-iMat.GGUF
ここのは比較的新しい。iQ4_xsがおすすめ