https://huggingface.co/CohereForAI/c4ai-command-a-03-2025/tree/main
command r+のaってこれかな
GGUF待ちや

4090でcobold→SillyTavernでの使用時
QwQ-32B Q4_K_M、4096だとちょっと辻褄あってない気がしたんで
>>719を参考にしていじってみた

コンテキストサイズ8192だとレイヤーが全て載らず遅かった
6000代だと66レイヤー全部?載る(-1 で限界まで乗せる、であっとるやろか)
ここらへんが上限かな……
いやでも他の作業できなさそうだから4096でするけども
駄目なところはプロンプトや設定の工夫でなんとかしたい