なんJLLM部 避難所 ★8
>>415
すまん分からん
3450Tokens(1133Permanent)ならあるんだが…
これのこと? >>416
3450Tokens使ってるってことやな
コンテキストサイズの上限はいくつにしてる?
会話5回でおかしくなるならたぶん4096Tokensになってると思うけど、それ超えたら色々おかしくなるで コンテキスト枠増やしたいならVRAM増量とかしか無い? それか溢れた分はCPUのメモリに行くからむちゃくちゃ遅くなるのを我慢するか coreUltraと高クロックDDR5だと溢れてもマシなんだろうか >>421
いや遅いよ
サーバー向けCPUならだいぶマシになるけど KoboldCppなら、バッチサイズみたいな名前のパラメーターを64ぐらいまで減らせば、コンテキスト長増やしてもVRAMあまり使わない。はず。
減らすとトークンを読む速度が遅くなるけど、小説やロールプレイならあまり気にならないかも。