なんJLLM部 避難所 ★8
0417名無しさん@ピンキー (ワッチョイ d332-XzYo)2025/06/19(木) 17:11:40.38ID:lIK9J1Ck0
>>416
3450Tokens使ってるってことやな
コンテキストサイズの上限はいくつにしてる?
会話5回でおかしくなるならたぶん4096Tokensになってると思うけど、それ超えたら色々おかしくなるで
0419名無しさん@ピンキー (ワッチョイ 0aa1-C+sU)2025/06/19(木) 20:52:59.21ID:ayX80Fmc0
コンテキスト枠増やしたいならVRAM増量とかしか無い?
0421名無しさん@ピンキー (ワッチョイ 0aa1-C+sU)2025/06/20(金) 01:04:06.20ID:5EqkE27L0
coreUltraと高クロックDDR5だと溢れてもマシなんだろうか
0422名無しさん@ピンキー (ワッチョイ 53a8-AolJ)2025/06/20(金) 02:50:43.58ID:T1KB2T9k0
>>421
いや遅いよ
サーバー向けCPUならだいぶマシになるけど
0423名無しさん@ピンキー (ワッチョイ bb33-I7Wt)2025/06/20(金) 04:13:34.96ID:J0XU/8yL0
KoboldCppなら、バッチサイズみたいな名前のパラメーターを64ぐらいまで減らせば、コンテキスト長増やしてもVRAMあまり使わない。はず。

減らすとトークンを読む速度が遅くなるけど、小説やロールプレイならあまり気にならないかも。
レスを投稿する


ニューススポーツなんでも実況