>>261
一般的に界隈ではmax tokensっていうと1度の出力でLLMに出させるトークン数(あるいはそのMAX値)のことを指すかな
入力と出力を合わせた記憶総量ならcontext windowって言葉が使われてる
モデルのシートにもだいたいそういう風に分けて表記してある