0978名無しさん@ピンキー (ワッチョイ 1259-S3dw)2026/02/12(木) 13:44:14.31ID:PwEbN11/0 >>977 待てるならvramいっぱいにモデルを詰めていいし、そうでないならkvキャッシュ用に空けておくべき モデルによってkv量子化だったりオフロードしなかった時の精度や速度が違うから試しながら調節してみ