0101名無しさん@ピンキー (ワッチョイ 9ea9-V8yF)2025/11/29(土) 03:31:27.18ID:zZvH3VnR0 qwen nextのiq4を4090 + メモリ64GBで動かして16token/sだった オプションは --context 131072 --n-gpu-layers 100 --n-cpu-moe 37 最適化がまだ完全に終わってないだろうからもうちょい早くなるであろうことを考えると十分やなぁこれ contextは256kまで行けるみたいやけどとりあえず128kで動かしちゃったからこれで試してる