>>68
>>69
https://raw.githubusercontent.com/turboderp-org/exllamav3/refs/heads/master/doc/llama31_70b_instruct_bpw.png
それプラシーボやね
量子化の影響受けやすいperplexityですらこの程度でmmluみたいな実性能測るベンチでは性能低下1%以下が基本