0071名無しさん@ピンキー (ワッチョイ a3ae-1dY1)2025/05/12(月) 10:50:57.76ID:s2GrTugT0 >>68 >>69 https://raw.githubusercontent.com/turboderp-org/exllamav3/refs/heads/master/doc/llama31_70b_instruct_bpw.png それプラシーボやね 量子化の影響受けやすいperplexityですらこの程度でmmluみたいな実性能測るベンチでは性能低下1%以下が基本