qwen3 のMoEモデルって24GB gpu+ryzen AI maxで15t/s位出るらしいね
40万ちょっとで235Bモデルを実用レベルで動かせるのはロマンある