ほーん、CPUでもデカいモデル動かせるかもしれんのか
と思って12B_Q4で試したら4token/sしか出なかったからえーんえーんって泣いてる