>>715
LM STUDIO+Amaterasu‑123B(IQ3_XXS・モデルサイズ47.01 GB)で実験中。
VRAMは余裕で溢れ(RTX4090なので当然)メモリ40GBくらい消費し、先ほどのテストでは0.49 tok/sec・712 tokens・10.77s to first token
生成文の品質は高いと思うが、実験に時間がかかる。