なんJLLM部避難所 ★9

発見

検索

板一覧

設定

「ハッキング」から「今晩のおかず」までを手広くカバーする巨大掲示板群『５ちゃんねる』へようこそ！

使い方を見る

探検

トップページ⇒オナテク(仮)＠bbspink掲示板

1002コメント342KB

なんJLLM部避難所 ★9

■ このスレッドは過去ログ倉庫に格納されています

0140名無しさん＠ピンキー (ﾜｯﾁｮｲ 33f0-Mlxs)

2025/09/05(金) 02:37:29.66ID:XUkLc0/u0

汎用で量子化するならQ6は最低限な感じ
mlxだとFP16からの量子化でmixed_2_6とか4_6にできるけどベストポジション探すのめんどい
mac 128Gだと100B前後が限界。300BをQ2とかで動かしてもね
そのサイズだとGPUパワー足りなくて待ちきれん
M4maxだと128Gは絶妙なサイズなのかも
M3Ultraはどうにも予算がw
VRAMに乗ればnVidiaは圧倒的
MoEはそろそろピークで次はJet-Nemotronだな
来年のLLM界隈も楽しみだ

■ このスレッドは過去ログ倉庫に格納されています

ニュース

スポーツ

なんでも

実況