なんJLLM部避難所 ★9

発見

検索

板一覧

設定

「ハッキング」から「今晩のおかず」までを手広くカバーする巨大掲示板群『５ちゃんねる』へようこそ！

使い方を見る

探検

トップページ⇒オナテク(仮)＠bbspink掲示板

1002コメント342KB

なんJLLM部避難所 ★9

■ このスレッドは過去ログ倉庫に格納されています

0513名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b00-3WT3)

2025/09/30(火) 01:14:40.06ID:z5KqAsk90

command-a-03-2025とqwen3-235b-a22b
近いサイズまで量子化してあるやつを読み込んで推論したら
command-aの方は0.8t/sぐらいなのに
qwen3は5.0t/s出るんですけど
なんでこんなに差があってqwen3の方は早いんですか？
LMstudioでやってます、ロード時のパラメータでcommand-aには無いもの（エキスパート数とか）がqwen3にはありますがこれが影響してるのでしょうか
ローカルLLMに最近手を出したにわかですがご教示お願いします🙏

■ このスレッドは過去ログ倉庫に格納されています

ニュース