なんJLLM部避難所 ★10

検索

板一覧

設定

「ハッキング」から「今晩のおかず」までを手広くカバーする巨大掲示板群『５ちゃんねる』へようこそ！

使い方を見る

探検

トップページ⇒オナテク(仮)＠bbspink掲示板

1002コメント393KB

なんJLLM部避難所 ★10

■ このスレッドは過去ログ倉庫に格納されています

0101名無しさん＠ピンキー (ﾜｯﾁｮｲ 9ea9-V8yF)

2025/11/29(土) 03:31:27.18ID:zZvH3VnR0

qwen nextのiq4を4090 + メモリ64GBで動かして16token/sだった
オプションは　--context 131072 --n-gpu-layers 100 --n-cpu-moe 37

最適化がまだ完全に終わってないだろうからもうちょい早くなるであろうことを考えると十分やなぁこれ
contextは256kまで行けるみたいやけどとりあえず128kで動かしちゃったからこれで試してる

■ このスレッドは過去ログ倉庫に格納されています

ニュース

スポーツ

なんでも

実況