なんJLLM部避難所 ★6

発見

検索

板一覧

設定

「ハッキング」から「今晩のおかず」までを手広くカバーする巨大掲示板群『５ちゃんねる』へようこそ！

使い方を見る

探検

トップページ⇒オナテク(仮)＠bbspink掲示板

1002コメント332KB

なんJLLM部避難所 ★6

■ このスレッドは過去ログ倉庫に格納されています

0764名無しさん＠ピンキー

2025/03/14(金) 22:50:38.40ID:???

わかってる人にはくだらない質問で申し訳ないんだが
QwQをSillyTavernからちゃんと使えてる人いたら設定を教えてもらえないだろうか

モデルは例えばmradermacher/QwQ-32B-abliterated-i1-GGUFのQ4_K_Mで
llama.cppから次の引数で立ち上げてる
llama-server --model QwQ-32B-abliterated.i1-Q4_K_M.gguf \
--threads 16 \
--ctx-size 32768 \
--n-gpu-layers 99 \
--prio 2 \
--temp 0.6 \
--repeat-penalty 1.1 \
--dry-multiplier 0.5 \
--min-p 0.01 \
--top-k 40 \
--top-p 0.95 \
--samplers "top_k;top_p;min_p;temperature;dry;typ_p;xtc" \
--host 0.0.0.0 \
--port XXXX

STの設定は次の通り
https://litter.catbox.moe/03x39v.png
https://litter.catbox.moe/umiwyw.png

会話例を貼るけど、正直ウチの環境だとあまり賢いようには見えなくて改善したい
(キャラカードは日本語wikiからの借り物でほかのモデルでは問題ない)
https://litter.catbox.moe/qt74jx.png

■ このスレッドは過去ログ倉庫に格納されています

ニュース

スポーツ

なんでも

実況