なんJLLM部避難所 ★9

851コメント290KB

なんJLLM部避難所 ★9

2025/11/09(日) 02:29:55.03ID:TvxxS+nl0

俺はそもそも24bモデルをmistral smallしか知らないかもしれない

2025/11/09(日) 20:02:17.85ID:02ttLA3w0

Llama.cppのQwen3 Next対応がようやっと終わりが見えてきたで

こっちがCPU対応で
https://github.com/ggml-org/llama.cpp/pull/16095
こっちがCUDA対応なんやろか？　いまいちよくわかっとらんが
https://github.com/ggml-org/llama.cpp/pull/17063
上のは実装終わっとって下のも今レビューに入ったようや

今のところ動かすのを優先してて実行速度は見てないそうなので遅いかもわからんけど
Qwen3.5が来る前に実装終わりそうでよかったわ

0849名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f75-an14)

2025/11/09(日) 22:24:33.08ID:jHM7u+Om0

Qwen3 nextって対抗馬であろうgpt-ossの120BとかGLM 4.5 Airとか比較してどうなん？

0850名無しさん＠ピンキー (ﾜｯﾁｮｲ bf49-8xKa)

2025/11/09(日) 22:55:33.63ID:rYYgkPmA0

Qwen3 Nextってアクティブパラメーター3Bだから
もっと小さいサイズのモデルとの比較になるかな

0851名無しさん＠ピンキー (ﾜｯﾁｮｲ 6332-Pj3+)

2025/11/09(日) 23:48:37.25ID:X2fQlB1a0

>>844
Mistral Smallを推す人は小説派なんかな？
ロールプレイチャットだとQwen系の方が比較的自然なやり取りになると思ったけどな
喘ぎ声強化プロンプトもQwQは効いてるのにMistral Smallはなんかいまいちだった
Qwen3はそもそもエロ検閲が厳しすぎて諦めたけど

新着レスの表示

レスを投稿する