なんJLLM部避難所 ★10

846コメント333KB

なんJLLM部避難所 ★10

0834名無しさん＠ピンキー (ﾜｯﾁｮｲ af6b-qxTp)

2026/01/29(木) 11:16:51.02ID:y80AVPBn0

k2.5をローカルで動かすにはどれくらいのスペックが必要なんや？

0835名無しさん＠ピンキー (ｼｬﾁｰｸ 0C8f-AlTQ)

2026/01/29(木) 11:56:27.24ID:LHsf3L4/C

macしか無理
Q1じゃ話にならんし

0836名無しさん＠ピンキー (ｽｯﾌﾟ Sdaa-Qkxx)

2026/01/29(木) 12:27:45.00ID:iilnWksjd

>>831
フロントエンド何つこてる？
lm studioとkoboldcppで使った経験あるがあれで申し訳された経験はないな。おそらくシステムプロンプトに問題があるとは思うが

0837名無しさん＠ピンキー (ﾜｯﾁｮｲ 9ea9-jbA7)

2026/01/29(木) 12:42:25.66ID:0vQW0f4i0

kimi k2はパラメータ数が1Tだからある程度妥協してQ4、KVキャッシュも含めたら768GBくらいはいる
劣化させたくないならQ8+KVキャッシュで1.5GBくらい、
フルならbf16+kvキャッシュで3TBくらいいるんとちゃう

0838名無しさん＠ピンキー (ﾜｯﾁｮｲ 9ea9-jbA7)

2026/01/29(木) 12:54:20.47ID:0vQW0f4i0

今思うとgpt-oss-120bって公式でmxfp4で配ってて
当時であの精度出してるのは結構すごいことだったんだな

他の同等モデルたちがフルサイズでベンチマークかけられてるのに対して
gpt-ossは4bitで戦ってたわけだから
4bitってなんだかんだ言って結構劣化するもんなぁ

0839名無しさん＠ピンキー (ﾜｯﾁｮｲ 0a9a-v5Ab)

2026/01/29(木) 13:01:52.60ID:pDXz5Kxh0

>>833, 836
返信ありがとう
みんなシステムプロンプトで回避してる感じなのかな
フロントエンドでollama使ったときとpythonで直にAPI叩いたとき両方でたまに申し訳された感じだった
heretic化前はRefusalsが96/100だったから不通に検閲されてるモデルなんだと思うけど

0840名無しさん＠ピンキー (ﾜｯﾁｮｲ af6b-qxTp)

2026/01/29(木) 14:02:53.73ID:y80AVPBn0

k2.5 unslothの1.8bit版ならVRAM24GBと256GBメモリで10 token/sで動くらしい
メモリ256GBなら個人でも持ってる人居そうやな…

0841名無しさん＠ピンキー (ｼｬﾁｰｸ 0C8f-AlTQ)

2026/01/29(木) 14:19:43.91ID:LHsf3L4/C

>>840
精度どれくらいなんやろ

0842名無しさん＠ピンキー (ﾜｯﾁｮｲ af6b-qxTp)

2026/01/29(木) 14:34:11.74ID:y80AVPBn0

1.8bitやし性能はお察しやろうな…
エロに限定すれば使い物になるのかも？

0843名無しさん＠ピンキー (ﾜｯﾁｮｲ 87dc-v5Ab)

2026/01/29(木) 19:27:13.51ID:l5XAHaNA0

俺様スペックで
LM Studio-lumimaid-magnum-v4-12bはエロ最強だ
最近のがっかり
Mistral Small 3.2 24B Instruct 2506
zai-org/glm-4.6v-flash

0844名無しさん＠ピンキー (ﾜｯﾁｮｲ 0a97-oVBd)

2026/01/29(木) 19:50:46.41ID:o+r7QE+h0

そろそろQwen3-VL-235Bより頭良くてエロいけるのが欲しい

0845名無しさん＠ピンキー (ﾜｯﾁｮｲ 07c6-Vxuf)

2026/01/29(木) 23:18:06.05ID:yut66++a0

うへぇSillyTavernのRSS拡張機能がなんか動かない...
config.yamlからenableCorsProxyをtrueにして関数呼び出しはできているけどRSSフィードの取得に失敗する...
動かせている人居る？

0846名無しさん＠ピンキー (ﾜｯﾁｮｲ 07c6-Vxuf)

2026/01/29(木) 23:44:32.09ID:yut66++a0

>>845
自己レス
拡張機能の「RSS Feeds」欄にスラッシュコマンド入れるというアホなことしてた
スレ汚しごめんね

レスを投稿する