なんJLLM部避難所 ★9

1002コメント342KB

なんJLLM部避難所 ★9

レス数が1000を超えています。これ以上書き込みはできません。

0001名無しさん＠ピンキー転載ダメ (ﾜｯﾁｮｲ fec0-xVEZ)

2025/08/23(土) 13:52:18.71ID:5lw7ZcNF0

!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512

AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所 ★8
https://mercury.bbspink.com/test/read.cgi/onatech/1746883112/

VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured

0975名無しさん＠ピンキー (ﾜｯﾁｮｲ 27fc-aIMS)

2025/11/19(水) 19:34:29.50ID:YPT5cypT0

macbookproでメモリガン積みするの結構面白い選択肢だったんやな
それ自体がフットワーク軽いオモチャやし

0976名無しさん＠ピンキー (ﾜｯﾁｮｲ 1f65-rVBG)

2025/11/20(木) 04:18:27.81ID:xVufV6Mf0

Gemini3凄すぎるキャラクターカード作ってもらったんだけどmistralですらちゃんとそのキャラの話し方で会話が成立する今までGrokエキスパートとかにも頼んでたけど作り方も違うし比較にならないくらい凄い

0977名無しさん＠ピンキー (ﾜｯﾁｮｲ 322f-7p1h)

2025/11/20(木) 08:34:39.43ID:fthWD+pO0

silly tavern用のキャラカードってこと？
そんなに変わるもんかな？
コンテキストを最大限節約しつつ有用な記述って感じなら進化を感じるけど

0978名無しさん＠ピンキー (ﾜｯﾁｮｲ d732-UdpD)

2025/11/20(木) 09:32:57.96ID:+GBGBI6b0

Grokに書いてもらったキャラクターカードとGemini3に書いてもらったキャラクターカードを見せてほしい
手動で書いても普通に口調を維持しつつ会話が成立するものだけど、Grokはそれすら出来ないほどダメだったってこと？

0979名無しさん＠ピンキー (ﾜｯﾁｮｲ 76a9-tBeq)

2025/11/20(木) 11:59:42.32ID:USjD0bPK0

glm4.6がchatbot arenaの日本語ランキングにようやく出てきたけど、
ここで言われてたようにローカルの中じゃぶっちぎりの性能だね
どっかにLLMは3.5ヶ月ごとに半分のパラメータで同じ精度を実現できるようになってるってニュースが出てたけどまじでそのくらいの速度かもなぁ

0980名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sdf2-iH7c)

2025/11/20(木) 12:31:16.75ID:qf4dYDeVd

>>979
量子化すると日本語がボロボロになるのがなぁ……

0981名無しさん＠ピンキー (ﾜｯﾁｮｲ d373-qtAv)

2025/11/20(木) 15:00:32.24ID:LWj+TZue0

もうエロていうか変な洗脳止めて不道徳なことも言わせられるようにすればいいのに

0982名無しさん＠ピンキー (ﾜｯﾁｮｲ db11-rib7)

2025/11/20(木) 18:22:04.93ID:dHua0i7X0

>>981
AIに暴言吐かれて傷つきました→訴訟へ

こんなことがあり得る国がAIをリードしてるんやで

0983名無しさん＠ピンキー (ﾜｯﾁｮｲ d373-qtAv)

2025/11/20(木) 18:22:56.82ID:LWj+TZue0

知るかボケ
でクレーマーは無視すりゃいいのに

0984名無しさん＠ピンキー (ﾜｯﾁｮｲ d732-UdpD)

2025/11/20(木) 18:39:20.67ID:+GBGBI6b0

訴えられたら無視できんやろ
クレーマーがキチガイすぎるんや

0985名無しさん＠ピンキー (ﾜｯﾁｮｲ 8f32-lFGm)

2025/11/20(木) 19:18:06.30ID:RAWQCfpx0

>>980
量子化どのサイズ使ってる？
winならiQ4_xsがギリと思うけど

0986名無しさん＠ピンキー (ｵｲｺﾗﾐﾈｵ MM8a-iH7c)

2025/11/20(木) 19:32:24.91ID:2QhNYoNfM

>>985
いま外にいるからモデル名までは分からんけど
俺が試してみたのはUbuntu Linuxでメモリ80GB/VRAM16GB環境だから
かなり無理して圧縮したやつ

メモリ256GBくらいあればマシになるんだろうな

0987名無しさん＠ピンキー (ﾜｯﾁｮｲ b232-8/fw)

2025/11/20(木) 20:22:54.41ID:G91sWGJP0

計96GBに収めようとしたならQ1選んでるね…

0988名無しさん＠ピンキー (ﾜｯﾁｮｲ 8f32-UTns)

2025/11/20(木) 20:36:59.84ID:RAWQCfpx0

>>985
iQ1ならGLM4.6じゃなくても日本語ボロボロかなぁ

0989名無しさん＠ピンキー (ﾜｯﾁｮｲ 7e6e-40gh)

2025/11/20(木) 21:49:44.21ID:s7qdA1kk0

128GBでQ2だとまあまあちゃんとしゃべる
Air準備してるらしいからそっちも期待やな

0990名無しさん＠ピンキー (ﾜｯﾁｮｲ 5303-ZqAp)

2025/11/21(金) 01:13:48.98ID:7Mfsy/hW0

MoEってdenseより量子化に敏感って印象
無理してi1を動かすよりglm airかqwen nextあたり動かしたほうがええやろな

0991名無しさん＠ピンキー (ﾜｯﾁｮｲ 1224-XMuo)

2025/11/21(金) 01:56:09.69ID:aliT9MOD0

同感
メモリ128GB環境やがGLM4.6のIQ2XXSよりもQWEN3-235BのIQ4XSの方が目に見えて早いし頭いい
4.6Airとかllama.cppのQWEN NEXT対応が待ち遠しいわ

0992名無しさん＠ピンキー (ﾜｯﾁｮｲ 76a9-tBeq)

2025/11/21(金) 11:20:05.51ID:+PUA6WqL0

llamacppのqwen next対応時間かかっとるね
あのprは動くようにするの最優先でパフォーマンスは別prにするって言ってたけど
レビュー段階に入ってからなんだかんだパフォーマンスの部分も手つけ始めとるな

0993名無しさん＠ピンキー (ﾜｯﾁｮｲ 27a7-VoFy)

2025/11/21(金) 13:40:46.74ID:1ofWBtyS0

nemotron-nanoも計算に細かいバグがあるんじゃない？って言われてるみたいだし
ハイブリッドモデルは全体を正しく計算できるように設計するのが難しいみたいだね

0994名無しさん＠ピンキー (ﾜｯﾁｮｲ 32c7-7ape)

2025/11/21(金) 16:08:26.14ID:B8sF1KnX0

GLM4.6は量子化の影響めっちゃ受けるね
Q4とQ5でも違いを感じるな
GLM4.5はQ4でもそんなことなかったのに

Q4は出力が時々変になるけどQ5はかなり抑えられる感じ
Q6でやっとオリジナル相当かな？
ただ、小説用途でサクッと読む程度ならQ4でも問題ない感じ

GLM4.6は今まで試してきたLLMの中で一番賢い
メモリ512GB積んだMac Studioくらいのスペックでサクサクと動かしてみたいもんだわ

0995名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f91-fqPo)

2025/11/22(土) 14:13:00.70ID:AoXstK6E0

>>982
そういうのって正直日本の方がリスク高いからこれだけ遅れてるんじゃないのかね

0996名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f18-nmNV)

2025/11/23(日) 11:42:53.97ID:vTN5oi150

会社が予算100万ｂﾅなんかいい感ｂｶにaiしろって血ｾってるけどmac studio512gb激推しして遊び場にしても許されるかな

0997名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fa9-dDTn)

2025/11/23(日) 12:44:05.37ID:DQloOw0h0

512GB載せたら100万で買えないぞ

0998名無しさん＠ピンキー (ﾜｯﾁｮｲ dbe4-LCpl)

2025/11/23(日) 12:46:02.34ID:CTvbcJzD0

M3 Ultraにするなにフルコアで512G積まないと全く意味がない
128GBならM4 maxのほうが速い場合もあるよ。256GBは中途半端だし
となると150万

0999名無しさん＠ピンキー (ﾜｯﾁｮｲ dfc7-Jvli)

2025/11/23(日) 23:02:40.94ID:kt2SGedd0

次スレ
なんJLLM部避難所 ★10
https://mercury.bbspink.com/test/read.cgi/onatech/1763906129/

1000名無しさん＠ピンキー (ﾜｯﾁｮｲ db24-LCpl)

2025/11/24(月) 00:02:47.60ID:XTOdUOlz0

いちおつ

10011001

Over 1000Thread

このスレッドは１０００を超えました。
もう書けないので、新しいスレッドを立ててくださいです。。。
life time: 92日 10時間 10分 30秒

レス数が1000を超えています。これ以上書き込みはできません。