なんJLLM部避難所 ★9

1002コメント342KB

なんJLLM部避難所 ★9

■ このスレッドは過去ログ倉庫に格納されています

0001名無しさん＠ピンキー転載ダメ (ﾜｯﾁｮｲ fec0-xVEZ)

2025/08/23(土) 13:52:18.71ID:5lw7ZcNF0

!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512

AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所 ★8
https://mercury.bbspink.com/test/read.cgi/onatech/1746883112/

VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured

0013名無しさん＠ピンキー (ﾜｯﾁｮｲ f385-6Hg8)

2025/08/23(土) 23:35:58.73ID:nllRM+eP0

スレ立てありがとう

0014名無しさん＠ピンキー (ﾜｯﾁｮｲ dba3-BdKp)

2025/08/23(土) 23:37:21.11ID:Z2L/fI+E0

新しいモデル来ないと盛り上がらんなあ

0015名無しさん＠ピンキー (ﾜｯﾁｮｲ c716-BBaN)

2025/08/24(日) 00:29:39.09ID:Pbn0WOox0

GPTかGeminiかClaude並の知能あって何も拒否しなくてローカルで動くやつ、出して

0016名無しさん＠ピンキー (ﾜｯﾁｮｲ dba3-BdKp)

2025/08/24(日) 00:36:12.45ID:4Xx0/wYJ0

わ
わかんないっピ…

0017名無しさん＠ピンキー (ﾜｯﾁｮｲ 729f-uDW3)

2025/08/24(日) 07:45:44.58ID:1KQNreGg0

Grok 2きとるわね
https://huggingface.co/xai-org/grok-2

0018名無しさん＠ピンキー (ｼｬﾁｰｸ 0C53-c+Mf)

2025/08/24(日) 07:55:42.30ID:Xzxqe1AhC

>>15
magnum123b

0019名無しさん＠ピンキー (ｼｬﾁｰｸ 0C53-c+Mf)

2025/08/24(日) 10:11:18.38ID:Xzxqe1AhC

CohereLabs/command-a-reasoning-08-2025
なんか出てた

0020名無しさん＠ピンキー (ﾜｯﾁｮｲ f3c2-DcZR)

2025/08/24(日) 10:46:14.18ID:OJuYvR2Q0

grok2なんて今更どうするんだ
性能ではもう価値ないだろう

0021名無しさん＠ピンキー (ﾜｯﾁｮｲ d203-TnY8)

2025/08/24(日) 10:49:30.41ID:20pTTCWQ0

command rってちょっと前にあったよ、なんだったかもう忘れたッピけど…

0022名無しさん＠ピンキー (ﾜｯﾁｮｲ b6a9-slH+)

2025/08/24(日) 10:55:13.30ID:5IWKqrSs0

>>19
MoEだとちょうどいいサイズなんだけどMoEじゃないから動かすのしんどいやね

Cohereは最初からなんでも出力してくれるから好きなんだけど

0023名無しさん＠ピンキー (ﾜｯﾁｮｲ f3c2-TcND)

2025/08/24(日) 11:39:43.59ID:h1oo6yxg0

MacでもRyzenAIでもいいからVRAM126GB
50万以下で載せられる時代来ないかね

0024名無しさん＠ピンキー (ﾜｯﾁｮｲ a36a-Bq+j)

2025/08/24(日) 12:03:09.69ID:K9fb1xWi0

毒舌なんじゃなかったっけ？grok2
あとエロに寛容？

0025名無しさん＠ピンキー (ﾜｯﾁｮｲ f3a6-Nkl/)

2025/08/24(日) 12:50:40.01ID:UGJ9tbE40

Grok2は研究用に使ってねって感じだからローカル民が使う用途にはなって無さそう

0026名無しさん＠ピンキー (ﾜｯﾁｮｲ f29c-JKMc)

2025/08/24(日) 14:31:33.78ID:/ky+OZzI0

今時の高効率なLLMと比べるとgrok2なんて研究用でも使い道あるんかな。llama4もそんな感じのレベル

0027名無しさん＠ピンキー (ﾜｯﾁｮｲ b6a9-slH+)

2025/08/24(日) 14:47:20.24ID:5IWKqrSs0

今のLM Arena日本語ランキングの上位勢でオープンなLLMのサイズ調べてみた
qwen3-30b-a3bがなんか異常にいいのとqwen3-235b-a22b、gpt-oss-120b、gemma-3n-e4bあたりがコスパいいね
コスパじゃなくてパラメータに対するパフォーマンスだからパラパと言うのかわからんけど
https://i.imgur.com/3351cnd.png

このリストでは一番下にいるllama3.1-405bって出た当初はクローズLLMも含めた中でtop5くらいに食い込んでた記憶があるけど
今や4bのgemma-3n-e4bに抜かれてるのとかLLMの進化は恐ろしいな

0028名無しさん＠ピンキー (ﾜｯﾁｮｲ f66f-/T2E)

2025/08/24(日) 16:18:42.39ID:mZXf77670

llamaってもう過去のものみたいな感じするからな

0029名無しさん＠ピンキー (ﾜｯﾁｮｲ fb8c-GMkG)

2025/08/24(日) 16:24:33.63ID:j7Yf8Kt20

>>28
gpt-oss 出ちゃったからなぁ

0030名無しさん＠ピンキー (ﾜｯﾁｮｲ 2249-DcZR)

2025/08/24(日) 16:56:34.90ID:3I/Vxdms0

MetaはFacebookとかInstagramのビックデータ資産があるのにどうしてこんなにAIショボいのだろうか
Grokはその部分で成功しているのに

0031名無しさん＠ピンキー (ﾜｯﾁｮｲ fb8c-GMkG)

2025/08/24(日) 18:01:11.62ID:j7Yf8Kt20

grok はつまみ食いしてるだけだから
というか何も成功はしてないだろ

0032名無しさん＠ピンキー (ﾜｯﾁｮｲ f3b0-TnY8)

2025/08/24(日) 20:54:18.60ID:KAk5/6Ny0

えっcalude sonnet4とgtp ossとdeepseek r1よりqwen3-30b-a3bの方がいいの？まじ

0033名無しさん＠ピンキー (ﾜｯﾁｮｲ b6a9-slH+)

2025/08/24(日) 21:53:36.27ID:5IWKqrSs0

確かに信じがたいけど一応今の順位はこうなってる
ただGemma3-27bも結構なうえにいるし、それよりも後発＆MoE＆Qwenシリーズが全体的に高性能
であることを考えるとありえなくはないかなとも思ってる

0034名無しさん＠ピンキー (ﾜｯﾁｮｲ bfec-TnY8)

2025/08/24(日) 22:17:19.22ID:1z/0yi150

Claude 4 Sonnetより上ならかなり頂点に近いところにいるよねQwen3 30B

IQ Test | Tracking AI https://www.trackingai.org/home

0035名無しさん＠ピンキー (ﾜｯﾁｮｲ bfec-TnY8)

2025/08/24(日) 22:20:19.57ID:1z/0yi150

違ったこの表>>34は偏差値だから、gemini pro 2.5の次くらいかな？

0036名無しさん＠ピンキー (ﾜｯﾁｮｲ bfec-TnY8)

2025/08/24(日) 22:21:43.42ID:1z/0yi150

>>27
ごめんここに書いてたｗ　2.5flashにも及ばずだけどローカルにしてはやっぱ強いな…

0037名無しさん＠ピンキー (ﾜｯﾁｮｲ e6b4-BBaN)

2025/08/24(日) 22:28:06.57ID:FNr2UDXZ0

gpt-oss-20bよりはQwen3 30B-A3Bのほうがまあって感じはあるけど、それでもClaude超えはちょっと眉唾感
ローカルでしか試してないけど

0038名無しさん＠ピンキー (ﾜｯﾁｮｲ f66e-3pEJ)

2025/08/24(日) 23:19:43.96ID:DhANUb0X0

そもそもlm arenaは性能じゃなくて人間の主観による評価だからあんまり参考にならない
llama4みたいに実性能は終わってるモデルでも媚びへつらいまくったら上位に入れるからね
性能比較したいならartificial analysisの方がいいよ

0039名無しさん＠ピンキー (ﾜｯﾁｮｲ fea4-Utcz)

2025/08/25(月) 13:51:55.73ID:EMhRYAyr0

Qwenはエロが終わってるからこのスレ民には全く価値ない

0040名無しさん＠ピンキー (ﾜｯﾁｮｲ fea4-Utcz)

2025/08/25(月) 13:52:52.10ID:EMhRYAyr0

それよりMistral Largeの新バージョンがもうすぐ出るという噂だからこっちが本命かも

0041名無しさん＠ピンキー (ｵｯﾍﾟｹ Srd7-8hX9)

2025/08/25(月) 14:51:18.90ID:2ATDkfuJr

実際に使わずに推測しだすのは謎すぎる

Qwen30bは性能はよくある30b程度なんだけど日本語そのものが流暢ってモデルだね

0042名無しさん＠ピンキー (ﾜｯﾁｮｲ f285-Nkl/)

2025/08/25(月) 17:06:23.49ID:9pvmUDuL0

https://i.imgur.com/Cqa45vu.jpeg
ローカルで使いやすい〜30Bくらいのモデルだと大体こんな感じ
LGが出したExaone地味に気になってるんだよな

0043名無しさん＠ピンキー (ﾜｯﾁｮｲ f38e-FUtm)

2025/08/25(月) 17:16:16.20ID:6/dlAeV90

メインメモリ増やしたからGLM 4.5 Air Q6さわってみたけど理解力とエロは良かった
ただ結構中国語混ざったりワードチョイスが変で日本語はなんとも
Mistral系ぐらい日本語出来て100B前後のMoEが欲しくなる

0044名無しさん＠ピンキー (ﾜｯﾁｮｲ 2249-DcZR)

2025/08/25(月) 17:23:46.34ID:UOPr6/iC0

LGもLLM作ってたんだな
NTTも作ってるらしいけど公開しないから無いのと同じだな

0045名無しさん＠ピンキー (ﾜｯﾁｮｲ 5bc6-53nT)

2025/08/25(月) 18:24:17.67ID:VQ3VpI5L0

ちょっと前にSTでGLM 4.5 AirのQ4KM触った時はワードチョイスはともかく特に中国語混じったりはしなかった記憶
サンプラー設定の違いかな？

ただAirのQ4動かすよりGLM 4.5無印のIQ2XXSの方が体感的には良かった

0046名無しさん＠ピンキー (ﾜｯﾁｮｲ fe57-TcND)

2025/08/25(月) 19:08:19.02ID:Q9en1aht0

量子化はかなり性能落ちてるから元モデルの性能あまり当てにならないんよな
落ち方も色々だし

0047名無しさん＠ピンキー (ﾜｯﾁｮｲ f38e-FUtm)

2025/08/25(月) 19:09:19.77ID:6/dlAeV90

>>45
あれそうなんだ、設定弄ってみます
無印も試そうかな

0048名無しさん＠ピンキー (ﾜｯﾁｮｲ fbfb-GMkG)

2025/08/25(月) 19:54:16.15ID:Rgpm/ZNh0

ベンチマークと体感の性能が合わなすぎてな　
qwen系統ってNSFW要素を除いても実際の触ると微妙なんよ　典型的な過学習モデルって印象
GPT 4o(スコア:30)やclaude 3.5 sonnet(スコア:33)よりqwen 30B3A(思考:53/通常:46)が圧倒的に性能が良いとはならん

0049名無しさん＠ピンキー (ﾜｯﾁｮｲ 2f32-c+Mf)

2025/08/25(月) 19:55:10.05ID:cFB7ykMv0

>>40
オープンされるん？

0050名無しさん＠ピンキー (ﾜｯﾁｮｲ e67d-Nkl/)

2025/08/25(月) 19:57:18.80ID:eX9rrhFH0

ベンチと実用途はやっぱ違うわ
一般人が求めるようなAIの性能はARC-AGIとかポケモンベンチみたいなもっと複雑な系の話に近いと思うからまだまだそういうとこも発展途上やね

0051名無しさん＠ピンキー (ﾜｯﾁｮｲ fb7e-GMkG)

2025/08/25(月) 20:01:52.93ID:PsOmsKjJ0

AMD RDNA 5がVRAM 512GB載せられるかも、みたいな怪情報が出てたけどどうなんだろう
70Bクラスのモデルをfp16で動かせるのはすごそう

0052名無しさん＠ピンキー (ｵｯﾍﾟｹ Srd7-pOSt)

2025/08/25(月) 22:09:04.17ID:9jAW386or

strix haloの後のmedusa haloが帯域が太いらしいとか怪しい噂だけど本当なら良いねぇ…

0053名無しさん＠ピンキー (ﾜｯﾁｮｲ f3c8-2tZm)

2025/08/26(火) 14:45:51.13ID:A5cB8PUx0

LPDDRでメモリクロック低めバス幅広めみたいね

0054名無しさん＠ピンキー (ﾜｯﾁｮｲ f247-JKMc)

2025/08/26(火) 15:12:07.06ID:s4igKReV0

384bitの「広大な」メモリバスだと？

0055名無しさん＠ピンキー (ﾜｯﾁｮｲ 2f32-slH+)

2025/08/26(火) 17:07:01.44ID:AhRj7Eo60

command-a-reasoning-08-2025

これ3月版より進化してないか？
むちゃくちゃエロくなってる

0056名無しさん＠ピンキー (ﾜｯﾁｮｲ f6c5-Utcz)

2025/08/26(火) 19:10:32.78ID:IMpTXkqb0

Denseで100B越えはきついなぁ

0057名無しさん＠ピンキー (ﾜｯﾁｮｲ f247-JKMc)

2025/08/26(火) 19:18:48.48ID:s4igKReV0

thinkがデフォルトだから妄想が捗ってるんでは

0058名無しさん＠ピンキー (ﾜｯﾁｮｲ 2f32-slH+)

2025/08/26(火) 22:26:00.90ID:AhRj7Eo60

>>57
koboldだとthinkしてくれない
逆にどうやったらthinkさせられるかな？
thinkさせたら更にエロくなるかもｗ

0059名無しさん＠ピンキー (ﾜｯﾁｮｲ bf52-eKAO)

2025/08/27(水) 09:10:35.50ID:w5Y0R7kr0

>>55
HuggingfaceのSpaceで試してみたけど文章めちゃくちゃ濃密ですごく良い感じだったけど、2ターン目で動かなくなっちゃう
これをローカルで遊べる人羨ましい...。

0060名無しさん＠ピンキー (ﾍﾞｰｲﾓ MM0e-zVP4)

2025/08/27(水) 12:50:15.55ID:MatvxI7ZM

どのくらいのスペックいるんや？

0061名無しさん＠ピンキー (ｼｬﾁｰｸ 0C53-c+Mf)

2025/08/27(水) 12:57:24.96ID:briXnebQC

最低メモリ64Gあれば動く
遅いけど

0062名無しさん＠ピンキー (ﾜｯﾁｮｲ fb42-TcND)

2025/08/28(木) 09:17:13.80ID:PtV/rBm30

RAM128GBに増設しようと思うんやがVRAM16とあわせてGLM4.5の量子化ってどのくらいtok/secでるか分かるニキおる？
MoEといえどパラメータ大きいからどのくらいの速度出るか知りたいんやが試してる人がおらん

0063名無しさん＠ピンキー (ﾜｯﾁｮｲ 5bc6-Emuj)

2025/08/28(木) 10:46:20.62ID:zC+NRNLm0

4.5無印のUD-IQ2_XXSをDDR4-2666/128GB、VRAM/16GB&12GBで"--cpu-moe"オプション、"gpu-layers"をMAXで読み込んで入力するContextのサイズにもよるけど1.7~3.0トークン/s前後って感じ

0064名無しさん＠ピンキー (ﾜｯﾁｮｲ fb42-TcND)

2025/08/28(木) 12:43:02.81ID:PtV/rBm30

やっぱりアクティブパラメータ漏れて遅くなるんやねぇサンガツ
Airの高量子化とかにメモリ増設の価値はあるんやろか……

0065名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sd92-rbF3)

2025/08/28(木) 12:46:39.75ID:7uXnzDa8d

GLMの検索機能ってローカルでは動かないの？

0066名無しさん＠ピンキー (ﾜｯﾁｮｲ bf35-8L5d)

2025/08/28(木) 13:39:25.56ID:7DDmQCxX0

検索機能がついてるLLMなんて無い
検索は外部のツールで情報持ってきてLLMにデータを渡しているだけ

0067名無しさん＠ピンキー (ﾜｯﾁｮｲ 5bc6-Emuj)

2025/08/28(木) 13:49:04.05ID:zC+NRNLm0

>>64
63だけどAirのQ4_K_Mなら5トークン/s前後だったよ
ローカルで動画生成とかもするならメモリ増設の価値はあるかも

0068名無しさん＠ピンキー (ﾜｯﾁｮｲ c22a-TnY8)

2025/08/28(木) 13:59:28.17ID:MOCeri5p0

>>55
これ動かすのってQ8 ggufの複数あるのを全部落として、koboldcppで読み込めばいいの？
96gbメモリーで動くかな？

0069名無しさん＠ピンキー (ｼｬﾁｰｸ 0C53-c+Mf)

2025/08/28(木) 14:21:41.78ID:+W0jXESuC

>>68
96GならQ5_k_mかな
Q6_kはギリギリいけるかどうか
2ファイル落としてcmdで結合させて読み込む

0070名無しさん＠ピンキー (ﾜｯﾁｮｲ c22a-TnY8)

2025/08/28(木) 14:27:10.74ID:MOCeri5p0

>>69
Q5_k_m.ggufが00001～00006まであるんだけど、１と２だけを結合すればいいの？

0071名無しさん＠ピンキー (ｼｬﾁｰｸ 0C53-c+Mf)

2025/08/28(木) 14:55:14.97ID:+W0jXESuC

>>70
あ　ごめん　複数って書こうとして間違えた
連番全部ね

0072名無しさん＠ピンキー (ｼｬﾁｰｸ 0C53-c+Mf)

2025/08/28(木) 14:57:02.55ID:+W0jXESuC

>>70
あれ？
見てるとこ違うかな
mradermacher/command-a-reasoning-08-2025-GGUF
こっちなら2ファイルですむで

0073名無しさん＠ピンキー (ﾜｯﾁｮｲ bf35-GMkG)

2025/08/28(木) 16:47:31.62ID:xl5DRWuq0

command aってAPI経由なら月1000回まで無料で使えるから試すだけならそっちで良いんじゃないの？最悪BANされても痛くないし
流石にメモリオフロードすると1t/sすら切るからまともに使えんよ
3090 x 3とq4_k_mで10t/sぐらいそれでも遅いくらいなのに

0074名無しさん＠ピンキー (ﾜｯﾁｮｲ f665-JKMc)

2025/08/28(木) 19:08:47.96ID:35cB4ZDG0

>>65
正確に検索するならElasticSearch
ベクトルでなんとなく近い文書検索ならFAISSとかChromaを呼び出して
最終的にLLMで文書化する感じ

0075名無しさん＠ピンキー (ﾜｯﾁｮｲ f25e-TnY8)

2025/08/28(木) 22:37:55.88ID:vd6bbEay0

>>72
ダウンロードしてたけど>>73の案で行ってみる！
ニキ2人ともサンガツです

0076名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sd92-rbF3)

2025/08/29(金) 00:04:54.39ID:F+uohBhud

>>74
ESは入れたことあるから知っとるで
クローラーでゴリゴリWebからデータを引っ張りたいんや
LLMサーバの負荷を考えると別サーバで立てられる奴がええな

0077名無しさん＠ピンキー (ﾜﾝﾐﾝｸﾞｸ MMa2-1Laf)

2025/08/29(金) 15:50:24.61ID:QgHAaCUyM

書いた小説をテキストビューアで見てるけど、やはり画像もあった方が捗る。
挿絵機能欲しい

0078名無しさん＠ピンキー (ﾜﾝﾐﾝｸﾞｸ MM5f-N4bW)

2025/08/30(土) 01:23:00.97ID:+aOWuCZhM

silly tavern使っててしばらくチャット進めてると
キャラのセリフがずっと「アハ、アハ」言って笑ってて不気味になる。
コンテキストがいっぱいなんかな

0079名無しさん＠ピンキー (ﾜｯﾁｮｲ 8f8f-QNGN)

2025/08/30(土) 14:05:46.43ID:CfLeb00u0

あはっ、あはっ、なんにもおぼえられなくなっちゃった、あはっ……

0080名無しさん＠ピンキー (ﾜｯﾁｮｲ efc9-4tCA)

2025/08/30(土) 14:12:22.62ID:3hx39vZG0

茂木さんが乗り移ったとか？

0081名無しさん＠ピンキー (ﾜｯﾁｮｲ bf32-iuFk)

2025/08/30(土) 15:15:39.18ID:ycCFEzdM0

EPYC 4545Pとか言う安いのがあると思ったらam5用だった
名前はいいけどレーンもっと出してくれなきゃ嫌よ

0082名無しさん＠ピンキー (ﾜｯﾁｮｲ ef6a-4tCA)

2025/08/30(土) 16:47:32.49ID:M5/IkpAF0

command a API経由でSilly Tavernで使ったけど所々変な英語が混じるね

0083名無しさん＠ピンキー (ﾜｯﾁｮｲ 93df-4tCA)

2025/08/30(土) 20:43:01.58ID:M+HiyT//0

gemini apiエロ防壁作動してない？

0084名無しさん＠ピンキー (ﾜｯﾁｮｲ ef27-5CC8)

2025/08/31(日) 01:37:17.86ID:QSNVGU1f0

緩めとはいえAPIも以前からエロチェックしてるよ
システムプロンプトと最後に入力したメッセージは厳しくチェックされる
道中の会話は割とスルーされる
だからある程度回避はできる

出力結果もチェックされるけどこれはな…
露骨なエロワード避けるようなプロンプト組めば回避出てきそうだが、それって結果の質が下がる訳で

0085名無しさん＠ピンキー (ｵｲｺﾗﾐﾈｵ MM7f-4sJE)

2025/08/31(日) 09:40:52.22ID:5wmO9Mw4M

ollama見つけて熱に浮かされたようにあれこれ入れてみたけど、落ち着いてきたら使用する機会がない。
スマホで動かせないし、話し相手にも使わないからかな。
日常利用にはChatGPTとGrokでほぼ足りる。

0086名無しさん＠ピンキー (ｵｲｺﾗﾐﾈｵ MM7f-4sJE)

2025/08/31(日) 09:43:39.03ID:5wmO9Mw4M

ところでこのスレ何でこんな妙なタイトルなのでしょうか？
ローカルLLM総合みたいなスレも他に見当たらないし。

0087名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-9zWR)

2025/08/31(日) 09:46:06.44ID:/Moe9oy+0

もともとなんJにあったスレだから、
なんJがスクリプト荒らしが発生してこっちに避難した

0088名無しさん＠ピンキー (ｵｲｺﾗﾐﾈｵ MM7f-4sJE)

2025/08/31(日) 10:08:35.15ID:5wmO9Mw4M

そうなんだ。
ご丁寧にどうもありがとう。

0089名無しさん＠ピンキー (ﾜﾝﾄﾝｷﾝ MM5f-N4bW)

2025/08/31(日) 12:08:38.98ID:DQLe/olAM

やっぱローカルでやってる人は少ないのかな
情報もあんまりないし

0090名無しさん＠ピンキー (ｼｬﾁｰｸ 0C77-1eHW)

2025/08/31(日) 12:52:38.13ID:CJ5ondywC

新しいモデルがあまり出ないからねー
今の旬はcommand-a-reasoning-08-2025 やね

0091名無しさん＠ピンキー (ﾜｯﾁｮｲ 4366-TchX)

2025/08/31(日) 13:04:55.92ID:HY3TnHzC0

俺はローカルでやってるが出せるような情報を持って無いのでず～っとROM専
RTX3060 12GB + メインメモリ32GB では出来ることも限られてる

0092名無しさん＠ピンキー (ｼｬﾁｰｸ 0C77-1eHW)

2025/08/31(日) 13:33:10.71ID:CJ5ondywC

ではcommand-aの感想をば
3月版に比べて明らかに進化して規制も緩くなってて申し訳も少ないけど
ストーリーを健全な方向に持って行こうとする傾向があるのでunconsented版が出たら大化けするかも

0093名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sddf-p01K)

2025/08/31(日) 14:17:11.02ID:n3mn8kMFd

先週ノートPCのメモリを128GBに増やしたら
Qwen3-235B-A22B-Instruct-2507-Q4_K_M
が動くようになった
eGPUでTITAN RTXを繋いで合計152GB

0094名無しさん＠ピンキー (ﾜﾝﾄﾝｷﾝ MM5f-N4bW)

2025/08/31(日) 15:22:36.97ID:DQLe/olAM

うちのPCは8Bモデル程度が限界だわ
もっと低VRAMで動くようになればなあ

0095名無しさん＠ピンキー (ﾜｯﾁｮｲ ff66-C4T7)

2025/08/31(日) 16:58:23.64ID:jV+qo11F0

>>79
おぼえられなくなっちゃったからにはもう・・・ネ・・・

0096名無しさん＠ピンキー (ﾜｯﾁｮｲ 9382-M1Je)

2025/08/31(日) 17:00:42.04ID:EDviwWZF0

最近だと前スレで出てたCydonia v4がよかったくらいだな
もちろん理解力とか知識は24B相当ではあるけど同サイズ帯だったら個人的には一番

0097名無しさん＠ピンキー (ﾜｯﾁｮｲ 937f-vYwD)

2025/08/31(日) 17:19:50.98ID:tJyUmQEb0

512GB、帯域幅819.2GB/sのユニファイドメモリのM3 Ultra Mac Studioが150万か…

0098名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fcd-QNGN)

2025/08/31(日) 18:35:32.55ID:aw8WlFbQ0

ベースモデルの性能だと今もmistral small 3.1 baseがずば抜けている印象
新モデルだとseed ossとかZLMもqwenもgemmaと同様に知性自体は悪くないけど日本語工口知識はなさそう
mistralもマイナーチェンジしか出さないしもう一社くらい良い性能のモデルだしてほしい

0099名無しさん＠ピンキー (ﾜｯﾁｮｲ ff47-QNGN)

2025/08/31(日) 20:15:02.55ID:oUrfHM340

MS3.2-PaintedFantasy-v2-24Bが自分の中じゃ一番かなぁ繰り返しや変な点が沢山ついたりするのが無くなった

0100名無しさん＠ピンキー (ﾜｯﾁｮｲ ef45-Mlxs)

2025/08/31(日) 21:28:02.99ID:ZIzBmPWb0

>>97 VRAMを500GB以上にできるから実は激安なんだよ！

0101名無しさん＠ピンキー (ﾜｯﾁｮｲ cfd9-Sz+9)

2025/08/31(日) 22:21:06.77ID:uBoO6iIK0

正直その辺のファインチューニング版は日本語だと普通に誤差レベルだと思う
学習データ全部英語だろうし
たまたまその人にとっていい感じになったとかはあり得るけど個人差の域を出ないと思う

0102名無しさん＠ピンキー (ﾜｯﾁｮｲ 6375-dfzl)

2025/09/01(月) 03:06:55.30ID:GHk97tzm0

mistral-smallに日本語を継続学習させたのをCydoniaあたりとChatVectorしたらいい感じになったりしないかな

0103名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-9zWR)

2025/09/02(火) 08:05:30.81ID:t75Akvey0

windows updateしてからタスクマネージャーでGPUの状況が表示されなくなったんだが

0104名無しさん＠ピンキー (ﾜｯﾁｮｲ bf32-iuFk)

2025/09/02(火) 09:19:11.40ID:ML4JfrKZ0

大体winアプデに含まれたドライバ自動で当てられておかしくなってるから入れ直し

0105名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-9zWR)

2025/09/02(火) 09:25:51.03ID:t75Akvey0

MS＜(∩ﾟдﾟ)ｱｰｱｰｷｺｴﾅｰｲ

0106名無しさん＠ピンキー (ﾜｯﾁｮｲ 63a4-vYwD)

2025/09/02(火) 11:42:03.93ID:mRzJl1JX0

スレ違いかも知れんが特に話題無いようだしここで聞かせてくれ
やっぱ文章生成だけじゃなくて喋らせたいんやがみんなTTSは何使うてるんや？

0107名無しさん＠ピンキー (ﾜｯﾁｮｲ efbd-F6ss)

2025/09/02(火) 11:48:49.87ID:OSnhYV1G0

AivisSpeech、voicevox、elevenlabsあたりか？

0108名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sddf-vYwD)

2025/09/02(火) 12:05:25.44ID:gBXooA4Ld

elevenlabsは初めて聞いたな
しかしローカルで動かんからこれアカンな…
無難にvoicevoxとaivisspeechを試すわ感謝

0109名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa9-pwDE)

2025/09/02(火) 16:36:36.83ID:KtSxONQh0

SBV2も試してみるがよし

0110名無しさん＠ピンキー (ﾜｯﾁｮｲ bf9f-D63A)

2025/09/02(火) 23:44:31.99ID:LqsAXTo20

いやらしい感じの文章をえんえんリピートする症状って結局根本的な回避法ってないのん？
症状が出ないように温度となんとかペナルティを祈りながら動かすだけ？

0111名無しさん＠ピンキー (ﾜｯﾁｮｲ ef32-ZghJ)

2025/09/03(水) 07:43:34.16ID:4rMkALTk0

ワイのパソコンDDR3 32GB RAM + 4060Ti 16GB VRAMとローカルLLM的にお寒い性能なのでそろそろ更新せなって思っとるんやが、
Ryzen 9 7XXX系にRAMガン積みするのと、AI Max+ 395みたいなユニファイドメモリみたいなタイプ、どっちが将来性あるとみんなは考えとるんや？
今のグラボも使いまわしたいし、LLMだけでなくSBV2とかUnityでVR開発と醸しとるんで、今んとこRyzen 9 + RAMガン積みに気持ちは傾いとるんやが、みんなの忌憚のない意見やワイの見落としてる点とか聞かせてもらえたら嬉しいんやで

0112名無しさん＠ピンキー (ﾜｯﾁｮｲ bf32-iuFk)

2025/09/03(水) 10:11:32.07ID:Tb5aNmqP0

今判断するの難しいけどやっぱまだメモリ増設できる普通構成で良いんじゃないかな

ローカルモデルが巨大化していって、転送帯域ゴリ押しみたいなやり方も続くなら、一般人がLLM使うときの正解はメインメモリ直付け高速化したPCになっていくけど

■ このスレッドは過去ログ倉庫に格納されています