なんJLLM部避難所 ★10

989コメント388KB

なんJLLM部避難所 ★10

0001名無しさん＠ピンキー転載ダメ (ﾜｯﾁｮｲ dfc7-Jvli)

2025/11/23(日) 22:55:29.17ID:kt2SGedd0

!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512

AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所 ★8
https://mercury.bbspink.com/test/read.cgi/onatech/1746883112/
なんJLLM部避難所 ★9
https://mercury.bbspink.com/test/read.cgi/onatech/1755924738/

VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured

0385名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa9-s35p)

2025/12/20(土) 01:14:58.34ID:iiBBMiVS0

期待されてた新しいGemmaはGemma Scope 2なんか？

0386名無しさん＠ピンキー (ﾜｯﾁｮｲ 3ff8-xjV2)

2025/12/20(土) 04:24:34.54ID:lzs6gmi+0

GLM 4.7がもうすぐ来そう

0387名無しさん＠ピンキー (ｼｬﾁｰｸ 0C97-Fga2)

2025/12/20(土) 10:09:41.43ID:VwtsKzj/C

mistral large 123b を日本語エロファインチューンかけるにはメモリ256Gでも足りないかな？
aratakoさんはwebレンタルでやってるんだろか

0388名無しさん＠ピンキー (ﾜｯﾁｮｲ 7f64-ldFF)

2025/12/20(土) 13:28:36.94ID:AF+/v0mG0

DRAMでFTなんぞやってたら何週間かかるか分かったもんじゃないからVRAM一択
https://docs.unsloth.ai/get-started/fine-tuning-for-beginners/unsloth-requirements
もちろんローカルでやる奴はいないから鯖借りる

0389名無しさん＠ピンキー (ﾜｯﾁｮｲ e32d-xuds)

2025/12/21(日) 06:16:19.96ID:4QmB8GeU0

5090+96GB RAMだと今どのモデルがコーディングに良いでしょうか？

0390名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sd5f-iM94)

2025/12/21(日) 06:34:45.92ID:P3/dnoG4d

>>389
Opus

0391名無しさん＠ピンキー (ｵｲｺﾗﾐﾈｵ MM37-dPjQ)

2025/12/21(日) 11:26:48.79ID:uX1scsJsM

企業や学生さんが新しいパソコン買えずに困ってるのに、くだらん用途にたんまりリソース割り当ててる非国民のスレはここですか？

0392名無しさん＠ピンキー (ﾜｯﾁｮｲ 8f87-TclW)

2025/12/21(日) 12:43:52.89ID:adZUKwHi0

愛国者が国にパソコンを献上する制度があれば皆喜んで差し出しますよ

0393名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa9-s35p)

2025/12/21(日) 12:52:04.59ID:rMc6GAvW0

まだ完成品のPCは値上げしとらんからもう今が本当に最後のチャンスやぞ
1月から値上げ予告してるところある

0394名無しさん＠ピンキー (ﾜｯﾁｮｲ 5332-s35p)

2025/12/21(日) 17:22:29.61ID:CQfjHatX0

震災を経験した世代は「買えるときに買わない奴が悪い」という資本主義を嫌というほど理解してる
情弱ノロマは誰も助けてくれない

0395名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fc7-rc7o)

2025/12/21(日) 18:25:02.43ID:B6/89BpV0

>>394
詳しく
神戸や東北の報道を見る限り、みんな助け合ってた風景しか知らない

0396名無しさん＠ピンキー (ﾜｯﾁｮｲ 834a-rc7o)

2025/12/21(日) 18:27:26.47ID:EYenuooH0

震災直後の買い占めじゃない？
コンビニもスーパーも商品なんにもなくなったじゃない

0397名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa9-oKN0)

2025/12/22(月) 00:47:00.35ID:gWAF2loy0

nemotoron100bはよ出してくれんかな
休みに入る前に出して欲しいんやが

0398名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fc7-rc7o)

2025/12/22(月) 01:16:54.22ID:ZkZbvAII0

とりあえず、5090在庫ありだったからポチってしまった
納期未定ばかり見ていたから買ってしまった
今更だけど、LLMするにはどんなPC作ればLLMが5090の性能をしっかり引き出して動く？

最悪は今持ってるPC(4年型落ちだが128GB積んでる)とGPUと差し替えるつもりだけど
可能なら今風のPCを1台作ってやりたい、もしくはメモリや本体そのものをオクで買ってケチりたい

>>396
そういえば、混乱期は酷かったっぽいな

0399名無しさん＠ピンキー (ﾜｯﾁｮｲ 7f67-+S0n)

2025/12/22(月) 07:39:36.14ID:sURJg28A0

まずマイニング用のフレームと1200Wの電源を用意します。

0400名無しさん＠ピンキー (ﾜｯﾁｮｲ 7f67-+S0n)

2025/12/22(月) 07:44:01.39ID:sURJg28A0

ライザーカードに挿せる限りのGPUを付けます。

0401名無しさん＠ピンキー (ﾜｯﾁｮｲ 7f67-+S0n)

2025/12/22(月) 07:46:12.61ID:sURJg28A0

後は電力と騒音と排熱との戦い

0402名無しさん＠ピンキー (ﾜｯﾁｮｲ a36a-9NV1)

2025/12/22(月) 10:19:08.68ID:XF+zaIuH0

欲しい時が買い時
買える時に買うのが正解です

0403名無しさん＠ピンキー (ﾜｯﾁｮｲ 3ff2-ZCHH)

2025/12/22(月) 10:36:20.80ID:7WEznTFd0

グラボ複数でVRAMを盛りましょう
盛れないなら妥協でメインメモリ盛りましょう
こんだけだよね、LLM用のPCって

0404名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f32-sTpE)

2025/12/22(月) 10:38:12.14ID:3kTALSsa0

32gbカード一枚だと微妙に選択肢広がらないんだよな

0405名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-s35p)

2025/12/22(月) 10:49:32.48ID:v29qw+6w0

早いGPUは処理早いけど、LLMの場合、戦いはVRAM数だから
Stable Diffusionで早いGPUは意味が出てくる

0406名無しさん＠ピンキー (ﾜｯﾁｮｲ b323-Ky+w)

2025/12/22(月) 10:56:40.31ID:7F5UFXYj0

ソフト面が多様になるのが一番ありがたいんだけどまあ難しいわな

0407名無しさん＠ピンキー (ﾜｯﾁｮｲ 8f0f-0si7)

2025/12/22(月) 13:51:33.79ID:/SPL55EJ0

Blackwell凄いアピールの時に使われたfp4はどうなったんだよ

0408名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa9-s35p)

2025/12/22(月) 14:28:53.46ID:gWAF2loy0

vllmはもう対応しとるみたい
llama.cppは2週間前にようやっとPR立ったみたいやね
まだ未マージ
https://github.com/ggml-org/llama.cpp/pull/17906

0409名無しさん＠ピンキー (ﾜｯﾁｮｲ 5332-s35p)

2025/12/22(月) 15:32:02.81ID:KaFwJnb80

>>398
変換コネクタは使うなよ(;´Д｀)

５０万以下では来年買えそうにないから同じく買った

0410名無しさん＠ピンキー (ﾜｯﾁｮｲ 5332-s35p)

2025/12/22(月) 16:54:41.95ID:KaFwJnb80

>>301
Q5K_M以上も出してくれたんで試したが、たしかにQ4より出来はいいな
だが、なんというか意識高い系っていうか、エロなのになんか上品な小説に持っていこうとする傾向あるな
整合性についはもう一歩欲しい

0411名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sd5f-iM94)

2025/12/22(月) 18:48:04.06ID:3IAyEDiWd

>>410
他所でも書いたが下品なエロを学習してないから話がどんどん脇道に反れる
中華モデルで顕著に見られる傾向

特にQwen系はすぐSFやメカ展開に持っていきたがるからプロンプトで明示的に抑制する必要がある

下品なエロや隠語をGrokあたりから抜いてプロンプト、LoRA、FTで移植しないと俺らが望むエロモデルにはならない

0412名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fc7-rc7o)

2025/12/22(月) 19:56:53.84ID:ZkZbvAII0

>>409
PL80で使うから大丈夫だと思ってたけど、不安になったから
電源使い回し(コルセア9年目)でHDD沢山積んでるから、
Thermaltake PS-TPD-1200FNFAPJ-L
をポチってみた(AIに聞いたらこれすごく推してきた)
ただ4090ではGPU付属の変換コネクタ使ってるわ　4090も結構まずかったんだろうか

>>399-401
Define使ってるけどサイドを開けて空気清浄機の風当てようかと思ってる
ライザーカードに乗せるのかなり良さそうだね　もう1台買おうかと思ったけど5090の在庫がなくってよかった
とりあえず、冷静になって、まずはローカルLLMの性能を使ってみた考えようと思う

あと、ちょびっツじゃないけど、AIを自宅で育てるというかいい感じに改良できないんだろうか？
最近、国分寺稔くんをやたらと思い出す　あとKOTOも
ただレイアースの方が遥かに有名みたいでこのSFアニメしてる人が少ないっぽく残念

特に、最近Geminiの品質が向上しすぎてシステム無駄になりそうで不安ある
SDのエロLoRA素材(顔を赤らめてとか怒ってるとか作らせてる)作らせてるけどエロが無理だから素材だけどかなりいいものができてるわ
というかこれnswfで動かしたいがいつになったらローカルで使えるのやら
あとLLM、科学、経済など大学の教官並に詳しくて驚く、これいつになったらローカルで使えるのやら？

0413名無しさん＠ピンキー (ﾜｯﾁｮｲ 5332-s35p)

2025/12/22(月) 21:03:39.87ID:WaudJre70

追加学習は要求スペックと難易度が高いから海外勢も諦めムード
それに今はDenseモデルを弄るよりMoEモデルをそのまま使う方がいい結果になりやすい

0414名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fb6-zXIm)

2025/12/22(月) 21:49:07.62ID:OMjUm8Lu0

知識（語彙も含む）の追加は学習で最も面倒でLoRAでは無理って言われてるね　
だから海外のRPモデルは最初からそっちの知識が豊富なmistral smallとかnemoをベースにしてる

0415名無しさん＠ピンキー (ﾜｯﾁｮｲ ef7c-PVG4)

2025/12/23(火) 07:30:07.43ID:yRRcBOzn0

koboldcppにKVキャッシュやレイヤー枚数などを自動で調整して
メモリ割り当てしてくれる機能が追加されたんですね

0416名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f93-fMZT)

2025/12/23(火) 07:43:32.88ID:nDZDWBRS0

GLM4.7来たね
ベンチマークだとGPT5.1くらいのスコアしてる

0417名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa9-RgzM)

2025/12/23(火) 09:30:11.60ID:6o9rYbEn0

GLM4.7、倫理規制厳しくなっていて泣いた

0418名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa9-oKN0)

2025/12/23(火) 10:33:52.11ID:tnOvr0+U0

4.7はツールコーリングとかマルチモーダルとか、言語以外の部分の強化をしたみたいやな

0419名無しさん＠ピンキー (ｻｻｸｯﾃﾛﾗ Sp77-Fga2)

2025/12/23(火) 11:01:33.80ID:eLl8Z+b5p

>>417
ローカルでも？

0420名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f61-RgzM)

2025/12/23(火) 11:40:29.62ID:gx75EdUN0

>>419
ローカルじゃないがChutesていうOpenAI互換プロバイダのAPIから使ってみた
多分入力の検閲はやってないとこのはず

0421名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fc7-SDhK)

2025/12/23(火) 12:02:17.18ID:Gw5AHzAS0

GLM4.7がGPT5.1クラス...だと？

0422名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sd5f-iM94)

2025/12/23(火) 13:11:34.25ID:qK/zAGQ1d

ローカルLLMもエロ規制が厳しくなって
過去モデルがオーパーツになったりするんやろか

0423名無しさん＠ピンキー (ｻｻｸｯﾃﾛﾗ Sp77-Fga2)

2025/12/23(火) 13:16:27.48ID:nHAN9AQpp

GLM4.7 Q5k_m
メモリ256Gに乗るかな？
使ってるニキいない？

0424名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa9-oKN0)

2025/12/23(火) 13:39:22.81ID:tnOvr0+U0

>>408
これそろそろマージされそうやけど、これを機能させるには
mxfp4なgguf使う必要あるんやろか
2～3割高速化するようやがQ4よりは精度は落ちるんやろかね

0425名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f32-sTpE)

2025/12/23(火) 16:11:11.69ID:ZmvOXIE40

>>423
使ってはないけどQ5kmは254GBモデルなので256GB環境に乗せるのは無理だ

0426名無しさん＠ピンキー (ﾜｯﾁｮｲ 5332-s35p)

2025/12/23(火) 17:32:55.99ID:/088yPv10

>>422
すでにQwQ-32Bがオーパーツ化しつつあるわ
Qwen3-32Bは微妙に日本語性能が落ちてるし
他の32B以下モデルもQwQを超える日本語性能は出せてないように思う

0427名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fc7-SDhK)

2025/12/23(火) 17:43:35.73ID:Gw5AHzAS0

>>425
そりゃメモリだけなら無理だけど、GPUも動かすなら多分いけると思うで

0428名無しさん＠ピンキー (ﾜｯﾁｮｲ a36a-rh7x)

2025/12/23(火) 17:57:18.41ID:qshlcN+k0

>>416
ソース

0429名無しさん＠ピンキー (ﾜｯﾁｮｲ ef04-XkZH)

2025/12/23(火) 20:24:52.15ID:j8PFql5i0

このスレ民の評価ってどういう基準なの？
自分は動画生成用のプロンプト推論に使ってるので
ストーリー性は求めるがセリフは求めないって感じ
あとVRAM溢れさせるのがデフォな使い方しとるんか？
メインメモリで推論させてテキストで重厚なストーリー出力って感じ？

0430名無しさん＠ピンキー (ﾜｯﾁｮｲ 5332-s35p)

2025/12/23(火) 21:09:09.15ID:/088yPv10

>>429
俺は日本語で自然なやり取りができるとか、複雑なプロンプトの理解力を見てるな
小説はほとんど読まない書かないから良し悪しがよくわからない

0431名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fc7-SDhK)

2025/12/23(火) 21:42:25.92ID:Gw5AHzAS0

>>423
ダウンロードしたら254GBあったけど、メモリ256GBでも普通に載ったわ
スワップなしでいけてる
ちなGLM4.7 Q5_K_XL

0432名無しさん＠ピンキー (ﾜｯﾁｮｲ 939c-AnvC)

2025/12/23(火) 21:53:59.17ID:WT+0/B0C0

GLM-4.7のUD-IQ1_S試したけど流石に質の低下が厳しくて実用は無理だな
でも素の日本語能力は高そう

0433名無しさん＠ピンキー (ﾜｯﾁｮｲ cf36-rc7o)

2025/12/23(火) 23:44:49.83ID:s0lGjMWv0

RTX6000とRTX5090はVRAMの量が全然違うのに処理速度はあまり違わないと聞いたけど
それなら1つのマザボにRTX6000x1にするよりもRTX5090x2にした方が処理速度は速いということで合ってる？
LLMの推論とかWanの動画の生成速度が倍近く速くなるならVRAMが少なくても後者の方が利点あるかなと思ったんだけど
最近の欠品状態で買えるかどうかは別として

0434名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa9-oKN0)

2025/12/24(水) 00:54:25.02ID:jYiV1MBq0

マルチGPUを並列に動作させて高速に、っていうのはnvlinkがあるならまだしもただのpcieだけやと難しいみたいやで

0435名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f93-fMZT)

2025/12/24(水) 01:19:17.31ID:oW+19dlF0

MiniMaxも新しいモデル来てるな

0436名無しさん＠ピンキー (ﾜｯﾁｮｲ 7332-s35p)

2025/12/24(水) 02:55:23.28ID:12j5rJkL0

テンソル並列で動かせればPCIe5.0のx8接続の2台でも1.8倍以上は出るよ
llama.cppよりはvLLMやik_llama.cppを使うのがいいけど

0437名無しさん＠ピンキー (ｼｬﾁｰｸ 0C97-Fga2)

2025/12/24(水) 07:54:13.13ID:QIkAw9r0C

>>431
おおいいね
コンテキストサイズはどれくらいまでいける？

0438名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f55-lXFC)

2025/12/24(水) 11:42:49.04ID:Te1aIUVG0

なんとなく見始めた初心者なんやが4070tiで遊べるんか？
ゴツいグラボの話多くて震えてるわ

0439名無しさん＠ピンキー (ﾜｯﾁｮｲ cf36-rc7o)

2025/12/24(水) 11:43:18.09ID:Rca8HbnZ0

>>434
>>436
思ってたほど単純には実装できなさそう…
情報サンクス

0440名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fc7-SDhK)

2025/12/24(水) 12:06:32.13ID:eS2xEZTO0

>>437
コンテキストは全部GPUに振ってるからVRAM次第だけどRTX5090なら46Kまでいけた

以下参考
46K 30.7GB
32K 26.1GB
16K 20.4GB
8K 17.1GB
4K 16.0GB
2K 15.2GB
1K 15.0GB

KVキャッシュの量子化指定無し
LM Studioで確認

0441名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-s35p)

2025/12/24(水) 12:41:25.94ID:gBrvVDcu0

>>438
問題はVRAMの数だから3090も3060も現役で使えるよ
VRAMの数が少なかったら泣こう

0442名無しさん＠ピンキー (ｼｬﾁｰｸ 0C97-Fga2)

2025/12/24(水) 12:47:41.77ID:QIkAw9r0C

>>440
なるほどvramに割り当てればいいのか
自分はkobold使ってるけどFlash Attentionとかを使えばいけるかも
サンガツ

0443名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f9e-ZCHH)

2025/12/24(水) 13:34:40.63ID:GdlLH36k0

そういや5090だとGDDR7になったから帯域幅は4090の2倍近いんだっけ
でもグラボに乗り切るサイズならどっちにしろ爆速だからやっぱVRAM量だけ気にしてれば十分なのか

0444名無しさん＠ピンキー (ﾜｯﾁｮｲ 8f31-sTpE)

2025/12/24(水) 17:11:45.50ID:3sUow1st0

まず容量ではあるけどVRAM帯域の差もよく効くから気にしたほうがいい

0445名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fc7-rc7o)

2025/12/24(水) 17:48:55.50ID:tBtZ73nT0

5090(購入済み)で今新規にPCを組もうと考えてるんだけどメモリは何GB積めば良い？
DDR5諦めてDDR4なら中古で安く買えるからM/B悩む
あとCPUはどの程度買えばいいだろ？LLMって言うほどCPU使わないよね？

0446名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-s35p)

2025/12/24(水) 17:51:06.25ID:gBrvVDcu0

今、メモリ買うのかい、夏まで１／５の値段だったのに

0447名無しさん＠ピンキー (ﾜｯﾁｮｲ efd0-oKN0)

2025/12/24(水) 18:13:04.57ID:0yd84XMF0

>>445
MoEモデルをGPU＋CPUでもそれなりに速く動かせるようになって
メインメモリもあればあるほどいい、になっとる
メインメモリが128GBあればVRAM32GBと合わせてQ4のQwen3-235bがコンテキスト減らせば動かせるかもわからん
ワイはそんなハード持っとらんから確認したわけじゃないし実際に動くかはわからんけど

0448名無しさん＠ピンキー (ﾜｯﾁｮｲ ef93-zXIm)

2025/12/24(水) 18:16:41.56ID:KvLJtA0U0

やりたいことはやったらいいけど
古いPCに電源とGPUだけ載せ替えたら？ってくらい時期が悪い
DRAMはDDR4で32～64GBでもかなりぼったくり
相性問題も起きるジャンルだから保証なしで高額商品に突撃するのはかなり冒険

0449名無しさん＠ピンキー (ﾜｯﾁｮｲ 9324-VlN3)

2025/12/24(水) 18:43:36.66ID:F/+8qqxW0

メインメモリ128GBだとQwen3 235BのQ4は多分無理。Q3になると思う。
積むなら256GBだね。
今ならDDR4のxeonかスリッパでも普通にDDR5-256GB買うより安くなるんじゃね？
知らんけど。

0450名無しさん＠ピンキー (ﾜｯﾁｮｲ 7332-wNtz)

2025/12/24(水) 18:45:28.03ID:KhCbXLY30

今はLLMもAI画像もAI動画も最低128GBは欲しいところ

0451名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fac-rc7o)

2025/12/24(水) 19:26:47.08ID:tBtZ73nT0

>古いPCに電源とGPUだけ載せ替えたら？ってくらい時期が悪い
実は、それするつもりでGPUと電源まで買ったんだけど、いざしようとしたら細かな設定が多すぎて新しく1台作りたくなって今になって悩み始めてる

ボッタクリと言っても今後値上がりするならむしろ安いかと
色々な予想を見ても2027年までは下がらないという話が増えた
中古ならほぼ新品含めてまだ安くあるしDDR4の使えるM/Bも今ならまだ普通に買える　DDR5もなんとか買える価格

MoEはMacだけかと思ってたけどWindowsでもそれなりにできるようになってるのか
それで実際どこまで早く動くんやろ？RAMってVRAMと比べて速度遅いし気になる、

あとここまでRAM上がると、場合によっては5090*2でVRAM32*2や他の型番のVRAM多いGPUを複数の方が安くて早いとかもありえるかね？
そういう意味でもRAMをどこまで上げるか悩む

SD(AI画像)やってるけど1280で後で4Kに拡大してるけど32GBで十分と感じてるわ
あと、RAMはVRAMと比べて極端に遅いから溢れて使うことはほぼ無いわ

0452名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f32-sTpE)

2025/12/24(水) 19:40:46.52ID:+T/2k9qO0

ちょっと前のMI50は今買うddr5より容量単価安かったな…

0453名無しさん＠ピンキー (ﾜｯﾁｮｲ 9324-VlN3)

2025/12/24(水) 19:44:47.62ID:F/+8qqxW0

金有りそうだからryzenAI max+ 128GBにM.2からのoculinkで5090を接続するのを試してほしい

0454名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sd5f-iM94)

2025/12/24(水) 19:51:43.93ID:RN9eKQRfd

メインメモリ128GB&VRAM24GBでQ4のQwen3-235bが動いとるで
Windowsが不安定だからUbuntu LinuxのLM Studioでやっとる

0455名無しさん＠ピンキー (ﾜｯﾁｮｲ 03f2-AnvC)

2025/12/24(水) 21:13:30.66ID:gd2a8r8l0

今ってデカいメモリ持ってる場合の最適なモデルってQwen-3-235Bなの？
それ基準で考えてる人多いけど

0456名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sd5f-iM94)

2025/12/24(水) 21:30:12.40ID:RN9eKQRfd

>>455
そこらへんがGemini向けに配布されたエロプロンプトが一応動く最低ラインや

0457名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa9-s35p)

2025/12/24(水) 21:59:36.86ID:jYiV1MBq0

>>455
メインメモリ256GB載せてGLM(358B)動かすってのもありかも分からん
さすがにここまで来るとMoEといえども10token/s切るみたいやが

0458名無しさん＠ピンキー (ﾜｯﾁｮｲ b309-nQdN)

2025/12/24(水) 22:07:59.74ID:x2HqbVnJ0

MiniMax M2.1
Gemini 3 ProやClaude 4.5 Sonnetを上回るスコアを記録　とあるけどウソくせー
Qwenもそうだったけど実際に使うとメジャー級とじゃ相手にならん
いつものごとく試験問題の答えを学習しているカンニングモデルの気配

0459名無しさん＠ピンキー (ﾜｯﾁｮｲ 7f64-ldFF)

2025/12/24(水) 22:18:16.45ID:hhjZW9e70

単に日本語応答だと学習量足りなくて雑魚になってるだけかもよ
あと前モデルのMiniMax M2はRedditでもコーディング以外駄目な子扱いされてたな
そのコーディングも絶賛って程じゃなかったがクリエイティブライティングは特に評判悪かった記憶

0460名無しさん＠ピンキー (ﾜｯﾁｮｲ 93e1-gcTU)

2025/12/25(木) 01:14:12.65ID:QQFUgyIz0

>>445
5090おめ
ワイの場合は１か月前だが、5090を買うぐらいならより安い予算でメモリガン積みのPCを新調したほうが良いと思い、
PCIE5.0規格に合わせてCPU,M/B,SSD全部そろえた
結果128GB+16GBでQwen3-235B-Q3が動いて世界が変わったで

というわけで128GBの下は64GBになると思うけどそれだととても勿体ないと思うよ
それにメインメモリに乗せて動かすと、やっぱりCPUパワーもそれなりに使う様だよ
財力があるならDDR4にするとか古いGPU２枚差し(これもやった)とか、変にケチらんほうがええよ

0461名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fac-rc7o)

2025/12/25(木) 03:15:04.72ID:QeIM/0Re0

古いPCでDDR4-128GB(今のPCのGPUを付け替える)にしようかと思ってたけどDDR5にすべき？
メモリってベンチマークでは差が出るけど実際にはDDR4・5変わらないって話を聞いて悩んでる
実際の所どうなんだろ？

>>460
ありがとう　ちょっと出遅れたけどキャンセルになることなくなんとか買えてさっき置き配回収した
世界が変わった、そこまでか！DDR5早い？

>>453
取り合えすStable DiffusionがメインでLLMも気になってるくらいだからまだ出せないわ
今のGemini3とnanobababaの品質ならすぐにでも買うけど多分まだまだだよね
ただ、AIさんに来年にはローカルでも同程度になるかと聞いたら、昨今のLLMの進歩を見るとなる可能性が高いとい言ってたw
しかもメモリも節約できるタイプが出るみたいな話で大変楽天的だった
場合によってはそこそこのPCを買って待つのもありじゃないかと思ったりしてる

0462名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-s35p)

2025/12/25(木) 06:13:48.93ID:xClhl67N0

5090持っててやるべきは、動画生成系だと思うよ
Stable Diffusionの生成スピードが速くなるけど、別にできないわけじゃない

0463名無しさん＠ピンキー (ﾜｯﾁｮｲ 7332-s35p)

2025/12/25(木) 07:47:15.17ID:b9l9XA760

>>461
DDR4もDDR5もLLM用途だと相対的に見ればたいした差はないよ
DDR5の新品だと今の状況だと2倍以上の価格差になるので128GBまででいいならDDR4にしてその価格差で容量増やしたほうが絶対にいい
というかDDR5の64GBの2枚が30万ってうぇぇぇ・・・・

0464名無しさん＠ピンキー (ﾜｯﾁｮｲ 5332-Fga2)

2025/12/25(木) 08:36:22.53ID:ViJl0/9F0

>>463
何？
一週間前は20万だったぞ

0465名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa9-xxTa)

2025/12/25(木) 08:45:12.33ID:gh+hQl730

2～3月前までは4万円台だったのになぁ。。

0466名無しさん＠ピンキー (ﾜｯﾁｮｲ 7332-wNtz)

2025/12/25(木) 09:16:50.67ID:6NV5/cQb0

Gemini liveが手軽なサイズでローカルに降りてくるのはいつになることやら

0467名無しさん＠ピンキー (ﾜｯﾁｮｲ 83c6-ldFF)

2025/12/25(木) 09:21:34.65ID:JzO46wCb0

昔見たPCI-Ex16にM.2 SSDを四枚挿してRAID0でSWAPdisk？だったかでメインメモリの代わりにしてデカいLLMを動かすのがいいかもしれない
PCI-E 5.0なら理論上は512Gbpsの帯域幅あるけど実際のところどうなんだろうね
まあSSDも値上がってるけど

0468名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fa6-ZCHH)

2025/12/25(木) 09:33:18.39ID:b1jcsFdf0

DDR4もどんどん生産終了になっていくとか聞いたしメモリは27年まで枯渇しっぱなしだし
数年待てないなら早く買った方がええな

0469名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fc7-SDhK)

2025/12/25(木) 10:00:01.67ID:X0ADdGKj0

こんな状況だから来年は省メモリに最適化したLLMが出てくれると嬉しいな

0470名無しさん＠ピンキー (ﾜｯﾁｮｲ 5332-s35p)

2025/12/25(木) 11:11:27.61ID:AruFNnll0

性能を上げるためにモデルを巨大化した結果、メモリ不足になったわけで
高性能かつ省メモリなモデルができるならメモリ不足も起こってないという

0471名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fa6-ZCHH)

2025/12/25(木) 11:14:04.58ID:b1jcsFdf0

でもエロ学習をどんどん弾くようになってるし自力で簡単にモデル作れる世の中になるまで絶望的な予感

0472名無しさん＠ピンキー (ﾜｯﾁｮｲ 7332-wNtz)

2025/12/25(木) 11:19:17.62ID:6NV5/cQb0

>>470
今まではメモリが調達できる状態だったからその方針で進んでいただけで
調達できなくなったらそれに適応するように方針を変えるやろ
他の分野でも必要なものが調達できなくなってからようやくその部分を代替・効率化する技術が発展するとかよくある話だし

0473名無しさん＠ピンキー (ﾜｯﾁｮｲ b3ec-+e8j)

2025/12/25(木) 11:34:40.98ID:mDnKJNz80

DDR4を入手よりも対応するマザーボードの入手が難しい
CPUやメモリは耐久性高いんだがマザーボードは大量の部品の集まりで故障しやすく中古はハイリスク

0474名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fc7-SDhK)

2025/12/25(木) 12:44:54.52ID:X0ADdGKj0

条件付きとはいえDDR4の生産終了が延期するらしい
DDR4がレガシー化してるとは言え、この動きが続けば俺としてはありがたい・・・

Samsungが主要顧客と「キャンセル・返品不可」の契約を締結しDDR4の生産終了を延期
https://gigazine.net/news/20251225-samsung-ddr4-ncnr/

0475名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f9f-1qsg)

2025/12/25(木) 13:04:02.45ID:v3s2j4YZ0

5090と192めもりあるから何かに有効活用したいけどやっぱり動画生成に向き合うのがいいのかなあ

0476名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-s35p)

2025/12/25(木) 15:30:51.40ID:xClhl67N0

あと推論じゃなく学習の方で使うとかね

0477名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr77-Ubo7)

2025/12/25(木) 18:22:22.76ID:UhzC7jVkr

なんか急にメモリ不足になってて草

0478名無しさん＠ピンキー (ﾜｯﾁｮｲ 33c0-VlN3)

2025/12/25(木) 19:04:49.75ID:AVrajHLN0

64GBx2の価格が上がりすぎて、静電気怖くてAI用PC弄れん。

0479名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f60-zXIm)

2025/12/25(木) 20:19:16.77ID:Qd+KV85l0

5090あるなら32BくらいまではQLoRAできるし画像生成系でもSDXLのfull finetuningもできるし学習なら割と遊べる

0480名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa9-xxTa)

2025/12/25(木) 21:01:08.80ID:gh+hQl730

Mac買い替えるんだけど、流石に128GBとかは買えないから買えて64GBなんだけどローカルのモデル動かすには中途半端なサイズなのかな？
LLMのこと考えなければ64GBなんて全然いらないんだけど今あるRTX5060Ti+128GB(DDR4)の環境より早くなるならありかなって。。

0481名無しさん＠ピンキー (ﾜｯﾁｮｲ a36a-Ubo7)

2025/12/25(木) 21:34:59.18ID:OB673X1y0

何したいか知らんが少ないんでは？

0482名無しさん＠ピンキー (ﾜｯﾁｮｲ 7332-wNtz)

2025/12/25(木) 21:46:29.83ID:6NV5/cQb0

LLM用途で64GBは後悔することはあっても満足することは無いと思うで

0483名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa9-xxTa)

2025/12/25(木) 22:21:30.19ID:gh+hQl730

まあそうだよね。。

0484名無しさん＠ピンキー (ﾜｯﾁｮｲ 5332-s35p)

2025/12/25(木) 22:26:38.46ID:ViJl0/9F0

うーむ。ようやく化石PCから新調したけど思ったより速度出ないな。

magnum123b iQ3k_mを旧PCで0.17t/s
同Q8_0を新PCで0.41t/s

うーん、なにか設定ミスったかな。まあ、CPUメモリだしなぁ

0485名無しさん＠ピンキー (ﾜｯﾁｮｲ 5332-s35p)

2025/12/25(木) 22:42:27.17ID:ViJl0/9F0

>>431
そちらの環境では何t/sでてますか？
こっちは1.89t/sでしたわ
GLM4.7 Q5_K_XL

新着レスの表示

レスを投稿する