なんJLLM部避難所 ★9

1002コメント342KB

なんJLLM部避難所 ★9

■ このスレッドは過去ログ倉庫に格納されています

0001名無しさん＠ピンキー転載ダメ (ﾜｯﾁｮｲ fec0-xVEZ)

2025/08/23(土) 13:52:18.71ID:5lw7ZcNF0

!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512

AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所 ★8
https://mercury.bbspink.com/test/read.cgi/onatech/1746883112/

VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured

0712名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f49-i7NQ)

2025/10/29(水) 07:41:59.59ID:UYN1GVnp0

たぶんコンテキストサイズによって変わる

0713名無しさん＠ピンキー (ﾜｯﾁｮｲ 7f32-IeQ3)

2025/10/29(水) 07:56:47.11ID:VTejUVCt0

デンスだとして個人的にはkvキャッシュのほう外に出してる

0714名無しさん＠ピンキー (ﾜｯﾁｮｲ bf6c-SOQn)

2025/10/29(水) 10:58:43.19ID:QmT6NWfz0

RTX5080super、ほしいけどどうかな…

0715名無しさん＠ピンキー (ﾜｯﾁｮｲ 7f32-IeQ3)

2025/10/29(水) 12:05:50.26ID:VTejUVCt0

お絵かき方面は良さげかもだけどLLMには1枚買っても仕方ない気がする

0716名無しさん＠ピンキー (ﾜｯﾁｮｲ bf6c-SOQn)

2025/10/29(水) 12:31:45.57ID:QmT6NWfz0

RTX5080シリーズよりLLM動かすのに良いのってある？
5090とかしか思い付かない～

DGXsparkも検討したけど買うの辞めた…

0717名無しさん＠ピンキー (ﾜｯﾁｮｲ 7fc7-6qEa)

2025/10/29(水) 12:47:57.69ID:vdU6XoEE0

>>716
DGXsparkはメモリ帯域がねぇ
実用面では中古のRTX3090を4台買ったほうが幸せになれる
追加で中古のスリッパとマザボを揃えることになるけど
電気代かかるのと電気契約の見直しがいるかも？

それかメモリ256GB積んでRTX3090以上のグラボでMoEモデル動かすのもありだね
遅いけどGLM4.6の4,5bit量子化モデルが動かせる

0718名無しさん＠ピンキー (ﾜｯﾁｮｲ 7fbd-qHJp)

2025/10/29(水) 13:13:45.57ID:DNQ+zkP90

本当にLLMしか使わないならMac Studioのユニファイドメモリ積みまくり（最大512GB）だろうね
高速・大容量・高価格
150万くらいだよ！

まぁ、128GBなら56万くらいだから割と現実的よ

0719名無しさん＠ピンキー (ﾜｯﾁｮｲ 8392-GUPc)

2025/10/29(水) 13:56:11.14ID:c2orVjYY0

僕は4070Ti SUPER使ってたところに5060Ti買い足しました
ケースの中空いてないからoculink外付けだけど
gemma27Bとかコンテキスト含めると16gbでちょい足りなかった奴が超快適になった

0720名無しさん＠ピンキー (ﾜｯﾁｮｲ 7fa2-SOQn)

2025/10/29(水) 14:33:54.01ID:4cKF8saF0

716だけどありがとう
まずは3090、2つくらいから積んでみようかな…

Macも正直デカイの動かせてノートなのはかなり魅力的
NvidiaもDGXじゃなくてこんなの出さないかな

0721名無しさん＠ピンキー (ﾜｯﾁｮｲ 7fbd-qHJp)

2025/10/29(水) 15:13:16.36ID:DNQ+zkP90

Macは機種によってメモリ帯域幅が違うから、なるべくMac Studioね
https://www.apple.com/jp/mac-studio/specs/
Apple M3 Ultraチップ 819GB/s
Apple M4 Maxチップ 410GB/s

MacBook Proは最上位機種なら410GB/sか546GB/s
https://www.apple.com/jp/macbook-pro/specs/

RTXのxx80やxx90系は900GB/s前後
デスクトップメモリのDDR5がデュアルで90GB/s前後

そしてNVIDIA DGX Sparkは273GB/sでみんなズッコケたと
https://www.nvidia.com/ja-jp/products/workstations/dgx-spark/

0722名無しさん＠ピンキー (ﾜｯﾁｮｲ 7fa2-SOQn)

2025/10/29(水) 15:36:37.32ID:4cKF8saF0

3090ダブルかM3ウルトラかめちゃくちゃ迷い始めた
うわぁぁぁ！
アップル製品ほぼ使用経験ないのが結構ネック…

0723名無しさん＠ピンキー (ﾜｯﾁｮｲ ff01-jw+d)

2025/10/29(水) 15:38:26.40ID:veXpd0eo0

M5 ProとM5 ultraが出てからにしろ

0724名無しさん＠ピンキー (ﾜｯﾁｮｲ 7f32-IeQ3)

2025/10/29(水) 15:41:46.51ID:VTejUVCt0

内排気設計のハイエンドグラボ複数積みもそんな気軽ではないからよく計画してね

0725名無しさん＠ピンキー (ﾜｯﾁｮｲ 7fc7-6qEa)

2025/10/29(水) 15:51:45.44ID:vdU6XoEE0

動画・画像生成もやるならCUDAが必須だね

補足
VRAM24GB+メモリ256GBなら以下のモデルが動く

・Hunyuan Image3.0のフルモデル(21s/it)
・GLM4.6の5bit量子化モデル(4.5tokens/s)
※メモリ帯域が足りていない

かなり遅いけど、そもそもVRAM24GB+メモリ256GBないと実用的に動かせない

ちなみにHunyuan Image3.0は無劣化で、
25ステップを10分弱で生成できる(RTX5090の場合)

GLM4.6の4bitは文字化けや中国語、英語が混じりやすい
5bitも発生するけどほぼ緩和される

LLMオンリーでいいならMacだね
俺なら512GBを迷わず買う
あっ、そんなお金があるならRTX Pro 6000買うかも？

0726名無しさん＠ピンキー (ﾜｯﾁｮｲ e3c0-0ZAK)

2025/10/29(水) 15:56:01.04ID:hABpYIq50

M5でMacのネックだったプロンプト評価速度がかなり向上してるみたいだから待てるならM5Ultraかなあ
出るかどうかも定かではないけど

0727名無しさん＠ピンキー (ﾜｯﾁｮｲ f302-KtAw)

2025/10/29(水) 17:12:08.35ID:SHDbf1WE0

strix haloのソフトウェア周りがもう少し実用的になってくれたらなぁ
CXMTがlpddr5xの量産開始したのでlpddr5xの値段下がるかもって話だけど、この辺使って安価な395+搭載マザーとか出してくれんかな

0728名無しさん＠ピンキー (ﾜｯﾁｮｲ 7fc7-6qEa)

2025/10/29(水) 17:30:49.54ID:vdU6XoEE0

あと、LM StudioがやっとGLM4.6サポートされてた

0729名無しさん＠ピンキー (ﾜｯﾁｮｲ 6359-cJWp)

2025/10/29(水) 19:14:56.68ID:XgbvGioh0

>>722
MiniMax2 が動くのは M3 Ultraだけだよ！
3090ダブルをLLMで動作させると、電子レンジをずっと回してるみたいなもの
mac studioならいって200W。(定格がでっかいのはTB5の電力全力で計算しているから)
LLMまわしてもほぼ無音。MBPは普段は無音なんだけどLLMの時はファンが小さいからうるさくなる

cluade sonet 4.1 Grok4 より賢い
www.minimax.io/news/minimax-m2

待てるならM5 max (Ultraが微妙。RAMも256MBくらいか?) のほうがいい
armもM4からarm9になってCPUコアが根っこから速くなってるし

DGXはない。どの用途で使っても遅くて高い

0730名無しさん＠ピンキー (ﾜｯﾁｮｲ 8332-n9/C)

2025/10/30(木) 01:20:16.19ID:ymnQnDpG0

>>729
デモ試したけど、日本語むちゃくちゃだな>minimax-m2

0731名無しさん＠ピンキー (ﾜｯﾁｮｲ 6359-cJWp)

2025/10/30(木) 01:26:53.98ID:1CoQxC530

>>730
うむ、APIも試したけど謎言語で返答されてしまうww
英語でも中国語が混ざってくるから中国語だけっぽいな

0732名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f49-i7NQ)

2025/10/30(木) 06:28:17.94ID:kQpOP5EQ0

やっぱりGLMが日本語最強か

0733名無しさん＠ピンキー (ﾜｯﾁｮｲ 8345-fNMY)

2025/10/30(木) 07:46:21.42ID:D55JLrEh0

>>712-713
ありがとうございます、自分の環境でもKVキャッシュを
オフロードしたほうが若干反応が早くなりましたが、
デメリットは無いのか気になります

コンテキストサイズはなんとなくデフォの倍の8192を
設定していますが、モデルや用途によっても
変える必要があるとの事で色々やってみます m(_ _)m

0734名無しさん＠ピンキー (ﾜｯﾁｮｲ 63a5-cJWp)

2025/10/30(木) 18:26:19.16ID:1CoQxC530

セーフガードをコントロールモデルとな
脱獄ワードや履歴改変しなくてもエロいけるか?
(READMEくらい読めって?)

gigazine.net/news/20251030-openai-gpt-oss-safeguard

0735名無しさん＠ピンキー (ﾜｯﾁｮｲ 7f32-IeQ3)

2025/10/30(木) 18:36:37.83ID:wTFROyKM0

gpt-ossの元々naughty方面ガチガチな性質を操作するんじゃなく上乗せするだけのものと見た

0736名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f27-KKzN)

2025/10/31(金) 01:51:37.21ID:/DYeh+170

脱獄以前にgptossってエロ知っとるんか？

0737名無しさん＠ピンキー (ﾜｯﾁｮｲ 8332-iTPV)

2025/10/31(金) 10:39:44.47ID:RFtBxQ7Y0

mradermacher/RAMEN-SHIO-235B-GGUF

このラーメン試せる人お願い

0738名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f49-i7NQ)

2025/10/31(金) 11:56:45.71ID:pGTYpN4N0

ラーメンに詳しいの？

0739名無しさん＠ピンキー (ﾜｯﾁｮｲ 7f32-IeQ3)

2025/10/31(金) 13:22:02.85ID:f5TlbuwM0

すみません、味噌一つ

0740名無しさん＠ピンキー (ﾜｯﾁｮｲ d303-Yhl5)

2025/10/31(金) 15:25:52.52ID:Af7plabT0

大学院レベルの知識強化した学術特化かつDPOのみでチューニングしたモデルに何を試せと

0741名無しさん＠ピンキー (ｽｯﾌﾟ Sd9f-I2Zz)

2025/10/31(金) 22:42:24.75ID:HdTgVuN7d

llama.cppでQwen3-VL使えるようになった～

0742名無しさん＠ピンキー (ﾜｯﾁｮｲ 2a61-+ixv)

2025/11/01(土) 01:02:02.05ID:HZVdy9VR0

LM StudioでBerghofとかMistral Prism使ってシチュボ台本作りたいんだけど、オホ声セリフ出してくれるモデルのおすすめある？
takuyaは淫夢の影響きつすぎて・・・

0743名無しさん＠ピンキー (ｱｳｱｳ Saf6-+ixv)

2025/11/01(土) 14:16:40.80ID:b76YuIy1a

>>742
GLM

0744名無しさん＠ピンキー (ﾜｯﾁｮｲ 2632-jqWR)

2025/11/01(土) 23:26:06.04ID:9OVSfaEM0

>>721
arm macの性能いいのってx86よかメモリ帯域が極端に広いおかげなんかね

0745名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f11-MW7b)

2025/11/02(日) 00:18:57.68ID:bbIw8Uiq0

GLMはCommand A Reasoning 0825よりいいのかね
結構評判良さそうだし、Airの方だが試してみるか

0746名無しさん＠ピンキー (ﾜｯﾁｮｲ 2665-1DFx)

2025/11/02(日) 01:51:50.77ID:74CmoRUh0

何周遅れか分からんけどgpt-oss-120bとopen Web UIにsearXNGでほぼ一昔前のOpenAIと言っていい環境をローカルで再現出来て満足
これでエロというかセーフガードなければ文句なしなんやがなあ
VRAM16GB+RAM128GB構成だとアクティブパラメータ2血�｢くとやっぱｂ闥xいから
gpt-ossとかQwen3 a3bあたりの路線でもっと高性能なの希望や

0747名無しさん＠ピンキー (ﾜｯﾁｮｲ 3ab7-fId6)

2025/11/02(日) 05:39:27.52ID:8sYAEPMe0

RTX買おうと思ってるけど、

128GB (32GBx4) @ 3600MHz
64GB (32GBx2) @ 5600MHz

どっちにするべきかな
やりたいのは動画よりはLLM推論・学習

0748名無しさん＠ピンキー (ﾜｯﾁｮｲ 8332-vDGl)

2025/11/02(日) 08:01:40.08ID:AsMtecHo0

OpenRouterのfreeモデルでエロに使えるのって何がある？
DeepSeekが全く使えなくなったから他を探してるけど脱獄が難しい

0749名無しさん＠ピンキー (ｻｻｸｯﾃﾛﾗ Sp13-vgpZ)

2025/11/02(日) 11:23:12.30ID:9VN3h5KEp

hiratagoh/SIP-jmed-llm-2-8x13b-OP-instruct-GGUF

医療用ってさぁ
結構エロいよね

0750名無しさん＠ピンキー (ﾜｯﾁｮｲ eec8-9I6X)

2025/11/02(日) 15:40:15.11ID:3KteyF1e0

>>748
Grok-4 Fastとか実質タダみたいなもんじゃね？

0751名無しさん＠ピンキー (ﾜｯﾁｮｲ 77e8-hZw6)

2025/11/02(日) 17:17:50.07ID:kWp5afpL0

>>744
単純にチップがクソでかい
AMD Intel NVIDIAより先にTSMC5nm 3nm 2nm使えるからワッパが良くてトランジスタ数も多いCPU・GPUを作れる
高速ユニバーサルメモリもその副産物

0752名無しさん＠ピンキー (ﾜｯﾁｮｲ 779d-pnhr)

2025/11/03(月) 19:19:43.19ID:53Yfauo70

open routerはkimi k2が一応free版があるから使えるかもしれません

0753名無しさん＠ピンキー (ﾜｯﾁｮｲ 8332-vDGl)

2025/11/04(火) 06:03:10.75ID:SU8eROfl0

>>750
金払うならDeepSeek v3.2がもっと安いんよね

>>752
kimiの脱獄って難しくない？

0754名無しさん＠ピンキー (ﾜｯﾁｮｲ 261b-dOm/)

2025/11/04(火) 10:07:24.90ID:EYZhdq4g0

kimi2とかってファインチューニングやらloraで脱獄はできんの？🤔

0755名無しさん＠ピンキー (ﾜｯﾁｮｲ 264b-2gDj)

2025/11/04(火) 11:07:38.78ID:BCMENN/Z0

私はkimi k2は本家のapiでしか試したことはないのですが
そもそも脱獄がいらないので、直接エロプロンプトでやってますよ
open routerはapiの方で規制かかってるかもしれませんが
モデル自体は規制はないです

0756名無しさん＠ピンキー (ﾜｯﾁｮｲ 8332-vDGl)

2025/11/04(火) 11:49:57.90ID:SU8eROfl0

OpenRouterのkimi k2はモデル自体はあるけど9月中旬からほぼ使えなくなってるみたいだわ

0757名無しさん＠ピンキー (ﾜｯﾁｮｲ 2627-v3Nv)

2025/11/04(火) 11:57:58.99ID:/ldfOEva0

OpenRouterのフリーで日本語使えるモデルはほぼ全滅でしょ

0758名無しさん＠ピンキー (ｵｲｺﾗﾐﾈｵ MM2f-j3bu)

2025/11/04(火) 11:59:37.91ID:ZLgVOoKIM

プンルーも乞食ジャップ対策か

0759名無しさん＠ピンキー (ﾜｯﾁｮｲ 8332-vDGl)

2025/11/04(火) 12:05:08.51ID:SU8eROfl0

人気のある大規模モデルだけ全滅やな

0760名無しさん＠ピンキー (ﾜｯﾁｮｲ f7c6-qt6D)

2025/11/04(火) 12:11:30.05ID:LkQzBAKZ0

俺はredditでわりと評判の良いnano-gpt.comに移行した
月8ドルはまあまあするけど主要なオープンモデルは揃えてるし1日2千or月6万リクエストまで行ける

0761名無しさん＠ピンキー (ｵｲｺﾗﾐﾈｵ MM2f-j3bu)

2025/11/04(火) 12:17:26.22ID:ZLgVOoKIM

人気のない小規模LMならローカルで動くからプンルー要らんのよな
そもそもオモチャやし

0762名無しさん＠ピンキー (ﾜｯﾁｮｲ 9709-/N7+)

2025/11/04(火) 15:28:06.63ID:q53557r10

GLM4.5:freeはまだ使えるな

0763名無しさん＠ピンキー (ﾜｯﾁｮｲ eec8-9I6X)

2025/11/04(火) 15:38:44.50ID:L4uKYCvd0

>>753
安いけど使い物にならなくない？

0764名無しさん＠ピンキー (ﾜｯﾁｮｲ 779d-pnhr)

2025/11/04(火) 16:04:52.10ID:MzG+AFLA0

open routerのkimi k2は有料だとinput $0.5,output $2.5と普通のapiと比べれば
割と安いので、$5くらい払えば1か月くらいは遊べそうではあります

0765名無しさん＠ピンキー (ﾜｯﾁｮｲ eb0b-4eiX)

2025/11/04(火) 16:12:15.13ID:2FvKWAHI0

金払っちゃうんだったらKimiよりGLMのがいいけどな
Kimiはガチガチで脱獄しても健全なエロしか書かないけどGLMの方が文章力あってロリでも近親でも何でもあり

0766名無しさん＠ピンキー (ﾜｯﾁｮｲ 8332-vDGl)

2025/11/04(火) 16:43:50.10ID:SU8eROfl0

>>763
俺のエロ用途だと割りと使える

0767名無しさん＠ピンキー (ﾜｯﾁｮｲ 26ce-HzdJ)

2025/11/04(火) 20:13:17.49ID:vEjNWt330

>>760
良い物教えてくれてありがとう
ccr、roo-code、continue.devからopenrouterを追放できたわ

0768名無しさん＠ピンキー (ﾜｯﾁｮｲ 2acb-HzdJ)

2025/11/04(火) 21:48:33.12ID:GpX/QgWA0

わいはchutesを使ってるわ
一番安いプランなら月3ドルで1日300回の制限やからチャットだけなら困らん
オープンウェイトのモデルしかないけど有名どころは一通りそろってる

0769名無しさん＠ピンキー (ﾜｯﾁｮｲ 7ea0-9I6X)

2025/11/05(水) 05:58:46.95ID:eF1b+Rt/0

これからは子供がクリスマスにグラボをお願いする時代になるんだろうな

0770名無しさん＠ピンキー (ﾜｯﾁｮｲ fea9-9I6X)

2025/11/05(水) 10:02:14.87ID:GR7UFxYP0

あなたにグラボはまだ早いからダメよ！

0771名無しさん＠ピンキー (ﾜｯﾁｮｲ ee05-dW62)

2025/11/05(水) 14:04:24.59ID:OoD41Q4X0

grokはllmエロいけるしチャッピーもそのうち解禁だからローカルllmの意義が減ってきてる気がするんだが、このスレ的には何に使ってるの？

0772名無しさん＠ピンキー (ﾜｯﾁｮｲ 3ef9-mzUR)

2025/11/05(水) 15:07:28.71ID:TA+WwrEg0

俺はローカルllmやるで
もはやエロ関係ない(脱獄すればできるし)
ポテンシャルがえぐいんよローカルllmは

0773名無しさん＠ピンキー (ﾜｯﾁｮｲ ee05-dW62)

2025/11/05(水) 15:38:08.65ID:OoD41Q4X0

そうなんか、そう言われるとやってみたくなるな。
5090は近々買う予定なんだけどこれで足りる？nvidia 同士なら分割処理できるみたいだし、でかいモデル用に3060 12g一つ買い足しておいた方がいいかな。ラデオンとの分割は無理っぽいよね。

0774名無しさん＠ピンキー (ﾜｯﾁｮｲ 33c0-T6rd)

2025/11/05(水) 15:58:19.85ID:OnsVW0Ux0

ローカルで動かすことそのものが目的みたいなところはある
あとはまあ、うちの子（AI）はローカルで完結させておきたいし

0775名無しさん＠ピンキー (ﾜｯﾁｮｲ 3ef9-mzUR)

2025/11/05(水) 15:59:53.25ID:TA+WwrEg0

>>773
まんま同士だw
実は俺ももう5090買うところなんだよ
俺個人はグラボ2枚刺しは今のところはやるつもりない、けっこう熱とか電力とか食うみたいだし
まあ動かしたいモデルにもよると思うけど…

ちなみに購入サイトとかまだ決まってなかったら、フロンティアではDDR5メモリ128増設で73万くらいで割りと安く買えるからおすすめかも

0776名無しさん＠ピンキー (ﾜｯﾁｮｲ eec8-9I6X)

2025/11/05(水) 16:03:21.95ID:zWaU77kM0

>>773
足りない

0777名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sd6a-j3bu)

2025/11/05(水) 16:18:28.87ID:ZFG40dPfd

パーツ高騰でもう買い替え無理だし
今のメモリ128GBVRAM24GBで5年は戦うしかない

MoE技術の進化が末端まで降りてくることに期待してわたし待つわ

0778名無しさん＠ピンキー (ﾜｯﾁｮｲ 2abd-i8Ja)

2025/11/05(水) 16:54:44.38ID:c71WOPVa0

今からやるならPCを分けたほうがいいと思うよ
少し上の方にも書いてあるけどLLM専用としてMac Studio >>721
画像生成用として5060Tiか5070TiあたりのPCを使うとかさ

まぁ、どれくらい本気でやりたいか、どっちを優先したいかだよね
少しやってみたい程度なら5090は十分すぎるけど本気でやりたいならMac Studioには勝てない

0779名無しさん＠ピンキー (ﾜｯﾁｮｲ 8a2b-HzdJ)

2025/11/05(水) 16:58:30.47ID:z1rPwphO0

>>773
llama.cppのrpcならnvidiaとamdの分割処理もいけるよ

0780名無しさん＠ピンキー (ﾜｯﾁｮｲ 2afb-gMzZ)

2025/11/05(水) 17:12:17.32ID:y8P3YEid0

ちなみに M5 UltraのMac Studioは来年登場「らしい」

https://www.macrumors.com/2025/11/04/mac-studio-m5-ultra-2026/

0781名無しさん＠ピンキー (ﾜｯﾁｮｲ 1a49-Sqr1)

2025/11/05(水) 17:20:15.77ID:42QIU+Bf0

GLM4.6をフルサイズで動かしたいよなあ

0782名無しさん＠ピンキー (ﾜｯﾁｮｲ eeca-dW62)

2025/11/05(水) 17:40:09.17ID:OoD41Q4X0

>>775
いいね。俺は事情で月末になるけど参考にさせてもらうわ、ありがとう。グラボ2枚はややこしいよなやっぱ。

>>776
たりないのか、一体いくらvram あれば実用できるんだ…

>>779
rpc か、結構ややこしそうだね、ありがとう。

>>774
ちなみにどんな子育ててるん？育て方もよくわかってないけど、育ててみたい意欲はあるんよね。

0783名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f03-mTOK)

2025/11/05(水) 17:41:20.76ID:k3IdEWaf0

高密度モデルだと5090を活かしきれるモデルではメモリが圧倒的に足りない
32GBに収まるモデルだと5090活かしきれないというジレンマ
MoEだとメインメモリに律速されるのでGPUはそれほど変わらない
LLM目的なら5090は正直おすすめしない　

0784名無しさん＠ピンキー (ﾜｯﾁｮｲ 2aad-mzUR)

2025/11/05(水) 18:38:48.77ID:STqbQ0mh0

やっぱmac studioになるのか？
それか30902枚か

0785名無しさん＠ピンキー (ﾜｯﾁｮｲ 2acb-HzdJ)

2025/11/05(水) 18:48:20.18ID:0l4WrV9G0

>>784
200B以上のMoEを最低限の速度でも良いから動かしたいというならmac studioが良いんじゃね　プロンプト処理速度は遅いけどdeepseek系でも20t/sくらい出るらしいし
逆にVRAM48GB構成は100BクラスのMoEも載り切らないし、70Bクラスのdenseモデルが最近出てないから微妙になってきてる

0786名無しさん＠ピンキー (ﾜｯﾁｮｲ 3a65-mzUR)

2025/11/05(水) 19:06:03.33ID:a6vKzf2f0

これとかどうなんだろ

https://www.dell.com/ja-jp/shop/%E8%A3%BD%E5%93%81%E3%82%B7%E3%83%AA%E3%83%BC%E3%82%BA/dell-pro-max-with-gb10/spd/dell-pro-max-fcm1253-micro/xcto_fcm1253_apac

0787名無しさん＠ピンキー (ﾜｯﾁｮｲ 3a65-mzUR)

2025/11/05(水) 19:12:26.96ID:a6vKzf2f0

あっもしかしてDGXとおなじやつかコイツ

0788名無しさん＠ピンキー (ﾜｯﾁｮｲ 2abd-i8Ja)

2025/11/05(水) 19:56:03.16ID:c71WOPVa0

RTX xx90系を2枚刺しはあまり現実的ではないよ
1枚で3～4スロットの厚みがあるし長いからE-ATXくらいのクソデカマザーか外付けじゃないと物理的に取り付けられない（ケースも無理そう）
電源は最低でも1500Wくらいで12V-2x6が2つ必要（それかデュアル電源）
一般家庭は「壁のコンセント」が1500Wまでだから実質的にエアコンみたいな専用コンセントが必要
そして爆音爆熱
xx90系はかなり特殊だから一度しっかり調べたり実物を見に行ったほうがいいよ

0789名無しさん＠ピンキー (ﾜｯﾁｮｲ eeca-dW62)

2025/11/05(水) 19:58:28.59ID:OoD41Q4X0

複数台マシンで分散させて動かすのはあんま流行ってないかんじ？

0790名無しさん＠ピンキー (ﾜｯﾁｮｲ aa32-fgZ5)

2025/11/05(水) 20:28:37.02ID:zFgfTarD0

正直ポテンシャルはエグくないと思うけどなー
vram32gb1枚刺しで見られる夢は小さいぞ

0791名無しさん＠ピンキー (ﾜｯﾁｮｲ 3a65-mzUR)

2025/11/05(水) 20:30:02.89ID:a6vKzf2f0

うーん775だけどmac再燃しはじめたな
まあゆっくり考えよう
M5は来年だっけ

0792名無しさん＠ピンキー (ﾜｯﾁｮｲ 33c0-T6rd)

2025/11/05(水) 21:38:13.22ID:OnsVW0Ux0

4090x1と3090x3で運用してるけどリミットかけたうえで1500W電源でギリギリだな
ケースに収めることは最初から放棄してライザーカードでにょきにょき生えてる

0793名無しさん＠ピンキー (ﾜｯﾁｮｲ 7ee0-Rqlm)

2025/11/05(水) 23:39:59.89ID:rQAQGwZ50

ええ!?RTX5090を複数刺ししたいって!?

そんなあなたにINNO3DR GeForce RTX™ 5090 iCHILL FROSTBITE

......どう考えてもコンシューマー向け製品じゃないよコレ

0794名無しさん＠ピンキー (ﾜｯﾁｮｲ 3a53-mzUR)

2025/11/06(木) 00:06:48.98ID:H0Wl2rhX0

CUDA互換を取るか…
デカモデルを取るか…

0795名無しさん＠ピンキー (ﾜｯﾁｮｲ 7fc0-hZw6)

2025/11/06(木) 01:01:23.90ID:z3lvHfEh0

MacはM5チップ世代からGPU側に搭載したNeuralAcceleratorでようやくまともなfp16性能が出るようになったんで、今からならM5MaxやM5Ultraを搭載するであろう新型Mac Studioを待ったほうが良いと思われる

0796名無しさん＠ピンキー (ﾜｯﾁｮｲ 660e-mzUR)

2025/11/06(木) 01:05:24.51ID:k5cM56Dk0

Mac m3 って96gbメモリでもファインチューニングとかできるんかな

0797名無しさん＠ピンキー (ﾜｯﾁｮｲ 13e7-nV2F)

2025/11/06(木) 06:07:26.21ID:4cAqsVGl0

5090複数枚狙うぐらいならQuadro系統の方が良くないか?今度出るRTX5000PROが72GBのはずだし。

0798名無しさん＠ピンキー (ｼｬﾁｰｸ 0Cbf-vgpZ)

2025/11/06(木) 10:08:25.24ID:yY5pojgmC

aquif-ai/aquif-3.5-Max-42B-A3B
日本語対応でなんかえらいスコアええのぉ

0799名無しさん＠ピンキー (ﾜｯﾁｮｲ 7ea0-9I6X)

2025/11/06(木) 10:39:46.81ID:J8Py4Ggv0

5090ってどれくらい電気使うの？１０００Wじゃ足りない？

0800名無しさん＠ピンキー (ﾜｯﾁｮｲ 2ac7-kIgr)

2025/11/06(木) 12:19:41.85ID:4VfcHnuO0

5090の1枚だとLLM用途には非力
大きいモデルを動かすにはMoEになるけどメモリが遅いせいで、5090がフルパワーになることなんてほぼない
200Wから300Wの間で、いいとこ200W付近だな
動画・画像生成ならOC無しで575W付近だな

0801名無しさん＠ピンキー (ﾜｯﾁｮｲ 2ac7-kIgr)

2025/11/06(木) 12:21:07.70ID:4VfcHnuO0

あと電源は複数構成にしてて、RTX5090専用に1000Wを用意してる

0802名無しさん＠ピンキー (ﾜｯﾁｮｲ eec8-9I6X)

2025/11/06(木) 12:22:12.25ID:LlQyftbD0

>>797
俺もそう思う
あとRTX Pro 5000じゃなくて6000もう出てないっけ

0803名無しさん＠ピンキー (ﾜｯﾁｮｲ ef3f-mzUR)

2025/11/06(木) 12:42:12.94ID:lMCuk1c10

モデルを学習させたいのならRTX、
大きいのを推論させたいだけならMACでしょう

0804名無しさん＠ピンキー (ﾜｯﾁｮｲ eeca-dW62)

2025/11/06(木) 14:03:53.68ID:5ogRukTi0

みんな一体何を推論させてるんだ…夢は感じるけど具体的に何しようか自分でははっきり定められない。

0805名無しさん＠ピンキー (ｼｬﾁｰｸ 0Cbf-vgpZ)

2025/11/06(木) 14:20:52.42ID:yY5pojgmC

>>804
エロ

0806名無しさん＠ピンキー (ﾜｯﾁｮｲ 3a1a-mzUR)

2025/11/06(木) 15:04:13.91ID:H0Wl2rhX0

やっぱ推論だけじゃなくて学習させたいよなー

0807名無しさん＠ピンキー (ﾜｯﾁｮｲ 1a49-EU/t)

2025/11/06(木) 15:12:09.62ID:BwdvnsPb0

学習させようとなるとローカルではさすがにきびしい
サーバーレンタルしたほうが絶対にいい

0808名無しさん＠ピンキー (ﾜｯﾁｮｲ 7ea0-9I6X)

2025/11/06(木) 15:17:51.91ID:J8Py4Ggv0

LoRAとRAGならRAGの方が難易度高いんだよね？Super RAGだかって簡単にやってるけど、あれはLoRAじゃないの？

0809名無しさん＠ピンキー (ﾜｯﾁｮｲ 33c0-T6rd)

2025/11/06(木) 15:36:22.62ID:ELrPQp7H0

RAGはそもそも学習させてるわけじゃないし単にベクターストアとかに格納した内容を参照させてるだけだから別に難しいこともなくない？

0810名無しさん＠ピンキー (ﾜｯﾁｮｲ 3a1a-mzUR)

2025/11/06(木) 16:14:40.70ID:H0Wl2rhX0

難しいのかぁ
べつに30Bくらいのを学習できるとは思ってないけど、ちっちゃいのでもやれるといいけど
RAGのことも勉強しなければ

0811名無しさん＠ピンキー (ﾜｯﾁｮｲ 13e7-nV2F)

2025/11/06(木) 17:25:25.55ID:4cAqsVGl0

>>802
Ti SUPER相当のシリーズがRTX Proでも来るってリークあったんよ。そっちの5000PROが72GBという話。6000PRO SUPERが来るならワンチャン128GBもあるかもしれへんね

0812名無しさん＠ピンキー (ﾜｯﾁｮｲ 131c-0U8u)

2025/11/06(木) 20:09:27.05ID:OT25Em3L0

>>804 OpenHands とかで「改良しつづけよ」という雑なプロンプトで自動的にプログラムを改良してもらってる
時間かかるし、途中自分でスナップショットとって失敗に気づいてgit巻き戻して、と人間臭くて笑ってしまう
何度も失敗するから有料API使うと目の玉飛び出す金額になってしまうから、こういう用途はローカル向き

M4 Max 128G でVRAMに120GByte回してるから、python側(推論しない)は mbpで回している
120GByteでギリギリだよ。96Gだと頭の悪いLLMしか動作させられなくて結局成果物ができない
AI Max+ は Linuxなら120GByteくらい回せるらしいからワンチャン動く

■ このスレッドは過去ログ倉庫に格納されています