なんJLLM部避難所 ★9

トップページ⇒オナテク(仮)＠bbspink掲示板

821コメント279KB

なんJLLM部避難所 ★9

0802名無しさん＠ピンキー (ﾜｯﾁｮｲ eec8-9I6X)

2025/11/06(木) 12:22:12.25ID:LlQyftbD0

>>797
俺もそう思う
あとRTX Pro 5000じゃなくて6000もう出てないっけ

0803名無しさん＠ピンキー (ﾜｯﾁｮｲ ef3f-mzUR)

2025/11/06(木) 12:42:12.94ID:lMCuk1c10

モデルを学習させたいのならRTX、
大きいのを推論させたいだけならMACでしょう

0804名無しさん＠ピンキー (ﾜｯﾁｮｲ eeca-dW62)

2025/11/06(木) 14:03:53.68ID:5ogRukTi0

みんな一体何を推論させてるんだ…夢は感じるけど具体的に何しようか自分でははっきり定められない。

0805名無しさん＠ピンキー (ｼｬﾁｰｸ 0Cbf-vgpZ)

2025/11/06(木) 14:20:52.42ID:yY5pojgmC

>>804
エロ

0806名無しさん＠ピンキー (ﾜｯﾁｮｲ 3a1a-mzUR)

2025/11/06(木) 15:04:13.91ID:H0Wl2rhX0

やっぱ推論だけじゃなくて学習させたいよなー

0807名無しさん＠ピンキー (ﾜｯﾁｮｲ 1a49-EU/t)

2025/11/06(木) 15:12:09.62ID:BwdvnsPb0

学習させようとなるとローカルではさすがにきびしい
サーバーレンタルしたほうが絶対にいい

0808名無しさん＠ピンキー (ﾜｯﾁｮｲ 7ea0-9I6X)

2025/11/06(木) 15:17:51.91ID:J8Py4Ggv0

LoRAとRAGならRAGの方が難易度高いんだよね？Super RAGだかって簡単にやってるけど、あれはLoRAじゃないの？

0809名無しさん＠ピンキー (ﾜｯﾁｮｲ 33c0-T6rd)

2025/11/06(木) 15:36:22.62ID:ELrPQp7H0

RAGはそもそも学習させてるわけじゃないし単にベクターストアとかに格納した内容を参照させてるだけだから別に難しいこともなくない？

0810名無しさん＠ピンキー (ﾜｯﾁｮｲ 3a1a-mzUR)

2025/11/06(木) 16:14:40.70ID:H0Wl2rhX0

難しいのかぁ
べつに30Bくらいのを学習できるとは思ってないけど、ちっちゃいのでもやれるといいけど
RAGのことも勉強しなければ

0811名無しさん＠ピンキー (ﾜｯﾁｮｲ 13e7-nV2F)

2025/11/06(木) 17:25:25.55ID:4cAqsVGl0

>>802
Ti SUPER相当のシリーズがRTX Proでも来るってリークあったんよ。そっちの5000PROが72GBという話。6000PRO SUPERが来るならワンチャン128GBもあるかもしれへんね

0812名無しさん＠ピンキー (ﾜｯﾁｮｲ 131c-0U8u)

2025/11/06(木) 20:09:27.05ID:OT25Em3L0

>>804 OpenHands とかで「改良しつづけよ」という雑なプロンプトで自動的にプログラムを改良してもらってる
時間かかるし、途中自分でスナップショットとって失敗に気づいてgit巻き戻して、と人間臭くて笑ってしまう
何度も失敗するから有料API使うと目の玉飛び出す金額になってしまうから、こういう用途はローカル向き

M4 Max 128G でVRAMに120GByte回してるから、python側(推論しない)は mbpで回している
120GByteでギリギリだよ。96Gだと頭の悪いLLMしか動作させられなくて結局成果物ができない
AI Max+ は Linuxなら120GByteくらい回せるらしいからワンチャン動く

0813名無しさん＠ピンキー (ﾜｯﾁｮｲ 3a5c-mzUR)

2025/11/06(木) 21:22:16.20ID:H0Wl2rhX0

96でも頭わるいのかぁ困ったな
金がいくらあっても足らん
今のM3はファインチューニング向いてないらしいけど、M5出たらそこも改善されるといいなあ

0814名無しさん＠ピンキー (ﾜｯﾁｮｲ aa32-fgZ5)

2025/11/06(木) 22:59:52.80ID:hCNcAFKl0

複数枚とか考え出すとgpuクラウドが輝いて見えだすしローカルは険しいよ

0815名無しさん＠ピンキー (ﾜｯﾁｮｲ 7e36-pnhr)

2025/11/06(木) 23:05:29.93ID:85R9xs1T0

有名なYoutuberがGPU8枚挿しでローカルLLM動かしてた気がする

0816名無しさん＠ピンキー (ﾜｯﾁｮｲ 5377-tukP)

2025/11/06(木) 23:10:03.96ID:6mI+tSJ80

火出そう

0817名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f03-mTOK)

2025/11/06(木) 23:46:10.80ID:VQ2HluPM0

クラウドで微調整するにしても最低3090以上のローカルGPUも欲しい
学習設定やデータセットをテストを小さいモデルでやるにしても全部クラウドでやると無駄に金いくらあっても足りないし微調整後の推論は結局ローカルGPUだし

0818名無しさん＠ピンキー (ﾜｯﾁｮｲ 2ac7-kIgr)

2025/11/07(金) 00:00:29.77ID:ynemYx0F0

火出そうって・・・
マイニング流行ってた頃はパワーリミットしてたとは言え、20枚挿しも珍しくなかったんだから8枚挿しくらい余裕だろ
マンションとかならともかく一軒家ならブレーカー落ちることないし

0819名無しさん＠ピンキー (ﾜｯﾁｮｲ 5377-tukP)

2025/11/07(金) 00:20:35.21ID:N23kjsAV0

マイニングとか何世代前だよ
最近ので8枚とか普通に暖房だろ
業務用サーバーレベルだぞ

0820名無しさん＠ピンキー (ﾜｯﾁｮｲ 1b32-9I6X)

2025/11/07(金) 00:42:54.98ID:s85a3z+e0

昔のGPUなら８枚でも良かったが5090を８枚なら燃えると思うｗ

0821名無しさん＠ピンキー (ﾜｯﾁｮｲ aa32-fgZ5)

2025/11/07(金) 00:57:51.64ID:/AdQkzVv0

普通の個人はパイプライン並列だろうし電源は意外と余裕ある
うちは300W gpu x2が650W電源で働かされてる

新着レスの表示

レスを投稿する