なんJLLM部 避難所 ★9
>>804 OpenHands とかで「改良しつづけよ」という雑なプロンプトで自動的にプログラムを改良してもらってる 時間かかるし、途中自分でスナップショットとって失敗に気づいてgit巻き戻して、と人間臭くて笑ってしまう 何度も失敗するから有料API使うと目の玉飛び出す金額になってしまうから、こういう用途はローカル向き M4 Max 128G でVRAMに120GByte回してるから、python側(推論しない)は mbpで回している 120GByteでギリギリだよ。96Gだと頭の悪いLLMしか動作させられなくて結局成果物ができない AI Max+ は Linuxなら120GByteくらい回せるらしいからワンチャン動く 96でも頭わるいのかぁ困ったな 金がいくらあっても足らん 今のM3はファインチューニング向いてないらしいけど、M5出たらそこも改善されるといいなあ 複数枚とか考え出すとgpuクラウドが輝いて見えだすしローカルは険しいよ 有名なYoutuberがGPU8枚挿しでローカルLLM動かしてた気がする クラウドで微調整するにしても最低3090以上のローカルGPUも欲しい 学習設定やデータセットをテストを小さいモデルでやるにしても全部クラウドでやると無駄に金いくらあっても足りないし微調整後の推論は結局ローカルGPUだし 火出そうって・・・ マイニング流行ってた頃はパワーリミットしてたとは言え、20枚挿しも珍しくなかったんだから8枚挿しくらい余裕だろ マンションとかならともかく一軒家ならブレーカー落ちることないし マイニングとか何世代前だよ 最近ので8枚とか普通に暖房だろ 業務用サーバーレベルだぞ 昔のGPUなら8枚でも良かったが5090を8枚なら燃えると思うw 普通の個人はパイプライン並列だろうし電源は意外と余裕ある うちは300W gpu x2が650W電源で働かされてる
read.cgi ver 09.0h [pink] - 2025/10/27 Walang Kapalit ★ | uplift ★ 5ちゃんねる