なんJLLM部避難所 ★9

1002コメント342KB

なんJLLM部避難所 ★9

■ このスレッドは過去ログ倉庫に格納されています

0001名無しさん＠ピンキー転載ダメ (ﾜｯﾁｮｲ fec0-xVEZ)

2025/08/23(土) 13:52:18.71ID:5lw7ZcNF0

!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512

AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所 ★8
https://mercury.bbspink.com/test/read.cgi/onatech/1746883112/

VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured

0784名無しさん＠ピンキー (ﾜｯﾁｮｲ 2aad-mzUR)

2025/11/05(水) 18:38:48.77ID:STqbQ0mh0

やっぱmac studioになるのか？
それか30902枚か

0785名無しさん＠ピンキー (ﾜｯﾁｮｲ 2acb-HzdJ)

2025/11/05(水) 18:48:20.18ID:0l4WrV9G0

>>784
200B以上のMoEを最低限の速度でも良いから動かしたいというならmac studioが良いんじゃね　プロンプト処理速度は遅いけどdeepseek系でも20t/sくらい出るらしいし
逆にVRAM48GB構成は100BクラスのMoEも載り切らないし、70Bクラスのdenseモデルが最近出てないから微妙になってきてる

0786名無しさん＠ピンキー (ﾜｯﾁｮｲ 3a65-mzUR)

2025/11/05(水) 19:06:03.33ID:a6vKzf2f0

これとかどうなんだろ

https://www.dell.com/ja-jp/shop/%E8%A3%BD%E5%93%81%E3%82%B7%E3%83%AA%E3%83%BC%E3%82%BA/dell-pro-max-with-gb10/spd/dell-pro-max-fcm1253-micro/xcto_fcm1253_apac

0787名無しさん＠ピンキー (ﾜｯﾁｮｲ 3a65-mzUR)

2025/11/05(水) 19:12:26.96ID:a6vKzf2f0

あっもしかしてDGXとおなじやつかコイツ

0788名無しさん＠ピンキー (ﾜｯﾁｮｲ 2abd-i8Ja)

2025/11/05(水) 19:56:03.16ID:c71WOPVa0

RTX xx90系を2枚刺しはあまり現実的ではないよ
1枚で3～4スロットの厚みがあるし長いからE-ATXくらいのクソデカマザーか外付けじゃないと物理的に取り付けられない（ケースも無理そう）
電源は最低でも1500Wくらいで12V-2x6が2つ必要（それかデュアル電源）
一般家庭は「壁のコンセント」が1500Wまでだから実質的にエアコンみたいな専用コンセントが必要
そして爆音爆熱
xx90系はかなり特殊だから一度しっかり調べたり実物を見に行ったほうがいいよ

0789名無しさん＠ピンキー (ﾜｯﾁｮｲ eeca-dW62)

2025/11/05(水) 19:58:28.59ID:OoD41Q4X0

複数台マシンで分散させて動かすのはあんま流行ってないかんじ？

0790名無しさん＠ピンキー (ﾜｯﾁｮｲ aa32-fgZ5)

2025/11/05(水) 20:28:37.02ID:zFgfTarD0

正直ポテンシャルはエグくないと思うけどなー
vram32gb1枚刺しで見られる夢は小さいぞ

0791名無しさん＠ピンキー (ﾜｯﾁｮｲ 3a65-mzUR)

2025/11/05(水) 20:30:02.89ID:a6vKzf2f0

うーん775だけどmac再燃しはじめたな
まあゆっくり考えよう
M5は来年だっけ

0792名無しさん＠ピンキー (ﾜｯﾁｮｲ 33c0-T6rd)

2025/11/05(水) 21:38:13.22ID:OnsVW0Ux0

4090x1と3090x3で運用してるけどリミットかけたうえで1500W電源でギリギリだな
ケースに収めることは最初から放棄してライザーカードでにょきにょき生えてる

0793名無しさん＠ピンキー (ﾜｯﾁｮｲ 7ee0-Rqlm)

2025/11/05(水) 23:39:59.89ID:rQAQGwZ50

ええ!?RTX5090を複数刺ししたいって!?

そんなあなたにINNO3DR GeForce RTX™ 5090 iCHILL FROSTBITE

......どう考えてもコンシューマー向け製品じゃないよコレ

0794名無しさん＠ピンキー (ﾜｯﾁｮｲ 3a53-mzUR)

2025/11/06(木) 00:06:48.98ID:H0Wl2rhX0

CUDA互換を取るか…
デカモデルを取るか…

0795名無しさん＠ピンキー (ﾜｯﾁｮｲ 7fc0-hZw6)

2025/11/06(木) 01:01:23.90ID:z3lvHfEh0

MacはM5チップ世代からGPU側に搭載したNeuralAcceleratorでようやくまともなfp16性能が出るようになったんで、今からならM5MaxやM5Ultraを搭載するであろう新型Mac Studioを待ったほうが良いと思われる

0796名無しさん＠ピンキー (ﾜｯﾁｮｲ 660e-mzUR)

2025/11/06(木) 01:05:24.51ID:k5cM56Dk0

Mac m3 って96gbメモリでもファインチューニングとかできるんかな

0797名無しさん＠ピンキー (ﾜｯﾁｮｲ 13e7-nV2F)

2025/11/06(木) 06:07:26.21ID:4cAqsVGl0

5090複数枚狙うぐらいならQuadro系統の方が良くないか?今度出るRTX5000PROが72GBのはずだし。

0798名無しさん＠ピンキー (ｼｬﾁｰｸ 0Cbf-vgpZ)

2025/11/06(木) 10:08:25.24ID:yY5pojgmC

aquif-ai/aquif-3.5-Max-42B-A3B
日本語対応でなんかえらいスコアええのぉ

0799名無しさん＠ピンキー (ﾜｯﾁｮｲ 7ea0-9I6X)

2025/11/06(木) 10:39:46.81ID:J8Py4Ggv0

5090ってどれくらい電気使うの？１０００Wじゃ足りない？

0800名無しさん＠ピンキー (ﾜｯﾁｮｲ 2ac7-kIgr)

2025/11/06(木) 12:19:41.85ID:4VfcHnuO0

5090の1枚だとLLM用途には非力
大きいモデルを動かすにはMoEになるけどメモリが遅いせいで、5090がフルパワーになることなんてほぼない
200Wから300Wの間で、いいとこ200W付近だな
動画・画像生成ならOC無しで575W付近だな

0801名無しさん＠ピンキー (ﾜｯﾁｮｲ 2ac7-kIgr)

2025/11/06(木) 12:21:07.70ID:4VfcHnuO0

あと電源は複数構成にしてて、RTX5090専用に1000Wを用意してる

0802名無しさん＠ピンキー (ﾜｯﾁｮｲ eec8-9I6X)

2025/11/06(木) 12:22:12.25ID:LlQyftbD0

>>797
俺もそう思う
あとRTX Pro 5000じゃなくて6000もう出てないっけ

0803名無しさん＠ピンキー (ﾜｯﾁｮｲ ef3f-mzUR)

2025/11/06(木) 12:42:12.94ID:lMCuk1c10

モデルを学習させたいのならRTX、
大きいのを推論させたいだけならMACでしょう

0804名無しさん＠ピンキー (ﾜｯﾁｮｲ eeca-dW62)

2025/11/06(木) 14:03:53.68ID:5ogRukTi0

みんな一体何を推論させてるんだ…夢は感じるけど具体的に何しようか自分でははっきり定められない。

0805名無しさん＠ピンキー (ｼｬﾁｰｸ 0Cbf-vgpZ)

2025/11/06(木) 14:20:52.42ID:yY5pojgmC

>>804
エロ

0806名無しさん＠ピンキー (ﾜｯﾁｮｲ 3a1a-mzUR)

2025/11/06(木) 15:04:13.91ID:H0Wl2rhX0

やっぱ推論だけじゃなくて学習させたいよなー

0807名無しさん＠ピンキー (ﾜｯﾁｮｲ 1a49-EU/t)

2025/11/06(木) 15:12:09.62ID:BwdvnsPb0

学習させようとなるとローカルではさすがにきびしい
サーバーレンタルしたほうが絶対にいい

0808名無しさん＠ピンキー (ﾜｯﾁｮｲ 7ea0-9I6X)

2025/11/06(木) 15:17:51.91ID:J8Py4Ggv0

LoRAとRAGならRAGの方が難易度高いんだよね？Super RAGだかって簡単にやってるけど、あれはLoRAじゃないの？

0809名無しさん＠ピンキー (ﾜｯﾁｮｲ 33c0-T6rd)

2025/11/06(木) 15:36:22.62ID:ELrPQp7H0

RAGはそもそも学習させてるわけじゃないし単にベクターストアとかに格納した内容を参照させてるだけだから別に難しいこともなくない？

0810名無しさん＠ピンキー (ﾜｯﾁｮｲ 3a1a-mzUR)

2025/11/06(木) 16:14:40.70ID:H0Wl2rhX0

難しいのかぁ
べつに30Bくらいのを学習できるとは思ってないけど、ちっちゃいのでもやれるといいけど
RAGのことも勉強しなければ

0811名無しさん＠ピンキー (ﾜｯﾁｮｲ 13e7-nV2F)

2025/11/06(木) 17:25:25.55ID:4cAqsVGl0

>>802
Ti SUPER相当のシリーズがRTX Proでも来るってリークあったんよ。そっちの5000PROが72GBという話。6000PRO SUPERが来るならワンチャン128GBもあるかもしれへんね

0812名無しさん＠ピンキー (ﾜｯﾁｮｲ 131c-0U8u)

2025/11/06(木) 20:09:27.05ID:OT25Em3L0

>>804 OpenHands とかで「改良しつづけよ」という雑なプロンプトで自動的にプログラムを改良してもらってる
時間かかるし、途中自分でスナップショットとって失敗に気づいてgit巻き戻して、と人間臭くて笑ってしまう
何度も失敗するから有料API使うと目の玉飛び出す金額になってしまうから、こういう用途はローカル向き

M4 Max 128G でVRAMに120GByte回してるから、python側(推論しない)は mbpで回している
120GByteでギリギリだよ。96Gだと頭の悪いLLMしか動作させられなくて結局成果物ができない
AI Max+ は Linuxなら120GByteくらい回せるらしいからワンチャン動く

0813名無しさん＠ピンキー (ﾜｯﾁｮｲ 3a5c-mzUR)

2025/11/06(木) 21:22:16.20ID:H0Wl2rhX0

96でも頭わるいのかぁ困ったな
金がいくらあっても足らん
今のM3はファインチューニング向いてないらしいけど、M5出たらそこも改善されるといいなあ

0814名無しさん＠ピンキー (ﾜｯﾁｮｲ aa32-fgZ5)

2025/11/06(木) 22:59:52.80ID:hCNcAFKl0

複数枚とか考え出すとgpuクラウドが輝いて見えだすしローカルは険しいよ

0815名無しさん＠ピンキー (ﾜｯﾁｮｲ 7e36-pnhr)

2025/11/06(木) 23:05:29.93ID:85R9xs1T0

有名なYoutuberがGPU8枚挿しでローカルLLM動かしてた気がする

0816名無しさん＠ピンキー (ﾜｯﾁｮｲ 5377-tukP)

2025/11/06(木) 23:10:03.96ID:6mI+tSJ80

火出そう

0817名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f03-mTOK)

2025/11/06(木) 23:46:10.80ID:VQ2HluPM0

クラウドで微調整するにしても最低3090以上のローカルGPUも欲しい
学習設定やデータセットをテストを小さいモデルでやるにしても全部クラウドでやると無駄に金いくらあっても足りないし微調整後の推論は結局ローカルGPUだし

0818名無しさん＠ピンキー (ﾜｯﾁｮｲ 2ac7-kIgr)

2025/11/07(金) 00:00:29.77ID:ynemYx0F0

火出そうって・・・
マイニング流行ってた頃はパワーリミットしてたとは言え、20枚挿しも珍しくなかったんだから8枚挿しくらい余裕だろ
マンションとかならともかく一軒家ならブレーカー落ちることないし

0819名無しさん＠ピンキー (ﾜｯﾁｮｲ 5377-tukP)

2025/11/07(金) 00:20:35.21ID:N23kjsAV0

マイニングとか何世代前だよ
最近ので8枚とか普通に暖房だろ
業務用サーバーレベルだぞ

0820名無しさん＠ピンキー (ﾜｯﾁｮｲ 1b32-9I6X)

2025/11/07(金) 00:42:54.98ID:s85a3z+e0

昔のGPUなら８枚でも良かったが5090を８枚なら燃えると思うｗ

0821名無しさん＠ピンキー (ﾜｯﾁｮｲ aa32-fgZ5)

2025/11/07(金) 00:57:51.64ID:/AdQkzVv0

普通の個人はパイプライン並列だろうし電源は意外と余裕ある
うちは300W gpu x2が650W電源で働かされてる

0822名無しさん＠ピンキー (ﾜｯﾁｮｲ 7ea0-9I6X)

2025/11/07(金) 06:05:17.44ID:HkTQDH8p0

ブレーカー落ちるし、そもそも電源ボックスで起動すらできない
50A契約とか三相電源とか考えないとな、コンセントは15Aが定格

0823名無しさん＠ピンキー (ﾜｯﾁｮｲ 7ea0-9I6X)

2025/11/07(金) 06:07:36.47ID:HkTQDH8p0

グラボの為に、エアコン用の200V電源とか使ってる人いるのかな

0824名無しさん＠ピンキー (ﾜｯﾁｮｲ 2ac7-kIgr)

2025/11/07(金) 11:23:17.12ID:ynemYx0F0

電力会社によっては100Aとか普通に使えるからな
マイニングしてたときは1部屋で計2500W超を24時間常時動かしてたぞ
夏はエアコン、冬は窓開けっ放しで問題なかったな

0825名無しさん＠ピンキー (ﾜｯﾁｮｲ ef12-dW62)

2025/11/07(金) 11:27:33.51ID:zDkRZzoS0

ハードル高すぎる…
ローカルllmはロマンがあるなと思ってたけど、実現が難しく夢のようだからロマンがあると感じてるだけな気がしてきた。

>>812
なるほど、半年前にちょっと32bとかのモデルでコーティングエージェント試したときはあんまりだなと思ったが、やはり大規模は賢いのか。

0826名無しさん＠ピンキー (ﾜｯﾁｮｲ 3af3-W5UO)

2025/11/07(金) 11:31:39.97ID:UkdlHTtB0

普通にopenrouterとか使うほうがコスパ良いよ
業務で使うから～って用途以外ではまあロマンというか趣味の世界>ローカルLLM

0827名無しさん＠ピンキー (ﾜｯﾁｮｲ ef47-mzUR)

2025/11/07(金) 14:02:55.05ID:0Urjr8TJ0

32Bとかでも、FTしてコーディング特化させても無理なのかな？
全然わからん

0828名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sd6a-j3bu)

2025/11/07(金) 21:10:36.70ID:ZDdER0GHd

Torishima / INTP
@izutorishima

Koemotion いつのまにあぼーんしてしまったんだ・・・（というか rinna 社自体畳む方向？）
https://rinna.co.jp/products/business/koemotion/

0829名無しさん＠ピンキー (ﾜｯﾁｮｲ 1a49-JEdv)

2025/11/07(金) 23:00:18.35ID:4AEqnHGL0

りんなは貴重な日本のAI企業だったのに

0830名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sd6a-j3bu)

2025/11/07(金) 23:01:21.58ID:ZDdER0GHd

日本のAI苦手っぷりは異常

0831名無しさん＠ピンキー (ﾜｯﾁｮｲ 3a24-mzUR)

2025/11/07(金) 23:03:50.97ID:/wC3jWy70

俺がAIを作る

0832名無しさん＠ピンキー (ﾜｯﾁｮｲ cf20-qekO)

2025/11/08(土) 00:04:47.22ID:m032+gq00

上を見てるとキリがないから16GBのVRAMでも快適にエロを出力できるモデルでいいのはないかな？
個人的にはyamatazenさんの「EsotericSage-12B」や「NeonMaid-12B-v2 」が12Bにしては良かった
この作者は12Bのモデルがメインっぽいけど24Bの「EsotericKnowledge-24B」もなかなか良い感じ

0833名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sd1f-TDZ4)

2025/11/08(土) 00:49:59.65ID:bRyKi+btd

RTX 6000 Ada 48GBの中古が安くならんかな
もうメモリ高騰でAI向きの安いGPUは今後も出ないやろ

0834名無しさん＠ピンキー (ﾜｯﾁｮｲ bf49-MSRj)

2025/11/08(土) 07:39:15.01ID:S1Z1naTn0

kimi k2 thinkingすごいな

0835名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-Pj3+)

2025/11/08(土) 08:47:17.25ID:EAEk+Zkn0

りんなは早すぎたんだろうな、時代が今頃追いついて、あっという間に追い抜いて行った。

チャッピーが出たタイミングで出せばよかったのに、支援する側が気づいたころには無くなっていたんじゃな

0836名無しさん＠ピンキー (ﾜｯﾁｮｲ 53d6-t3bi)

2025/11/08(土) 12:46:40.77ID:9jrhr8L/0

>>798
aquif-ai/aquif-3.5-Max-42B-A3B、
これa3bだから低スぺgpu(4gb)でも推論できる。ほとんどメインメモリからだからvram使ってるのか？
42bのモデルはやっぱり語彙力が高いですね
色々ためしてみます

0837名無しさん＠ピンキー (ﾜｯﾁｮｲ 3303-vw5Q)

2025/11/08(土) 13:26:13.88ID:4MM0420w0

GPT5.1と噂のpolaris alpha　エロokっぽいな
合成データ作らせてみたけどお断りが一切ない　GLM4.6やKimi K2でも断られるくらいなのに

0838名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-Pj3+)

2025/11/08(土) 13:49:04.34ID:EAEk+Zkn0

Grokで大体のエロはマスターしたから、もっとハードなエロ専用モデルがほしいのよな、バカでもいいから

そういう専用モデルを作るのが今後のローカルLLMだと思うのだが

学問方面とかもな

0839名無しさん＠ピンキー (ﾜｯﾁｮｲ 6332-Pj3+)

2025/11/08(土) 15:24:49.33ID:O5mMz/d70

>>832
日本語LLMに関しては32Bが最低ラインかなあ
32B未満はプロンプトの理解度が低くてきっつい

0840名無しさん＠ピンキー (ﾜｯﾁｮｲ 7397-t3bi)

2025/11/08(土) 16:51:35.14ID:r4q5rRrN0

GPT 5 Thinkingバグってないか
回答が不安定でエラー連発

0841名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f7c-usgL)

2025/11/08(土) 17:38:53.08ID:pCVG21Oa0

>>832
自分は>>8のBerghofとCydonia 24B、
あとMistralPrism-24Bが良かったです
Qwen系はなんかすぐ簡字体を出してきて
あまり相性が良くなかったです

EsotericKnowledge-24B気になるので使ってみます

0842名無しさん＠ピンキー (ﾜｯﾁｮｲ 63c6-GlLO)

2025/11/08(土) 22:00:39.34ID:Y7kxKVlU0

Berghof 7b　淫語表現が良いが理解力はほとんどない
NemoAurora 12b　理解力と表現が良いが短めに終わらせがち
MistralPrism 24b　理解力と表現が良いが続けるとハルシネーション増えがち繰り返し増えがちで修正必要
shisa-v2-mistral-small 24b　理解力と一般的な部分の表現力が一番高いがエロ表現はあらかじめ表現指定しないと古風な官能小説になりがち
全部指定のテンプレでロールプレイした感想
理解力っていうのは察する能力も含めて
ここで話題に挙がる海外のマージもよく試すんだけど英文とか変な文字交じるからほとんど使わなくなる
指定しても直訳っぽい表現になるしみんな我慢してるのか自分が使い方間違ってるのか分からん

0843名無しさん＠ピンキー (ﾜｯﾁｮｲ 4314-KUF3)

2025/11/08(土) 23:26:01.08ID:nTiP9kKY0

賢いberghofがほんと欲しい
berghofも普通の会話だとたまにうおっ！？てなるほど察してくれる時があるんだけどなあ
エロシチュの把握とかになると弱いね

0844名無しさん＠ピンキー (ﾜｯﾁｮｲ ffc0-vw5Q)

2025/11/09(日) 00:16:52.90ID:zVGj0deu0

いまだにベースモデルとしては8か月前のmistral smallが圧倒的に強いのは困る　そろそろ新しいモデルほしい
最近のモデルを含めて日本語能力は50b以下だとmistral smallの一人勝ち状態
baseモデルで小説の続きとか書かせて比較すると分かるけど中華モデルだと明らかに文脈理解が出来てなくて、語彙力も酷い　
qwen3(aquif含む)とかERNIE-4.5-21Bとかね　一般用途ならgemma3も悪くないけどデータセットの検閲とライセンスが厳しい

0845名無しさん＠ピンキー (ﾜｯﾁｮｲ cf20-qekO)

2025/11/09(日) 00:36:13.80ID:25n82Uux0

0846名無しさん＠ピンキー (ﾜｯﾁｮｲ cf20-qekO)

2025/11/09(日) 00:45:30.08ID:25n82Uux0

だよなぁ
24Bのモデルはほとんどベースがmistral smallだし、12Bは1年以上前のmistral nemo 2407がベースばかりだもんな

0847名無しさん＠ピンキー (ﾜｯﾁｮｲ ff32-RctB)

2025/11/09(日) 02:29:55.03ID:TvxxS+nl0

俺はそもそも24bモデルをmistral smallしか知らないかもしれない

0848名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa9-Pj3+)

2025/11/09(日) 20:02:17.85ID:02ttLA3w0

Llama.cppのQwen3 Next対応がようやっと終わりが見えてきたで

こっちがCPU対応で
https://github.com/ggml-org/llama.cpp/pull/16095
こっちがCUDA対応なんやろか？　いまいちよくわかっとらんが
https://github.com/ggml-org/llama.cpp/pull/17063
上のは実装終わっとって下のも今レビューに入ったようや

今のところ動かすのを優先してて実行速度は見てないそうなので遅いかもわからんけど
Qwen3.5が来る前に実装終わりそうでよかったわ

0849名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f75-an14)

2025/11/09(日) 22:24:33.08ID:jHM7u+Om0

Qwen3 nextって対抗馬であろうgpt-ossの120BとかGLM 4.5 Airとか比較してどうなん？

0850名無しさん＠ピンキー (ﾜｯﾁｮｲ bf49-8xKa)

2025/11/09(日) 22:55:33.63ID:rYYgkPmA0

Qwen3 Nextってアクティブパラメーター3Bだから
もっと小さいサイズのモデルとの比較になるかな

0851名無しさん＠ピンキー (ﾜｯﾁｮｲ 6332-Pj3+)

2025/11/09(日) 23:48:37.25ID:X2fQlB1a0

>>844
Mistral Smallを推す人は小説派なんかな？
ロールプレイチャットだとQwen系の方が比較的自然なやり取りになると思ったけどな
喘ぎ声強化プロンプトもQwQは効いてるのにMistral Smallはなんかいまいちだった
Qwen3はそもそもエロ検閲が厳しすぎて諦めたけど

0852名無しさん＠ピンキー (ﾜｯﾁｮｲ a31e-EFGP)

2025/11/10(月) 01:16:48.21ID:J833ZOIP0

TheDrummer_Magidonia-24Bを鉄拳に/no_thinkっての入れて使ってるなぁ12㎇のグラボでできる範囲じゃ今のとこエロで頭良く感じるQwen3はクイズ解かせたりできてめちゃくちゃ頭いいけどエロチャットはなんか駄目だわ

0853名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sd1f-TDZ4)

2025/11/10(月) 01:38:11.52ID:Yc6RVjkad

まず24GB以上のGPUを買います

0854名無しさん＠ピンキー (ﾜｯﾁｮｲ 4307-ym2Q)

2025/11/10(月) 03:07:55.03ID:PPD7d/Ix0

>>851
aratakoさんのQwen3-30B-A3B-ERP試した?

0855名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-Pj3+)

2025/11/10(月) 07:53:39.91ID:0xQPX6q00

作ったエロ小説をepub.jsで読めるようにしている人はいませんか

0856名無しさん＠ピンキー (ﾜｯﾁｮｲ cf33-BzYz)

2025/11/10(月) 09:12:42.01ID:5p23CTvp0

ローカルのllmを使う理由ってエロかapiの従量課金が嫌以外でこう使うといいよみたいな使い方ある？

0857名無しさん＠ピンキー (ﾜｯﾁｮｲ 4300-7b+o)

2025/11/10(月) 10:03:17.49ID:yzR75pPE0

仕事で使う場合外部に情報送信するのがコンプラ的にアウトだからローカルしかない
相手が情報漏らしませんと契約してもOpenAIみたいな新興ベンチャーを信じる方がアホやし
中国勢はもっと信用ならん

0858名無しさん＠ピンキー (ｻｻｸｯﾃﾛﾙ Spc7-GMeL)

2025/11/10(月) 11:37:09.27ID:XqDWb0UGp

>>851
喘ぎ声強化プロンプト詳しく

0859名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-Pj3+)

2025/11/10(月) 12:21:55.63ID:0xQPX6q00

epub.jsでページめくりして、背景画像を変えて、BGMとかも流すことを考えてるけど、やってる人おらんの？

0860名無しさん＠ピンキー (ﾜｯﾁｮｲ a327-U6pz)

2025/11/10(月) 12:26:29.42ID:gR0qwMLB0

ニッチすぎるでしょう

0861名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-Pj3+)

2025/11/10(月) 13:10:24.96ID:0xQPX6q00

求めているのはサウンドノベル形式とも違うんだよな

0862名無しさん＠ピンキー (ﾜｯﾁｮｲ 7fe5-BzYz)

2025/11/10(月) 16:14:38.46ID:wqoUurfQ0

>>857
会社でローカルのLLMなら外部送信しないから使っていいよって言われたの？
どうやって説得したの？

0863名無しさん＠ピンキー (ｵｯﾍﾟｹ Src7-iKR1)

2025/11/10(月) 16:23:58.82ID:mXEqgUIwr

renpyみたいなノベルゲーワークフレームでやったほうが楽そう

0864名無しさん＠ピンキー (ﾜｯﾁｮｲ 6332-Pj3+)

2025/11/10(月) 17:23:39.65ID:2yJIjkXT0

>>858
これをシステムプロンプトに入れると、喘ぎ声がエロ漫画風になる
文頭に近い奴が使われやすい傾向があるのと、なぜか入れてない喘ぎ声も使いだすようになる
QwQ用に作ったから他のモデルでは上手くいかないかも

セックスの挿入時は「きもぢい♥」「おごおっ♥」「アﾞっ♥」「あﾞっ♥」「あんっ♥」「ん゙っ♥」「んぁっ♥」「んほぉ♥」「ふっ♥」「おﾞっ♥」「いっ♥」
「ひっ♥」「ひぐっ♥」「はへっ♥」「はひっ♥」「んっ♥」「おっ♥」「あひっ♥」「おほぉおっ♥」「だめ♥」などの喘ぎ声を多めに入れてください。
絶頂時は「おほおおお！♥」「イクぅぅぅぅ！♥」「んぼぉぉ♥」「おっごおおお♥」「ほおおおお♥」「イグイグイグイグ♥」「あﾞあﾞあﾞあﾞあﾞあﾞ♥」「きもちいいいい♥」などを叫んでください。

0865名無しさん＠ピンキー (ﾜｯﾁｮｲ 8fc8-Pj3+)

2025/11/10(月) 18:06:11.36ID:0VG105DD0

きもすぎるｗ

0866名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sd1f-TDZ4)

2025/11/10(月) 18:24:15.80ID:Yc6RVjkad

>>856
使用するモデルを完全に固定できるのは開発者にとってはメリットが大きいんじゃないかな

クラウドLLMはバージョンアップ時に雑に旧バージョンを切り捨てるし
都度都度システム障害に対応させられたらたまったもんじゃない

絶対的な性能ではクラウドLLMの方が上だから金持ちならGeminiをオンプレで導入するといった選択肢もあるな

0867名無しさん＠ピンキー (ﾜｯﾁｮｲ 5306-YWFX)

2025/11/10(月) 18:24:25.41ID:Qk+xbBAM0

100Bくらいやっぱり必要なんだろ？🤔
まともに会話したりできるのって

0868名無しさん＠ピンキー (ﾜｯﾁｮｲ ff32-RctB)

2025/11/10(月) 18:27:06.89ID:ZSVDIp5t0

文法的にマトモな日本語で返してくるだけなら4B程度から完璧だよ

0869名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sd1f-TDZ4)

2025/11/10(月) 18:29:09.77ID:Yc6RVjkad

会話にバリエーションを求めるならQwen3-235B-A22Bが最低ラインじゃね
メモリ128GB VRAM24GBでGGUFがギリギリ動く

235BのNextはよはよ

0870名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-Pj3+)

2025/11/10(月) 18:38:28.38ID:0xQPX6q00

epub.jsがepubのフレームワークでしょ

0871名無しさん＠ピンキー (ﾜｯﾁｮｲ f36a-YWFX)

2025/11/10(月) 20:48:02.11ID:9ernYLeZ0

カスタマイズさせた会話を成り立たせるのは32B以上じゃないと無理では？

0872名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sd1f-TDZ4)

2025/11/10(月) 21:39:29.97ID:Yc6RVjkad

>>871
主流がMoEモデルに移行したから小型のモデルを弄くり回す意味も消えたな

メインメモリガン積みすればご家庭のPCで235Bが動くんだから
小細工するヒマがあったらメモリを増設すればいい

そのメモリも超絶価格高騰中だからケチってた奴はさらに突き放される流れ

0873名無しさん＠ピンキー (ﾜｯﾁｮｲ ffbd-RohE)

2025/11/11(火) 01:06:53.07ID:rEa/AdKq0

Mac Studio（M3 Ultra）とDGX Sparkでgpt-oss-120bの比較
https://x.com/sunazukan/status/1987474685152633174

DGXはM3の7割位の速さとのこと
意外と早いんだね
このくらいの大きさになるとメモリ以外の性能も関わってくるからアレなのかな
まぁ、それでも買おうとは思わないけどw

0874名無しさん＠ピンキー (ﾜｯﾁｮｲ 0332-eSGf)

2025/11/11(火) 03:22:23.69ID:1hIK3H7H0

VRAM 16GBとメインメモリ128GBでエロチャットするのにオススメのMoEモデルを教えてくれ

0875名無しさん＠ピンキー (ﾜｯﾁｮｲ 4391-C3m5)

2025/11/11(火) 06:31:29.56ID:1O7LU6da0

M4 maxでもgpt-oss-120bは60-70tk/sでるから
M3 Ultraは512GByteの力技で効いてくるんだな
128GByteじゃ動かないものは動かないから太刀打ちできん
M5 Ultraはmac proだけとか言わないでくれよ...

0876名無しさん＠ピンキー (ﾜｯﾁｮｲ 7f19-k7gA)

2025/11/11(火) 07:18:17.11ID:ze1tTo6B0

512gメモリって100万越えやろ？
それならDGXの2台接続と比較しないとおかしくないか

0877名無しさん＠ピンキー (ﾜｯﾁｮｲ ffdb-7b+o)

2025/11/11(火) 12:59:21.35ID:xmeZyyPe0

実用的なコンテキストウィンドウがデカいローカルLLMが欲しい

0878名無しさん＠ピンキー (ﾜｯﾁｮｲ ff32-RctB)

2025/11/11(火) 13:05:46.35ID:1iJdQ74C0

128kで実用未満だとするならけっこう限られるな

0879名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sd1f-TDZ4)

2025/11/11(火) 13:14:02.31ID:67HKqvcxd

ASUS Ascent GX10やThinkStation PGXなら
将来的にワンチャンセールやるかも知れないしな

メモリが超絶高騰中の今ではわりと現実的な選択肢よ

0880名無しさん＠ピンキー (ﾜｯﾁｮｲ 4358-t3bi)

2025/11/11(火) 16:12:46.12ID:3XWXuw6R0

>>865
このスレでは言ったらあかん事や

0881名無しさん＠ピンキー (ﾜｯﾁｮｲ ffc7-T20X)

2025/11/11(火) 17:13:00.94ID:SqiVBR2v0

ローカルLLMでコンテキストウインドウいっぱい確保できるのある？
よくて32Kだわ

0882名無しさん＠ピンキー (ﾜｯﾁｮｲ b320-iKR1)

2025/11/11(火) 20:07:10.40ID:vm/8wIy30

そういや理論値、設定値ではなく実効コンテクスト数がどのくらいなのかってデータあんまないよね
まとめをつくると何か面白いモデルが見つかるかもね

0883名無しさん＠ピンキー (ﾜｯﾁｮｲ cf1e-i+36)

2025/11/11(火) 20:10:53.76ID:fd6lY8wG0

gpt-ossはkvキャッシュの節約が効いてて結構詰め込める
どういう技術が効いてるのかはようわからんけど

■ このスレッドは過去ログ倉庫に格納されています