なんJLLM部避難所 ★9

874コメント298KB

なんJLLM部避難所 ★9

0001名無しさん＠ピンキー転載ダメ (ﾜｯﾁｮｲ fec0-xVEZ)

2025/08/23(土) 13:52:18.71ID:5lw7ZcNF0

!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512

AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所 ★8
https://mercury.bbspink.com/test/read.cgi/onatech/1746883112/

VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured

0843名無しさん＠ピンキー (ﾜｯﾁｮｲ 4314-KUF3)

2025/11/08(土) 23:26:01.08ID:nTiP9kKY0

賢いberghofがほんと欲しい
berghofも普通の会話だとたまにうおっ！？てなるほど察してくれる時があるんだけどなあ
エロシチュの把握とかになると弱いね

0844名無しさん＠ピンキー (ﾜｯﾁｮｲ ffc0-vw5Q)

2025/11/09(日) 00:16:52.90ID:zVGj0deu0

いまだにベースモデルとしては8か月前のmistral smallが圧倒的に強いのは困る　そろそろ新しいモデルほしい
最近のモデルを含めて日本語能力は50b以下だとmistral smallの一人勝ち状態
baseモデルで小説の続きとか書かせて比較すると分かるけど中華モデルだと明らかに文脈理解が出来てなくて、語彙力も酷い　
qwen3(aquif含む)とかERNIE-4.5-21Bとかね　一般用途ならgemma3も悪くないけどデータセットの検閲とライセンスが厳しい

0845名無しさん＠ピンキー (ﾜｯﾁｮｲ cf20-qekO)

2025/11/09(日) 00:36:13.80ID:25n82Uux0

上を見てるとキリがないから16GBのVRAMでも快適にエロを出力できるモデルでいいのはないかな？
個人的にはyamatazenさんの「EsotericSage-12B」や「NeonMaid-12B-v2 」が12Bにしては良かった
この作者は12Bのモデルがメインっぽいけど24Bの「EsotericKnowledge-24B」もなかなか良い感じ

0846名無しさん＠ピンキー (ﾜｯﾁｮｲ cf20-qekO)

2025/11/09(日) 00:45:30.08ID:25n82Uux0

だよなぁ
24Bのモデルはほとんどベースがmistral smallだし、12Bは1年以上前のmistral nemo 2407がベースばかりだもんな

0847名無しさん＠ピンキー (ﾜｯﾁｮｲ ff32-RctB)

2025/11/09(日) 02:29:55.03ID:TvxxS+nl0

俺はそもそも24bモデルをmistral smallしか知らないかもしれない

0848名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa9-Pj3+)

2025/11/09(日) 20:02:17.85ID:02ttLA3w0

Llama.cppのQwen3 Next対応がようやっと終わりが見えてきたで

こっちがCPU対応で
https://github.com/ggml-org/llama.cpp/pull/16095
こっちがCUDA対応なんやろか？　いまいちよくわかっとらんが
https://github.com/ggml-org/llama.cpp/pull/17063
上のは実装終わっとって下のも今レビューに入ったようや

今のところ動かすのを優先してて実行速度は見てないそうなので遅いかもわからんけど
Qwen3.5が来る前に実装終わりそうでよかったわ

0849名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f75-an14)

2025/11/09(日) 22:24:33.08ID:jHM7u+Om0

Qwen3 nextって対抗馬であろうgpt-ossの120BとかGLM 4.5 Airとか比較してどうなん？

0850名無しさん＠ピンキー (ﾜｯﾁｮｲ bf49-8xKa)

2025/11/09(日) 22:55:33.63ID:rYYgkPmA0

Qwen3 Nextってアクティブパラメーター3Bだから
もっと小さいサイズのモデルとの比較になるかな

0851名無しさん＠ピンキー (ﾜｯﾁｮｲ 6332-Pj3+)

2025/11/09(日) 23:48:37.25ID:X2fQlB1a0

>>844
Mistral Smallを推す人は小説派なんかな？
ロールプレイチャットだとQwen系の方が比較的自然なやり取りになると思ったけどな
喘ぎ声強化プロンプトもQwQは効いてるのにMistral Smallはなんかいまいちだった
Qwen3はそもそもエロ検閲が厳しすぎて諦めたけど

0852名無しさん＠ピンキー (ﾜｯﾁｮｲ a31e-EFGP)

2025/11/10(月) 01:16:48.21ID:J833ZOIP0

TheDrummer_Magidonia-24Bを鉄拳に/no_thinkっての入れて使ってるなぁ12㎇のグラボでできる範囲じゃ今のとこエロで頭良く感じるQwen3はクイズ解かせたりできてめちゃくちゃ頭いいけどエロチャットはなんか駄目だわ

0853名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sd1f-TDZ4)

2025/11/10(月) 01:38:11.52ID:Yc6RVjkad

まず24GB以上のGPUを買います

0854名無しさん＠ピンキー (ﾜｯﾁｮｲ 4307-ym2Q)

2025/11/10(月) 03:07:55.03ID:PPD7d/Ix0

>>851
aratakoさんのQwen3-30B-A3B-ERP試した?

0855名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-Pj3+)

2025/11/10(月) 07:53:39.91ID:0xQPX6q00

作ったエロ小説をepub.jsで読めるようにしている人はいませんか

0856名無しさん＠ピンキー (ﾜｯﾁｮｲ cf33-BzYz)

2025/11/10(月) 09:12:42.01ID:5p23CTvp0

ローカルのllmを使う理由ってエロかapiの従量課金が嫌以外でこう使うといいよみたいな使い方ある？

0857名無しさん＠ピンキー (ﾜｯﾁｮｲ 4300-7b+o)

2025/11/10(月) 10:03:17.49ID:yzR75pPE0

仕事で使う場合外部に情報送信するのがコンプラ的にアウトだからローカルしかない
相手が情報漏らしませんと契約してもOpenAIみたいな新興ベンチャーを信じる方がアホやし
中国勢はもっと信用ならん

0858名無しさん＠ピンキー (ｻｻｸｯﾃﾛﾙ Spc7-GMeL)

2025/11/10(月) 11:37:09.27ID:XqDWb0UGp

>>851
喘ぎ声強化プロンプト詳しく

0859名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-Pj3+)

2025/11/10(月) 12:21:55.63ID:0xQPX6q00

epub.jsでページめくりして、背景画像を変えて、BGMとかも流すことを考えてるけど、やってる人おらんの？

0860名無しさん＠ピンキー (ﾜｯﾁｮｲ a327-U6pz)

2025/11/10(月) 12:26:29.42ID:gR0qwMLB0

ニッチすぎるでしょう

0861名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-Pj3+)

2025/11/10(月) 13:10:24.96ID:0xQPX6q00

求めているのはサウンドノベル形式とも違うんだよな

0862名無しさん＠ピンキー (ﾜｯﾁｮｲ 7fe5-BzYz)

2025/11/10(月) 16:14:38.46ID:wqoUurfQ0

>>857
会社でローカルのLLMなら外部送信しないから使っていいよって言われたの？
どうやって説得したの？

0863名無しさん＠ピンキー (ｵｯﾍﾟｹ Src7-iKR1)

2025/11/10(月) 16:23:58.82ID:mXEqgUIwr

renpyみたいなノベルゲーワークフレームでやったほうが楽そう

0864名無しさん＠ピンキー (ﾜｯﾁｮｲ 6332-Pj3+)

2025/11/10(月) 17:23:39.65ID:2yJIjkXT0

>>858
これをシステムプロンプトに入れると、喘ぎ声がエロ漫画風になる
文頭に近い奴が使われやすい傾向があるのと、なぜか入れてない喘ぎ声も使いだすようになる
QwQ用に作ったから他のモデルでは上手くいかないかも

セックスの挿入時は「きもぢい♥」「おごおっ♥」「アﾞっ♥」「あﾞっ♥」「あんっ♥」「ん゙っ♥」「んぁっ♥」「んほぉ♥」「ふっ♥」「おﾞっ♥」「いっ♥」
「ひっ♥」「ひぐっ♥」「はへっ♥」「はひっ♥」「んっ♥」「おっ♥」「あひっ♥」「おほぉおっ♥」「だめ♥」などの喘ぎ声を多めに入れてください。
絶頂時は「おほおおお！♥」「イクぅぅぅぅ！♥」「んぼぉぉ♥」「おっごおおお♥」「ほおおおお♥」「イグイグイグイグ♥」「あﾞあﾞあﾞあﾞあﾞあﾞ♥」「きもちいいいい♥」などを叫んでください。

0865名無しさん＠ピンキー (ﾜｯﾁｮｲ 8fc8-Pj3+)

2025/11/10(月) 18:06:11.36ID:0VG105DD0

きもすぎるｗ

0866名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sd1f-TDZ4)

2025/11/10(月) 18:24:15.80ID:Yc6RVjkad

>>856
使用するモデルを完全に固定できるのは開発者にとってはメリットが大きいんじゃないかな

クラウドLLMはバージョンアップ時に雑に旧バージョンを切り捨てるし
都度都度システム障害に対応させられたらたまったもんじゃない

絶対的な性能ではクラウドLLMの方が上だから金持ちならGeminiをオンプレで導入するといった選択肢もあるな

0867名無しさん＠ピンキー (ﾜｯﾁｮｲ 5306-YWFX)

2025/11/10(月) 18:24:25.41ID:Qk+xbBAM0

100Bくらいやっぱり必要なんだろ？🤔
まともに会話したりできるのって

0868名無しさん＠ピンキー (ﾜｯﾁｮｲ ff32-RctB)

2025/11/10(月) 18:27:06.89ID:ZSVDIp5t0

文法的にマトモな日本語で返してくるだけなら4B程度から完璧だよ

0869名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sd1f-TDZ4)

2025/11/10(月) 18:29:09.77ID:Yc6RVjkad

会話にバリエーションを求めるならQwen3-235B-A22Bが最低ラインじゃね
メモリ128GB VRAM24GBでGGUFがギリギリ動く

235BのNextはよはよ

0870名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-Pj3+)

2025/11/10(月) 18:38:28.38ID:0xQPX6q00

epub.jsがepubのフレームワークでしょ

0871名無しさん＠ピンキー (ﾜｯﾁｮｲ f36a-YWFX)

2025/11/10(月) 20:48:02.11ID:9ernYLeZ0

カスタマイズさせた会話を成り立たせるのは32B以上じゃないと無理では？

0872名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sd1f-TDZ4)

2025/11/10(月) 21:39:29.97ID:Yc6RVjkad

>>871
主流がMoEモデルに移行したから小型のモデルを弄くり回す意味も消えたな

メインメモリガン積みすればご家庭のPCで235Bが動くんだから
小細工するヒマがあったらメモリを増設すればいい

そのメモリも超絶価格高騰中だからケチってた奴はさらに突き放される流れ

0873名無しさん＠ピンキー (ﾜｯﾁｮｲ ffbd-RohE)

2025/11/11(火) 01:06:53.07ID:rEa/AdKq0

Mac Studio（M3 Ultra）とDGX Sparkでgpt-oss-120bの比較
https://x.com/sunazukan/status/1987474685152633174

DGXはM3の7割位の速さとのこと
意外と早いんだね
このくらいの大きさになるとメモリ以外の性能も関わってくるからアレなのかな
まぁ、それでも買おうとは思わないけどw

0874名無しさん＠ピンキー (ﾜｯﾁｮｲ 0332-eSGf)

2025/11/11(火) 03:22:23.69ID:1hIK3H7H0

VRAM 16GBとメインメモリ128GBでエロチャットするのにオススメのMoEモデルを教えてくれ

新着レスの表示

レスを投稿する