なんJLLM部 避難所 ★9
0831名無しさん@ピンキー (ワッチョイ 3a24-mzUR)2025/11/07(金) 23:03:50.97ID:/wC3jWy70
俺がAIを作る
0832名無しさん@ピンキー (ワッチョイ cf20-qekO)2025/11/08(土) 00:04:47.22ID:m032+gq00
上を見てるとキリがないから16GBのVRAMでも快適にエロを出力できるモデルでいいのはないかな?
個人的にはyamatazenさんの「EsotericSage-12B」や「NeonMaid-12B-v2 」が12Bにしては良かった
この作者は12Bのモデルがメインっぽいけど24Bの「EsotericKnowledge-24B」もなかなか良い感じ
0834名無しさん@ピンキー (ワッチョイ bf49-MSRj)2025/11/08(土) 07:39:15.01ID:S1Z1naTn0
kimi k2 thinkingすごいな
0835名無しさん@ピンキー (ワッチョイ cfa0-Pj3+)2025/11/08(土) 08:47:17.25ID:EAEk+Zkn0
りんなは早すぎたんだろうな、時代が今頃追いついて、あっという間に追い抜いて行った。

チャッピーが出たタイミングで出せばよかったのに、支援する側が気づいたころには無くなっていたんじゃな
0836名無しさん@ピンキー (ワッチョイ 53d6-t3bi)2025/11/08(土) 12:46:40.77ID:9jrhr8L/0
>>798
aquif-ai/aquif-3.5-Max-42B-A3B、
これa3bだから低スぺgpu(4gb)でも推論できる。ほとんどメインメモリからだからvram使ってるのか?
42bのモデルはやっぱり語彙力が高いですね
色々ためしてみます
0838名無しさん@ピンキー (ワッチョイ cfa0-Pj3+)2025/11/08(土) 13:49:04.34ID:EAEk+Zkn0
Grokで大体のエロはマスターしたから、もっとハードなエロ専用モデルがほしいのよな、バカでもいいから

そういう専用モデルを作るのが今後のローカルLLMだと思うのだが

学問方面とかもな
0840名無しさん@ピンキー (ワッチョイ 7397-t3bi)2025/11/08(土) 16:51:35.14ID:r4q5rRrN0
GPT 5 Thinkingバグってないか
回答が不安定でエラー連発
0841名無しさん@ピンキー (ワッチョイ 6f7c-usgL)2025/11/08(土) 17:38:53.08ID:pCVG21Oa0
>>832
自分は>>8のBerghofとCydonia 24B、
あとMistralPrism-24Bが良かったです
Qwen系はなんかすぐ簡字体を出してきて
あまり相性が良くなかったです

EsotericKnowledge-24B気になるので使ってみます
0842名無しさん@ピンキー (ワッチョイ 63c6-GlLO)2025/11/08(土) 22:00:39.34ID:Y7kxKVlU0
Berghof 7b 淫語表現が良いが理解力はほとんどない
NemoAurora 12b 理解力と表現が良いが短めに終わらせがち
MistralPrism 24b 理解力と表現が良いが続けるとハルシネーション増えがち繰り返し増えがちで修正必要
shisa-v2-mistral-small 24b 理解力と一般的な部分の表現力が一番高いがエロ表現はあらかじめ表現指定しないと古風な官能小説になりがち
全部指定のテンプレでロールプレイした感想
理解力っていうのは察する能力も含めて
ここで話題に挙がる海外のマージもよく試すんだけど英文とか変な文字交じるからほとんど使わなくなる
指定しても直訳っぽい表現になるしみんな我慢してるのか自分が使い方間違ってるのか分からん
0843名無しさん@ピンキー (ワッチョイ 4314-KUF3)2025/11/08(土) 23:26:01.08ID:nTiP9kKY0
賢いberghofがほんと欲しい
berghofも普通の会話だとたまにうおっ!?てなるほど察してくれる時があるんだけどなあ
エロシチュの把握とかになると弱いね
0844名無しさん@ピンキー (ワッチョイ ffc0-vw5Q)2025/11/09(日) 00:16:52.90ID:zVGj0deu0
いまだにベースモデルとしては8か月前のmistral smallが圧倒的に強いのは困る そろそろ新しいモデルほしい
最近のモデルを含めて日本語能力は50b以下だとmistral smallの一人勝ち状態
baseモデルで小説の続きとか書かせて比較すると分かるけど中華モデルだと明らかに文脈理解が出来てなくて、語彙力も酷い 
qwen3(aquif含む)とかERNIE-4.5-21Bとかね 一般用途ならgemma3も悪くないけどデータセットの検閲とライセンスが厳しい
0845名無しさん@ピンキー (ワッチョイ cf20-qekO)2025/11/09(日) 00:36:13.80ID:25n82Uux0
上を見てるとキリがないから16GBのVRAMでも快適にエロを出力できるモデルでいいのはないかな?
個人的にはyamatazenさんの「EsotericSage-12B」や「NeonMaid-12B-v2 」が12Bにしては良かった
この作者は12Bのモデルがメインっぽいけど24Bの「EsotericKnowledge-24B」もなかなか良い感じ
0846名無しさん@ピンキー (ワッチョイ cf20-qekO)2025/11/09(日) 00:45:30.08ID:25n82Uux0
だよなぁ
24Bのモデルはほとんどベースがmistral smallだし、12Bは1年以上前のmistral nemo 2407がベースばかりだもんな
0848名無しさん@ピンキー (ワッチョイ cfa9-Pj3+)2025/11/09(日) 20:02:17.85ID:02ttLA3w0
Llama.cppのQwen3 Next対応がようやっと終わりが見えてきたで

こっちがCPU対応で
https://github.com/ggml-org/llama.cpp/pull/16095
こっちがCUDA対応なんやろか? いまいちよくわかっとらんが
https://github.com/ggml-org/llama.cpp/pull/17063
上のは実装終わっとって下のも今レビューに入ったようや

今のところ動かすのを優先してて実行速度は見てないそうなので遅いかもわからんけど
Qwen3.5が来る前に実装終わりそうでよかったわ
0849名無しさん@ピンキー (ワッチョイ 6f75-an14)2025/11/09(日) 22:24:33.08ID:jHM7u+Om0
Qwen3 nextって対抗馬であろうgpt-ossの120BとかGLM 4.5 Airとか比較してどうなん?
0850名無しさん@ピンキー (ワッチョイ bf49-8xKa)2025/11/09(日) 22:55:33.63ID:rYYgkPmA0
Qwen3 Nextってアクティブパラメーター3Bだから
もっと小さいサイズのモデルとの比較になるかな
0851名無しさん@ピンキー (ワッチョイ 6332-Pj3+)2025/11/09(日) 23:48:37.25ID:X2fQlB1a0
>>844
Mistral Smallを推す人は小説派なんかな?
ロールプレイチャットだとQwen系の方が比較的自然なやり取りになると思ったけどな
喘ぎ声強化プロンプトもQwQは効いてるのにMistral Smallはなんかいまいちだった
Qwen3はそもそもエロ検閲が厳しすぎて諦めたけど
0852名無しさん@ピンキー (ワッチョイ a31e-EFGP)2025/11/10(月) 01:16:48.21ID:J833ZOIP0
TheDrummer_Magidonia-24Bを鉄拳に/no_thinkっての入れて使ってるなぁ12㎇のグラボでできる範囲じゃ今のとこエロで頭良く感じるQwen3はクイズ解かせたりできてめちゃくちゃ頭いいけどエロチャットはなんか駄目だわ
0854名無しさん@ピンキー (ワッチョイ 4307-ym2Q)2025/11/10(月) 03:07:55.03ID:PPD7d/Ix0
>>851
aratakoさんのQwen3-30B-A3B-ERP試した?
0856名無しさん@ピンキー (ワッチョイ cf33-BzYz)2025/11/10(月) 09:12:42.01ID:5p23CTvp0
ローカルのllmを使う理由ってエロかapiの従量課金が嫌以外でこう使うといいよみたいな使い方ある?
0857名無しさん@ピンキー (ワッチョイ 4300-7b+o)2025/11/10(月) 10:03:17.49ID:yzR75pPE0
仕事で使う場合外部に情報送信するのがコンプラ的にアウトだからローカルしかない
相手が情報漏らしませんと契約してもOpenAIみたいな新興ベンチャーを信じる方がアホやし
中国勢はもっと信用ならん
0862名無しさん@ピンキー (ワッチョイ 7fe5-BzYz)2025/11/10(月) 16:14:38.46ID:wqoUurfQ0
>>857
会社でローカルのLLMなら外部送信しないから使っていいよって言われたの?
どうやって説得したの?
レスを投稿する


ニューススポーツなんでも実況