なんJLLM部避難所 ★10

1002コメント393KB

なんJLLM部避難所 ★10

■ このスレッドは過去ログ倉庫に格納されています

0001名無しさん＠ピンキー転載ダメ (ﾜｯﾁｮｲ dfc7-Jvli)

2025/11/23(日) 22:55:29.17ID:kt2SGedd0

!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512

AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所 ★8
https://mercury.bbspink.com/test/read.cgi/onatech/1746883112/
なんJLLM部避難所 ★9
https://mercury.bbspink.com/test/read.cgi/onatech/1755924738/

VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured

0077名無しさん＠ピンキー (ﾜｯﾁｮｲ 1bdd-sV47)

2025/11/28(金) 13:04:06.27ID:o8KK+6df0

>>62
ありがとう今こんなのあるのか
ちょっと試してみるわ

0078名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fc0-dDTn)

2025/11/28(金) 15:16:21.50ID:NW4XP3260

>>76
ロールプレイって音声入力＆出力でやってんの？
キーボードかたかたやって会話しても盛り上がらんだろうし

0079名無しさん＠ピンキー (ﾜｯﾁｮｲ 1b32-Mbnk)

2025/11/28(金) 15:42:23.30ID:NmTnCINp0

文章だけのチャットでも楽しいぞ
5chやXとかでレスバで盛り上がってる奴らがいるだろ？
あれぐらいヒートアップ出来るのが文章チャットだ

0080名無しさん＠ピンキー (ﾜｯﾁｮｲ df6d-1/gi)

2025/11/28(金) 16:02:22.06ID:WIXK3jgP0

>>78
世代じゃなかったらピンとこんかも知れんけどボイチャが当たり前になる前のオンゲはみんなチャットで熱中してたんやで
LLM出力はTTSで声出しさせてるけどこっちは手打ちや

0081名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sdff-QkBA)

2025/11/28(金) 16:04:29.78ID:UBhA8/QJd

しょうがないにゃあ・・

0082名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fc0-dDTn)

2025/11/28(金) 16:49:12.96ID:NW4XP3260

>>80
んーじゃあその頃は>>76みたいにチャットの応答に５秒かかったらアウトだったってこと？
ちょっと想像できないけど

0083名無しさん＠ピンキー (ﾜｯﾁｮｲ df6d-1/gi)

2025/11/28(金) 16:56:30.67ID:WIXK3jgP0

>>82
一度に長文を打たずにサクサクやり取りしていくスタイルが好まれてたなー
LINEとかでもそうでしょ？お互い向き合ってチャットしてる時はテンポが大事

0084名無しさん＠ピンキー (ｵｯﾍﾟｹ Srff-ao6q)

2025/11/28(金) 18:15:15.35ID:/4eRJ5m/r

だいぶひとによるような...

0085名無しさん＠ピンキー (ﾜｯﾁｮｲ 9f6a-A5gx)

2025/11/28(金) 18:37:32.96ID:jb/LTKTc0

ここ1週間ロールプレイのためにいろいろやってみたが、実際ちょい日本語やこんなの言わんやろみたいなのあると萎えるな、70B q4のモデル使てるけど設定詰めたら完璧になるんやろか…
いまのとこ環境作り切った時が一番楽しかった気がするわw

0086名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f24-5doS)

2025/11/28(金) 18:40:04.40ID:HAI81JuR0

5秒以内の応答を求めるのは対人でも仕事趣味どっちでも結構怖い人だと思っちゃうな
内容次第だとは思うけどそんなすぐ返答出来なかったり細切れにして何度も送るほうが厄介なケースの方が多そう

ここまで書いててAIとのRPでも内容によって応答速度変えられたら面白そうだよね
短文であっても言いづらかったり熟考した末の発言ならわざとディレイをかけるみたいな感じ
その判断に余計なリソース使うし実際にはそう簡単にはいかないんだろうけど上手く行けば人間味みたいなのは出そう

0087名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fa0-dDTn)

2025/11/28(金) 18:41:32.14ID:TOt/Q9ps0

チャットの設定ってテンプレとかあるの？JKテンプレとか

0088名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fa0-dDTn)

2025/11/28(金) 18:47:31.26ID:TOt/Q9ps0

LLMとStable Diffusion両方やるといろいろ勉強になるな、

Stable Diffusionはdanboru語＋LoRAの文化がすさまじいな

本日の発見は、ロングヘアを舞い上がらせるには、floating hairというdanboru語を使い、floating hairのLoRAも使う

hair spread outというdanboru語もあるけど、弱い。floating hairの方が強い

0089名無しさん＠ピンキー (ﾌﾞｰｲﾓ MMff-1/gi)

2025/11/28(金) 18:56:11.40ID:DRT5CeeiM

>>86
いや人との会話とLLM使ったロールプレイのを一緒にしないで🥺
オンゲのチャットだって打つの遅い人とかまとめて打つ人のやり取りだって普通にやるで
ただ、何か別のことでもしながら返事待ってるかなーってテンションになるだけや
それがLLMとのロールプレイの場合、別にもうええかー…ってテンションになるだけや

0090名無しさん＠ピンキー (ﾜｯﾁｮｲ df32-ylw2)

2025/11/28(金) 19:11:55.73ID:Zq4snQgY0

打ち間違いかと思ってたけど一応danbooruな
この辺適当だとpublic hairお化けになっちゃうぞ

0091名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sdff-QkBA)

2025/11/28(金) 19:20:12.28ID:UBhA8/QJd

爆速エロチャットじゃなきゃイヤって奴にはGrokに課金しとけとしか言いようがないわ

0092名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b09-ZAG6)

2025/11/28(金) 20:43:05.83ID:cVU0vvbk0

あとそれはSDじゃなくて一部のモデルの特徴や

0093名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fa9-dDTn)

2025/11/28(金) 20:44:53.86ID:ztH2zo8J0

ようやっとQwen Next対応がllamacppにマージされた
まだバイナリはできてないけどb7186が出てきｂｽらそれが多分QwenNext対応版になると思うで

長かったなぁ
ほんまに2か月半かかったな

0094名無しさん＠ピンキー (ﾜｯﾁｮｲ df32-ylw2)

2025/11/28(金) 20:47:43.78ID:Zq4snQgY0

言ってた通り専門のプロがフルタイムで取り組んだってことか！？

0095名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fa9-dDTn)

2025/11/28(金) 20:54:54.47ID:ztH2zo8J0

LLMに詳しい人ではあったみたいやが、QwenNextの仕組み(ハイブリッドモデル)については今回を機に勉強しながらって人やったみたい
でも途中からLlamacppの創設者のggerganovとか他の中心メンバーも出張ってきて
実装についてかなり綿密にやりとりしとったから、ほぼ専門のプロがフルタイムで取り組んだに近いと思う

0096名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fa9-dDTn)

2025/11/28(金) 20:56:10.07ID:ztH2zo8J0

今回のPR作業者がhuggingfaceに上げてるggufモデル
https://huggingface.co/ilintar/Qwen3-Next-80B-A3B-Instruct-GGUF/

0097名無しさん＠ピンキー (ﾜｯﾁｮｲ bb32-dDTn)

2025/11/28(金) 22:48:24.13ID:z6z6F4gg0

Qwen nextって、規制はきついんだっけ？

0098名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f9f-8p14)

2025/11/28(金) 23:19:43.22ID:fzEd81Ad0

ロールプレイならAratako氏のモデルとか多々あるけど、NSFW向けの日本語小説地の文に強いモデルってありますか？

自分でも色々ダウンロードして試してきたけど、もしかしたら2024年リリースのモデルは見逃しているのかもしれない・・・

0099名無しさん＠ピンキー (ﾜｯﾁｮｲ dfc6-vfAy)

2025/11/28(金) 23:55:33.52ID:kXDPBP540

普通のゲーミングPCだとshisa-v2-mistral-small-24b.i1が個人的に未だトップ
エロは無指定だと官能小説になりがちだから語彙を事前に指定する
ロールプレイもどっちもいける

0100名無しさん＠ピンキー (ﾜｯﾁｮｲ eb32-V8yF)

2025/11/29(土) 00:01:41.96ID:A7yVUzgp0

エロ小説の精度はamaterasuとmagnum123bで甲乙つけがたいが
若干amaterasuの方が規制が取り切れてない感がある
ワイの独断偏見やが

0101名無しさん＠ピンキー (ﾜｯﾁｮｲ 9ea9-V8yF)

2025/11/29(土) 03:31:27.18ID:zZvH3VnR0

qwen nextのiq4を4090 + メモリ64GBで動かして16token/sだった
オプションは　--context 131072 --n-gpu-layers 100 --n-cpu-moe 37

最適化がまだ完全に終わってないだろうからもうちょい早くなるであろうことを考えると十分やなぁこれ
contextは256kまで行けるみたいやけどとりあえず128kで動かしちゃったからこれで試してる

0102名無しさん＠ピンキー (ﾜｯﾁｮｲ 6337-H63f)

2025/11/29(土) 04:28:24.19ID:M9nsibf90

>>101
fastllmの方でrtx3060ｘ2で20tok/s出てたからまだ伸び代はあると思うで

0103名無しさん＠ピンキー (ﾜｯﾁｮｲ d332-ggsB)

2025/11/29(土) 12:36:53.09ID:hIXRG3LQ0

qwen3_next_80b_a3b_instruct-iq4_nl.ggufは全然規制ないな
何でもできる

0104名無しさん＠ピンキー (ﾜｯﾁｮｲ 4684-yaz6)

2025/11/29(土) 12:59:12.93ID:98WDNVoI0

>>52
PCでいうとwin95のころスマホだとiPhone3GSくらいの勢いを感じるな
落ち着いたらつまんなくなると思う！

0105名無しさん＠ピンキー (ｼｬﾁｰｸ 0C8f-jWuL)

2025/11/29(土) 16:25:53.76ID:3/OAWLD3C

>>103
マジ？
バニラモデルなのに規制ないの？
あのQwenが？？(　ﾟдﾟ)

0106名無しさん＠ピンキー (ﾜｯﾁｮｲ 9ea9-V8yF)

2025/11/29(土) 17:14:50.37ID:zZvH3VnR0

規制なくても学習量は少なそうだなという印象は受ける

0107名無しさん＠ピンキー (ﾜｯﾁｮｲ 9ea9-V8yF)

2025/11/29(土) 17:18:32.48ID:zZvH3VnR0

でも一般向け内容だと実際100b以上クラスの知的さは感じるわ
Qwen3.5待ち遠しいなぁ

0108名無しさん＠ピンキー (ﾜｯﾁｮｲ 46cb-H82u)

2025/11/29(土) 18:02:03.87ID:MUT20k2k0

ロールプレイに向く70B awq int4のモデルってある？llama3.1 70b instruct awq int4がギリッギリ動くから似たようないいモデルないかなと探してるんだけどなかなか。

0109名無しさん＠ピンキー (ﾜｯﾁｮｲ 8ec1-Oau4)

2025/11/29(土) 18:12:26.80ID:nKhiGNoJ0

Wannabeの作者ここ見てるか知らんけど応援してるで

0110名無しさん＠ピンキー (ﾜｯﾁｮｲ 86ee-Oau4)

2025/11/29(土) 20:29:56.23ID:TKDMJ4Lc0

Qwen-next-80B-A3B使ってみたけど確かに規制は緩いな
VRAM12GB+VRAM64GB環境だと5～7tok/sが限界かな
あと文章が冗長になりがちな印象がある

0111名無しさん＠ピンキー (ﾜｯﾁｮｲ 6a24-/Zt4)

2025/11/29(土) 22:08:22.19ID:R0QjvFT00

5070tiと128GBでunslothのQwen3-Next-80B-A3B-Instruct-Q8試してみたけど爆速やん
文章は確かに冗長な感じするからここは調整必要そうやな
規制の有無ってどんな指示出せばわかるん？Qwen3って初っ端は無理でも適当に会話のラリー続ければ最初は拒否られた指示でも通ることあるからようわからんわ

0112名無しさん＠ピンキー (ﾜｯﾁｮｲ eb32-V8yF)

2025/11/29(土) 22:44:53.56ID:A7yVUzgp0

>>110
VRAM合計７６Gもあるんか、すげーな

0113名無しさん＠ピンキー (ﾜｯﾁｮｲ 634d-H63f)

2025/11/30(日) 00:02:43.06ID:pom+2B990

Qwen3-next先乗り勢はcliのlammacppでやっとるん？あるいはlm studioもう対応した？

0114名無しさん＠ピンキー (ﾜｯﾁｮｲ 6a24-/Zt4)

2025/11/30(日) 00:22:35.04ID:La7vUKxs0

llama.cppをopenwebUIに繋いで試しとるよ

0115名無しさん＠ピンキー (ﾜｯﾁｮｲ eb32-V8yF)

2025/11/30(日) 00:35:40.51ID:J7bCQ3Ly0

>>113
koboldも対応してたで
しかし、80Bとは思えんほど速いな
小説精度はmagnum123bには劣るが

0116名無しさん＠ピンキー (ﾜｯﾁｮｲ 6a24-/Zt4)

2025/11/30(日) 00:40:33.26ID:La7vUKxs0

「これ以上されたら壊れちゃう♥」みたいな展開で更に限界超えて攻め続けたら「あああああああああああああああああ」って出力が止まらなくなって草
ロールプレイじゃなくて本当に壊れてどうすんねん

0117名無しさん＠ピンキー (ﾜｯﾁｮｲ 1ea0-V8yF)

2025/11/30(日) 01:10:36.01ID:EfIK+31i0

続けるという単語がNGワードなんよ弱いLLMは

0118名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sd4a-CRit)

2025/11/30(日) 01:14:43.00ID:lHclrnhJd

何を続けるか分からせないと無限ループするよなｗ

0119名無しさん＠ピンキー (ﾜｯﾁｮｲ 632b-H63f)

2025/11/30(日) 04:09:47.53ID:pom+2B990

>>115
サンクス、こっちもkoboldcppで試してみた。
まだfastllmにtok/sで負けてる(rtx3060ｘ2で8tok/s前後)けどまあ十分速いっちゃ速い。
尻用のキャラカード読ませて標準webから試してみたけどこれ本当にqwen？って思うぐらいにエロには寛容やね

0120名無しさん＠ピンキー (ﾜｯﾁｮｲ 0702-0bcI)

2025/11/30(日) 05:00:27.71ID:tSt65eze0

>>111
正味のとこ何tok/sくらい行くか教えて欲しい、できたらコンテキスト長も

0121名無しさん＠ピンキー (ｼｬﾁｰｸ 0C8f-jWuL)

2025/11/30(日) 10:05:14.88ID:8Bk5CCCxC

>>111
エロ小説書かせたら即申し訳喰らうけど
ある日　とかに修正すればノリノリで書き始める
規制きついモデルだと書き始めても内容が健全よりになってくけど
これは普通にエロ展開にしてくれるので緩いっちゃん緩いんかな
ただセリフの整合性が7bモデル並みなんだよなぁ

0122名無しさん＠ピンキー (ﾜｯﾁｮｲ 6a24-/Zt4)

2025/11/30(日) 17:24:42.38ID:La7vUKxs0

>>120
確かだいたい15tok/s前後だった気がする
ほぼUnslothの解説ページから持ってきただけやが実行時のコマンドも置いとくやで
llama-server \
--model /Qwen3-Next-80B-A3B-Instruct-Q8_0-00001-of-00002.gguf --alias "unsloth/Qwen3-Next-80B-A3B-Instruct" --jinja -ngl 99 --threads -1 --ctx-size 32684 \
--temp 0.7 --min-p 0.0 --top-p 0.80 --top-k 20 --presence-penalty 1.0 -ot ".ffn_.*_exps.=CPU"

>>121
試しにインピオ小説書かせてみたら235Bだと一発目は拒否られてたのがnextは内容はともかく拒否られんかったわ
けどセリフの整合性っていうか全体のクオリティは低く感じるな235Bのときは時々だけど「そうそうそれ！！」ってのがあったけどnextはほぼ無い

エロ小説とかエロRP向けにファインチューン出来ればとんでもなく化けそう

0123名無しさん＠ピンキー (ﾜｯﾁｮｲ 0702-0bcI)

2025/11/30(日) 17:51:45.97ID:tSt65eze0

>>122
120ですありがとう
流石にコンテキスト100000超えとかになるとそんなペラペラとは喋ってくれなそうな感じかな
でもオフロードしててもそんくらい出るなら確かに魅力的

0124名無しさん＠ピンキー (ﾜｯﾁｮｲ 63f5-nDnm)

2025/12/01(月) 01:07:11.73ID:zZMNKE8+0

エロいけるけど率先して使う意味も無さ気な性能なのか

0125名無しさん＠ピンキー (ﾜｯﾁｮｲ 639f-H63f)

2025/12/01(月) 02:30:27.21ID:orhw+VyS0

ただ可能性は感じるので今後ファインチューニングモデルが出ると化ける可能性は大いにあると思う。

0126名無しさん＠ピンキー (ﾜｯﾁｮｲ 0acc-3xT4)

2025/12/01(月) 18:43:35.52ID:lX1K3BWS0

ministral3 8Bが来るらしいね
baseモデルもあって微調整しやすそうだしnemoの後継になることを期待してる

0127名無しさん＠ピンキー (ﾌﾞｰｲﾓ MMaa-nDnm)

2025/12/01(月) 18:52:46.05ID:4sPzT+u4M

>>126
こういうのでいいんだよこういうので
って感じになれるポテンシャルを感じる
追加学習が簡単そうだし

0128名無しさん＠ピンキー (ﾜｯﾁｮｲ 6a62-3xT4)

2025/12/01(月) 19:00:52.88ID:5YMQA3Mf0

https://github.com/vllm-project/vllm/pull/29757
ついでにmistral large3も来る
moeらしいからvram弱者でも動かせそう

0129名無しさん＠ピンキー (ﾜｯﾁｮｲ 0acc-3xT4)

2025/12/01(月) 19:28:00.24ID:lX1K3BWS0

>>128
まじかlargeを公開するのは予想外　じゃあopenrouterのBert-Nebulon Alphaはこいつなのかな
アーキテクチャ自体はdeepseekの改良版っぽいがMoEでmistral medium以上の性能だと考えると300Bは超えそう

0130名無しさん＠ピンキー (ﾜｯﾁｮｲ eb32-V8yF)

2025/12/01(月) 19:47:49.32ID:bsiF7LPE0

>>128
マ？
middleすっとばしていきなりlarge公開？？

0131名無しさん＠ピンキー (ﾜｯﾁｮｲ 0aa5-izmX)

2025/12/01(月) 21:27:50.26ID:t2CNpdOm0

DeepSeek新しいの来たな

0132名無しさん＠ピンキー (ﾜｯﾁｮｲ eb32-V8yF)

2025/12/01(月) 23:21:05.42ID:bsiF7LPE0

>>131
extのデモ試したがいい感じやな
specialeってのは何が違うんだろ？こっちはデモないが

0133名無しさん＠ピンキー (ﾜｯﾁｮｲ 9ea9-V8yF)

2025/12/01(月) 23:23:35.65ID:Hb1/0/Z70

ｖ3.2かぁ
無印がgpt5と同等、specialeがgemini3proと同等って言ってるけど
モデルの規模は同じなんやね
ファインチューンやっただけっぽいな

0134名無しさん＠ピンキー (ﾜｯﾁｮｲ 9ea9-V8yF)

2025/12/01(月) 23:36:26.58ID:Hb1/0/Z70

色々LLM使っててGPT5が初めて「出てきた内容ワイが確認しなおさんでもええわ」って思ったLLMだから
その性能を本当にローカルで実現できるようになったのだとしたらもうワイ的にはゴールやわ

あとは、もっとちっちゃいモデルで実現してほしいけども
そこは3.5か月で半分のパラメータで同等の性能実現の法則があるから
来年の6月には200b以下で実現してるはずやしな

0135名無しさん＠ピンキー (ﾜｯﾁｮｲ ef6a-wnv0)

2025/12/02(火) 04:45:18.10ID:NEhf/O560

deepmindが発表したnested learningでまた改善するよ

0136名無しさん＠ピンキー (ﾜｯﾁｮｲ 0a08-nDnm)

2025/12/02(火) 10:05:43.68ID:If8B8osZ0

mistral large 3は675Bのアクティブ37B前後ってgrok君が言ってる🥺

0137名無しさん＠ピンキー (ﾜｯﾁｮｲ 46e6-lIKY)

2025/12/02(火) 10:49:24.25ID:4oasGZZc0

あんまりでかいとQ1でギリギリだからなあ

0138名無しさん＠ピンキー (ﾜｯﾁｮｲ 0ac7-Fnms)

2025/12/02(火) 10:50:47.27ID:xspZ7b8a0

>>136
でかすぎてローカルで動かせんなw

0139名無しさん＠ピンキー (ﾜｯﾁｮｲ 1ed9-VZ/W)

2025/12/02(火) 10:59:42.91ID:k4DJTi1d0

Ministralは14Bもあるらしいが俺ら的にはこっちが本命かもな

0140名無しさん＠ピンキー (ﾜｯﾁｮｲ 0a3e-nDnm)

2025/12/02(火) 11:30:46.72ID:If8B8osZ0

これがministral 3じゃね？って言われてるステルスモデルがあるのね
>>129も言ってるやつ
でもこれだと思いっきり真面目用途なのかなあ🥹

OpenRouterには、もう一つのステルスモデル「Bert-Nebulon Alpha」があります。

- 汎用マルチモーダルモデル（テキスト/画像入力、テキスト出力）
- 拡張コンテキストタスクにおける一貫性を維持
- タスク間で安定した予測可能な動作
- 競争力のあるコーディングパフォーマンス

本番環境レベルのアシスタント、検索拡張システム、科学研究ワークロード、複雑なエージェントワークフロー向けに設計されています。

0141名無しさん＠ピンキー (ﾜｯﾁｮｲ 8a32-W44i)

2025/12/02(火) 12:06:13.91ID:PGeHvXsE0

初めて見たときsmallで24bってちょいデカいなと思ったし
largeなんて来たらそんなもんか

0142名無しさん＠ピンキー (ﾜｯﾁｮｲ 1ea0-V8yF)

2025/12/02(火) 12:07:44.80ID:83zytnpZ0

その源内だかのパラメーターはどれくらいなんだよ、
当然さくらインターネットを使うんだろ？

デジ庁、「国産LLM」の公募開始　行政向けAIに実装へ
https://news.yahoo.co.jp/articles/6d4b2f08d810be322e710957acf90bea2a8e5574

0143名無しさん＠ピンキー (ﾜｯﾁｮｲ 4627-OPZB)

2025/12/02(火) 12:13:34.25ID:/wmTHfrd0

外国産でも日本の領土に埋めて掘り起こせば国産とします

0144名無しさん＠ピンキー (ﾜｯﾁｮｲ 1aca-vb78)

2025/12/02(火) 12:39:13.29ID:7Ex19R0T0

アサリかよ。

0145名無しさん＠ピンキー (ﾜｯﾁｮｲ 1ed9-VZ/W)

2025/12/02(火) 14:29:05.34ID:k4DJTi1d0

PLaMo翻訳の中身はちゃんとフルスクラッチだから許してやってくれ

0146名無しさん＠ピンキー (ｽﾌﾟﾌﾟ Sdaa-F7SQ)

2025/12/02(火) 15:24:22.85ID:hs/T9wUNd

26年度は無償での提供って...
pretrainどんだけかかると思ってんだよ

0147名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sd4a-CRit)

2025/12/02(火) 16:01:04.71ID:NKP9Lufed

>>138
プンルーやChutesのモデルに仲間入りしてAPIを安く使えるから
高性能なら朗報やぞ

0148名無しさん＠ピンキー (ﾜｯﾁｮｲ 0a0b-3xT4)

2025/12/02(火) 16:30:10.93ID:s0JsiPey0

>>147
mistral largeはプルリクエストから非商用・研究ライセンスと判明してるからmistral以外ホストできないはず
正直largeを公開した理由はよく分からん　mediumを公開してラージは隠しておけば良いのに
もちろん公開してくれるのはうれしいけど動かすの大変すぎまたmac ultra 512GBの株が上がるな

0149名無しさん＠ピンキー (ﾜｯﾁｮｲ 27a1-3xT4)

2025/12/02(火) 21:31:09.32ID:Yxsu674y0

>>143
伯方の塩みたいなもんやな！

0150名無しさん＠ピンキー (ﾜｯﾁｮｲ 6a03-3xT4)

2025/12/03(水) 00:52:42.01ID:eRQwD1910

https://huggingface.co/collections/mistralai/ministral-3
https://huggingface.co/collections/mistralai/mistral-large-3
ministral 3とlarge3が公開
結局bert-nebulon-alphaはlarge3だったからエロ苦手になってるのかぁ......

0151名無しさん＠ピンキー (ﾜｯﾁｮｲ 46e6-lIKY)

2025/12/03(水) 01:44:18.82ID:dfpw1z2m0

14Bはsmall 3.2と置き換えられるってモデルカードに書いてあるけどホントかなあ

0152名無しさん＠ピンキー (ﾜｯﾁｮｲ 0a0b-3xT4)

2025/12/03(水) 02:39:03.99ID:CytqpInh0

largeまでapache 2.0とかやるやん　いつもの非商用ライセンスだと思ってた
日本語能力高そうだしありがてえ

0153名無しさん＠ピンキー (ﾜｯﾁｮｲ 86ce-37/u)

2025/12/03(水) 07:53:34.81ID:1Za0pPzO0

higgingfaceでVLモデル良いの無いか漁ってるんだけど
生のsafetensorに比べてgguf（Q8）は短文ばっかり出力されるんだけどそういうもん？
○○文字以上とか指示に含めてもまるで守られない
ちなみに今試してるのはQwen3のhuihui
Instructもthinkingもggufだと短文だし指示したシチュとかほぼ無視

0154名無しさん＠ピンキー (ﾜｯﾁｮｲ 46e6-lIKY)

2025/12/03(水) 10:55:53.81ID:dfpw1z2m0

>>153
ここで生モデル使ってる話は見たことがないから答えられる人居るか怪しい
パラメーターミスってるが一番あり得ると思う
あとはプロンプトは数字で指定するより長文でとか書いた方が伝りやすい

0155名無しさん＠ピンキー (ﾜｯﾁｮｲ d332-ggsB)

2025/12/03(水) 11:16:26.50ID:qRVmoTTi0

「長文で」であんまり長くならないなら「10000文字の長文で」にするとすごく長くなる
数値と長文でを組み合わせるとそこそこ具体的な長さが期待できる
まあ文字数なんてカウントしてないんだから忠実には守らないんだけど

0156名無しさん＠ピンキー (ﾜｯﾁｮｲ 9ea9-hgi+)

2025/12/03(水) 11:30:07.72ID:ZsqTOFao0

ライブラリによってデフォルトのパラメータちゃうかったりするからパラメータ見直すんが早いやろな

0157名無しさん＠ピンキー (ﾜｯﾁｮｲ d332-ggsB)

2025/12/03(水) 11:36:46.57ID:qRVmoTTi0

あ、でも賢いLLMなら日本語も数えられるみたいだね
GPT-5は1000文字程度の日本語ならほぼ正確に数えて出力できるけどGrokは全くダメ

0158名無しさん＠ピンキー (ﾜｯﾁｮｲ 0a44-nDnm)

2025/12/03(水) 11:38:46.82ID:Ido+wOKk0

ministral3 の最大コンテキスト長は256Kだけどgguf出してる人の解説によると適切サイズはinstructモデルが16K、reasoningモデルで32Kみたいね
やっぱそれ以上は性能落ちちゃうのか

0159名無しさん＠ピンキー (ﾜｯﾁｮｲ 0aaa-37/u)

2025/12/03(水) 11:53:57.53ID:570hYi4e0

>>154
うーんそっか
とりあえずパラメーターをsafetensor版とgguf版同一にしても
gguf版が明らかに劣化してるんだよね
gguf版はポーズ指示とかに留まりストーリーがまるでない感じ

コンテキストと生成長はデフォルトより大きくとってるし
他のパラメータも調整したけど差は埋まらないわ
AIにも何故かって相談してるんだけどGGUFにする過程で劣化はよくあるみたいな回答だった

用途としては添付画像を基にストーリー作成依頼して動画生成ってやってる
このスレでVL使えるモデルでおすすめはあるかい？
もちろんエロに使えるヤツで（真顔）

0160名無しさん＠ピンキー (ﾜｯﾁｮｲ eb32-V8yF)

2025/12/03(水) 12:05:18.60ID:UfeasB1n0

large3デモ試せるとこある？

0161名無しさん＠ピンキー (ﾜｯﾁｮｲ 0a42-3xT4)

2025/12/03(水) 12:11:49.55ID:CytqpInh0

openrouterで触ってるけどエ口小説の続きを書かせると悪くないな　拒否もされない
VL用途だと駄目だわ　拒否はないけどレーティング関係なくアニメイラストだと画像理解が壊滅的でまともなキャプションつけれてない　

0162名無しさん＠ピンキー (ﾜｯﾁｮｲ 8673-k9e5)

2025/12/04(木) 00:59:33.94ID:c8c4dRTO0

DeepseekV3.2、結構エロいけるな
kimi,glmとエロ系行けるデカいモデルが増えて嬉しい

0163名無しさん＠ピンキー (ﾜｯﾁｮｲ 86bd-Oau4)

2025/12/04(木) 01:14:29.63ID:3vUvfeA00

>>162
ひよこお薬かわいそう小説ベンチで90000文字で書いてって言ったら一気に1万3000文字出てきた
例によってDeepseek系の冒頭でドバっと地の文が出る癖はあるけどその後は描写もリズムもいい
これは使えるわ

0164名無しさん＠ピンキー (ﾜｯﾁｮｲ bbcd-OoXl)

2025/12/04(木) 01:44:08.68ID:tbKVwEm70

Deepseek 3.2は小説だと無茶苦茶長文出すけどエロチャだと逆に返事が一段落くらいで短くなりがちなんだよな
文脈読んで長く書こう短く書こうってしてるんだろうけど極端

0165名無しさん＠ピンキー (ﾜｯﾁｮｲ eb32-V8yF)

2025/12/04(木) 05:04:57.64ID:450uVRWw0

>>159
エロ画像に特化したVLMがないからなあ
JoyCaption Beta Oneが比較的精度高い気がするけど、性的な説明文が多くなる
動画生成用なら画像にない説明文を盛ってくるmlabonne/gemma-3-27b-it-abliterated-GGUFの方がいいかもしれない

0166名無しさん＠ピンキー (ﾜｯﾁｮｲ 1ea0-V8yF)

2025/12/04(木) 07:03:44.66ID:pJIXEJs40

せっかくまもなくチャッピーがエロ解禁されるのに、エロ生成を極めてないと使いこなせないよ
半年前にGrok先生と長時間レスバして、LLMのエロは大体理解した。

LLMにエロ書けなんて言っても、AIはエロの定義が広すぎて上手く生成できないのよ、
その代わりに、クソ長いプロンプトは受け付けてくれるから。
自分がほしいエロ描写を整理してプロンプトに入れる。クソ長いプロンプトでOK
頭の悪いLLMほど、細かいプロンプトが必要。

Grok先生よりチャッピーの方が自然で滑らかな文章を作れると実感はあるから
貯めたクソ長プロンプトをチャッピーに食わせる。

Gemini3がチャッピーより上というがどうなんだろうね

0167名無しさん＠ピンキー (ﾜｯﾁｮｲ d332-ggsB)

2025/12/04(木) 07:31:47.88ID:bc7PGPTq0

＞LLMにエロ書けなんて言っても、AIはエロの定義が広すぎて上手く生成できないのよ

LLMを始めてみんなが初日に気付く基本やね

0168名無しさん＠ピンキー (ﾜｯﾁｮｲ 0ae7-37/u)

2025/12/04(木) 07:52:57.66ID:FY/50lnz0

>>165
JoyCaptionは画像の説明は出来るんだけど
ストーリーは無理だったからHuihuiに流れ着いた
mlabonne/gemma-3-27b-it-abliterated-GGUF
は試したことないから試してみるよサンクス

0169名無しさん＠ピンキー (ｵｯﾍﾟｹ Sra3-Nwf+)

2025/12/04(木) 10:53:43.76ID:z8Aeon72r

となりに文章生成AIスレがあるんだからそっちを参考にすればええのでは
個人レベルでの探求はどうしたって無駄や余分が生じて変な方向に向かうから数を集めるしかない

0170名無しさん＠ピンキー (ｽﾌｯ Sdaa-HpHP)

2025/12/04(木) 12:54:56.48ID:Z4N0uJ+3d

>>166
GPTは察しが良いから、厳密に詳細に要件定義してなくてもそれなりに求めたものが出るから便利だね(エロ以外は)

0171名無しさん＠ピンキー (ﾜｯﾁｮｲ 1ade-h42X)

2025/12/04(木) 15:06:50.87ID:7T+v66uc0

RTX5090 が届いた

0172名無しさん＠ピンキー (ﾜｯﾁｮｲ 63ac-KeyG)

2025/12/04(木) 16:23:39.40ID:dsNTTyn40

Ministral-3-8Bが出たって事で久々にローカルで遊んでみてるけどいつの間にかUDって形式が出てて困惑するわ
Q8とUD-Q8だとUD-Q8の方がなんとなく良さそうな気がするけど、これ日本語力はどうなんだろう？
UDは重要度に応じて量子化の程度を変更する仕組みってAIが言ってたけど、「日本語は重要な情報じゃない」って切り捨てられてる可能性もワンチャンあるのかな？

0173名無しさん＠ピンキー (ﾜｯﾁｮｲ 6343-wzh9)

2025/12/04(木) 18:13:56.30ID:CpllBQus0

量子化の方法だから言語は関係ない

0174名無しさん＠ピンキー (ｵｲｺﾗﾐﾈｵ MM96-H82u)

2025/12/04(木) 19:19:48.98ID:B9B4dZfMM

silly tavern でmagnumv4 72b iq4km使ってるけど、なかなかクオリティ上げるの難しい…システムプロンプトとかが悪いんだろうけど、まだ使い出したばかりで全然慣れないわ。
magnum にopen web ui で適当に小説書かせたらかなり日本語も良いし、モデルはこれでいいと思うんだが…

0175名無しさん＠ピンキー (ﾜｯﾁｮｲ 9ea9-V8yF)

2025/12/04(木) 20:38:00.73ID:ZzdV9jd50

>>172
量子化手法によっては評価データで評価をしながら量子化するってのがあって、
その評価データに日本語がないと日本語の性能下がるってことがありえるやろな
GGUFはどうなんやろ？　評価データ使う方式なのかどうなのかググったけどよくわからんな

0176名無しさん＠ピンキー (ﾜｯﾁｮｲ 9ea9-V8yF)

2025/12/04(木) 20:43:36.24ID:ZzdV9jd50

チャッピーに聞いたわ
GGUFは評価データいらんらしいから日本語性能下がるとか考えなくてよさそうや
https://i.imgur.com/w2pAa23.png

■ このスレッドは過去ログ倉庫に格納されています