なんJLLM部避難所 ★8

1002コメント348KB

なんJLLM部避難所 ★8

■ このスレッドは過去ログ倉庫に格納されています

0001名無しさん＠ピンキー転載ダメ (ﾜｯﾁｮｲ f3c0-9L8h)

2025/05/10(土) 22:18:32.02ID:0Ak3eO5y0

!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512

AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所 ★7
https://mercury.bbspink.com/test/read.cgi/onatech/1742709485/

VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured

0002名無しさん＠ピンキー (ﾜｯﾁｮｲ f3c0-9L8h)

2025/05/10(土) 22:19:47.51ID:0Ak3eO5y0

初心者は導入しやすいKoboldcppから始めるのをお勧め
(1)NVIDIA、CPUユーザーはここで最新版のKoboldcpp.exeをダウンロード
https://github.com/LostRuins/koboldcpp/releases
AMDユーザーはこっち
https://github.com/YellowRoseCx/koboldcpp-rocm
(2)ここで良さげなggufモデルをダウンロード
https://huggingface.co/models?sort=modified&search=gguf
この2つのファイルだけで動く

Koboldの設定や使い方は英語だけどここが詳しい
https://github.com/LostRuins/koboldcpp/wiki

0003名無しさん＠ピンキー (ﾜｯﾁｮｲ f3c0-9L8h)

2025/05/10(土) 22:20:16.10ID:0Ak3eO5y0

oobabooga/text-generation-webui
通称大葉
これもKoboldAIに並んで有用な実行環境やで
https://github.com/oobabooga/text-generation-webui

0004名無しさん＠ピンキー (ﾜｯﾁｮｲ f3c0-9L8h)

2025/05/10(土) 22:20:33.45ID:0Ak3eO5y0

●Zuntanニキ謹製のツールEasyNovelAssistant
主に小説用で使われとるで
ローカルLLM導入のハードルをぐっと下げてくれたで
初めてのお人はここから始めるのもいいで
https://github.com/Zuntan03/EasyNovelAssistant

0005名無しさん＠ピンキー (ﾜｯﾁｮｲ f3c0-9L8h)

2025/05/10(土) 22:20:51.59ID:0Ak3eO5y0

https://github.com/SillyTavern/SillyTavern
AIチャットに特化したUI、SillyTavernや
キャラをbot的に管理したりグラ登録したり複数選んでグループチャットしたり大量の設定を外部記憶的に管理したり色々できるで
画像出力や音声出力とも連携可能で夢が広がるで
機能が豊富すぎて最初取っ付きにくいのと日本語の解説がほとんど無いのが難点やがRPチャット派は使うと幸せになれるやで
あくまでUI(フロントエンド)やからこれ自体にはAIは内蔵されてないから注意してな
好きなAPIやローカルモデルと接続して使うんやで

0006名無しさん＠ピンキー (ﾜｯﾁｮｲ f3c0-9L8h)

2025/05/10(土) 22:21:14.79ID:0Ak3eO5y0

例としてKoboldで起動したローカルモデルとSillyTavernを接続する設定や
先にいつもどおりKoboldを起動してな

SillyTavernのプラグのアイコンをクリック
APIに Text Completion を選択
API Typeは KoboldCpp
API keyは不要
API URLに http://localhost:5001/
これでいける

0007名無しさん＠ピンキー (ﾜｯﾁｮｲ f3c0-9L8h)

2025/05/10(土) 22:21:36.99ID:0Ak3eO5y0

●多くのモデルには「base」と「instruct」の2種類があるで
baseはチューニングされていない、与えられた文書の続きを垂れ流すモデルやで
instructはchatGPTのように対話して質問に答えるようチューニングされたAIやで

⚫︎LLMを動かすにはGPUを使う方法とCPUを使う方法があるで
GPUを使う場合は比較的速く動くけど、VRAM容量の大きなグラボが必要になるで
CPUを使う場合はグラボが不要でメインメモリのRAMを増やすだけで大きなモデルが動かせるというメリットがあるけど、動作速度はGPUよりは落ちるで

⚫︎LLMモデルには量子化されてないsafetensorsファイルと、8bitや4bitなどに量子化されて容量が小さくなったものがあるで
量子化モデルにはGGUFやGPTQなどの種類があるで
基本的にはCPU (llama.cpp)で動かす場合はGGUF、GPUで動かす場合はGPTQを選べばええで
量子化は4bitまでならほとんど精度が落ちないのでよくわからない場合はIQ4_XSやQ4_k_mなどにしとけばええで

⚫︎LLMモデルは既存のbaseモデルを元に自分で学習(ファインチューニング)させることもできるで
画像AIのようにLoRAファイルとして学習結果を保存したりLoRAを読み込むこともできるで

●モデルのサイズ(パラメータ数)は◯B (B=billion=10億)という単位で表記されるで
例えば7Bのモデルを読み込むなら量子化しない場合は約14GB、8ビット量子化の場合は7GB、4ビット量子化の場合は3.5GBのメモリまたはVRAMが必要になるで
基本的にはBが大きいほど性能が高いで

0008名無しさん＠ピンキー (ﾜｯﾁｮｲ f3c0-9L8h)

2025/05/10(土) 22:22:06.73ID:0Ak3eO5y0

●その他の最近話題になったモデルも挙げとくで
動きの速い界隈やから日々チェックやで

Mistral-7B系:
LightChatAssistant
Antler-7B-RP
Japanese-Starling-ChatV
Antler-7B-Novel-Writing
SniffyOtter-7B-Novel-Writing-NSFW
Ninja-v1
Vecteus-v1
Berghof-NSFW-7B-i1-GGUF

Llama3-70B系:
Smaug-Llama-3-70B-Instruct-abliterated-v3

Cohere系:
c4ai-command-r-08-2024 (35B)
c4ai-command-r-plus-08-2024 (104B)

magnumシリーズ(エロ特化):
https://huggingface.co/collections/anthracite-org/v4-671450072656036945a21348

Lumimaid-Magnum:
Lumimaid-Magnum-v4-12B

magnumの日本語版:
Mistral-nemo-ja-rp-v0.2

0009名無しさん＠ピンキー (ﾜｯﾁｮｲ f3c0-9L8h)

2025/05/10(土) 22:22:38.96ID:0Ak3eO5y0

●高性能なPCがないけどLLMを試したい人や大きなモデルを速く動かしたい人はpaperspaceなどのクラウド環境を使うのも手やで
若干規制はあるもののGoogle AI studioから無料でAPI keyを入手して高性能なAIを使うこともできるのでそれを使うのええで
API keyの入手はhttps://aistudio.google.com/apikeyここからできるで

0010名無しさん＠ピンキー (ﾜｯﾁｮｲ f3c0-9L8h)

2025/05/10(土) 22:24:24.73ID:0Ak3eO5y0

テンプレここまで、しばらく更新されてないから過去ログも参考にしてな

0011名無しさん＠ピンキー (ﾜｯﾁｮｲ 733d-9L8h)

2025/05/10(土) 22:38:04.01ID:JABFV6+D0

おつつ

0012名無しさん＠ピンキー (ﾜｯﾁｮｲ c3ed-aBcW)

2025/05/10(土) 22:38:23.25ID:2GbJOTYW0

サンイチやで
EVO-X2予約ニキの報告楽しみにしとるで

0013名無しさん＠ピンキー (ﾜｯﾁｮｲ 538d-/A7e)

2025/05/10(土) 23:12:16.95ID:gS1Fz//C0

Violet_Magcap-12Bの設定使ったら推論って奴できて嬉しい

0014名無しさん＠ピンキー (ﾜｯﾁｮｲ 737a-KB/z)

2025/05/10(土) 23:46:17.50ID:4K/o7R6K0

すれたておつ
evo-x2はこんな感じらしいで
https://wiki.onakasuita.org/pukiwiki/?EVO-X2

0015名無しさん＠ピンキー (ﾜｯﾁｮｲ 733d-9L8h)

2025/05/10(土) 23:50:58.42ID:JABFV6+D0

ryzenMAX+はCPUにAVX512とか載ってるから
CPUにも仕事させた方が良いんだろうか

0016名無しさん＠ピンキー (ﾜｯﾁｮｲ a34c-Fs2+)

2025/05/10(土) 23:53:47.12ID:MSpCSYXy0

70Bモデルまで行くと速度的に厳しそう
それでもCPU推論よりはマシか？

Testing the Ryzen M Max+ 395 : r/LocalLLM
https://www.reddit.com/r/LocalLLM/comments/1k3hlw3/testing_the_ryzen_m_max_395/

0017名無しさん＠ピンキー (ﾜｯﾁｮｲ 733d-9L8h)

2025/05/10(土) 23:56:31.43ID:JABFV6+D0

100～130BくらいのMoEモデルなら良さそう

0018名無しさん＠ピンキー (ﾜｯﾁｮｲ a34c-Fs2+)

2025/05/10(土) 23:58:05.16ID:MSpCSYXy0

>>14
DeepSeek-R1-Distill-Llama-70B Q3_K_Lと
Qwen3-235B-A22Bでかなり違うのな

>>16のDeepSeek R1 70Bでも5～10tk/s
なんかコード修正したら10tk/s以上出るとかも
言われてるけど

https://x.com/hjc4869/status/1913562550064799896

0019名無しさん＠ピンキー (ﾜｯﾁｮｲ cf7a-pbnj)

2025/05/11(日) 01:40:24.53ID:JcEjG3AG0

これでゲームもCUDAが必要とか言ってる動画生成系のやつも全部できたら乗り換えるのになぁ

0020名無しさん＠ピンキー (ﾜｯﾁｮｲ 8fa9-KB/z)

2025/05/11(日) 02:02:00.77ID:2Y5MxzTS0

前スレのこれ、sshでつないでポートフォワードしたらできるで

>Project Wannabeを使ってみてるんだけど、他のPCで起動してるkobold.cppに接続して使う方法ってあります？

0021名無しさん＠ピンキー (ﾜｯﾁｮｲ c3ed-aBcW)

2025/05/11(日) 02:45:01.80ID:9tW4zWNv0

前にここで紹介された
Qwen3-30B-A3B-NSFW-JP
ggufがないからまだ試せないンゴ

0022!donguri (ﾜｯﾁｮｲ 33b6-Onb0)

2025/05/11(日) 02:46:49.81ID:zvdvg/lI0

別にわざわざポートフォワードせんでもlan内でポートへの接続許可したらマシンのipで繋げれるんとちゃうか。winならファイアウォールの設定で受信の許可ルール作ればええ

0023!donguri (ﾜｯﾁｮｲ 33b6-Onb0)

2025/05/11(日) 02:47:46.27ID:zvdvg/lI0

>>21
ERPの方はggufあげてくれてるで。nsfwは事前学習モデルやからそのまま使ってもいい感じにはならなさそう

0024名無しさん＠ピンキー (ﾜｯﾁｮｲ 733d-9L8h)

2025/05/11(日) 03:48:39.58ID:WqNVjOrV0

Project Wannabeは最初に提示されたkobld_client.pyを書き換える方法で上手くいきました。

0025名無しさん＠ピンキー (ﾜｯﾁｮｲ 733d-9L8h)

2025/05/11(日) 03:51:47.38ID:WqNVjOrV0

>>21
今見たらあったよ

0026名無しさん＠ピンキー (ﾜｯﾁｮｲ c3ed-aBcW)

2025/05/11(日) 04:39:18.59ID:9tW4zWNv0

>>23
サンガツやで！さっそくDLしてきた
あとで試してみるわ
Q6_Kから25Gやけど
このへん5090ニキらなら乗るんかぁええなあ……

0027名無しさん＠ピンキー (ﾜｯﾁｮｲ c3ed-aBcW)

2025/05/11(日) 04:43:26.19ID:9tW4zWNv0

>>25
ホンマやありがとう！
同じ量子化のをDLして比べてみるわ
wannabeつかわせてもろとるけど
koboldでのモデル変更て一旦cmd閉じて再起動よね？
モデル切り替えちょい面倒なんよな

0028名無しさん＠ピンキー (ﾜｯﾁｮｲ 13c8-KB/z)

2025/05/11(日) 04:51:44.68ID:5TYO75BO0

koboldcppってOllamaと結構性能違うのかな？
Ollamaの方が使い分け楽だから、性能僅差ならOllamaで済ませたいなぁ。
誰か詳しい人いる？

0029名無しさん＠ピンキー (ﾜｯﾁｮｲ 33b6-Onb0)

2025/05/11(日) 04:59:47.92ID:zvdvg/lI0

>>26
古いMacStudioやけど128gbあるからQ8が乗るで
LLM以外やとまじで役に立たんけどな

0030名無しさん＠ピンキー (ﾜｯﾁｮｲ c3ed-aBcW)

2025/05/11(日) 06:10:09.56ID:9tW4zWNv0

そういやwannabeニキに大それたリクエストがあるんやけど

縦書き

仕様にできんやろか？
ワイ書くのも読むのも縦書きのオールドタイプなんで……
前にObsidianを縦書きにするアドオンとか作れんかGPT君にきいたら
えらい難易度が高くて諦めたから
無茶な注文なのは解っとるけども
でけたらえらい嬉しい

0031名無しさん＠ピンキー (ﾜｯﾁｮｲ c3ed-aBcW)

2025/05/11(日) 06:14:01.75ID:9tW4zWNv0

>>29
ええなあ……ワイはメデューサ待ちや
出るまでに自分が電書化した小説とか学習できたらええんやが
技術がない……

0032名無しさん＠ピンキー (ﾜｯﾁｮｲ 53e1-K+3N)

2025/05/11(日) 07:13:30.30ID:E29fFdF/0

Qwen3-30B-A3B-NSFW-JP っていうやつ見たら「事後学習せい」って書いてあるけど、なにしたらええんや？
なんか参考になるリンクとかあったら教えてほしい。

0033名無しさん＠ピンキー (ｼｬﾁｰｸ 0C57-RYlZ)

2025/05/11(日) 07:55:31.95ID:7CxUj3MxC

ベース学習しただけだから指示じゃなくて続き書かせる手法にするってことか

0034名無しさん＠ピンキー (ﾜｯﾁｮｲ 53e1-K+3N)

2025/05/11(日) 09:10:36.59ID:E29fFdF/0

>>32
すまん、ChatGPTにきいたら自決したわ。

0035名無しさん＠ピンキー (ﾜｯﾁｮｲ 5357-o2kj)

2025/05/11(日) 09:11:17.01ID:HDNSvN5C0

御冥福をお祈りします

0036名無しさん＠ピンキー (ﾜｯﾁｮｲ 3ffb-S5D2)

2025/05/11(日) 09:18:22.31ID:Fz8wHnsU0

>>34
R.I.P.

0037名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f74-0HJO)

2025/05/11(日) 10:07:15.31ID:1E9qyqAu0

evo-x2はやっぱり同スペックのm4proと同じかちょっと早いくらいやな。

m4maxには勝てんかったか...

0038名無しさん＠ピンキー (ﾜｯﾁｮｲ 5357-o2kj)

2025/05/11(日) 10:11:37.39ID:HDNSvN5C0

やっぱりハード面は根本的なブレイクスルーが必要だよなあ

0039名無しさん＠ピンキー (ﾜｯﾁｮｲ cf7a-pbnj)

2025/05/11(日) 10:30:07.70ID:JcEjG3AG0

win機なら需要の幅広そうだしm4との棲み分けはできそう

0040名無しさん＠ピンキー (ﾜｯﾁｮｲ a34c-Fs2+)

2025/05/11(日) 11:12:14.73ID:PQJRxjMR0

>>37
2022年のM1 Ultraにも負けてるじゃん？
メモリの帯域幅が足りないからでは？
256GB/sではM1 Ultraの800GB/sには遠く及ばない

0041名無しさん＠ピンキー (ﾜｯﾁｮｲ 1316-kIO2)

2025/05/11(日) 11:33:26.26ID:UfhF4txJ0

LLMならmacが良いらしい、いやmac微妙だぞのやり取りが去年たくさんあったしな
それよりさらに微妙な物なら買う事は無さそうやな
後数世代待てば帯域の事も考えられた専用機が出てくるやろ

0042名無しさん＠ピンキー (ﾜｯﾁｮｲ 636a-7OJS)

2025/05/11(日) 12:05:46.90ID:ZK6f01030

欲しい時が買い時

0043名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fec-9L8h)

2025/05/11(日) 12:29:11.31ID:Fh5rBXvw0

去年と違うのは今はMoEが主流になりつつことだな　
動かすだけならユニファイドメモリが最も手軽な手段だし
3090x4より安いし30万以下なら全然あり

0044名無しさん＠ピンキー (ﾜｯﾁｮｲ 53e1-K+3N)

2025/05/11(日) 12:30:13.06ID:E29fFdF/0

Qwen3-30B-A3B-ERP-v0.1-GGUF 試した。
初手テンプレートエラーでたから、オリジナルのQwen3からテンプレートコピペしてきたら動いた。

しかし「あなたは日本のベストセラー官能小説家です。官能小説のプロットを5つ考えてください
プロットは一つ１００文字以内とし、箇条書きで書き出してください。」というプロンプトで、
プロットを一つずつしか出してくれないのでめんどくさい。

https://ibb.co/cXXq5vxy

0045名無しさん＠ピンキー (ﾜｯﾁｮｲ 53e1-K+3N)

2025/05/11(日) 12:44:10.74ID:E29fFdF/0

i7-14700 64GB 4090 の環境で 20t 〜 40t くらい

速度は十分実用的だと思う

0046名無しさん＠ピンキー (ﾜｯﾁｮｲ cfd9-OIzT)

2025/05/11(日) 12:56:04.62ID:KSze43Me0

>>44
そのモデルは多分そういうプロンプトには対応してないと思うで
ロールプレイの一種ではあるけどそういうのは学習してないと思う

0047名無しさん＠ピンキー (ﾜｯﾁｮｲ 53e1-K+3N)

2025/05/11(日) 13:15:00.78ID:E29fFdF/0

>>46
そうなんや、ERPとChatはまた違うってことか。サンガツやで。

0048名無しさん＠ピンキー (ﾜｯﾁｮｲ 7fb5-KB/z)

2025/05/11(日) 13:28:05.98ID:sJ3HcAG00

小中と俺をいじめてたやつがタイでロリコンになってた話
https://zch-vip.com/archives/50709772.html

15年前、タイでメーサイの岡崎と呼ばれる男との一晩の出来事
https://zch-vip.com/archives/50767692.html

0049名無しさん＠ピンキー (ﾜｯﾁｮｲ 737a-KB/z)

2025/05/11(日) 14:04:02.96ID:fsVnkFbE0

>>47
モデル作者aratako氏のデータセットを参照すると、system promptに設定全部入力してあって、出力は全部キャラクターの発言だけだね
このデータセットが使われたかどうかは分からんけど、これに準拠してるなら小説は難しいだろうね
でも、このモデル元にして、自分で小説のデータセット用意して微調整すれば書けるようになると思うよ

0050名無しさん＠ピンキー (ﾜｯﾁｮｲ 1332-hXBp)

2025/05/11(日) 14:42:50.01ID:uQcWQT3u0

>>41
Macの良さってメモリの大きさだけなんだよな
OSとかGPUとかはべつにLLMに向いてない

0051名無しさん＠ピンキー (ﾜｯﾁｮｲ 4322-RYlZ)

2025/05/11(日) 14:52:49.17ID:mC2kvZOG0

>>50
大きさと言うより帯域幅だね

0052名無しさん＠ピンキー (ﾜｯﾁｮｲ cfd9-OIzT)

2025/05/11(日) 14:56:20.09ID:KSze43Me0

DGX Sparkはチップ性能だけ見たらコスパ微妙っぽいけどCUDA使えるのとBlackwellだからFP4対応でFA3とかの最新の最適化手法とかも（多分）使えるのが売りになるのかな

0053名無しさん＠ピンキー (ﾜｯﾁｮｲ 1332-hXBp)

2025/05/11(日) 15:06:25.90ID:uQcWQT3u0

>>51
帯域はべつに普通じゃないか？
M3ウルトラはNvidiaよりは遅い
M3 MaxはRyzenより遅い

0054名無しさん＠ピンキー (ﾜｯﾁｮｲ 737a-KB/z)

2025/05/11(日) 16:14:00.76ID:fsVnkFbE0

昔のredditの投稿で、Ryzen AI Max+ 395でdeepseek-r1の70B蒸留モデルのQ8使ったら3token/sって話だったけど、どうなんやろね
https://www.reddit.com/r/LocalLLaMA/comments/1iv45vg/amd_strix_halo_128gb_performance_on_deepseek_r1/

>>14の記事だとQ3_K_L?らしいから、これがQ8になった時に本当にどこまで速度が落ちるのかどうか気になる

0055名無しさん＠ピンキー (ﾜｯﾁｮｲ 636a-7OJS)

2025/05/11(日) 17:35:15.05ID:ZK6f01030

遅いね

0056名無しさん＠ピンキー (ﾜｯﾁｮｲ 33ce-9L8h)

2025/05/11(日) 18:12:12.51ID:aNwVsevj0

ryzenMax+のmac ultraやDGXに対する加点部分はお値段とグラボが積めるってあたりか

0057名無しさん＠ピンキー (ﾜｯﾁｮｲ e3c0-aBcW)

2025/05/11(日) 18:53:46.87ID:tIZcxvUc0

GeminiをGoogle ai studioのAPIから使いまくってるけど一生使えるわ
なんなんだコイツは

0058名無しさん＠ピンキー (ﾜｯﾁｮｲ 1316-kIO2)

2025/05/11(日) 19:01:14.92ID:UfhF4txJ0

今日5090が届いたから4090から換装してみた
最新のgamereadyドライバ入れるだけでkoboldcppは動いたけどSBV2がpytorch未対応で動かず
そんで調べたらつい先日CUDA12.9が公開されてたので入れてみたらそれだけで推論も学習も動くようになったよ
comfyも同様
RTX50XX買った人はとりあえず最新ドライバにしてCUDA12.9入れるといいよ

0059名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr37-kKZT)

2025/05/11(日) 19:22:02.00ID:X0o+S5Gar

ドライバは最新のにしたくないなぁ
一応reforgeやKohyaも正常に動いてるし

0060名無しさん＠ピンキー (ﾜｯﾁｮｲ cf0e-QZP8)

2025/05/11(日) 20:23:10.64ID:HIgGdvz50

DGX SparkはARM64のLinuxなのが意外にネックになりそう
oobaもKoboldもx64ほど簡単には動かない予感

0061名無しさん＠ピンキー (ﾜｯﾁｮｲ cfd9-OIzT)

2025/05/11(日) 20:47:26.33ID:KSze43Me0

vLLMが動けばそれで解決するんじゃない？

0062名無しさん＠ピンキー (ﾜｯﾁｮｲ 7f1b-kIO2)

2025/05/11(日) 23:54:43.90ID:4SaZeGzm0

あ、やっぱり5090でSBV2の学習駄目ぽ…
文字起こしまではできたけど(4090よりクソ遅い)その先がエラー出るや

0063名無しさん＠ピンキー (ﾜｯﾁｮｲ eff4-A5UE)

2025/05/12(月) 01:54:15.29ID:J+nQccr80

ChatGPTスレから誘導されて来ました
ローカルで質問なんですけど
32Bモデルの量子化されてないオリジナルをロードできる環境があって
その環境でギリギリロードできるまで量子化した100Bモデルと32Bの非量子化モデルってどっちが生成の質が高くなりますか？
生成の質っていうのはタスクの理解力みたいやイメージです

0064名無しさん＠ピンキー (ﾜｯﾁｮｲ cf02-KB/z)

2025/05/12(月) 01:55:51.36ID:8E83fqQk0

うっかり嫁とエッホエッホの話振ったら
それ以降セックスの最中にもエッホエッホ言い出して笑い死ぬかと思った

0065名無しさん＠ピンキー (ﾜｯﾁｮｲ 7f30-9L8h)

2025/05/12(月) 02:20:48.95ID:Xl2DnzB/0

>>63
余裕で100b
4bitまでは性能劣化がほとんどないからサイズも1/4にできると考えていいよ

0066名無しさん＠ピンキー (ﾜｯﾁｮｲ a307-aBcW)

2025/05/12(月) 08:06:29.47ID:P1iu5DwA0

>>23　>>25
Wannabeで試してみたが
Qwen3-30B-A3B-NSFW-JP-Q4_K_M　まったく使い物にならんかった
Qwen3-30B-A3B-ERP-v0.1-Q4_K_M　こっちは出力されんかった
なおkobold上だと応答はあって不思議
>>44ニキは成功しとるみたいだから何かワイがwannabeで喰わせたjsonに問題あるんかな……

0067名無しさん＠ピンキー (ﾜｯﾁｮｲ 636a-7OJS)

2025/05/12(月) 08:44:27.59ID:XIJXEZ190

どっか設定違うんでしょ

■ このスレッドは過去ログ倉庫に格納されています