なんJLLM部避難所 ★10

1002コメント393KB

なんJLLM部避難所 ★10

■ このスレッドは過去ログ倉庫に格納されています

0001名無しさん＠ピンキー転載ダメ (ﾜｯﾁｮｲ dfc7-Jvli)

2025/11/23(日) 22:55:29.17ID:kt2SGedd0

!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512

AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所 ★8
https://mercury.bbspink.com/test/read.cgi/onatech/1746883112/
なんJLLM部避難所 ★9
https://mercury.bbspink.com/test/read.cgi/onatech/1755924738/

VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured

0481名無しさん＠ピンキー (ﾜｯﾁｮｲ a36a-Ubo7)

2025/12/25(木) 21:34:59.18ID:OB673X1y0

何したいか知らんが少ないんでは？

0482名無しさん＠ピンキー (ﾜｯﾁｮｲ 7332-wNtz)

2025/12/25(木) 21:46:29.83ID:6NV5/cQb0

LLM用途で64GBは後悔することはあっても満足することは無いと思うで

0483名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa9-xxTa)

2025/12/25(木) 22:21:30.19ID:gh+hQl730

まあそうだよね。。

0484名無しさん＠ピンキー (ﾜｯﾁｮｲ 5332-s35p)

2025/12/25(木) 22:26:38.46ID:ViJl0/9F0

うーむ。ようやく化石PCから新調したけど思ったより速度出ないな。

magnum123b iQ3k_mを旧PCで0.17t/s
同Q8_0を新PCで0.41t/s

うーん、なにか設定ミスったかな。まあ、CPUメモリだしなぁ

0485名無しさん＠ピンキー (ﾜｯﾁｮｲ 5332-s35p)

2025/12/25(木) 22:42:27.17ID:ViJl0/9F0

>>431
そちらの環境では何t/sでてますか？
こっちは1.89t/sでしたわ
GLM4.7 Q5_K_XL

0486名無しさん＠ピンキー (ﾜｯﾁｮｲ 8389-r6/A)

2025/12/25(木) 23:19:46.06ID:3J/gLz4j0

Nemotron3はなかなか良いね

0487名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fc7-SDhK)

2025/12/25(木) 23:34:18.22ID:X0ADdGKj0

>>485
4.1t/sですわ
GLM4.7 Q5_K_XL

0488名無しさん＠ピンキー (ﾜｯﾁｮｲ 93b2-VlN3)

2025/12/25(木) 23:43:37.00ID:+4TZHvI30

128GBでQ5で使える170Bくらいの良い感じのモデルが欲しい

0489名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fc7-rc7o)

2025/12/26(金) 00:22:15.91ID:yMjii2Jm0

LM Studioでとりあえず色々なモデルダウンロードしてるんだけど
ふと思ったがファイルってそもそも安全なんだろうか？

0490名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f7c-geEI)

2025/12/26(金) 00:58:47.21ID:p+OQnC8X0

何も考えずに ollama 使ってたけど直接 llama-server 叩いたほうが速いうえに webui も付いてたんだね
ollama ってなんのためにあるんだ…

0491名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sd5f-iM94)

2025/12/26(金) 00:59:59.20ID:qCRoD1VLd

GLMくらいのサイズのMoEで要らないエキスパートを外せれば128GBでも動きそうだが
メモリ128GBの貧乏人のことを真剣に考えてくれる開発元はQwenくらいしかないのが悲しい現実

0492名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sd5f-iM94)

2025/12/26(金) 01:02:34.18ID:qCRoD1VLd

米欧中のモデルって中身がほとんど英語と中国語だから
日本語メインのユーザーから見たらスッカスカのsparse状態だよな

もちろん英中を抜いて精度が維持出来るわけではないだろうが
日本人があまりにも不利すぎる

0493名無しさん＠ピンキー (ﾜｯﾁｮｲ 5332-s35p)

2025/12/26(金) 01:26:33.67ID:kUso6zPz0

>>487
さんきゅ

コンテキストをVRAMに乗せて、メモリ設定をexpo1にしたら、generate 2.16t/sになったけど、まだ半分かぁ

0494名無しさん＠ピンキー (ﾜｯﾁｮｲ b319-nQdN)

2025/12/26(金) 03:41:49.42ID:7grGkI6v0

>>480 予算という制限は最優先だけろうけど64GBはちょっとつらい
Macはメモリ全部をVRAMに回せるんだけど、当然OSの
分が必要なわけで 8から10GByteは少なく見積もったほうがいい

もともとQ4対象とするモデル(gpt-ossとか)じゃないと劣化が激しくて
実用には程遠い(Q1で「動いた!」と夢を見てもねw)

最近MoEが流行ってきたせいで128GByteでもちょいちょい足りない
待てるならM5 maxを待った方がいいよ

M3チップから先のM系CPUは、mlxモデルなら量子化圧縮の他に内部でリアルタイムで
コストなしにメモリー圧縮してくれる
例えば100GByteのモデルだと80GByteくらいになることもある。当然まったく縮まないモデルもある

あと画像動画系はM4maxまでは使いもんにならんので素直にRTXを選択だ

0495名無しさん＠ピンキー (ﾜｯﾁｮｲ b358-+e8j)

2025/12/26(金) 04:19:27.11ID:Wrkd9qpz0

オープンなモデルで見ると中国製はまだ日本語わかる方で英語圏のはマジで日本語知らない
Llamaとかきついね
最初あれを日本語ファインチューニングしてた会社多かったけどqwenの方が日本語分かるってみんな乗り換えたし

0496名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-s35p)

2025/12/26(金) 05:52:46.69ID:8zRv1QPC0

DRAM市場は価格変動が激しく、利益率が低いことで知られています。
特に、AIブームによるサーバー向け需要が優先され、PC向け供給が逼迫している現在、
ASUSのようなPCメーカーにとっては調達コストの上昇が深刻です。
噂では、ASUSが2026年に自社DRAM生産ラインを構築（または提携）するのは、
自社製品（ノートPC、デスクトップ）の供給を安定させ、価格転嫁を避けるためとされています。
しかし、この市場はSamsung、SK Hynix、Micronの「ビッグ3」が支配しており、
新規参入は資本集約的で収益化が難しい。台湾企業がこうした市場に手を出すのは、
単なるビジネスではなく、台湾の半導体エコシステム全体の戦略的強化を意図している可能性があります。
台湾政府は半導体を国家安全保障の柱と位置づけ、TSMCのようなファウンドリ（受託製造）だけでなく、
メモリ分野での自立を推進しています。これにより、中国依存を減らし、
米台同盟を強固にする地政学的メリットが生じます。

0497名無しさん＠ピンキー (ﾜｯﾁｮｲ 5332-s35p)

2025/12/26(金) 08:06:40.90ID:vPKVvi2t0

>>489
画像生成AIの初期にモデルデータに任意のコードを仕込めるのが発覚して
安全なSafetensorsやGGUFに移行したから今はほぼ大丈夫

0498名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fc7-SDhK)

2025/12/26(金) 12:29:34.27ID:gBa6xuvc0

>>484
PC新調したんやね
同じモデルで比較しなかったのはなんでだろ？

0499名無しさん＠ピンキー (ﾜｯﾁｮｲ 5332-Fga2)

2025/12/26(金) 12:56:43.48ID:kUso6zPz0

>>498
書き忘れてたわw
iQ3k_mだと1.32t/sやった
Q8でここまで落ちるんかとショックだわ
>>487のニキと何が違うんやろ
多分スペック的には大差ないと思うけど
ryzen7 9800x3d msi rtx5090
メモリcp64g56c46u5✖4 256G
5090怖いんでPL運用

0500名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fc7-SDhK)

2025/12/26(金) 13:33:50.22ID:gBa6xuvc0

>>499
うひゃ、すごいな
俺は4年前のスリッパなんでそこまで性能良くない

俺のスペックはこれ
Threadripper Pro 5955WX(16c32t)
DDR4 3200MHz 32GB@8枚(オクタチャネル)
RTX 5090+RTX 3090@3枚 PCI4.0接続

違いはメモリ帯域かなと思ったけど
5955WXは2CCDという制約があって、メモリ帯域がまだフル稼働してない状態なんよ
実効帯域は半分の90GB/s弱のはず
これだとDDR5のハイエンドデスクトップと変わらんはずなんよね

Magnum v4 123B Q8試してみたけど0.58t/sだったので、GLM4.7ほどの差はない模様

0501名無しさん＠ピンキー (ﾌﾞｰｲﾓ MM5f-s35p)

2025/12/26(金) 13:36:55.39ID:MZheLxaPM

>>500
すげーその構成でどれくらいの電源が必要ですか

0502名無しさん＠ピンキー (ｻｻｸｯﾃﾛﾙ Sp77-Fga2)

2025/12/26(金) 14:09:28.35ID:m9gDF1Omp

>>500
おおお
サーバでvram爆盛りやないすか
土俵が違いましたわw

0503名無しさん＠ピンキー (ﾜｯﾁｮｲ cf4c-gcTU)

2025/12/26(金) 21:44:50.00ID:MbwwI/fJ0

openRouterのGLM4.7はプレフィルにここの<think>のやつを入れたらだいだいOKだな
ただreasoningのほうに本文が全部入って帰ってくることになるからapi呼び出しコードとかちょっと修正がいるかも
ttps://www.reddit.com/r/SillyTavernAI/comments/1pv8jto/glm_47_my_holiday_present_to_those_effected_by/

0504名無しさん＠ピンキー (ﾜｯﾁｮｲ cf4c-gcTU)

2025/12/26(金) 21:48:00.90ID:MbwwI/fJ0

帰ってくることになるから　×
帰ってくることがあるから　◎

0505名無しさん＠ピンキー (ﾜｯﾁｮｲ 5332-s35p)

2025/12/26(金) 23:17:40.89ID:kUso6zPz0

>>503
4.7の規制解除版が出るまで
huihui-ai/Huihui-GLM-4.6-abliterated-GGUF
これ使ってる

thinkオフにしてやるとレスポンス良くて使い勝手いい
しかも日本語エロ最高ｗ

0506名無しさん＠ピンキー (ﾜｯﾁｮｲ 6ac7-Ls7H)

2025/12/27(土) 01:57:05.71ID:HyeodPWU0

ノベルはどこでみんなプロンプト勉強してるんだろ
学習場所みたいなの知りたい
ちなみに、SDはCivitaiなど先人のプロンプトが物凄く役に立った

0507名無しさん＠ピンキー (ﾜｯﾁｮｲ 6ac7-Ls7H)

2025/12/27(土) 01:57:53.57ID:HyeodPWU0

あと、ノベルに限らずLLMへの質問の仕方で回答かなり変わるしイマイチかん所が分からない

0508名無しさん＠ピンキー (ﾜｯﾁｮｲ 6ac8-0Alr)

2025/12/27(土) 02:22:26.07ID:J3Q+YJdX0

Grok先生とのレスバが最強でしょ

ＧＰＴのエロ解禁でどう変わるか

0509名無しさん＠ピンキー (ﾜｯﾁｮｲ e632-4mSN)

2025/12/27(土) 07:06:17.86ID:PA+m8zpZ0

>>56
尻タブのキャラクターカードを参考にするといい
https://aicharactercards.com/

ピンキリだけど何の取っ掛かりもなく一人で試行錯誤するよりはだいぶマシだ

0510名無しさん＠ピンキー (ﾜｯﾁｮｲ e632-4mSN)

2025/12/27(土) 07:06:35.15ID:PA+m8zpZ0

>>506だった

0511名無しさん＠ピンキー (ﾜｯﾁｮｲ cf20-UjAx)

2025/12/27(土) 10:47:56.62ID:qjlNvfdb0

モデルの進化に伴ってプロンプトの書き方は意味を失っていって、適切なコンテキストを渡せるかどうかの話になっていくから、今からプロンプト頑張っても1年2年で賞味期限切れになる気がする

0512名無しさん＠ピンキー (ﾜｯﾁｮｲ f180-JWG4)

2025/12/27(土) 10:56:34.89ID:0sXLjJzB0

そもそもプログラム言語が書けなくても色々やらせられるのが画期的だったんだからそれを学ぶってのも変な話なんだよな

0513名無しさん＠ピンキー (ﾜｯﾁｮｲ f0a0-0Alr)

2025/12/27(土) 11:04:09.25ID:UhnTFn4+0

最低限マークダウン形式は理解する意味がある

0514名無しさん＠ピンキー (ﾜｯﾁｮｲ 1f37-Ls7H)

2025/12/27(土) 13:43:07.28ID:Hy8yFs+J0

ある程度は同レベルじゃないと会話が通じないのと同じで、AIに高度なことをさせようと思ったら自分自身にも知識が必要という

0515名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sdee-KwNi)

2025/12/27(土) 15:46:43.74ID:JH4k1F+Sd

AntiGravity時代やから的外れなコードやドキュメントを指示出しで軌道修正するスキルが一番大事や

書けない分からないじゃなく出してから考えるんや

0516名無しさん＠ピンキー (ﾜｯﾁｮｲ 5a02-SbIX)

2025/12/27(土) 18:04:07.80ID:GInV4/hz0

GLM4.7を量子化無しで動かしたいなあ
500万円あったら足りるんかね

0517名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sdee-KwNi)

2025/12/27(土) 18:10:38.66ID:JH4k1F+Sd

>>516
ワイは月3ドルのChutesでええわ

0518名無しさん＠ピンキー (ﾜｯﾁｮｲ 6ac7-Ls7H)

2025/12/27(土) 18:22:42.46ID:HyeodPWU0

>>509
ありがとう
キャラクター設定を作るまでは分かったけどそれでどう楽しむのかが良く分からない
SDだとシンプルに画像を作ってみて楽しめるけどLLMはどうするん？

>>511
SD、2年やってるけど、プロンプトは基本的に同じだな、ただ関わってると大きな変更があると掲示板で話題になるからその時一部変更してそのまま移行できてる

>>514
そんなことはない、分からなければ聞けばいつまででも教えてくれる
サンプルプログラムを貼り付けるだけのスキルしか無いから、高度なこと(何が高度なのかすら分からない)は無理だと思うけど、
こんなスクリプト作ってと言って、動くまで繰り返したら中身の全く理解できないソフトができたりしてるわ　しかも、Perlしか使えないのに、PythonでGUIなソフトまで作ってくれた
時間はかかるけど、どんな物が欲しいのか(可能なら途中の処理がはっきりしてれば)がはっきりすればある程度はできる時代だと思う
ただ、ファイルの読み書きみたいな基本的な事もお任せしてたら、最近それも忘れてきた、AIなしだと何もできなくなりそうな怖さある

0519名無しさん＠ピンキー (ﾜｯﾁｮｲ 5a02-SbIX)

2025/12/27(土) 18:44:41.69ID:GInV4/hz0

>>517
chutesって量子化されてるだろ

0520名無しさん＠ピンキー (ﾜｯﾁｮｲ e632-4mSN)

2025/12/27(土) 19:19:40.12ID:PA+m8zpZ0

>>518
LLMはAIのシステムプロンプトに「あなたはこういう役割だからこういう風に振舞って」と基本ルールを記述しておく。
それとは別に「今からこういうことをして」というユーザープロンプトを与えると、基本ルールに沿った挙動で返信してくれる。

だから例えばAIに対して「あなたはファンタジー小説家です。私はあなたの担当編集者なので私の指示に従って小説を書いてください」という基本ルールを与えておいて
「それでは今から、物語の最初のシーンである勇者が冒険に旅立つ場面を書きましょう」とユーザープロンプトを与えるとファンタジー小説家らしく小説の冒頭を書き始めを生成してくれる。
スクリプト作るときも基本は同じやで。

AI画像生成、特に最近主流のリアスなんかはdanbooru語のプロンプトを与えるだけで良かったけど、LLMはもうちょっと設定の仕方が細かく分けられているって感じ。
さらにAIが理解しやすい記述方法にマークダウン記法とかを使った構造化プロンプトがあるからそれぐらいは覚えておいた方がいい。
構造化プロンプトはZ-image turboでも有効だと判明したからAI生成画像をやる場合でも覚えておいて損はないと思う。

0521名無しさん＠ピンキー (ﾜｯﾁｮｲ f0a0-0Alr)

2025/12/27(土) 19:25:08.76ID:UhnTFn4+0

チャッピーとかみんなマークダウン形式でやり取りしてる

0522名無しさん＠ピンキー (ﾜｯﾁｮｲ 6aac-Ls7H)

2025/12/27(土) 19:43:59.04ID:HyeodPWU0

>>520
これでどうエロに繋げるの？
とりあえず、mistral-small-24b-instruct-2501-abliterated-i1落としてエロ小説にしてと言ったらやってくれたけど、
それなら本でいい気がするが、LLMみんなハマってるし、もっと楽しんでるよね？
いまいち楽しみ方が分からん

あと、プログラム(Perl)だけどやってほしいことを箇条書きや文章で投げるだけばかりだったわ
ただ、AIにプロンプトをお願いしたら###がたくさんあるのを返してくれるな　この記法も覚えたほうがいいのか
z-imagaはまだ使ってないけどnanobananaだと誤字脱字無駄な文章ありまくりでもいいものができるし、内部でうまいこと処理してくれてんのかな

>>521
みんなのプロンプト例をあまり見ることがないから知らなかったわ
画像だとあるけど、LLMでもこんなプロンプトでこんな物作ったみたいな例がたくさん乗ってるサイトってあるかね？
そういうのからざっくり勉強(真似)したい

0523名無しさん＠ピンキー (ﾜｯﾁｮｲ f0a0-0Alr)

2025/12/27(土) 20:11:33.98ID:UhnTFn4+0

チャッピーとかは頭いいから、適当に書いても組みとっていくれるけど
マークダウンで書けば100%指示が伝わるから

0524名無しさん＠ピンキー (ﾜｯﾁｮｲ e632-4mSN)

2025/12/27(土) 20:30:00.68ID:PA+m8zpZ0

>>522
絵だってAIで生成せずともpixiv見るなり画集やCG集買うなりすればええやろ？
でも自分好みの絵が欲しいからAIで生成しているわけだ
文章も同じで自分好みの小説やキャラとのチャットを楽しみたいからLLMで生成するわけだ
本で満足できるなら別にLLMで生成する必要は無いで

エロに繋げるならエロ小説だけでなく
koboldcppのアドベンチャーモードを使って、プレイヤーの行動を記述することで物語が順番に進むエロTRPGみたいなこともできるし
単にキャラ設定を書いて自分好みのキャラとエロチャットを楽しんでもいい
妄想力とリビドーを働かせて遊ぶんやで

0525名無しさん＠ピンキー (ﾜｯﾁｮｲ 8d32-0Alr)

2025/12/27(土) 21:12:44.85ID:OFD0eLnw0

>>522
自分のお気に入りのキャラ（版権でもオリジナルでもいい）の設定を書いて
自分好みのシチュエーション提示して書いてもらったりする。
エロなら竿役の設定もね

0526名無しさん＠ピンキー (ﾜｯﾁｮｲ f432-ISUa)

2025/12/27(土) 21:54:34.36ID:2DxrJ48B0

絵は長らくdanbooru語で書かなきゃいかんかったから変にプロンプトぢから必要なだけで
こっちは日本語でも英語でも人間相手に分かりやすい書き方なら何でもいい
典型例にはmarkdownがある

0527名無しさん＠ピンキー (ﾜｯﾁｮｲ be32-0Alr)

2025/12/27(土) 22:42:39.52ID:EHZ6LBSo0

やりたいことやモデルにもよるけど、AIが得意な言語に合わせるのは重要だぞ
Nano Bananaは日本語だと全然言うこと聞かなくて
プロンプトを英語に翻訳したらあっさり意図した画像が生成できたりする

0528名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr9b-UjAx)

2025/12/27(土) 23:52:40.76ID:goYPX3Hpr

>522
よく分からないうちはもっと大型のLLMでやるほうがいい
gemini3.0proのAPI版とか
で、文章生成AIスレを両方とも覗いて参考にするのがベストに思える

ある程度小説読むひとなら、エロを主目的にするよりは文章を書くことを目的にしてエロで習慣化する、てのがいいんでないの
面白さを優先してたらエロさと微塵も関係ない話を10万字書いてました、みたいな話はあるあるだしね
数を書くと文章の型とキャラの型が出来てくるから、そこまで行けばあとは好きに作れるようになるよ

0529名無しさん＠ピンキー (ﾜｯﾁｮｲ 029f-FE3X)

2025/12/28(日) 01:31:14.07ID:BXAiGjWS0

>>522
ローカルAIなんてGPTやらGeminiやらと性能が雲泥の差があるから、余程の特定用途でもない限りローカルAIを、しかもエロ用途で使わない。

そういったコアな質問をしたかったのかな？

0530名無しさん＠ピンキー (ﾜｯﾁｮｲ c0a9-0Alr)

2025/12/28(日) 02:28:58.74ID:axaFFb1D0

MiniMax-M2.1って出てんねんな
229Bだって
MiniMaxってあまりここで話出てこないけどどんなんやろ

0531名無しさん＠ピンキー (ﾜｯﾁｮｲ cd9f-9IRd)

2025/12/28(日) 02:32:13.41ID:q0iBkmVY0

MiniMaxは日本語全然ダメやね
表現が貧弱というより日本語で答えろって言っても中国語か英語になりやすい

0532名無しさん＠ピンキー (ﾜｯﾁｮｲ 6aac-Ls7H)

2025/12/28(日) 02:52:14.12ID:/ozKpiSI0

>>524,525
同人誌を知らない人が、初めて同人誌というものを知ったら夢中になるじゃん
同じ様に、ローカルLLMをどんな風に楽しく使ってるのか、どういう世界があるのかが気になってる
チャットだけどエロゲ(殆選択肢なし)は昔良くしてたけど、主人公の発言がもし大量に必要ならコミュ力無いから正直進められる気がしないわ><
自分をアシストするような強化したLLMを用意したらいけるかもだが
あと、ソフト使ったりそういう感じで作り込んだりするんだな勉強になる！
ただこれって公開してる人居ないのかね？2chの頃だと自作小説を延々と投稿する人とか居たけけど最近そのスレ見かけない

>>527
かなり適当な書き方やDanbooru語でもいい感じで出るけど、英語必須って色々とレベル高そう

>>528
つい最近ローカルLLMはじめたんだけどサイズ的に小さいかな？　ただ、思ったよりも的確で驚いてる所。
パスワードとか個人情報がたくさんあって表に出したくないのはローカルで使えそうな気がしてる。
また、無料しか使ったこと無いけどGemini有料版は更に優秀？無料でも十分凄いと思ってる所だが使いこなせてないかも
あと、文章生成AIスレあるのか、見てみる

>>529
自分の場合版権もの多めでエロ画像を1日5000枚くらい見たいという熱烈な欲望があって生成AIをはじめた
GeminiはSDのLoRA学習元画像を作るのに使ってる
このスレではSDよりも高価なPCを用意してLLMで楽しんでる人も多く、どう楽しんでるのか気になってる感じ
自身はヌルオタで情報集めるのが下手で同人という世界を知ったのもかなり遅く、楽しそうな世界はあるような気はするけど、具体的な世界が見えない感じ
ただ、規制なしLLMは元々化学を専攻してた身からすると、どこまでも知識を掘れるのは面白いと感じてる、作ることはないけど知識欲はなかなかに満たしてくれる
あとRAGとか？うまくすれば、ちょびっツみたいなAIが作れるのかとか気になってる

0533名無しさん＠ピンキー (ﾜｯﾁｮｲ 82dd-mqrN)

2025/12/28(日) 03:35:47.86ID:T164suva0

自分もコミュ力ないから画像認識モデルに画像投げて「過激で性的なストーリーを」で終わりよ
Qwen3-VL-32B-Instruct-hereticあたりならノリノリで書いてくれるぞ
AI絵に設定やストーリーが加わるだけでも没入感が全く違う

0534名無しさん＠ピンキー (ﾜｯﾁｮｲ e632-4mSN)

2025/12/28(日) 06:12:23.25ID:IfHjdL+D0

>>532
主人公の発言なんて1文でもいいよ。あとはそれに沿って適当に進めてくれる
もしくは3つの選択肢に番号を振って提示させるようにすれば「1」って打つだけで選択肢1の内容を書き進めてくれるようになる
1. 町に出かける
2. ダンジョンを探索する
3. エルフの村を襲撃する
みたいに文章の終わりに次のユーザーの行動の選択肢を提示させるようにするんだ

他にもキャラ設定とシチュエーションを練り込んで、「昨日1日中犯され続けたことについて1時間ごとに区切って詳細に報告しろ」って言えば
どんな風に犯されたのか好きなキャラが淫語連発しながら報告してくれるとか色んな遊び方があるぞ
とにかく発想力をフル活用して自分がエロい、楽しいと思う遊びをするんだ
ある程度賢いモデルなら大体のことは出来る

0535名無しさん＠ピンキー (ﾜｯﾁｮｲ 5c50-7ChI)

2025/12/28(日) 06:47:41.88ID:ixi8DXTr0

BTO受注停止騒ぎの直前に新規にPCの発注をかけてたけど
納期が長いと冷静になっていけないなぁ…
外部のAPI経由でLLM使うなら
メモリを128GBにしなくても良かったんではないかとか
今になって頭の中でぐるぐるとしちゃって困る
GPUは16GBで抑えちゃったのになぁとか

0536名無しさん＠ピンキー (ｽｯｯﾌﾟ Sdec-CL6D)

2025/12/28(日) 12:57:46.25ID:gTMSw00Dd

PC新調しようかと思ったらネット注文不可
今日アキバに行ったんだけど、BTO軒並み在庫無し
グラボ自体も在庫無しorおま国価格
ヤベーよ

0537名無しさん＠ピンキー (ﾜｯﾁｮｲ 8c58-CT96)

2025/12/28(日) 13:07:13.67ID:i17KAbG/0

流石に2週間遅くないか
来年以降メモリ上がるから急いで買えって風潮だったやん

0538名無しさん＠ピンキー (ﾜｯﾁｮｲ d2f7-lw50)

2025/12/28(日) 13:11:29.91ID:5KEE6fBu0

新しいモデルを作ったで　小説生成支援アプリのproject wannabeと合わせて使ってみてほしいやで
https://huggingface.co/kawaimasa/Wanabi-Novelist-24B-GGUF
最低VRAM:16GB 推奨VRAM:24GB(q5km 24Kコンテキスト)~32GB(q6k 128Kコンテキスト)　専用アプリに特化してるから一般的な応答はできないので注意やで　

0539名無しさん＠ピンキー (ﾜｯﾁｮｲ f0c4-rRc0)

2025/12/28(日) 15:01:39.08ID:fJEhobiW0

>>538
おつかれさんやで！さっそくDLさせてもらう！

0540名無しさん＠ピンキー (ﾜｯﾁｮｲ 8267-53/h)

2025/12/28(日) 19:25:27.10ID:jMt3GEX50

もう地方の工房行脚する段階だろう

0541名無しさん＠ピンキー (ﾜｯﾁｮｲ 1f4c-Ls7H)

2025/12/28(日) 22:27:40.63ID:5e7hK7Am0

いまは時期が悪いおじさん「もうは時代がわるい」

0542名無しさん＠ピンキー (ﾜｯﾁｮｲ 8d32-0Alr)

2025/12/28(日) 23:37:14.92ID:jf4VxSVY0

mradermacher/Mistral-Large-3-675B-Instruct-2512-i1-GGUF

ここの　i1-IQ3_XXS 258.9G ってなってるけど、メモリ256Gに余裕で乗りましたので報告
若干規制掛かってるけど、プロンプトでなんとかなるレベルかな
日本語はかなりいい

ただ、HG側の問題でダウンロードは普通にやるとエラーになるから、Communityの書き込みを参考にしてね

0543名無しさん＠ピンキー (ﾜｯﾁｮｲ 1e38-Xpyt)

2025/12/28(日) 23:49:03.79ID:zaDZPMc00

ヒイヒイ言いながらddr4 3200 32gbを中古で買い集めて128GBにしたよ
とりあえず今挿して動くならそうそう壊れたりはしない…よな？
高騰は辛いけど手持ちのメモリもそこそこの値段で売れたので実質一枚平均12000円くらいだった

0544名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sdee-KwNi)

2025/12/28(日) 23:55:04.62ID:KEZv6WoId

>>543
おめでとう
これでQwen3 235Bデビューできるな

0545名無しさん＠ピンキー (ﾜｯﾁｮｲ dac8-cEFC)

2025/12/29(月) 00:56:52.09ID:OXDLX/Y60

>>538
いつもありがとうございます

ソフトとモデルをアップデートしたのですが
以前には一度も出なかった以下のエラーが出てしまいます

コマンドプロンプトでは
[ContextUtils] Failed to count tokens: All connection attempts failed
[ContextUtils] Failed to get true_max_context_length: All connection attempts failed

ソフトの出力窓では
--- 無限生成中エラー: Request Error: An error occurred during the request to http://127.0.0.1:5001/api/extra/generate/stream. Details: ---
と出て停止してしまいます

何か設定を間違っている感じでしょうか

他のモデルを使用しても以上のように停止してしまうので
困っております

0546名無しさん＠ピンキー (ﾜｯﾁｮｲ 6ac7-Ls7H)

2025/12/29(月) 01:03:03.91ID:IuqqNF7w0

>>533
その方法は良さそうだなしかもGeminiだと拒否されそうな内容、ローカルで試してみる
>>534
選択肢すらAIに作ってもらう発想は思いつきもしなかった、発想が凄い、ここで聞いてよかたぜ

0547名無しさん＠ピンキー (ﾜｯﾁｮｲ d2f7-lw50)

2025/12/29(月) 01:29:25.05ID:ewL055nu0

>>545
新規に環境を作り調査しましたが再現できませんでした

エラー内容から察するにkoboldcpp側との接続が確立できていないので、以下の内容を試してみてください

・koboldcppのアップデート（最新のkoboldcpp-1.104で動作確認しています）
・koboldcpp側でモデルを読み込んだ際に出る"Please connect to custom endpoint at http://localhost:5001";のメッセージを確認し、5001以外のportが使われている場合は設定→KoboldCpp設定→KobldCpp API portをkoboldcppの表示に合わせる
・koboldcppを別フォルダで新規クローンしてみる

これでも問題が解決しない場合は再度状況を教えていただければ対応いたします

0548名無しさん＠ピンキー (ﾜｯﾁｮｲ d2f7-lw50)

2025/12/29(月) 02:08:15.28ID:ewL055nu0

>>547
× koboldcppを新規クーロン
〇 wannabeを新規クーロン
訂正します

0549名無しさん＠ピンキー (ﾜｯﾁｮｲ dac8-cEFC)

2025/12/29(月) 12:43:26.33ID:OXDLX/Y60

>>547
ご返信ありがとうございます
koboldcpp.exe最新版使用や環境再構築、ポート番号設定など
作者様の指示通りにした後、再度同じ動作（起動させて「無限生成」）
をしたのですが、以下のように>>545で書いたようなエラーが出てしまいました

ソフトの生成窓には
--- 生成ブロック 1 ---から開始され、数文字あるいは数行出力された後で
--- 無限生成中エラー: Request Error: An error occurred during the request to http://127.0.0.1:5001/api/extra/generate/stream. Details: ---
と出て停止してしまいます

コマンドプロンプトでは
[ContextUtils] Failed to count tokens:
[ContextUtils] Failed to count tokens:
[ContextUtils] Failed to count tokens: All connection attempts failed
[ContextUtils] Failed to count tokens: All connection attempts failed
[ContextUtils] Failed to get true_max_context_length: All connection attempts failed
と出てその後、窓を閉じるまで後段2行が連続して出力されます

なお、関係ないかも知れないですがpythonのverは3.13（Win10 64bit）で
モデルはWanabi-Novelist-24B_Q5_K_M.ggufを使用しました
また、ログによると以下のようなパラメータ設定でした
（デフォルトから変えておりません）
"temperature": 0.5,
"min_p": 0.1,
"top_p": 0.95,
"top_k": 40,
"rep_pen": 1.1,
"stop_sequence": [],
"banned_tokens": [],
"ban_eos_token": true,
"max_length": 500

0550名無しさん＠ピンキー (ﾜｯﾁｮｲ d298-lw50)

2025/12/29(月) 20:37:33.61ID:ewL055nu0

>>549
538です。
エラー内容はkoboldcpp側との通信が失敗していることを示していますが、数文字は出力されているため初期の接続はできていると思われるので原因を切り分けるために以下について教えてもらえませんか？
[ContextUtils] Failed to count tokens: All connection attempts failed
[ContextUtils] Failed to get true_max_context_length: All connection atte
というエラーが出ている状態でのkoboldcppの状態を教えてください。

簡易チェック
・エラーが出ている最中にhttp://localhost:5001　が開けるか（5001は手元のport番号に合わせる）
→開けない場合はkoboldcppがクラッシュしています。コンテキストを減らす、小さなモデルを使うなどして様子を見てください。
・上記kobold側の簡易UI経由では途切れることなく生成されるか
→途切れる場合は別の量子化モデルでも同様の症状が起きるか確認してください。

0551名無しさん＠ピンキー (ﾜｯﾁｮｲ be58-Xpyt)

2025/12/29(月) 22:08:09.84ID:ThxXm4Cn0

3090(24GB)x2＋メインメモリ128GBで、Qwen235B-A22Bも123B系も0.5t/sくらいなんだが、もうちょい早くならんもんかね

0552名無しさん＠ピンキー (ﾜｯﾁｮｲ 0a24-wKEG)

2025/12/29(月) 23:50:39.28ID:Lo0GYeRO0

>>551
何で動かしとるん？3090の性能がどんなもんか詳しくしらんけど流石にQwen3-235Bはもうちょい早くなると思うぞ
ワイは5070tiでllama.cppから動かしとるけどそこまでは遅くない

0553名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sdee-KwNi)

2025/12/30(火) 00:43:29.12ID:lvS6oXsJd

クソデカコンテキスト長でぶん回してるとか

0554名無しさん＠ピンキー (ﾜｯﾁｮｲ f432-ISUa)

2025/12/30(火) 01:43:28.56ID:I8us/ozu0

提示するべき情報がものすごく欠けてる

0555名無しさん＠ピンキー (ﾜｯﾁｮｲ 05ff-rRc0)

2025/12/30(火) 02:48:07.84ID:lMorHdVk0

>>550
横からですが同じようなエラーに行き当たっていたので
環境としては5060ti 16GB DRAM 128GB
Windows11、Koblodcpp1.104、Project-Wannabeのmainブランチを本日pullしてます
WannabeのvenvはPython 3.12.6で構築してます

動作としてはKoboldcpp側でエラーが出て結果的に両方を落とすことになります

modelとしてWanabi-Novelist-24B_Q3_K_M.ggufと
wanabi_24b_v03_q4km.ggufを用いた場合共に発生
またKoboldcpp+sillytavernでモデルが動作することを確認しています

wanabe上で入力が限られた状態での初回連続生成では上手く動くことが多いのですが、
1度停止した後の再度連続生成でエラーが出て停止するケースが多いです
ただよく見ると、参照する本文がある程度長いと初回の連続生成でもエラーが出ているみたいです
しばらく
[ContextUtils] Failed to get true_max_context_length:
が続いた後稀に通信が成功するみたいですが連続生成を中断すると
koboldcpp側で正常に通信が終了せず
以下を含む数行のエラーメッセージがポート番号を1つずつインクリメントしながら延々続きました
Exception happened during processing of request from ('127.0.0.1', 62026)
(略)

0556名無しさん＠ピンキー (ﾜｯﾁｮｲ 05ff-rRc0)

2025/12/30(火) 02:48:43.08ID:lMorHdVk0

>>555の続き
また、本文入力なしでタイトルと簡単なあらすじだけだと初回は正常に動作し
本文を500トークンほど反映した2回目の生成ではKoboldcpp自体が落ちました
落ちる直前に見たときにコンテキストlengthが42xxを期待しているのに実際には41xxしかなかった
といった趣旨の文章が読み取れた気がしましたがその後Powershellごと落ちているのですいません
Koboldcpp側が落ちるとProject-Wannabeの側も正常に停止せず下記のようなメッセージで空回りが続くので
Powershellごと停止する形になっています
[ContextUtils] Failed to count tokens: All connection attempts failed
[ContextUtils] Failed to get true_max_context_length:

(上が延々続いてCtr+Cを押すと、この下の数行が続く、停止しないのでPowershellごと落とす)

[ContextUtils] Failed to get true_max_context_length: All connection attempts failed
Error calling Python override of QObject::timerEvent(): Traceback (most recent call last):
File "J:\LLM\Project-Wannabe\venv\Lib\site-packages\qasync\__init__.py", line 281, in timerEvent
del self.__callbacks[timerid]
~~~~~~~~~~~~~~~~^^^^^^^^^

0557名無しさん＠ピンキー (ﾜｯﾁｮｲ f0a0-0Alr)

2025/12/30(火) 06:17:08.08ID:FRPgPKaW0

親の顔より見慣れたpythonエラー

0558名無しさん＠ピンキー (ﾜｯﾁｮｲ be58-Xpyt)

2025/12/30(火) 06:44:06.82ID:3A8Anhbj0

>>552
LM Studio
ソフトで差が出るもんなの？

0559名無しさん＠ピンキー (ｼｬﾁｰｸ 0C71-1aal)

2025/12/30(火) 07:52:10.94ID:RCh0/l2gC

>>558
cuda使ってないとか？

0560名無しさん＠ピンキー (ﾜｯﾁｮｲ 6ac7-Ls7H)

2025/12/30(火) 08:09:46.00ID:UqaFaSWG0

価格コムでVRAM16GBで見てたら
RTX5060Ti 16G 8万円
5090 32GB 65万円　
5060Ti 2枚で32GBになるし、仮にだけど8枚でVRAM 128GBとかもあるし
下手に5090するよりも5060Tiで自作頑張る方が実はLLM向き？
というか、はじめっからAIなら最上位GPUって思ってたから
そもそも見てなかったんだけど、これかなり美味しい？
気になってAIに聞くと錬金術とか言ってるけど実際どうなんだろ？

0561名無しさん＠ピンキー (ﾜｯﾁｮｲ d20e-lw50)

2025/12/30(火) 09:44:29.57ID:Xq3KgeF30

>>555
詳細なご報告ありがとうございます。
やはり手元の環境では再現しなかったのですが、頂いたログから通信過多によるKoboldCpp側のクラッシュと推測し、以下の修正を行いました。

・生成中の不要なAPI呼び出し（トークンカウント）を停止し、通信負荷を大幅に軽量化
・終了時にプロセスが残りフリーズする問題を修正

git pullをお願いします。

もし更新後も改善しない場合は、本ソフトの「設定」→「生成パラメータ設定」→「最大コンテキスト超過時の処理」を『最大本文文字数にトリム』または『何もしない』に変更して動作をご確認ください。

0562名無しさん＠ピンキー (ﾜｯﾁｮｲ dac7-CKxx)

2025/12/30(火) 11:01:58.47ID:XOEiLvuB0

>>558
LM Studioの設定どうなってる？

Qwen235B-A22Bの場合はMoEモデルだからGPUオフロードを最大にして、Force Model Expert Weights onto CPUにチェックをいれるだけだよ
コンテキストサイズやCPUスレッド数はお任せ

画像は別MoEモデルの設定ね
https://i.imgur.com/jd8G4zK.png

0563名無しさん＠ピンキー (ｵｯﾍﾟｹ Srd3-UjAx)

2025/12/30(火) 11:08:46.67ID:PDgBbkB5r

8枚64万円とそれを動かす巨大リグをなんとか構築しても128GBにしかならない、という時点でどうもこうもないような

0564名無しさん＠ピンキー (ﾜｯﾁｮｲ 6aac-Ls7H)

2025/12/30(火) 11:22:17.42ID:UqaFaSWG0

>>563
5090　だと65万円で32GB、同じ価格で4倍のVRAMを確保できるのはかなりお得じゃない？
リグの料金がいくらになるのか分からないけど、ここまでじゃなくても、
2枚なら普通のM/Bで使える、この価格で5090と同程度のVRAMが確保できるのはかなりお得じゃないのか？
もちろん、これで足りないのはRAM依存になるけどVRAMが大きければそれだけで早くなるような気もする

0565名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f58-Ls7H)

2025/12/30(火) 11:34:48.37ID:bvNvqdUb0

VRAM128GBとメインメモリ128GBあれば大抵のことはできる

0566名無しさん＠ピンキー (ﾜｯﾁｮｲ 8294-mqrN)

2025/12/30(火) 11:40:11.78ID:L/CH3/cp0

パフォーマンス重視ならllama.cppを直接叩いたほうが良いのでは
llama.cppをバックエンドにしてるソフトは本家より遅くなることはあっても速くなることはないだろうから

0567名無しさん＠ピンキー (ﾜｯﾁｮｲ 6ea4-JWG4)

2025/12/30(火) 12:00:05.85ID:xVlh2pWI0

ただデカいモデルが動かせれてコンテキスト出力されるまでの時間が5分とかかかってもいいなら4枚刺しが正解と実際に検証した俺が言ってみる

0568名無しさん＠ピンキー (ﾜｯﾁｮｲ 8cb9-7+Bn)

2025/12/30(火) 13:58:51.68ID:5PlEm1Wy0

画像や音声生成は苦しいがLLM目的ならradeonも選択肢に入るんやで。
10万割りしているRX7900XTX 24GBつこてるけどlammacppやlm studioでは全く困ってない

0569名無しさん＠ピンキー (ﾜｯﾁｮｲ dac8-cEFC)

2025/12/30(火) 14:31:49.12ID:+JjZad5E0

>>555
詳細な情報提供ありがとうございました

>>561
迅速なアップデートありがとうございます

作者様や>>555様の言われたとおり、
12/28verではトークンを入力しなかったりかなり少なめにすると
koboldcpp.exeがクラッシュ後通信エラーにならず再現されませんでした

12/30の最新verでもレガシーや現在verのgguf、また他mistralモデルのいくつかを使用しても以上のエラーは再現されませんでした
そのため、「「最大コンテキスト超過時の処理」を『最大本文文字数にトリム』または『何もしない』に変更」せずともエラー無く動作し続けております
本当にありがとうございました

0570名無しさん＠ピンキー (ﾜｯﾁｮｲ deed-pQ3g)

2025/12/30(火) 18:56:05.42ID:MMydUQFK0

>>538
わーい新しいモデルだー

0571名無しさん＠ピンキー (ﾜｯﾁｮｲ 6ac7-Ls7H)

2025/12/30(火) 19:32:46.75ID:UqaFaSWG0

>>565
ただこんなにコスパいい方法ならもっと出回る気もするけどあまり話題にならない
実際にLLMで早くなるのか気になってる

>>567
そこまで遅いならRAMつけた時とあまり変わらない？
16Gなら他にももう少し上のクラスのGPUもあるけど、そもそもLLMは複数枚カードでもあまり早くならない？
AIさんに騙されたか・・・？

0572名無しさん＠ピンキー (ﾜｯﾁｮｲ 8294-mqrN)

2025/12/30(火) 20:20:30.60ID:L/CH3/cp0

5060tiのメモリ帯域はそこまで速くないからなぁ…

0573名無しさん＠ピンキー (ﾜｯﾁｮｲ be32-0Alr)

2025/12/30(火) 20:22:28.90ID:0XYEbhmH0

画像/動画生成用途ならGPGPU性能が物を言うし
LLM用途ならMac StudioやRyzen AI Max+ 395があるから
微妙なグラボ複数枚はどっちにしても中途半端な気がする

0574名無しさん＠ピンキー (ﾜｯﾁｮｲ b62c-JCzX)

2025/12/30(火) 20:48:09.93ID:MsEm9Rga0

Macストゥーディオが最強？

0575名無しさん＠ピンキー (ﾜｯﾁｮｲ dac7-CKxx)

2025/12/30(火) 22:03:27.51ID:XOEiLvuB0

LLM用途しかしないなら、Mac Studio（512GB）が最強やろな
俺だったら512GBしか買わん
実際動かしてみると上のクラスを動かしたくなるもので、128GBとかだと多分残念な思いをすると思う
画像生成はM5に期待やな

GPUを複数枚挿す構成はvLLM が活きて、バッチ処理がめちゃくちゃ速い
画像解析などのVLM系にも有効やし、
アプリ開発でもいろんな使い方ができる

マルチGPUで実用的なLLMは非MoEならMagnum-v4-123Bが有力
ただし、最低でもVRAM 72GB以上は必要で、24GB GPUを4枚挿ししたくなる
最低でも10 token/s以上を狙うなら、
全スロットが PCIe 4.0 x16以上の
ワークステーションクラスが欲しいところやな

まあ、今はMoEが主流なので、コスパでいえば高速なメモリをたっぷり積んでVRAM24GB用意するのがいいかも？
そのメモリが高いんだよな

0576名無しさん＠ピンキー (ﾜｯﾁｮｲ c0a9-J4pl)

2025/12/30(火) 22:27:13.74ID:HNChQwMA0

以前なら150万あったらxeonでメモリ1tb載せられた・・・
今じゃ多分無理やろが

0577名無しさん＠ピンキー (ﾜｯﾁｮｲ 5a27-0Alr)

2025/12/30(火) 23:35:00.13ID:TYTWQT260

今の状況で512GBのMacとかいくらになるんだ
Appleもそこまでメモリ確保出来てないって話だし次は倍ぐらいしそう

0578名無しさん＠ピンキー (ﾜｯﾁｮｲ 6ac7-Ls7H)

2025/12/31(水) 00:24:14.44ID:nATPkOzl0

5060Ti の帯域が狭いなら5070 Tiとか？これでも5090と比べたら半値でVRAM(16+16)確保できる
MoEでもメモリいくら増やしても速度は遅いし、メモリは現状維持で、GPU複数でVRAM増やすとかなり快適になるんじゃないかと思ってな
ちなみに、VRAM24でちょっと大きいくらいのMoEモデルなら驚くほど早かったわ

Mac StudioやRyzen AI Max+ 395ってどの程度快適なんだろ？以前ネットで調べた限りだと遅いって話だった気がするけど情報あまりない

あと、RTXならLLMの為に買っても実際には他の用途でも使いまくれるのが大きいかと

0579名無しさん＠ピンキー (ﾜｯﾁｮｲ be97-Xpyt)

2025/12/31(水) 01:19:09.77ID:+SOP+Ib10

>>562

ありがてえ、2t/sが安定するようになった！！！

0580名無しさん＠ピンキー (ﾜｯﾁｮｲ c0a9-0Alr)

2025/12/31(水) 01:50:43.20ID:91X6WRME0

>>562
これ見るにLM Studioはn-cpu-moeには非対応なんやろか？
そうだとするとVRAM48GBあるんやろからVRAMだいぶ余ってそうやし
llamacppで設定詰めたらもっと早くなるやろな

■ このスレッドは過去ログ倉庫に格納されています