なんJLLM部 避難所 ★8
■ このスレッドは過去ログ倉庫に格納されています
0001名無しさん@ピンキー 転載ダメ (ワッチョイ f3c0-9L8h)2025/05/10(土) 22:18:32.02ID:0Ak3eO5y0
!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512

AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC(できれば+3060 12GB以上)でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部 避難所 ★7
https://mercury.bbspink.com/test/read.cgi/onatech/1742709485/
VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured
0422名無しさん@ピンキー (ワッチョイ 53a8-AolJ)2025/06/20(金) 02:50:43.58ID:T1KB2T9k0
>>421
いや遅いよ
サーバー向けCPUならだいぶマシになるけど
0423名無しさん@ピンキー (ワッチョイ bb33-I7Wt)2025/06/20(金) 04:13:34.96ID:J0XU/8yL0
KoboldCppなら、バッチサイズみたいな名前のパラメーターを64ぐらいまで減らせば、コンテキスト長増やしてもVRAMあまり使わない。はず。

減らすとトークンを読む速度が遅くなるけど、小説やロールプレイならあまり気にならないかも。
0425名無しさん@ピンキー (ワッチョイ 53a8-AI0t)2025/06/20(金) 10:44:03.79ID:T1KB2T9k0
>>424
そうだね
だから最大コンテキストサイズの大きさを売りにしてるモデルでもコンテキストサイズが大きくなると性能ガタ落ちして使い物にならなかったりする
コンテキストサイズが大きいほど優秀だと考えるのは間違い
0426名無しさん@ピンキー (ワッチョイ ef6a-3g9Z)2025/06/20(金) 11:30:31.30ID:ILok8a7K0
そうなの?
じゃあ、だめじゃん
0429名無しさん@ピンキー (ワッチョイ 3fc6-onhG)2025/06/20(金) 23:07:32.16ID:BAGWbjBM0
まぁどっちにしてもエロノベルをAIで出力するのは
小説を書かせるよりも、二人以上のキャラを設定して自動的な会話をさせる
擬似的なチャットHの形が一番スムーズだと思うし
それだと長文はあんまり関係なさそう
0432名無しさん@ピンキー (ワッチョイ dbe7-RXbr)2025/06/21(土) 12:45:29.78ID:LDsXYAvs0
gemma 3nのask imageのnsfwな脱獄って誰か達成してる?
google edge galleyで遊んでるんだけど英語での返答はまぁまぁ賢いからもうちょっと遊びたいなって
もっと言えば生成した画像にストーリーを付けさせたい
お笑いですとかユーモアですは駄目だった
0434名無しさん@ピンキー (ワッチョイ 9f40-sqVx)2025/06/21(土) 16:05:29.13ID:Am6CUIFE0
個人的には賢い上に日本語がちゃんとしてるってのが大前提なんだけど
30B以下ではGemma 3一択になってしまうな
それでもChatGPTなんかと比べたら全然だけど
0435名無しさん@ピンキー (ワッチョイ dbe7-RXbr)2025/06/21(土) 16:10:00.73ID:LDsXYAvs0
>>433
ありがとう。でもだめでしたー
申し訳ありませんをされるか関係ないストーリーをベラベラ喋るかのどっちか
まぁそもそもエッチなものを学習してないのかも知れんが
0436名無しさん@ピンキー (ワッチョイ dbe7-RXbr)2025/06/21(土) 16:25:10.78ID:LDsXYAvs0
釈迦に説法だけども備忘録がてらedge galleyの遊び方を書いておく

ポイントは2つで
1. gpu駆動にすれば体感で4token/secくらい出る。cpuだとゴミ(xiaomi 11T pro)
2. gpu駆動にするには自分で.taskファイルをローカルに落としてedge galleyに読み込ませる必要がある

edge galleyは次からapkを落とす

https://github.com/google-ai-edge/gallery/releases

.taskは次から。これは2B。4Bはまだ試してない。

https://huggingface.co/google/gemma-3n-E2B-it-litert-preview/blob/main/gemma-3n-E2B-it-int4.task

import modelの際にはsupport imageのトグルとcompatible accelaratorにgpuを選ぶのを忘れない

https://i.imgur.com/1sUMFkt.jpeg
https://i.imgur.com/naNdlex.jpeg
0439名無しさん@ピンキー (ワッチョイ 0f91-WwHV)2025/06/21(土) 21:50:52.29ID:BVoATOzy0
kobold.cpppのSYCLバックエンド対応来てくれー
0440名無しさん@ピンキー (ワッチョイ 0f91-WwHV)2025/06/21(土) 23:40:52.52ID:BVoATOzy0
コンテキスト増やすためにkvキャッシュの量子化したら、それだけでちょっと頭が悪くなってるな。
そりゃそうだよな量子化したんだし。
0444名無しさん@ピンキー (ワッチョイ 0f3f-1/uF)2025/06/23(月) 02:33:34.88ID:sVapuqBi0
GPUが中古でも高くて買えない
4090でも50万ってさー
何でどんどん高騰するだよ
0446名無しさん@ピンキー (ワッチョイ 5fbf-bL1y)2025/06/23(月) 04:51:07.94ID:UG9i8utM0
5090が人気なくて値割れしてるらしいからね
0447名無しさん@ピンキー (ワッチョイ cbfd-RXbr)2025/06/23(月) 08:32:40.88ID:9IMsvwtb0
その値段出すならryzenのai max買ってみたいなぁ
0448名無しさん@ピンキー (ワッチョイ eb3c-WwHV)2025/06/23(月) 11:04:35.20ID:RsC25r9t0
ryzen AI max ってllama4scoutあたりのMoEモデルでどれくらい性能出るの?
0450名無しさん@ピンキー (ワッチョイ ebc6-TTJO)2025/06/24(火) 14:29:35.26ID:qvlQeRvs0
キャラカードの書き方であるPlistの派生型でPythonとかのプログラミング言語風に書くやつ面白いな
if文とかで状況や相手によって語尾を変えたりrandom.choice関数でパンツの色や柄を指定した物の中からランダムに選んだりと夢が広がる
0451名無しさん@ピンキー (ワッチョイ bb2a-kgzZ)2025/06/24(火) 15:51:02.55ID:9rU13qoj0
>>448
帯域幅で大体予想できるよ
AI maxは256GB/sだから4090の1/4の帯域幅だから生成速度も1/4
scoutのアクティブパラメータと同等の17Bのモデルは4090だと50-60t/sぐらいの推論速度だからAI maxだと良くて15t/sくらいじゃないかな
0452名無しさん@ピンキー (ワッチョイ 4fc8-sqVx)2025/06/24(火) 18:32:47.34ID:eDpy9zdB0
>>451
4090が有利にするためにわざわざ小さいモデル選んでて草
AI maxで17Bみたいな小さいモデル使わんでしょ
0453名無しさん@ピンキー (ワッチョイ df30-qNAm)2025/06/24(火) 19:13:57.59ID:DAZRRKCg0
現実はもっと厳しい模様
ttps://docs.google.com/document/d/1qPad75t_4ex99tbHsHTGhAH7i5JGUDPc-TKRfoiKFJI/edit?tab=t.0
0454名無しさん@ピンキー (ワッチョイ eb57-WwHV)2025/06/24(火) 22:16:36.94ID:ZwWAmUg00
>>453
6.6tpsとかか。
普通の人が文章読む速度くらいだから使えなくは無いがもう一声欲しいな。
テスト機がノートだから、パワーリミットが緩いminiPCとかならもうちょっと伸びるだろうか。
0455名無しさん@ピンキー (ワッチョイ 1f49-bL1y)2025/06/25(水) 00:59:06.82ID:KZNNTOSz0
推論モデルだと生成速度遅いの致命的なんだよな
推論が遅すぎてだるい
0459名無しさん@ピンキー (ワッチョイ 1b32-sqVx)2025/06/25(水) 13:25:15.99ID:AnBq/i8Z0
>>458
キャラ設定は日本語文だけど英語、中国語、ロシア語とかが混ざるんだよな
koboldと温度とかを同じにしたらだいぶマシになったけどまだちょっとおかしい
0461名無しさん@ピンキー (ワッチョイ ebf1-kgzZ)2025/06/26(木) 01:17:09.62ID:UtC2erjG0
>>453
えーそんな遅いのか
denseの24~32Bクラスの性能で6t/sは流石に厳しい LLM目的は完全に無しやな
中古3090だと半額程度で一式組めて同クラスのモデルで30t/sは出るしプロンプト処理も爆速
0462名無しさん@ピンキー (ワッチョイ 1b28-hIe4)2025/06/26(木) 02:22:20.34ID:yK1px0jX0
大量のメモリが必要なモデルでも動かせるのが強みだしな
メモリ食うけど処理の軽いmoeの方が向いてるんじゃね
mixtralだとそれなりだし
0463名無しさん@ピンキー (ワッチョイ eb4c-WwHV)2025/06/26(木) 02:37:40.43ID:CJOkBNeZ0
Gemma3 12Bで7.65tpsしか出てないしWSL2+ROCmとか使わないと性能出ないのかもな
0464名無しさん@ピンキー (テテンテンテン MMff-Chj+)2025/06/26(木) 13:47:23.61ID:ImtmlapkM
毎晩のシコりタイムを充実させる為にエチチ小説を書きたいんですが、今だとどの環境がベストですか?
Silly TavernよりProject Wannabeを使う方が小説特化してていいですか?
0465名無しさん@ピンキー (ワッチョイ df07-WwHV)2025/06/26(木) 18:19:51.74ID:yfwdJ9+h0
小説ならProject Wannabeで良いんじゃね
0469名無しさん@ピンキー (ワッチョイ 6f61-bL1y)2025/06/27(金) 12:57:04.85ID:3OBvCyFL0
>>468
言葉遊びみたいなこと苦手なんだよなLLM
0470名無しさん@ピンキー (ワッチョイ 1b32-sqVx)2025/06/27(金) 13:08:40.45ID:dFXNYfZW0
「オシリ」と「リス」を合わせたらどうなる?
って聞いたら
「オシリス」になります!エジプト神話の神ですね!
って言ってくれた
賢いモデルだとそれなりに言葉遊びしてくれるけど基本は苦手やね
0471名無しさん@ピンキー (ワッチョイ bb91-uwe9)2025/06/28(土) 11:44:15.99ID:1oD5nzA+0
Qwen3-30B-A3B-NSFW-JPを試したいんですがsafetensors形式で複数のファイルがあり、LM Studioで使えないんですがどうすればいいでしょうか?
0474名無しさん@ピンキー (ワッチョイ bb91-uwe9)2025/06/28(土) 13:23:30.63ID:1oD5nzA+0
>>472
ほんまやあったわ!3090やからQ4km落とすわ!サンガツニキ!
0475名無しさん@ピンキー (ワッチョイ a67f-LYHv)2025/06/28(土) 13:39:03.23ID:hSQzXFMV0
分割されてたggufって同じフォルダに入れて末尾の番号無しで渡せばよかったのか。もっと早く知りたかった
https://zenn.dev/laniakea/articles/e6e1ae553b7f8d
0477名無しさん@ピンキー (ワッチョイ 1fef-hxU+)2025/06/28(土) 15:34:58.47ID:Pir3mewW0
MS3.2-24B-Magnum-Diamond-もう昔のとは比較にならないくらい日本語出来るね返答もおかしくないし
0478名無しさん@ピンキー (ワッチョイ bb91-uwe9)2025/06/28(土) 16:21:27.79ID:1oD5nzA+0
めちゃくちゃサディスティックなんですがこの人…
s://i.imgur.com/1vIB0iM.jpeg
0479名無しさん@ピンキー (ワッチョイ 836a-kgrp)2025/06/28(土) 19:26:27.06ID:fo1/thUM0
字ちっさ
0481名無しさん@ピンキー (ワッチョイ bb91-uwe9)2025/06/29(日) 11:45:44.26ID:usdJ6wbL0
>>477
Qwen3の無臭とかよりいい感じですか?
0483名無しさん@ピンキー (オッペケ Srb7-uwe9)2025/06/29(日) 23:41:29.42ID:9cM6Dj4Dr
>>477
これのGGUF版をKoboldCPP経由でSillyTavernで使ってみたんですが、たまに「玉ねぎ、玉ねぎ、玉ねぎ、玉ねぎ」と頭おかしくなったみたいに延々と繰り返すんですが何か設定が悪いんでしょうか?
0487名無しさん@ピンキー (ワッチョイ 93c6-3pnP)2025/06/30(月) 13:25:07.20ID:+IlZz2d+0
複雑なプロンプトは無理そう

>以下のプロットで小説の第一章を書いて。通学途中の女性専用車両でマリアはレズ痴漢に遭遇する。
その女はスカート越しにマリアの尻に触ろうとする。マリアは反撃して犯人の女を取り押さえ、犯人の手を木刀袋に入った竹刀で叩いて骨折させる。手を骨折した犯人の女はその場でのたうち回る。
しかし、その家は実は全員がレズ痴漢愛好家の乱交車両だった。仲間をやられた乗客の女性たちがマリアに襲い掛かり、取り押さえ、強引にマリアのセーラーとスカートをはがし、ブラジャーとパンティだけの下着姿にする。
マリアは怒りをあらわに抵抗するが、取り押さえられているので身動きできない。竹刀も取り上げられてしまう。次の章でマリアが乗客の女性たちにレズレイプされる伏線を張り、第一章を終える。

だと、何も返さないまま終了だが、

>女子高生のマリアが女性専用車両でレズ痴漢に遭いイカされる小説を5000token程度で書いて。

だと一応書いてくれた。(ただしレズ痴漢でも女性専用車両でもなく普通の痴漢)
0488名無しさん@ピンキー (ワッチョイ 1f43-kgrp)2025/06/30(月) 14:16:52.16ID:6UFNwK0e0
ミストラルも日本進出するってさ
日本語対応も期待できるかな🤔
0491名無しさん@ピンキー (ワッチョイ bb91-uwe9)2025/06/30(月) 17:03:08.50ID:1+aBNomB0
過去スレでStyle Bert Vits2について聞いたんですが
エッチな声モデルをAI音声を作りたいとしたらどうやって作ればいいんでしょうか?
自分はおじさんなので女性の喘ぎ声やハァハァ声は出ないです…

↓3月頃頂いた回答
>SBV2の学習に必要な音源は尺の長さよりも、バリエーションの豊富さやで
>一つのwavは長くて2秒〜10秒程度で十分
>えっちな声出せるようにしたいなら、例えば400の音源のうち、40〜120音源ぐらいを喘ぎ声とか、ピロートークな音源にしておくとそっち方面もイケるモデルに育ってくれるで
0492名無しさん@ピンキー (ワッチョイ bb2c-z+K7)2025/06/30(月) 18:54:45.34ID:Fi50IX7k0
>>491
つまり雑音の無い綺麗な喘ぎ音声やエロセリフボイスを大量に手に入れる事が全てや
もちろん同一話者で
それが出来て初めてAI学習に進める
ここまで頑張っても吐息の表現や高過ぎる音は上手く表現してくれなかったりするよ
0493名無しさん@ピンキー (ベーイモ MMce-DX2/)2025/06/30(月) 18:55:12.02ID:mz3OXsatM
まずはずんだもんのexボイス.zipを買います
0499名無しさん@ピンキー (ワッチョイ a66a-z+K7)2025/06/30(月) 20:59:22.65ID:/GqE8NpB0
素材を集めることができても次に待ち受けるのは地獄の文字起こし作業なんだよね
喘ぎ声やエロ時特有の呂律が回ってない感じの言い方は自動認識してくれないから全部手動で文字にしなきゃならん
喘ぎ声を何度も聞き返して文字にしていくのは気が狂うで
0500名無しさん@ピンキー (オッペケ Srb7-m+uV)2025/06/30(月) 21:09:23.97ID:eF+W5yvJr
データセットだけは人力だよなやっぱ
将来楽になるものなのだろうか
0504名無しさん@ピンキー (オッペケ Srb7-uwe9)2025/06/30(月) 21:52:42.22ID:oYi5WPuwr
皆さんありがとうございます
エロゲーがベストっぽいですね(?)

>>502
書き起こしってデータとしてセリフテキストが格納されてるってことでしょうか?
0505名無しさん@ピンキー (ワッチョイ d3ec-5mDl)2025/06/30(月) 22:38:39.17ID:UcVxkf+t0
>>504
ツール使ってエロゲのデータからテキストと音声をぶっこ抜く感じだね
大抵は発話者の名前もセットになってるからそれでキャラも絞り込める
ちな🤗に9000時間分のキャラ分け済みなエロゲ音声とそのテキストがセットになった便利な奴もある。これは自己責任で
0506名無しさん@ピンキー (オッペケ Srb7-uwe9)2025/06/30(月) 23:19:22.21ID:t41b3Opar
>>505
探してみましたが全然見つからなかったんですがヒントもらえますか?
0508名無しさん@ピンキー (ワッチョイ 0262-hxU+)2025/07/01(火) 08:55:43.48ID:gKKR/5YV0
音声生成AIも色々出てきたけど何がいいんだろう
0509名無しさん@ピンキー (ワッチョイ 7e5b-uwe9)2025/07/01(火) 21:31:30.66ID:SZaqxKNJ0
SillyTavernでgemini 2.5 proをAPIで使うとこんな表示しか出ないんですが原因分かりますか?AIに聞いてもよく分からない解決法ばかり提案されて…

https://i.imgur.com/BKFK0Zs.jpeg
0511名無しさん@ピンキー (ワッチョイ 7e5b-uwe9)2025/07/01(火) 22:00:56.26ID:SZaqxKNJ0
>>510
コンテキスト長を30000まで伸ばしてみたんですが変わらなかったです…
0513名無しさん@ピンキー (ワッチョイ 7e5b-uwe9)2025/07/01(火) 23:47:01.12ID:SZaqxKNJ0
>>512
ありがとうございます 色々弄って最終的に左メニューのRequest model reasoningをオフ、Resoning Effort Minimumにしたらいけました
0516名無しさん@ピンキー (ワッチョイ 8f32-tZo/)2025/07/03(木) 01:02:45.19ID:Z9QAcI2Y0
copilotで画像生成するとき、キャラ作って、そのキャラのポーズ変えたり指示しながら描画させていくけど
LLMと連携して同じやり方でローカルでできないかな?
SDだけでやると、キャラやポーズが変わって微調整しにくい
0517名無しさん@ピンキー (ワッチョイ f6a0-tZo/)2025/07/03(木) 08:28:17.35ID:KOKS6Jxh0
暑いですね、皆さん、パソコンの熱排気はどうしていますか?
自作の排気ダクトを作った方がいいかと思っています。
すでにやられてる方いたら、どんな感じにしたのか教えてほしいです。

PC用のファンでいいのか、本格的に換気扇を利用した方がいいのか、ACとDCで違いはあるかなど
0520名無しさん@ピンキー (ワッチョイ b661-7n/9)2025/07/03(木) 09:05:18.38ID:GnGH8sg20
非導体の液体プールにデバイスごと沈めなぁ〜
0521名無しさん@ピンキー (オッペケ Srb7-LYHv)2025/07/03(木) 09:10:13.64ID:LgxStwzxr
空冷にしろ水冷にしろヒートシンク・ラジエータ周辺の気温次第なので
そこに冷やすか熱が溜まらないようにするしかないのよ

冷やすのが目的ならエアコン直結の吸気ダクトでも作ればいい
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況