なんJLLM部 避難所 ★8
■ このスレッドは過去ログ倉庫に格納されています
0001名無しさん@ピンキー 転載ダメ (ワッチョイ f3c0-9L8h)2025/05/10(土) 22:18:32.02ID:0Ak3eO5y0
!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512

AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC(できれば+3060 12GB以上)でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部 避難所 ★7
https://mercury.bbspink.com/test/read.cgi/onatech/1742709485/
VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured
0474名無しさん@ピンキー (ワッチョイ bb91-uwe9)2025/06/28(土) 13:23:30.63ID:1oD5nzA+0
>>472
ほんまやあったわ!3090やからQ4km落とすわ!サンガツニキ!
0475名無しさん@ピンキー (ワッチョイ a67f-LYHv)2025/06/28(土) 13:39:03.23ID:hSQzXFMV0
分割されてたggufって同じフォルダに入れて末尾の番号無しで渡せばよかったのか。もっと早く知りたかった
https://zenn.dev/laniakea/articles/e6e1ae553b7f8d
0477名無しさん@ピンキー (ワッチョイ 1fef-hxU+)2025/06/28(土) 15:34:58.47ID:Pir3mewW0
MS3.2-24B-Magnum-Diamond-もう昔のとは比較にならないくらい日本語出来るね返答もおかしくないし
0478名無しさん@ピンキー (ワッチョイ bb91-uwe9)2025/06/28(土) 16:21:27.79ID:1oD5nzA+0
めちゃくちゃサディスティックなんですがこの人…
s://i.imgur.com/1vIB0iM.jpeg
0479名無しさん@ピンキー (ワッチョイ 836a-kgrp)2025/06/28(土) 19:26:27.06ID:fo1/thUM0
字ちっさ
0481名無しさん@ピンキー (ワッチョイ bb91-uwe9)2025/06/29(日) 11:45:44.26ID:usdJ6wbL0
>>477
Qwen3の無臭とかよりいい感じですか?
0483名無しさん@ピンキー (オッペケ Srb7-uwe9)2025/06/29(日) 23:41:29.42ID:9cM6Dj4Dr
>>477
これのGGUF版をKoboldCPP経由でSillyTavernで使ってみたんですが、たまに「玉ねぎ、玉ねぎ、玉ねぎ、玉ねぎ」と頭おかしくなったみたいに延々と繰り返すんですが何か設定が悪いんでしょうか?
0487名無しさん@ピンキー (ワッチョイ 93c6-3pnP)2025/06/30(月) 13:25:07.20ID:+IlZz2d+0
複雑なプロンプトは無理そう

>以下のプロットで小説の第一章を書いて。通学途中の女性専用車両でマリアはレズ痴漢に遭遇する。
その女はスカート越しにマリアの尻に触ろうとする。マリアは反撃して犯人の女を取り押さえ、犯人の手を木刀袋に入った竹刀で叩いて骨折させる。手を骨折した犯人の女はその場でのたうち回る。
しかし、その家は実は全員がレズ痴漢愛好家の乱交車両だった。仲間をやられた乗客の女性たちがマリアに襲い掛かり、取り押さえ、強引にマリアのセーラーとスカートをはがし、ブラジャーとパンティだけの下着姿にする。
マリアは怒りをあらわに抵抗するが、取り押さえられているので身動きできない。竹刀も取り上げられてしまう。次の章でマリアが乗客の女性たちにレズレイプされる伏線を張り、第一章を終える。

だと、何も返さないまま終了だが、

>女子高生のマリアが女性専用車両でレズ痴漢に遭いイカされる小説を5000token程度で書いて。

だと一応書いてくれた。(ただしレズ痴漢でも女性専用車両でもなく普通の痴漢)
0488名無しさん@ピンキー (ワッチョイ 1f43-kgrp)2025/06/30(月) 14:16:52.16ID:6UFNwK0e0
ミストラルも日本進出するってさ
日本語対応も期待できるかな🤔
0491名無しさん@ピンキー (ワッチョイ bb91-uwe9)2025/06/30(月) 17:03:08.50ID:1+aBNomB0
過去スレでStyle Bert Vits2について聞いたんですが
エッチな声モデルをAI音声を作りたいとしたらどうやって作ればいいんでしょうか?
自分はおじさんなので女性の喘ぎ声やハァハァ声は出ないです…

↓3月頃頂いた回答
>SBV2の学習に必要な音源は尺の長さよりも、バリエーションの豊富さやで
>一つのwavは長くて2秒〜10秒程度で十分
>えっちな声出せるようにしたいなら、例えば400の音源のうち、40〜120音源ぐらいを喘ぎ声とか、ピロートークな音源にしておくとそっち方面もイケるモデルに育ってくれるで
0492名無しさん@ピンキー (ワッチョイ bb2c-z+K7)2025/06/30(月) 18:54:45.34ID:Fi50IX7k0
>>491
つまり雑音の無い綺麗な喘ぎ音声やエロセリフボイスを大量に手に入れる事が全てや
もちろん同一話者で
それが出来て初めてAI学習に進める
ここまで頑張っても吐息の表現や高過ぎる音は上手く表現してくれなかったりするよ
0493名無しさん@ピンキー (ベーイモ MMce-DX2/)2025/06/30(月) 18:55:12.02ID:mz3OXsatM
まずはずんだもんのexボイス.zipを買います
0499名無しさん@ピンキー (ワッチョイ a66a-z+K7)2025/06/30(月) 20:59:22.65ID:/GqE8NpB0
素材を集めることができても次に待ち受けるのは地獄の文字起こし作業なんだよね
喘ぎ声やエロ時特有の呂律が回ってない感じの言い方は自動認識してくれないから全部手動で文字にしなきゃならん
喘ぎ声を何度も聞き返して文字にしていくのは気が狂うで
0500名無しさん@ピンキー (オッペケ Srb7-m+uV)2025/06/30(月) 21:09:23.97ID:eF+W5yvJr
データセットだけは人力だよなやっぱ
将来楽になるものなのだろうか
0504名無しさん@ピンキー (オッペケ Srb7-uwe9)2025/06/30(月) 21:52:42.22ID:oYi5WPuwr
皆さんありがとうございます
エロゲーがベストっぽいですね(?)

>>502
書き起こしってデータとしてセリフテキストが格納されてるってことでしょうか?
0505名無しさん@ピンキー (ワッチョイ d3ec-5mDl)2025/06/30(月) 22:38:39.17ID:UcVxkf+t0
>>504
ツール使ってエロゲのデータからテキストと音声をぶっこ抜く感じだね
大抵は発話者の名前もセットになってるからそれでキャラも絞り込める
ちな🤗に9000時間分のキャラ分け済みなエロゲ音声とそのテキストがセットになった便利な奴もある。これは自己責任で
0506名無しさん@ピンキー (オッペケ Srb7-uwe9)2025/06/30(月) 23:19:22.21ID:t41b3Opar
>>505
探してみましたが全然見つからなかったんですがヒントもらえますか?
0508名無しさん@ピンキー (ワッチョイ 0262-hxU+)2025/07/01(火) 08:55:43.48ID:gKKR/5YV0
音声生成AIも色々出てきたけど何がいいんだろう
0509名無しさん@ピンキー (ワッチョイ 7e5b-uwe9)2025/07/01(火) 21:31:30.66ID:SZaqxKNJ0
SillyTavernでgemini 2.5 proをAPIで使うとこんな表示しか出ないんですが原因分かりますか?AIに聞いてもよく分からない解決法ばかり提案されて…

https://i.imgur.com/BKFK0Zs.jpeg
0511名無しさん@ピンキー (ワッチョイ 7e5b-uwe9)2025/07/01(火) 22:00:56.26ID:SZaqxKNJ0
>>510
コンテキスト長を30000まで伸ばしてみたんですが変わらなかったです…
0513名無しさん@ピンキー (ワッチョイ 7e5b-uwe9)2025/07/01(火) 23:47:01.12ID:SZaqxKNJ0
>>512
ありがとうございます 色々弄って最終的に左メニューのRequest model reasoningをオフ、Resoning Effort Minimumにしたらいけました
0516名無しさん@ピンキー (ワッチョイ 8f32-tZo/)2025/07/03(木) 01:02:45.19ID:Z9QAcI2Y0
copilotで画像生成するとき、キャラ作って、そのキャラのポーズ変えたり指示しながら描画させていくけど
LLMと連携して同じやり方でローカルでできないかな?
SDだけでやると、キャラやポーズが変わって微調整しにくい
0517名無しさん@ピンキー (ワッチョイ f6a0-tZo/)2025/07/03(木) 08:28:17.35ID:KOKS6Jxh0
暑いですね、皆さん、パソコンの熱排気はどうしていますか?
自作の排気ダクトを作った方がいいかと思っています。
すでにやられてる方いたら、どんな感じにしたのか教えてほしいです。

PC用のファンでいいのか、本格的に換気扇を利用した方がいいのか、ACとDCで違いはあるかなど
0520名無しさん@ピンキー (ワッチョイ b661-7n/9)2025/07/03(木) 09:05:18.38ID:GnGH8sg20
非導体の液体プールにデバイスごと沈めなぁ〜
0521名無しさん@ピンキー (オッペケ Srb7-LYHv)2025/07/03(木) 09:10:13.64ID:LgxStwzxr
空冷にしろ水冷にしろヒートシンク・ラジエータ周辺の気温次第なので
そこに冷やすか熱が溜まらないようにするしかないのよ

冷やすのが目的ならエアコン直結の吸気ダクトでも作ればいい
0523名無しさん@ピンキー (ワッチョイ b232-ScKi)2025/07/03(木) 09:25:38.53ID:vI4Dh9sR0
一般人はケースの普通のエアフローのままかサイドパネル開けて扇風機当てるで十分だと思うがね
人間よりは高温には強いので、人が生きられる室温ならエアコンもまあ最悪無しでも…
0524名無しさん@ピンキー (オッペケ Srb7-KtV6)2025/07/03(木) 12:21:41.80ID:P5KfW1Bir
工夫をするとしたら...DCサーキュレーターの上位クラスを導入する、とかかな

サーキュレータって40〜50畳クラスでも1万〜1.5万で、DCでファンブレードが大きいちゃんとしたものを選んで低出力運転すれば静音・大風量が確保できる

40畳クラスは通常出力でも部屋干しをあっという間に乾かせるだけの能力があるし、冷房暖房と併用するのも効果的なので使い回しが効くのでオススメ
0527名無しさん@ピンキー (ワッチョイ 8f32-tZo/)2025/07/03(木) 14:57:19.35ID:DAzkG0OM0
>>516
日本語プロンプト対応のローカル画像編集AIはまだないと思う
VLMを使ったローカル画像編集AIはStep1X-Edit、BAGEL、FLUX.1 Kontext、OmniGen2とか
色々出てるけど、どれも要求スペックが高い
0533名無しさん@ピンキー (ワッチョイ 6203-wJtD)2025/07/04(金) 23:20:47.64ID:VoAyVBJR0
VRAMが16GBしかないけど123Bのモデルとかで遊びたい場合はGPUで推論させてメモリに溢れさせるより
CPUだけで推論した方が良いんかな
VRAMに載るモデルだと叡智小説の振り幅に限界感じてきた
0534名無しさん@ピンキー (ワッチョイ 8f32-tZo/)2025/07/04(金) 23:49:34.02ID:G5zxKPnL0
FLUX.1 Kontextがvram12Gでもいい感じに使えたわ
ただ、規制強すぎてエロ方面は無理w
通常のFLUX.1 は無臭バージョンあるから、kontextも無臭化できれば最強やね

>>533
メモリ64Gじゃ低量子化しか使えんからせめてQ5K_M使える96G積んでmagnum123bシバきまわしたいわw
0536名無しさん@ピンキー (ワッチョイ bf03-AJyb)2025/07/05(土) 08:34:32.05ID:otzYoyf80
なるほどありがとう
RTX6000はさすがに買えないしAI maxが速くなったら買ってみようかな
0540名無しさん@ピンキー (オッペケ Src7-TXXJ)2025/07/05(土) 12:15:53.33ID:v7FjqLe/r
そんなこと一度使えばわかる話のような
この論文の主旨は計測ベンチマークを設計したよって話じゃないの

ベンチマークでスコアが算出できればあっという間に出来るようになるわけだから、遠くない未来に解決されますと言ってるようなもんでは
0541名無しさん@ピンキー (ワッチョイ cf6a-iUEm)2025/07/05(土) 12:24:12.20ID:frlkdolv0
このベンチマークに合格できるAIを開発できるか?という問いにはYesだが、それをもって「ポチョムキン理解」問題は解決かというとNoじゃね
0542名無しさん@ピンキー (ワッチョイ 33cc-8TIs)2025/07/05(土) 12:25:59.57ID:5tq/75+s0
例えばペニバン装着しておっさんを掘らせると速攻で女にちんちんが生えておっさんにおまんまんが生成されちゃうのは
コンテキスト長の問題で男女の設定が消え去るからなのか、
ペニバンについての知識が学習されてないからなのか、
そもそも男女の概念すら実は実践出来ないのか、どれだよって話になるからなあ
ポチョムキン理解が原因とすると改善は難航するんじゃないの
今までと全く異なるアプローチが必要になりそうどし
0543名無しさん@ピンキー (ワッチョイ f36a-P7Ho)2025/07/05(土) 14:46:57.18ID:qFps80Dd0
ポチョムキン理解の問題はillusion
0545名無しさん@ピンキー (ワッチョイ cf7a-On7B)2025/07/05(土) 18:42:17.63ID:QlfJmyHr0
まぁAIよりよっぽど頭が悪いようなタイプの人間ですら間違えないようなことを頭がよく見えるAIが
何の疑問も抱かずにさらっと間違ってるとことか見せられるとそれはちょっと思うよな
各AIのコスパとか分析させてる時に自信満々に「私、ChatGPTのPro版は月々1780円からです!」とか言うんじゃねえ
怖いわ
0546名無しさん@ピンキー (ワッチョイ cf7a-On7B)2025/07/05(土) 18:54:23.10ID:QlfJmyHr0
そういえば昨日Gensparkを何人か課金した人を見たけど、Opus使えてる?
公式説明でも紹介記事でもいまいち各社AIは書いててもバージョンをボカしてるというか曖昧にしてる気配がするんで
いろいろなAIでDeepSearchさせてたんだが、海外の一部界隈では、Opus使えますってのはもしかしたら「営業的デマ」で、実際には3.7sonnetが使われてるかもって話が出てるそうな
言いたかないがGensparkは大本が中華系開発者なんでユーザーのプライバシー情報含めその手の問題は噂されてるぽい

以下GENSPARK Plusで利用可能なAIモデルの調査結果まとめ(勿論この情報自体の精査も必要だが)

確認済み:GPT-4.1、OpenAI o3(またはo3-pro)、Claude 3.7 Sonnet、Gemini 2.5 Flash、DeepSeek R1。

不明確:Claude 4 Opus(存在しない可能性高く、Claude 3.7 Sonnetの誤記か)、o4-mini-high(詳細不明)、その他モデル(Qwen VL Plusなど)は公式情報不足。


情報の曖昧さ:GENSPARKの公式サイトやアプリストアではモデルバージョンの詳細が不足し、X投稿に誇張や誤情報(例:Claude 4 Opus)が含まれる。信頼性確保のため、genspark.aiで最新情報を確認することを推奨。
0548名無しさん@ピンキー (ワッチョイ 6fa6-qNg6)2025/07/05(土) 20:48:50.78ID:u8G4q2Sn0
>>544
パット見た感じ、二手目以降の方向性を決められるわけじゃないからどの程度実用性があるのかはわからないけど面白そうね
必要なコンテキスト長も短そうだし試しに学習してみようかな

それはそれとしてマルチターンで会話しながら小説生成って実際どうなん? 後半に行くたびにゴミが積み重なっていくわけで完成させるの大変そうだけど
0549名無しさん@ピンキー (ワッチョイ 6f9f-llbR)2025/07/05(土) 23:58:05.14ID:nwcVl32h0
AIの真偽をAIに調べさせてるって世も末だな
0551名無しさん@ピンキー (ワッチョイ 33c6-OdFU)2025/07/06(日) 01:06:12.43ID:IxA1OJx80
少なくともgrokやchatGPTはどこもopus使えると言っているし
情報の更新がない間に使えないとかsonnetしか無いと解釈しただけじゃないの
当然だが最新情報はすぐに反映されない

最近The Lustful Turk(1828年)みたけど
結構文体からキャラクター造形や倫理観から
AIの想定するポルノ小説にかなり近いと感じたなー
これ自体が土台じゃなく「源流」として多くの作品が痴を継承したって
ことだろうけど、写真ありきの説明文の淡白さを
ベースで構成されてるってのはわりと厄介ね
0552名無しさん@ピンキー (ワッチョイ 6f9f-llbR)2025/07/06(日) 01:12:01.17ID:1YwJa/wW0
ローカルをやってる人間としては如何にLLMがデタラメな回答を返すかって事を学んでるからな
企業の高性能モデルであってもその延長でしか無いから絶対とは言い切れん

deepsearchの情報ソースであるWeb検索の質が著しく落ちているなんて普段からググってたら気付くやろ
ネットで検索してきました!ソースはYahoo知恵袋ですみたいな回答を真に受けるんか
0555名無しさん@ピンキー (ワッチョイ 6f68-J+MR)2025/07/06(日) 08:26:10.06ID:dXiQMVbZ0
>>548
学習って3090でもできるかな?
0556名無しさん@ピンキー (ワッチョイ 6f68-J+MR)2025/07/06(日) 09:38:26.39ID:dXiQMVbZ0
複数名が登場するエチチ小説にチャレンジしてるんですが、複数名の会話の辻褄を合わせるのってどうやればいいでしょうか?
0557名無しさん@ピンキー (ワッチョイ d301-PJwe)2025/07/06(日) 09:42:28.70ID:AfwWoSHe0
Googleアシスタントに
今の天気は?
今日なんにち?
今何時?
とかで使ってたんだが
geminiに取って変わられてから
ウソ教えてくるようになってそのクソさを思い知らされたよ
0558名無しさん@ピンキー (ワッチョイ ffed-EYel)2025/07/06(日) 12:35:25.21ID:oyAfdCaV0
>>555
データセット見た感じコンテキスト長を4096~8192で済みそうだから4bit QLoRA + 最適化(liger karnel or FA2 +unsloth gradient checkpointingとか)を使えば24B~27BくらいまでならVRAM24GBに収まると思う
0559名無しさん@ピンキー (ワッチョイ 5373-FA3G)2025/07/06(日) 12:48:52.12ID:+JXOHre80
>>557
数ヶ月前のGeminiはそんなんだったけど今は改善されてないか?
0560名無しさん@ピンキー (ワッチョイ cfa9-I2fM)2025/07/06(日) 14:01:00.52ID:/29P8BAS0
>>533
演算GPUのみでVRAMからあふれてメインメモリも使ってるって状況と、
初めからGPU + CPUでVRAMとメインメモリも初めからアプリによって振り分けられてる場合とで
速度差は天と地ほどあるから気を付けてね

メインメモリに"あふれてしまってる"って状況はPCIバスが足を引っ張るので
CPU + メインメモリだけで演算するよりも遅い
0562名無しさん@ピンキー (ワッチョイ ffbf-EYel)2025/07/06(日) 18:04:17.91ID:uwjxkCXo0
wannabeやAIのべりすとみたいに小説本文とユーザ入力の関連情報を組み合わせてプロンプトを随時自動生成させる方法なら常に1ターンになるしそっちの方が合理的かもね
専用UIとか用意しないといけないし汎用性はないけど
0566名無しさん@ピンキー (オッペケ Src7-J+MR)2025/07/07(月) 00:56:51.39ID:yASFG8Brr
Silly Tavernで会話しながらエチチ小説を書いてるんですが、こっちの会話に反応して徐々にエチチチ化していくのヤバイですね…
これ書き上げるまでにタンク、カラカラになりそうです…
0567名無しさん@ピンキー (ワッチョイ d3ec-J+MR)2025/07/07(月) 01:47:31.54ID:bNU/WxX10
ふぅ。。。
冷静になって気づいたんですが、ST+KoboldでMS3.2-24B-Magnum-Diamond-Q5_K_S.gguf使ったんですが、

おっぱいもっと触って気持ちいいよ!!
おっぱい気持ちいい、イっちゃう!!

おまんこもっと触って気持ちいいよ!!
おまんこ気持ちいい、イっちゃう!!

のように部位を変えても同じテンプレフレーズに当てはめただけ、みたいに単調になりがちです
もうちょっと表現力を増したいんですが、24Bモデルだとこの辺が限界でしょうか?
0571名無しさん@ピンキー (ワッチョイ 53ad-SFEh)2025/07/07(月) 17:36:39.09ID:kIS3cuGi0
>>567
いつも繰り返しペナルティと繰り返しペナルティ範囲いじって、何とか頑張ってるけど、日本語変になったりするんだよね
それに、長くなるとどうしても限界があるっぽい
誰かもっといい対策知らない?
0573名無しさん@ピンキー (ワッチョイ cfbc-rJp5)2025/07/07(月) 21:32:10.22ID:/WE7oxmV0
Qwen3 の 14b 使ってみたんだけど同サイズのLLMと比べて頭1つ抜けて頭よくてびびる
tool と think 対応っていうのがめちゃくちゃデカい
Open WebUI が Native Tool Calling に対応したから自動でツール使用の判断してくれるし
think のおかげでできないことはできないってちゃんと判断して伝えてくれる
唯一ダメなところは文字数指定の出力だけど、これは他のモデルでも同じだからしょうがない
あとは vision 機能だけあればかなりいい感じなんだけど
Gemma3 は vision 対応してるけど think 未対応だから Qwen3 と知性の面で大きな差を付けられちゃってる感じ
Gemma が tool + think + vision 対応になってくれればまた状況が変わるかもしれないけど

それと Open WebUI が以前よりかなり進化してて驚いた
RAG とか画像生成とか Web 検索とか簡単に連携できてほぼ ChatGPT やん
ここのスレ的にはあんまり人気ないみたいだけど
■ このスレッドは過去ログ倉庫に格納されています