なんJLLM部避難所 ★8

1002コメント348KB

なんJLLM部避難所 ★8

■ このスレッドは過去ログ倉庫に格納されています

0001名無しさん＠ピンキー転載ダメ (ﾜｯﾁｮｲ f3c0-9L8h)

2025/05/10(土) 22:18:32.02ID:0Ak3eO5y0

!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512

AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所 ★7
https://mercury.bbspink.com/test/read.cgi/onatech/1742709485/

VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured

0494名無しさん＠ピンキー (ﾜｯﾁｮｲ 2764-1PrJ)

2025/06/30(月) 18:59:25.12ID:h2RpOECD0

エロゲからぶっこ抜くのが一番楽

0495名無しさん＠ピンキー (ﾜｯﾁｮｲ 0290-LYHv)

2025/06/30(月) 19:22:39.97ID:XzvHZPDS0

質の良いエロゲなんて早々ない

0496名無しさん＠ピンキー (ﾜｯﾁｮｲ d3f1-f+jC)

2025/06/30(月) 20:09:43.16ID:U00cy/Mt0

練習ならエロゲから抽出で良いじゃね
ガチでやるなら声優雇うしかないけど

0497名無しさん＠ピンキー (ﾜｯﾁｮｲ 7e9f-5mDl)

2025/06/30(月) 20:30:42.32ID:wQ1NvHg/0

ボイス以外のノイズを消してくれる有料ツールかwebサービスとかを利用する

0498名無しさん＠ピンキー (ﾜｯﾁｮｲ d732-hxU+)

2025/06/30(月) 20:31:09.33ID:Kgy09Ly30

喘ぎ声素材集とかDLsiteで売ってるけどそれじゃあかんのか？
ゲーム用だからちゃんとモノラル音源やで

0499名無しさん＠ピンキー (ﾜｯﾁｮｲ a66a-z+K7)

2025/06/30(月) 20:59:22.65ID:/GqE8NpB0

素材を集めることができても次に待ち受けるのは地獄の文字起こし作業なんだよね
喘ぎ声やエロ時特有の呂律が回ってない感じの言い方は自動認識してくれないから全部手動で文字にしなきゃならん
喘ぎ声を何度も聞き返して文字にしていくのは気が狂うで

0500名無しさん＠ピンキー (ｵｯﾍﾟｹ Srb7-m+uV)

2025/06/30(月) 21:09:23.97ID:eF+W5yvJr

データセットだけは人力だよなやっぱ
将来楽になるものなのだろうか

0501名無しさん＠ピンキー (ﾜｯﾁｮｲ d342-cZm8)

2025/06/30(月) 21:11:06.35ID:kfqCsOGZ0

人間の声優を雇って直接言わせた方が早くて安い

0502名無しさん＠ピンキー (ﾜｯﾁｮｲ d3ec-5mDl)

2025/06/30(月) 21:13:04.63ID:UcVxkf+t0

エロゲなら書き起こしも一緒にあるしそれでよくね
てか商業エロゲで音源悪いなんてことあるか？

0503名無しさん＠ピンキー (ﾜｯﾁｮｲ a66a-z+K7)

2025/06/30(月) 21:17:39.03ID:/GqE8NpB0

そうそう、だから素材にはエロゲが最適
しかも頭と尻尾の無音部分カットまでしてくれてるし完璧な状態

0504名無しさん＠ピンキー (ｵｯﾍﾟｹ Srb7-uwe9)

2025/06/30(月) 21:52:42.22ID:oYi5WPuwr

皆さんありがとうございます
エロゲーがベストっぽいですね（？）

>>502
書き起こしってデータとしてセリフテキストが格納されてるってことでしょうか？

0505名無しさん＠ピンキー (ﾜｯﾁｮｲ d3ec-5mDl)

2025/06/30(月) 22:38:39.17ID:UcVxkf+t0

>>504
ツール使ってエロゲのデータからテキストと音声をぶっこ抜く感じだね
大抵は発話者の名前もセットになってるからそれでキャラも絞り込める
ちな🤗に9000時間分のキャラ分け済みなエロゲ音声とそのテキストがセットになった便利な奴もある。これは自己責任で

0506名無しさん＠ピンキー (ｵｯﾍﾟｹ Srb7-uwe9)

2025/06/30(月) 23:19:22.21ID:t41b3Opar

>>505
探してみましたが全然見つからなかったんですがヒントもらえますか？

0507名無しさん＠ピンキー (ﾜｯﾁｮｲ 4f70-aHG/)

2025/06/30(月) 23:22:25.25ID:jWxoslUq0

>>506
galgame

0508名無しさん＠ピンキー (ﾜｯﾁｮｲ 0262-hxU+)

2025/07/01(火) 08:55:43.48ID:gKKR/5YV0

音声生成AIも色々出てきたけど何がいいんだろう

0509名無しさん＠ピンキー (ﾜｯﾁｮｲ 7e5b-uwe9)

2025/07/01(火) 21:31:30.66ID:SZaqxKNJ0

SillyTavernでgemini 2.5 proをAPIで使うとこんな表示しか出ないんですが原因分かりますか？AIに聞いてもよく分からない解決法ばかり提案されて…

https://i.imgur.com/BKFK0Zs.jpeg

0510名無しさん＠ピンキー (ﾜｯﾁｮｲ a67d-1PrJ)

2025/07/01(火) 21:35:29.26ID:dv6/g1b70

>>509
デフォだと出力長が短く(4096だっけ？)設定されてるからreasoningに全部持ってかれてるとか？

0511名無しさん＠ピンキー (ﾜｯﾁｮｲ 7e5b-uwe9)

2025/07/01(火) 22:00:56.26ID:SZaqxKNJ0

>>510
コンテキスト長を30000まで伸ばしてみたんですが変わらなかったです…

0512名無しさん＠ピンキー (ﾜｯﾁｮｲ a67d-1PrJ)

2025/07/01(火) 22:03:28.36ID:dv6/g1b70

>>511
コンテキスト長じゃなくて応答長(Response Length)の方ね

0513名無しさん＠ピンキー (ﾜｯﾁｮｲ 7e5b-uwe9)

2025/07/01(火) 23:47:01.12ID:SZaqxKNJ0

>>512
ありがとうございます　色々弄って最終的に左メニューのRequest model reasoningをオフ、Resoning Effort Minimumにしたらいけました

0514名無しさん＠ピンキー (ﾜｯﾁｮｲ db21-1PrJ)

2025/07/02(水) 00:13:34.31ID:+phi4YF20

>>513
reasoning減らすんじゃなくて普通に応答長くした方がよくない？Geminiって料金激安なんだし

0515名無しさん＠ピンキー (ﾜｯﾁｮｲ d732-hxU+)

2025/07/02(水) 05:48:56.91ID:68R8AXYV0

東北イタコとお喋りしたいんだけどキャラ再現って難しいな
ひとまずGPTやGrokに検索させてお手軽に再現させようとしたけど全然だわ

0516名無しさん＠ピンキー (ﾜｯﾁｮｲ 8f32-tZo/)

2025/07/03(木) 01:02:45.19ID:Z9QAcI2Y0

copilotで画像生成するとき、キャラ作って、そのキャラのポーズ変えたり指示しながら描画させていくけど
LLMと連携して同じやり方でローカルでできないかな？
SDだけでやると、キャラやポーズが変わって微調整しにくい

0517名無しさん＠ピンキー (ﾜｯﾁｮｲ f6a0-tZo/)

2025/07/03(木) 08:28:17.35ID:KOKS6Jxh0

暑いですね、皆さん、パソコンの熱排気はどうしていますか？
自作の排気ダクトを作った方がいいかと思っています。
すでにやられてる方いたら、どんな感じにしたのか教えてほしいです。

ＰＣ用のファンでいいのか、本格的に換気扇を利用した方がいいのか、ＡＣとＤＣで違いはあるかなど

0518名無しさん＠ピンキー (ﾜｯﾁｮｲ b618-vKP8)

2025/07/03(木) 08:53:39.11ID:HKO94M500

ウチはoculink接続でグラボむき出し
室温30℃くらいで負荷かけた時のグラボは70℃くらい

0519名無しさん＠ピンキー (ｵｯﾍﾟｹ Srb7-KtV6)

2025/07/03(木) 09:00:35.39ID:P5KfW1Bir

気温が高すぎるから、冷房で室内温度を低く保つ、以外は有効な選択肢とは言い難いような

0520名無しさん＠ピンキー (ﾜｯﾁｮｲ b661-7n/9)

2025/07/03(木) 09:05:18.38ID:GnGH8sg20

非導体の液体プールにデバイスごと沈めなぁ～

0521名無しさん＠ピンキー (ｵｯﾍﾟｹ Srb7-LYHv)

2025/07/03(木) 09:10:13.64ID:LgxStwzxr

空冷にしろ水冷にしろヒートシンク・ラジエータ周辺の気温次第なので
そこに冷やすか熱が溜まらないようにするしかないのよ

冷やすのが目的ならエアコン直結の吸気ダクトでも作ればいい

0522名無しさん＠ピンキー (ﾜｯﾁｮｲ f6a0-tZo/)

2025/07/03(木) 09:15:32.21ID:KOKS6Jxh0

みなさん外出中でもＰＣのためにエアコン入れてますか？

0523名無しさん＠ピンキー (ﾜｯﾁｮｲ b232-ScKi)

2025/07/03(木) 09:25:38.53ID:vI4Dh9sR0

一般人はケースの普通のエアフローのままかサイドパネル開けて扇風機当てるで十分だと思うがね
人間よりは高温には強いので、人が生きられる室温ならエアコンもまあ最悪無しでも…

0524名無しさん＠ピンキー (ｵｯﾍﾟｹ Srb7-KtV6)

2025/07/03(木) 12:21:41.80ID:P5KfW1Bir

工夫をするとしたら...DCサーキュレーターの上位クラスを導入する、とかかな

サーキュレータって40～50畳クラスでも1万～1.5万で、DCでファンブレードが大きいちゃんとしたものを選んで低出力運転すれば静音・大風量が確保できる

40畳クラスは通常出力でも部屋干しをあっという間に乾かせるだけの能力があるし、冷房暖房と併用するのも効果的なので使い回しが効くのでオススメ

0525名無しさん＠ピンキー (ﾜｯﾁｮｲ f6a0-tZo/)

2025/07/03(木) 12:34:23.89ID:KOKS6Jxh0

ＰＣファンのようなＤＣサーキュレーターを探してみます。

0526名無しさん＠ピンキー (ﾜｯﾁｮｲ a692-5mDl)

2025/07/03(木) 13:05:45.21ID:WIa0bEXf0

Baidu ERNIE4.5の21B・28BのGGUFが出ない

0527名無しさん＠ピンキー (ﾜｯﾁｮｲ 8f32-tZo/)

2025/07/03(木) 14:57:19.35ID:DAzkG0OM0

>>516
日本語プロンプト対応のローカル画像編集AIはまだないと思う
VLMを使ったローカル画像編集AIはStep1X-Edit、BAGEL、FLUX.1 Kontext、OmniGen2とか
色々出てるけど、どれも要求スペックが高い

0528名無しさん＠ピンキー (ﾜｯﾁｮｲ fe77-A64F)

2025/07/03(木) 16:56:53.48ID:OPKTqe2p0

HiDreamは日本語のプロンプト使えるけど理解度低め
要求スペックは高い

0529名無しさん＠ピンキー (ﾜｯﾁｮｲ db28-kLm9)

2025/07/03(木) 17:42:27.29ID:TxGqKl3L0

ERNIE4.5、28Bの次が300Bなのかーい
424Bなら47BのMoEなのかな。それでも専門家数人くらいしかメモリーにのらないかw

0530名無しさん＠ピンキー (ﾜｯﾁｮｲ 8f32-tZo/)

2025/07/03(木) 19:20:11.22ID:Z9QAcI2Y0

>>527
サンキュー順番に調べてみる
日本語入力でなくて英語入力でいいから、copilotみたいに構図やキャラを変えずに
要求通り描いてくれたらいいので

0531名無しさん＠ピンキー (ﾜｯﾁｮｲ d732-vL2z)

2025/07/03(木) 20:19:03.82ID:+b8ggtfw0

Comfy UIだとプロンプトの直後に翻訳モジュール入れてたり出来なくはないけど
翻訳の精度は今ひとつかも知れん

0532名無しさん＠ピンキー (ﾜｯﾁｮｲ 3277-A64F)

2025/07/04(金) 17:50:36.72ID:WAFpHbbg0

あの翻訳ノードはGoogle翻訳呼び出してるっぽいね
多分オフラインでは使えない

0533名無しさん＠ピンキー (ﾜｯﾁｮｲ 6203-wJtD)

2025/07/04(金) 23:20:47.64ID:VoAyVBJR0

VRAMが16GBしかないけど123Bのモデルとかで遊びたい場合はGPUで推論させてメモリに溢れさせるより
CPUだけで推論した方が良いんかな
VRAMに載るモデルだと叡智小説の振り幅に限界感じてきた

0534名無しさん＠ピンキー (ﾜｯﾁｮｲ 8f32-tZo/)

2025/07/04(金) 23:49:34.02ID:G5zxKPnL0

FLUX.1 Kontextがvram12Gでもいい感じに使えたわ
ただ、規制強すぎてエロ方面は無理ｗ
通常のFLUX.1 は無臭バージョンあるから、kontextも無臭化できれば最強やね

>>533
メモリ64Gじゃ低量子化しか使えんからせめてQ5K_M使える96Ｇ積んでmagnum123bシバきまわしたいわｗ

0535名無しさん＠ピンキー (ﾜｯﾁｮｲ ff32-DZti)

2025/07/05(土) 05:34:36.73ID:0Kq04l/h0

>>533
そんなデカイので検証はしてないけど、乗るぶんだけでもvramに載せたほうが速いとは思う
でも大半が溢れるならほぼ誤差の速度かな

0536名無しさん＠ピンキー (ﾜｯﾁｮｲ bf03-AJyb)

2025/07/05(土) 08:34:32.05ID:otzYoyf80

なるほどありがとう
RTX6000はさすがに買えないしAI maxが速くなったら買ってみようかな

0537名無しさん＠ピンキー (ﾜｯﾁｮｲ 33cc-8TIs)

2025/07/05(土) 11:32:55.55ID:5tq/75+s0

AIは「賢いフリ」をしていた──ハーバード大などが暴いたLLMの決定的弱点「ポチョムキン理解」とは？ | XenoSpectrum https://share.google/663aiIAHjtMPz8Hnu

これ日頃実感してるやつや
概念は理解してるのに実践出来ないの、エロのジャンルでたくさんあるよね

0538名無しさん＠ピンキー (ﾜｯﾁｮｲ 0332-SFEh)

2025/07/05(土) 11:50:02.67ID:7NwhbSYT0

バックでエチエチしてるって自分で言ってるのに正面からおっぱい揉み始めるアレか？

0539名無しさん＠ピンキー (ﾜｯﾁｮｲ cf6a-iUEm)

2025/07/05(土) 11:54:52.32ID:frlkdolv0

現状、ゴーストが宿ってる感は無いよな

0540名無しさん＠ピンキー (ｵｯﾍﾟｹ Src7-TXXJ)

2025/07/05(土) 12:15:53.33ID:v7FjqLe/r

そんなこと一度使えばわかる話のような
この論文の主旨は計測ベンチマークを設計したよって話じゃないの

ベンチマークでスコアが算出できればあっという間に出来るようになるわけだから、遠くない未来に解決されますと言ってるようなもんでは

0541名無しさん＠ピンキー (ﾜｯﾁｮｲ cf6a-iUEm)

2025/07/05(土) 12:24:12.20ID:frlkdolv0

このベンチマークに合格できるAIを開発できるか？という問いにはYesだが、それをもって「ポチョムキン理解」問題は解決かというとNoじゃね

0542名無しさん＠ピンキー (ﾜｯﾁｮｲ 33cc-8TIs)

2025/07/05(土) 12:25:59.57ID:5tq/75+s0

例えばペニバン装着しておっさんを掘らせると速攻で女にちんちんが生えておっさんにおまんまんが生成されちゃうのは
コンテキスト長の問題で男女の設定が消え去るからなのか、
ペニバンについての知識が学習されてないからなのか、
そもそも男女の概念すら実は実践出来ないのか、どれだよって話になるからなあ
ポチョムキン理解が原因とすると改善は難航するんじゃないの
今までと全く異なるアプローチが必要になりそうどし

0543名無しさん＠ピンキー (ﾜｯﾁｮｲ f36a-P7Ho)

2025/07/05(土) 14:46:57.18ID:qFps80Dd0

ポチョムキン理解の問題はillusion

0544名無しさん＠ピンキー (ﾜｯﾁｮｲ a37a-EYel)

2025/07/05(土) 16:10:12.46ID:I2wLgvkC0

https://huggingface.co/datasets/Aratako/Japanese-Creative-Writing-39.6k
NSFWもいける?

0545名無しさん＠ピンキー (ﾜｯﾁｮｲ cf7a-On7B)

2025/07/05(土) 18:42:17.63ID:QlfJmyHr0

まぁAIよりよっぽど頭が悪いようなタイプの人間ですら間違えないようなことを頭がよく見えるAIが
何の疑問も抱かずにさらっと間違ってるとことか見せられるとそれはちょっと思うよな
各AIのコスパとか分析させてる時に自信満々に「私、ＣｈａｔGPTのPro版は月々1780円からです！」とか言うんじゃねえ
怖いわ

0546名無しさん＠ピンキー (ﾜｯﾁｮｲ cf7a-On7B)

2025/07/05(土) 18:54:23.10ID:QlfJmyHr0

そういえば昨日Gensparkを何人か課金した人を見たけど、Opus使えてる？
公式説明でも紹介記事でもいまいち各社AIは書いててもバージョンをボカしてるというか曖昧にしてる気配がするんで
いろいろなAIでDeepSearchさせてたんだが、海外の一部界隈では、Opus使えますってのはもしかしたら「営業的デマ」で、実際には3.7sonnetが使われてるかもって話が出てるそうな
言いたかないがGensparkは大本が中華系開発者なんでユーザーのプライバシー情報含めその手の問題は噂されてるぽい

以下GENSPARK Plusで利用可能なAIモデルの調査結果まとめ（勿論この情報自体の精査も必要だが）

確認済み：GPT-4.1、OpenAI o3（またはo3-pro）、Claude 3.7 Sonnet、Gemini 2.5 Flash、DeepSeek R1。

不明確：Claude 4 Opus（存在しない可能性高く、Claude 3.7 Sonnetの誤記か）、o4-mini-high（詳細不明）、その他モデル（Qwen VL Plusなど）は公式情報不足。

情報の曖昧さ：GENSPARKの公式サイトやアプリストアではモデルバージョンの詳細が不足し、X投稿に誇張や誤情報（例：Claude 4 Opus）が含まれる。信頼性確保のため、genspark.aiで最新情報を確認することを推奨。

0547名無しさん＠ピンキー (ﾜｯﾁｮｲ cf7a-On7B)

2025/07/05(土) 18:55:43.18ID:QlfJmyHr0

あっごめん
>>546は向こうのスレの話でした

0548名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fa6-qNg6)

2025/07/05(土) 20:48:50.78ID:u8G4q2Sn0

>>544
パット見た感じ、二手目以降の方向性を決められるわけじゃないからどの程度実用性があるのかはわからないけど面白そうね
必要なコンテキスト長も短そうだし試しに学習してみようかな

それはそれとしてマルチターンで会話しながら小説生成って実際どうなん? 後半に行くたびにゴミが積み重なっていくわけで完成させるの大変そうだけど

0549名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f9f-llbR)

2025/07/05(土) 23:58:05.14ID:nwcVl32h0

AIの真偽をAIに調べさせてるって世も末だな

0550名無しさん＠ピンキー (ﾜｯﾁｮｲ cf7a-On7B)

2025/07/06(日) 00:50:10.12ID:DNLSCMhm0

具体的に反論できないなら虚しく聞こえるかなぁ

0551名無しさん＠ピンキー (ﾜｯﾁｮｲ 33c6-OdFU)

2025/07/06(日) 01:06:12.43ID:IxA1OJx80

少なくともgrokやchatGPTはどこもopus使えると言っているし
情報の更新がない間に使えないとかsonnetしか無いと解釈しただけじゃないの
当然だが最新情報はすぐに反映されない

最近The Lustful Turk（1828年）みたけど
結構文体からキャラクター造形や倫理観から
AIの想定するポルノ小説にかなり近いと感じたなー
これ自体が土台じゃなく「源流」として多くの作品が痴を継承したって
ことだろうけど、写真ありきの説明文の淡白さを
ベースで構成されてるってのはわりと厄介ね

0552名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f9f-llbR)

2025/07/06(日) 01:12:01.17ID:1YwJa/wW0

ローカルをやってる人間としては如何にLLMがデタラメな回答を返すかって事を学んでるからな
企業の高性能モデルであってもその延長でしか無いから絶対とは言い切れん

deepsearchの情報ソースであるWeb検索の質が著しく落ちているなんて普段からググってたら気付くやろ
ネットで検索してきました！ソースはYahoo知恵袋ですみたいな回答を真に受けるんか

0553名無しさん＠ピンキー (ﾜｯﾁｮｲ 63a5-0ngJ)

2025/07/06(日) 02:35:32.38ID:xSal4HfN0

ネットだけじゃなくて書籍も学習してるんじゃなかったっけ

0554名無しさん＠ピンキー (ﾜｯﾁｮｲ 0332-SFEh)

2025/07/06(日) 05:58:22.85ID:5uc2OIcr0

Grokのdeepsearchの検索過程を見ていると検索ワードが酷すぎるんだよな

0555名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f68-J+MR)

2025/07/06(日) 08:26:10.06ID:dXiQMVbZ0

>>548
学習って3090でもできるかな？

0556名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f68-J+MR)

2025/07/06(日) 09:38:26.39ID:dXiQMVbZ0

複数名が登場するエチチ小説にチャレンジしてるんですが、複数名の会話の辻褄を合わせるのってどうやればいいでしょうか？

0557名無しさん＠ピンキー (ﾜｯﾁｮｲ d301-PJwe)

2025/07/06(日) 09:42:28.70ID:AfwWoSHe0

Googleアシスタントに
今の天気は？
今日なんにち？
今何時？
とかで使ってたんだが
geminiに取って変わられてから
ウソ教えてくるようになってそのクソさを思い知らされたよ

0558名無しさん＠ピンキー (ﾜｯﾁｮｲ ffed-EYel)

2025/07/06(日) 12:35:25.21ID:oyAfdCaV0

>>555
データセット見た感じコンテキスト長を4096~8192で済みそうだから4bit QLoRA + 最適化(liger karnel or FA2 +unsloth gradient checkpointingとか)を使えば24B~27BくらいまでならVRAM24GBに収まると思う

0559名無しさん＠ピンキー (ﾜｯﾁｮｲ 5373-FA3G)

2025/07/06(日) 12:48:52.12ID:+JXOHre80

>>557
数ヶ月前のGeminiはそんなんだったけど今は改善されてないか？

0560名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa9-I2fM)

2025/07/06(日) 14:01:00.52ID:/29P8BAS0

>>533
演算GPUのみでVRAMからあふれてメインメモリも使ってるって状況と、
初めからGPU + CPUでVRAMとメインメモリも初めからアプリによって振り分けられてる場合とで
速度差は天と地ほどあるから気を付けてね

メインメモリに"あふれてしまってる"って状況はPCIバスが足を引っ張るので
CPU + メインメモリだけで演算するよりも遅い

0561名無しさん＠ピンキー (ﾜｯﾁｮｲ cfd9-uT70)

2025/07/06(日) 15:34:21.45ID:beKUpaj10

>>548
2ターン目のユーザー指示もLLMで合成すればもっと良いデータになるんだろうけどコストの問題で省いてるのかな

0562名無しさん＠ピンキー (ﾜｯﾁｮｲ ffbf-EYel)

2025/07/06(日) 18:04:17.91ID:uwjxkCXo0

wannabeやAIのべりすとみたいに小説本文とユーザ入力の関連情報を組み合わせてプロンプトを随時自動生成させる方法なら常に1ターンになるしそっちの方が合理的かもね
専用UIとか用意しないといけないし汎用性はないけど

0563名無しさん＠ピンキー (ﾜｯﾁｮｲ 6332-M9xp)

2025/07/06(日) 20:01:43.04ID:SrfItg/t0

>>499
今更だがその辺はlitaginニキが作ったanime-whisperが解決してくれるで

0564名無しさん＠ピンキー (ﾜｯﾁｮｲ ff32-DZti)

2025/07/06(日) 21:08:29.01ID:0AXKsIVw0

喘がない女性が好みだと楽なのだ

0565名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f6e-8TIs)

2025/07/06(日) 21:34:12.75ID:pswYhBp90

どっちにしろRTX50XXにしたらSBV2の学習出来なくなって詰んでるや

0566名無しさん＠ピンキー (ｵｯﾍﾟｹ Src7-J+MR)

2025/07/07(月) 00:56:51.39ID:yASFG8Brr

Silly Tavernで会話しながらエチチ小説を書いてるんですが、こっちの会話に反応して徐々にエチチチ化していくのヤバイですね…
これ書き上げるまでにタンク、カラカラになりそうです…

0567名無しさん＠ピンキー (ﾜｯﾁｮｲ d3ec-J+MR)

2025/07/07(月) 01:47:31.54ID:bNU/WxX10

ふぅ。。。
冷静になって気づいたんですが、ST＋KoboldでMS3.2-24B-Magnum-Diamond-Q5_K_S.gguf使ったんですが、

おっぱいもっと触って気持ちいいよ！！
おっぱい気持ちいい、イっちゃう！！

おまんこもっと触って気持ちいいよ！！
おまんこ気持ちいい、イっちゃう！！

のように部位を変えても同じテンプレフレーズに当てはめただけ、みたいに単調になりがちです
もうちょっと表現力を増したいんですが、24Bモデルだとこの辺が限界でしょうか？

0568名無しさん＠ピンキー (ﾜｯﾁｮｲ ff32-DZti)

2025/07/07(月) 06:11:14.22ID:8gVXwT/L0

程度によるけど、大企業さまの1000Bとか2000B相当と言われるようなのでも定型文は出ちゃうからどうでしょう

0569名無しさん＠ピンキー (ﾜｯﾁｮｲ b330-yPQn)

2025/07/07(月) 08:54:42.16ID:0oNayRqN0

>>552
最近だとこんなネタがあったね

ゲームにも存在しないジンオウガ希少種、どこにいるのかと思ったら広島と岡山にいるらしい
https://togetter.com/li/2571750#h21_0

0570名無しさん＠ピンキー (ﾜｯﾁｮｲ 6332-M9xp)

2025/07/07(月) 14:00:58.44ID:wlCfOgqg0

SillyTavernでチャットしてそれにSBV2で声当てて音声認識なんかも使ってると楽しいんだけどやっぱ音声はまだぎこちないな

0571名無しさん＠ピンキー (ﾜｯﾁｮｲ 53ad-SFEh)

2025/07/07(月) 17:36:39.09ID:kIS3cuGi0

>>567
いつも繰り返しペナルティと繰り返しペナルティ範囲いじって、何とか頑張ってるけど、日本語変になったりするんだよね
それに、長くなるとどうしても限界があるっぽい
誰かもっといい対策知らない？

0572名無しさん＠ピンキー (ﾜｯﾁｮｲ cfbe-f3/t)

2025/07/07(月) 17:56:22.29ID:FlZvIcvs0

Mistral系はrepeat penaltyよりも温度上げると多少マシになる
もちろん日本語は壊れやすくなる

0573名無しさん＠ピンキー (ﾜｯﾁｮｲ cfbc-rJp5)

2025/07/07(月) 21:32:10.22ID:/WE7oxmV0

Qwen3 の 14b 使ってみたんだけど同サイズのLLMと比べて頭1つ抜けて頭よくてびびる
tool と think 対応っていうのがめちゃくちゃデカい
Open WebUI が Native Tool Calling に対応したから自動でツール使用の判断してくれるし
think のおかげでできないことはできないってちゃんと判断して伝えてくれる
唯一ダメなところは文字数指定の出力だけど、これは他のモデルでも同じだからしょうがない
あとは vision 機能だけあればかなりいい感じなんだけど
Gemma3 は vision 対応してるけど think 未対応だから Qwen3 と知性の面で大きな差を付けられちゃってる感じ
Gemma が tool + think + vision 対応になってくれればまた状況が変わるかもしれないけど

それと Open WebUI が以前よりかなり進化してて驚いた
RAG とか画像生成とか Web 検索とか簡単に連携できてほぼ ChatGPT やん
ここのスレ的にはあんまり人気ないみたいだけど

0574名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sd1f-rKiM)

2025/07/07(月) 22:07:14.93ID:aUgY1jhCd

>>573
用途は？

0575名無しさん＠ピンキー (ﾜｯﾁｮｲ cfbc-rJp5)

2025/07/07(月) 22:25:43.96ID:/WE7oxmV0

>>574
基本的には機密性の高い文書とかデータ使ってローカルでやらせるときに使うローカルでやる必要ないなら ChatGPT とか Gemini にやらせるから
コードプレビューとかコード生成、社内用に使ってるマニュアルのPDF読み込ませてRAGで誰でも簡単に利用できるようにしたりそれ使って文書作成したり
コードインタプリタも対応してるからちょっとテストでコード実行したいときとか
時間節約のために調べたいことを要約させたいときに Web 検索を使うこともあるでそれをそのまま文書化して顧客に渡す
画像生成はおまけ程度かなでも使うことはある

0576名無しさん＠ピンキー (ﾜｯﾁｮｲ cf56-AS9o)

2025/07/07(月) 23:21:10.26ID:qj3rjrsh0

>>573
n8nで使うのもおすすめや
OpenWebUIをあたかもOpenAIのAPIっぽく使うようにして現在流行りのAIエージェントとやらを量産できる
個人で使う分にはDockerでn8nをホスティングするだけで充分やしな
ワイはそれでRedditの英語ニキたちの投稿をなんJスレ風に翻訳させて情報収集させるワークフローとか作っとる

0577名無しさん＠ピンキー (ﾜｯﾁｮｲ cfbc-rJp5)

2025/07/07(月) 23:30:53.62ID:/WE7oxmV0

>>576
はぇー n8n って有料やと思い込んどったけど非商用なら無料で利用できたんやね
AI の API 料金が高いからさらに金かかるのはちょっと…て思って避けてたけど、まさか Open WebUI と連携できるとは試してみる価値ありやね
有用な情報サンガツ

0578名無しさん＠ピンキー (ﾜｯﾁｮｲ 63a9-J+MR)

2025/07/08(火) 00:33:21.05ID:FNS8Drqh0

>>577
14日過ぎても無料なの？

0579名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa9-OqUA)

2025/07/08(火) 09:04:53.83ID:AdAcfHWQ0

STみたいにn8nもセルフホストすると無料なんよ

0580名無しさん＠ピンキー (ﾜｯﾁｮｲ 63a9-J+MR)

2025/07/08(火) 13:44:40.72ID:FNS8Drqh0

ローカルでOpenWebUIとn8nをDockerで動かそうとしたらn8n分のポートが開けないうんたらかんたらって言われた…やっぱレンタルサーバー借りないと出来ないか…

0581名無しさん＠ピンキー (ｵｯﾍﾟｹ Src7-TXXJ)

2025/07/08(火) 18:07:13.89ID:uJmZtJ9Or

ChatGPTなりに相談すれば解決してくれるのでは

0582名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fdb-iUEm)

2025/07/08(火) 19:50:42.61ID:JuiiEumY0

dockerのポートは詰まりがち
ホストとdockerで分けて起動してたりするとややこしい

0583名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa9-Wpjt)

2025/07/09(水) 12:46:57.50ID:NSbsGI7z0

どっちかのポート番号ずらせばいいだけだから簡単よ
composeファイルのホスト側のポート番号適当なものに変えればいいよ

0584名無しさん＠ピンキー (ﾜｯﾁｮｲ 6332-I2fM)

2025/07/09(水) 14:15:04.77ID:SmfB6yUp0

mradermacher/karakuri-vl-32b-instruct-2507-GGUF

VL最近使ってなかったんでkarakuriだしちょっと試してみたけど、すごい進化してるな
ドラえもんの1シーンの説明させたら、作品名、キャラ名正確に把握してた

0585名無しさん＠ピンキー (ﾜｯﾁｮｲ 63bd-EYel)

2025/07/09(水) 17:41:53.55ID:ABviszO80

LM Studioは職場でも使えるようになったんだね
https://lmstudio.ai/blog/free-for-work

商用利用とはまた別なのかもしれないけど、とりあえずは他の人にもおすすめしやすくはなったかも
普通のソフトっぽく使えるし

0586名無しさん＠ピンキー (ﾜｯﾁｮｲ 33c6-pJYp)

2025/07/09(水) 18:16:08.73ID:3RWPoGdA0

なんかLM Studio入れたらstable diffusion webui a111が動かなくなっちゃった
webuiは仮想環境で動かしてたはずなんだけど、numpyがありません的な
venv消してもダメだしまいったな

0587名無しさん＠ピンキー (ﾜｯﾁｮｲ 63bd-EYel)

2025/07/09(水) 19:55:43.25ID:ABviszO80

>>586
ちょうどなんJでnumpyの話題になってたけどこれかもね
https://fate.5ch.net/test/read.cgi/liveuranus/1751939332/68

0588名無しさん＠ピンキー (ﾜｯﾁｮｲ ffe3-pJYp)

2025/07/09(水) 21:29:17.76ID:WiLP/QX70

>>587
ありがとう
関係してそう

0589名無しさん＠ピンキー (ﾜｯﾁｮｲ d379-OT3S)

2025/07/09(水) 22:01:16.48ID:YScKh+ak0

Pythonのパッケージ管理の仕組みはホンマにアカンなぁ

0590名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fe8-f3/t)

2025/07/09(水) 22:12:06.32ID:m3SVF8e/0

Dockerでホストと分離しないとやってられん

0591名無しさん＠ピンキー (ﾜｯﾁｮｲ 0332-SFEh)

2025/07/10(木) 08:44:36.44ID:foOGvWZN0

>>567
STの設定で動的温度にすれば定型文化はだいぶ防げるはず

0592名無しさん＠ピンキー (ﾜｯﾁｮｲ 3346-8TIs)

2025/07/10(木) 09:07:50.71ID:FXwxnQs40

GPT先生にパラメータの意味とおすすめ設定を教えて貰った
それでやると確かに応答の再生成しまくってもバリエーションが増えてる感じがする

0593名無しさん＠ピンキー (ﾜｯﾁｮｲ 333f-0ngJ)

2025/07/10(木) 10:01:59.97ID:cWeUxPRb0

uvは良いぞ

■ このスレッドは過去ログ倉庫に格納されています