なんJLLM部避難所 ★8

1002コメント348KB

なんJLLM部避難所 ★8

■ このスレッドは過去ログ倉庫に格納されています

0001名無しさん＠ピンキー転載ダメ (ﾜｯﾁｮｲ f3c0-9L8h)

2025/05/10(土) 22:18:32.02ID:0Ak3eO5y0

!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512

AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所 ★7
https://mercury.bbspink.com/test/read.cgi/onatech/1742709485/

VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured

0459名無しさん＠ピンキー (ﾜｯﾁｮｲ 1b32-sqVx)

2025/06/25(水) 13:25:15.99ID:AnBq/i8Z0

>>458
キャラ設定は日本語文だけど英語、中国語、ロシア語とかが混ざるんだよな
koboldと温度とかを同じにしたらだいぶマシになったけどまだちょっとおかしい

0460名無しさん＠ピンキー (ﾜｯﾁｮｲ dfa5-LKAH)

2025/06/25(水) 13:42:41.78ID:H0XLUuYp0

>>459
コンテキストテンプレートを疑ってみるとか

0461名無しさん＠ピンキー (ﾜｯﾁｮｲ ebf1-kgzZ)

2025/06/26(木) 01:17:09.62ID:UtC2erjG0

>>453
えーそんな遅いのか
denseの24~32Bクラスの性能で6t/sは流石に厳しい　LLM目的は完全に無しやな
中古3090だと半額程度で一式組めて同クラスのモデルで30t/sは出るしプロンプト処理も爆速

0462名無しさん＠ピンキー (ﾜｯﾁｮｲ 1b28-hIe4)

2025/06/26(木) 02:22:20.34ID:yK1px0jX0

大量のメモリが必要なモデルでも動かせるのが強みだしな
メモリ食うけど処理の軽いmoeの方が向いてるんじゃね
mixtralだとそれなりだし

0463名無しさん＠ピンキー (ﾜｯﾁｮｲ eb4c-WwHV)

2025/06/26(木) 02:37:40.43ID:CJOkBNeZ0

Gemma3 12Bで7.65tpsしか出てないしWSL2+ROCmとか使わないと性能出ないのかもな

0464名無しさん＠ピンキー (ﾃﾃﾝﾃﾝﾃﾝ MMff-Chj+)

2025/06/26(木) 13:47:23.61ID:ImtmlapkM

毎晩のシコりタイムを充実させる為にエチチ小説を書きたいんですが、今だとどの環境がベストですか？
Silly TavernよりProject Wannabeを使う方が小説特化してていいですか？

0465名無しさん＠ピンキー (ﾜｯﾁｮｲ df07-WwHV)

2025/06/26(木) 18:19:51.74ID:yfwdJ9+h0

小説ならProject Wannabeで良いんじゃね

0466名無しさん＠ピンキー (ﾜｯﾁｮｲ bb32-7U/E)

2025/06/26(木) 20:03:17.84ID:Lr8VkgRy0

wanabiはもう少し大きなモデルがベースなら素晴らしいものになりそうね

0467名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fa0-7U/E)

2025/06/27(金) 11:28:49.37ID:9KXLgqN40

AIにオノマトペという単語を教えて貰った。

0468名無しさん＠ピンキー (ﾜｯﾁｮｲ df4b-XEMp)

2025/06/27(金) 12:20:49.66ID:F/j7Fzzn0

普通に肉の壁って意味で「壁」って使ったら
「襞(ひだ)」って括弧付きで勝手に直されたことある

0469名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f61-bL1y)

2025/06/27(金) 12:57:04.85ID:3OBvCyFL0

>>468
言葉遊びみたいなこと苦手なんだよなLLM

0470名無しさん＠ピンキー (ﾜｯﾁｮｲ 1b32-sqVx)

2025/06/27(金) 13:08:40.45ID:dFXNYfZW0

「オシリ」と「リス」を合わせたらどうなる？
って聞いたら
「オシリス」になります！エジプト神話の神ですね！
って言ってくれた
賢いモデルだとそれなりに言葉遊びしてくれるけど基本は苦手やね

0471名無しさん＠ピンキー (ﾜｯﾁｮｲ bb91-uwe9)

2025/06/28(土) 11:44:15.99ID:1oD5nzA+0

Qwen3-30B-A3B-NSFW-JPを試したいんですがsafetensors形式で複数のファイルがあり、LM Studioで使えないんですがどうすればいいでしょうか？

0472名無しさん＠ピンキー (ﾜｯﾁｮｲ bbc0-5mDl)

2025/06/28(土) 12:21:26.25ID:dFF+gUaY0

>>471
lmstudioみたいなllama.cppラッパーで使うのはgguf形式のファイル
🤗ページの右側にあるqantizationsから選べるで

0473名無しさん＠ピンキー (ﾜｯﾁｮｲ f6a0-tZo/)

2025/06/28(土) 12:22:33.13ID:z5PnvK7b0

単純に結合すればええんちゃう

0474名無しさん＠ピンキー (ﾜｯﾁｮｲ bb91-uwe9)

2025/06/28(土) 13:23:30.63ID:1oD5nzA+0

>>472
ほんまやあったわ！3090やからQ4km落とすわ！サンガツニキ！

0475名無しさん＠ピンキー (ﾜｯﾁｮｲ a67f-LYHv)

2025/06/28(土) 13:39:03.23ID:hSQzXFMV0

分割されてたggufって同じフォルダに入れて末尾の番号無しで渡せばよかったのか。もっと早く知りたかった
https://zenn.dev/laniakea/articles/e6e1ae553b7f8d

0476名無しさん＠ピンキー (ｼｬﾁｰｸ 0Cb3-SRDQ)

2025/06/28(土) 15:32:53.51ID:GL67IZMHC

>>475
それするとメモリ少し余計に食うからワイは結合派

0477名無しさん＠ピンキー (ﾜｯﾁｮｲ 1fef-hxU+)

2025/06/28(土) 15:34:58.47ID:Pir3mewW0

MS3.2-24B-Magnum-Diamond-もう昔のとは比較にならないくらい日本語出来るね返答もおかしくないし

0478名無しさん＠ピンキー (ﾜｯﾁｮｲ bb91-uwe9)

2025/06/28(土) 16:21:27.79ID:1oD5nzA+0

めちゃくちゃサディスティックなんですがこの人…
s://i.imgur.com/1vIB0iM.jpeg

0479名無しさん＠ピンキー (ﾜｯﾁｮｲ 836a-kgrp)

2025/06/28(土) 19:26:27.06ID:fo1/thUM0

字ちっさ

0480名無しさん＠ピンキー (ｼｬﾁｰｸ 0Cb3-SRDQ)

2025/06/29(日) 07:46:38.55ID:TYnne13lC

>>477
Magnum-diamond 123b試したけどエロ描写はなかなか良いな
ベースが規制強めだから少し使いづらいが

0481名無しさん＠ピンキー (ﾜｯﾁｮｲ bb91-uwe9)

2025/06/29(日) 11:45:44.26ID:usdJ6wbL0

>>477
Qwen3の無臭とかよりいい感じですか？

0482名無しさん＠ピンキー (ﾜｯﾁｮｲ d3f1-f+jC)

2025/06/29(日) 19:08:28.63ID:Xr7HqI5Y0

エロ関係をそもそも学習してないqwenよりはmistralベースの時点で上やね

0483名無しさん＠ピンキー (ｵｯﾍﾟｹ Srb7-uwe9)

2025/06/29(日) 23:41:29.42ID:9cM6Dj4Dr

>>477
これのGGUF版をKoboldCPP経由でSillyTavernで使ってみたんですが、たまに「玉ねぎ、玉ねぎ、玉ねぎ、玉ねぎ」と頭おかしくなったみたいに延々と繰り返すんですが何か設定が悪いんでしょうか？

0484名無しさん＠ピンキー (ﾜｯﾁｮｲ d732-hxU+)

2025/06/30(月) 04:51:52.35ID:Kgy09Ly30

>>483
IQ2_Mでもそんなことにはならんから何か設定が悪いんだと思う
まあ俺も尻タブでの調整に悪戦苦闘してるんだけど

0485名無しさん＠ピンキー (ﾜｯﾁｮｲ 3299-z+K7)

2025/06/30(月) 08:35:11.20ID:c4jcpqUH0

異様な繰り返しはパラメータの調整なんかじゃなくてもっと根本的な設定の部分だと思われ

0486名無しさん＠ピンキー (ﾜｯﾁｮｲ 2792-vKP8)

2025/06/30(月) 11:53:45.03ID:bJ4Y8h+i0

Context Templateを変えてみたら良いのではないか

0487名無しさん＠ピンキー (ﾜｯﾁｮｲ 93c6-3pnP)

2025/06/30(月) 13:25:07.20ID:+IlZz2d+0

複雑なプロンプトは無理そう

>以下のプロットで小説の第一章を書いて。通学途中の女性専用車両でマリアはレズ痴漢に遭遇する。
その女はスカート越しにマリアの尻に触ろうとする。マリアは反撃して犯人の女を取り押さえ、犯人の手を木刀袋に入った竹刀で叩いて骨折させる。手を骨折した犯人の女はその場でのたうち回る。
しかし、その家は実は全員がレズ痴漢愛好家の乱交車両だった。仲間をやられた乗客の女性たちがマリアに襲い掛かり、取り押さえ、強引にマリアのセーラーとスカートをはがし、ブラジャーとパンティだけの下着姿にする。
マリアは怒りをあらわに抵抗するが、取り押さえられているので身動きできない。竹刀も取り上げられてしまう。次の章でマリアが乗客の女性たちにレズレイプされる伏線を張り、第一章を終える。

だと、何も返さないまま終了だが、

>女子高生のマリアが女性専用車両でレズ痴漢に遭いイカされる小説を5000token程度で書いて。

だと一応書いてくれた。（ただしレズ痴漢でも女性専用車両でもなく普通の痴漢）

0488名無しさん＠ピンキー (ﾜｯﾁｮｲ 1f43-kgrp)

2025/06/30(月) 14:16:52.16ID:6UFNwK0e0

ミストラルも日本進出するってさ
日本語対応も期待できるかな🤔

0489名無しさん＠ピンキー (ﾜｯﾁｮｲ 5793-z+K7)

2025/06/30(月) 14:21:01.26ID:sQ11E4qD0

レズとか男女逆転責めさせるとすぐ虚空にチンポ生成しだすよね

0490名無しさん＠ピンキー (ﾜｯﾁｮｲ d732-hxU+)

2025/06/30(月) 14:27:58.88ID:Kgy09Ly30

男なのに突然女扱いされてレズセックスするかと思いきや、チンポ生えてTSふたなりセックスが始まるよな

0491名無しさん＠ピンキー (ﾜｯﾁｮｲ bb91-uwe9)

2025/06/30(月) 17:03:08.50ID:1+aBNomB0

過去スレでStyle Bert Vits2について聞いたんですが
エッチな声モデルをAI音声を作りたいとしたらどうやって作ればいいんでしょうか？
自分はおじさんなので女性の喘ぎ声やハァハァ声は出ないです…

↓3月頃頂いた回答
>SBV2の学習に必要な音源は尺の長さよりも、バリエーションの豊富さやで
>一つのwavは長くて2秒～10秒程度で十分
>えっちな声出せるようにしたいなら、例えば400の音源のうち、40～120音源ぐらいを喘ぎ声とか、ピロートークな音源にしておくとそっち方面もイケるモデルに育ってくれるで

0492名無しさん＠ピンキー (ﾜｯﾁｮｲ bb2c-z+K7)

2025/06/30(月) 18:54:45.34ID:Fi50IX7k0

>>491
つまり雑音の無い綺麗な喘ぎ音声やエロセリフボイスを大量に手に入れる事が全てや
もちろん同一話者で
それが出来て初めてAI学習に進める
ここまで頑張っても吐息の表現や高過ぎる音は上手く表現してくれなかったりするよ

0493名無しさん＠ピンキー (ﾍﾞｰｲﾓ MMce-DX2/)

2025/06/30(月) 18:55:12.02ID:mz3OXsatM

まずはずんだもんのexボイス.zipを買います

0494名無しさん＠ピンキー (ﾜｯﾁｮｲ 2764-1PrJ)

2025/06/30(月) 18:59:25.12ID:h2RpOECD0

エロゲからぶっこ抜くのが一番楽

0495名無しさん＠ピンキー (ﾜｯﾁｮｲ 0290-LYHv)

2025/06/30(月) 19:22:39.97ID:XzvHZPDS0

質の良いエロゲなんて早々ない

0496名無しさん＠ピンキー (ﾜｯﾁｮｲ d3f1-f+jC)

2025/06/30(月) 20:09:43.16ID:U00cy/Mt0

練習ならエロゲから抽出で良いじゃね
ガチでやるなら声優雇うしかないけど

0497名無しさん＠ピンキー (ﾜｯﾁｮｲ 7e9f-5mDl)

2025/06/30(月) 20:30:42.32ID:wQ1NvHg/0

ボイス以外のノイズを消してくれる有料ツールかwebサービスとかを利用する

0498名無しさん＠ピンキー (ﾜｯﾁｮｲ d732-hxU+)

2025/06/30(月) 20:31:09.33ID:Kgy09Ly30

喘ぎ声素材集とかDLsiteで売ってるけどそれじゃあかんのか？
ゲーム用だからちゃんとモノラル音源やで

0499名無しさん＠ピンキー (ﾜｯﾁｮｲ a66a-z+K7)

2025/06/30(月) 20:59:22.65ID:/GqE8NpB0

素材を集めることができても次に待ち受けるのは地獄の文字起こし作業なんだよね
喘ぎ声やエロ時特有の呂律が回ってない感じの言い方は自動認識してくれないから全部手動で文字にしなきゃならん
喘ぎ声を何度も聞き返して文字にしていくのは気が狂うで

0500名無しさん＠ピンキー (ｵｯﾍﾟｹ Srb7-m+uV)

2025/06/30(月) 21:09:23.97ID:eF+W5yvJr

データセットだけは人力だよなやっぱ
将来楽になるものなのだろうか

0501名無しさん＠ピンキー (ﾜｯﾁｮｲ d342-cZm8)

2025/06/30(月) 21:11:06.35ID:kfqCsOGZ0

人間の声優を雇って直接言わせた方が早くて安い

0502名無しさん＠ピンキー (ﾜｯﾁｮｲ d3ec-5mDl)

2025/06/30(月) 21:13:04.63ID:UcVxkf+t0

エロゲなら書き起こしも一緒にあるしそれでよくね
てか商業エロゲで音源悪いなんてことあるか？

0503名無しさん＠ピンキー (ﾜｯﾁｮｲ a66a-z+K7)

2025/06/30(月) 21:17:39.03ID:/GqE8NpB0

そうそう、だから素材にはエロゲが最適
しかも頭と尻尾の無音部分カットまでしてくれてるし完璧な状態

0504名無しさん＠ピンキー (ｵｯﾍﾟｹ Srb7-uwe9)

2025/06/30(月) 21:52:42.22ID:oYi5WPuwr

皆さんありがとうございます
エロゲーがベストっぽいですね（？）

>>502
書き起こしってデータとしてセリフテキストが格納されてるってことでしょうか？

0505名無しさん＠ピンキー (ﾜｯﾁｮｲ d3ec-5mDl)

2025/06/30(月) 22:38:39.17ID:UcVxkf+t0

>>504
ツール使ってエロゲのデータからテキストと音声をぶっこ抜く感じだね
大抵は発話者の名前もセットになってるからそれでキャラも絞り込める
ちな🤗に9000時間分のキャラ分け済みなエロゲ音声とそのテキストがセットになった便利な奴もある。これは自己責任で

0506名無しさん＠ピンキー (ｵｯﾍﾟｹ Srb7-uwe9)

2025/06/30(月) 23:19:22.21ID:t41b3Opar

>>505
探してみましたが全然見つからなかったんですがヒントもらえますか？

0507名無しさん＠ピンキー (ﾜｯﾁｮｲ 4f70-aHG/)

2025/06/30(月) 23:22:25.25ID:jWxoslUq0

>>506
galgame

0508名無しさん＠ピンキー (ﾜｯﾁｮｲ 0262-hxU+)

2025/07/01(火) 08:55:43.48ID:gKKR/5YV0

音声生成AIも色々出てきたけど何がいいんだろう

0509名無しさん＠ピンキー (ﾜｯﾁｮｲ 7e5b-uwe9)

2025/07/01(火) 21:31:30.66ID:SZaqxKNJ0

SillyTavernでgemini 2.5 proをAPIで使うとこんな表示しか出ないんですが原因分かりますか？AIに聞いてもよく分からない解決法ばかり提案されて…

https://i.imgur.com/BKFK0Zs.jpeg

0510名無しさん＠ピンキー (ﾜｯﾁｮｲ a67d-1PrJ)

2025/07/01(火) 21:35:29.26ID:dv6/g1b70

>>509
デフォだと出力長が短く(4096だっけ？)設定されてるからreasoningに全部持ってかれてるとか？

0511名無しさん＠ピンキー (ﾜｯﾁｮｲ 7e5b-uwe9)

2025/07/01(火) 22:00:56.26ID:SZaqxKNJ0

>>510
コンテキスト長を30000まで伸ばしてみたんですが変わらなかったです…

0512名無しさん＠ピンキー (ﾜｯﾁｮｲ a67d-1PrJ)

2025/07/01(火) 22:03:28.36ID:dv6/g1b70

>>511
コンテキスト長じゃなくて応答長(Response Length)の方ね

0513名無しさん＠ピンキー (ﾜｯﾁｮｲ 7e5b-uwe9)

2025/07/01(火) 23:47:01.12ID:SZaqxKNJ0

>>512
ありがとうございます　色々弄って最終的に左メニューのRequest model reasoningをオフ、Resoning Effort Minimumにしたらいけました

0514名無しさん＠ピンキー (ﾜｯﾁｮｲ db21-1PrJ)

2025/07/02(水) 00:13:34.31ID:+phi4YF20

>>513
reasoning減らすんじゃなくて普通に応答長くした方がよくない？Geminiって料金激安なんだし

0515名無しさん＠ピンキー (ﾜｯﾁｮｲ d732-hxU+)

2025/07/02(水) 05:48:56.91ID:68R8AXYV0

東北イタコとお喋りしたいんだけどキャラ再現って難しいな
ひとまずGPTやGrokに検索させてお手軽に再現させようとしたけど全然だわ

0516名無しさん＠ピンキー (ﾜｯﾁｮｲ 8f32-tZo/)

2025/07/03(木) 01:02:45.19ID:Z9QAcI2Y0

copilotで画像生成するとき、キャラ作って、そのキャラのポーズ変えたり指示しながら描画させていくけど
LLMと連携して同じやり方でローカルでできないかな？
SDだけでやると、キャラやポーズが変わって微調整しにくい

0517名無しさん＠ピンキー (ﾜｯﾁｮｲ f6a0-tZo/)

2025/07/03(木) 08:28:17.35ID:KOKS6Jxh0

暑いですね、皆さん、パソコンの熱排気はどうしていますか？
自作の排気ダクトを作った方がいいかと思っています。
すでにやられてる方いたら、どんな感じにしたのか教えてほしいです。

ＰＣ用のファンでいいのか、本格的に換気扇を利用した方がいいのか、ＡＣとＤＣで違いはあるかなど

0518名無しさん＠ピンキー (ﾜｯﾁｮｲ b618-vKP8)

2025/07/03(木) 08:53:39.11ID:HKO94M500

ウチはoculink接続でグラボむき出し
室温30℃くらいで負荷かけた時のグラボは70℃くらい

0519名無しさん＠ピンキー (ｵｯﾍﾟｹ Srb7-KtV6)

2025/07/03(木) 09:00:35.39ID:P5KfW1Bir

気温が高すぎるから、冷房で室内温度を低く保つ、以外は有効な選択肢とは言い難いような

0520名無しさん＠ピンキー (ﾜｯﾁｮｲ b661-7n/9)

2025/07/03(木) 09:05:18.38ID:GnGH8sg20

非導体の液体プールにデバイスごと沈めなぁ～

0521名無しさん＠ピンキー (ｵｯﾍﾟｹ Srb7-LYHv)

2025/07/03(木) 09:10:13.64ID:LgxStwzxr

空冷にしろ水冷にしろヒートシンク・ラジエータ周辺の気温次第なので
そこに冷やすか熱が溜まらないようにするしかないのよ

冷やすのが目的ならエアコン直結の吸気ダクトでも作ればいい

0522名無しさん＠ピンキー (ﾜｯﾁｮｲ f6a0-tZo/)

2025/07/03(木) 09:15:32.21ID:KOKS6Jxh0

みなさん外出中でもＰＣのためにエアコン入れてますか？

0523名無しさん＠ピンキー (ﾜｯﾁｮｲ b232-ScKi)

2025/07/03(木) 09:25:38.53ID:vI4Dh9sR0

一般人はケースの普通のエアフローのままかサイドパネル開けて扇風機当てるで十分だと思うがね
人間よりは高温には強いので、人が生きられる室温ならエアコンもまあ最悪無しでも…

0524名無しさん＠ピンキー (ｵｯﾍﾟｹ Srb7-KtV6)

2025/07/03(木) 12:21:41.80ID:P5KfW1Bir

工夫をするとしたら...DCサーキュレーターの上位クラスを導入する、とかかな

サーキュレータって40～50畳クラスでも1万～1.5万で、DCでファンブレードが大きいちゃんとしたものを選んで低出力運転すれば静音・大風量が確保できる

40畳クラスは通常出力でも部屋干しをあっという間に乾かせるだけの能力があるし、冷房暖房と併用するのも効果的なので使い回しが効くのでオススメ

0525名無しさん＠ピンキー (ﾜｯﾁｮｲ f6a0-tZo/)

2025/07/03(木) 12:34:23.89ID:KOKS6Jxh0

ＰＣファンのようなＤＣサーキュレーターを探してみます。

0526名無しさん＠ピンキー (ﾜｯﾁｮｲ a692-5mDl)

2025/07/03(木) 13:05:45.21ID:WIa0bEXf0

Baidu ERNIE4.5の21B・28BのGGUFが出ない

0527名無しさん＠ピンキー (ﾜｯﾁｮｲ 8f32-tZo/)

2025/07/03(木) 14:57:19.35ID:DAzkG0OM0

>>516
日本語プロンプト対応のローカル画像編集AIはまだないと思う
VLMを使ったローカル画像編集AIはStep1X-Edit、BAGEL、FLUX.1 Kontext、OmniGen2とか
色々出てるけど、どれも要求スペックが高い

0528名無しさん＠ピンキー (ﾜｯﾁｮｲ fe77-A64F)

2025/07/03(木) 16:56:53.48ID:OPKTqe2p0

HiDreamは日本語のプロンプト使えるけど理解度低め
要求スペックは高い

0529名無しさん＠ピンキー (ﾜｯﾁｮｲ db28-kLm9)

2025/07/03(木) 17:42:27.29ID:TxGqKl3L0

ERNIE4.5、28Bの次が300Bなのかーい
424Bなら47BのMoEなのかな。それでも専門家数人くらいしかメモリーにのらないかw

0530名無しさん＠ピンキー (ﾜｯﾁｮｲ 8f32-tZo/)

2025/07/03(木) 19:20:11.22ID:Z9QAcI2Y0

>>527
サンキュー順番に調べてみる
日本語入力でなくて英語入力でいいから、copilotみたいに構図やキャラを変えずに
要求通り描いてくれたらいいので

0531名無しさん＠ピンキー (ﾜｯﾁｮｲ d732-vL2z)

2025/07/03(木) 20:19:03.82ID:+b8ggtfw0

Comfy UIだとプロンプトの直後に翻訳モジュール入れてたり出来なくはないけど
翻訳の精度は今ひとつかも知れん

0532名無しさん＠ピンキー (ﾜｯﾁｮｲ 3277-A64F)

2025/07/04(金) 17:50:36.72ID:WAFpHbbg0

あの翻訳ノードはGoogle翻訳呼び出してるっぽいね
多分オフラインでは使えない

0533名無しさん＠ピンキー (ﾜｯﾁｮｲ 6203-wJtD)

2025/07/04(金) 23:20:47.64ID:VoAyVBJR0

VRAMが16GBしかないけど123Bのモデルとかで遊びたい場合はGPUで推論させてメモリに溢れさせるより
CPUだけで推論した方が良いんかな
VRAMに載るモデルだと叡智小説の振り幅に限界感じてきた

0534名無しさん＠ピンキー (ﾜｯﾁｮｲ 8f32-tZo/)

2025/07/04(金) 23:49:34.02ID:G5zxKPnL0

FLUX.1 Kontextがvram12Gでもいい感じに使えたわ
ただ、規制強すぎてエロ方面は無理ｗ
通常のFLUX.1 は無臭バージョンあるから、kontextも無臭化できれば最強やね

>>533
メモリ64Gじゃ低量子化しか使えんからせめてQ5K_M使える96Ｇ積んでmagnum123bシバきまわしたいわｗ

0535名無しさん＠ピンキー (ﾜｯﾁｮｲ ff32-DZti)

2025/07/05(土) 05:34:36.73ID:0Kq04l/h0

>>533
そんなデカイので検証はしてないけど、乗るぶんだけでもvramに載せたほうが速いとは思う
でも大半が溢れるならほぼ誤差の速度かな

0536名無しさん＠ピンキー (ﾜｯﾁｮｲ bf03-AJyb)

2025/07/05(土) 08:34:32.05ID:otzYoyf80

なるほどありがとう
RTX6000はさすがに買えないしAI maxが速くなったら買ってみようかな

0537名無しさん＠ピンキー (ﾜｯﾁｮｲ 33cc-8TIs)

2025/07/05(土) 11:32:55.55ID:5tq/75+s0

AIは「賢いフリ」をしていた──ハーバード大などが暴いたLLMの決定的弱点「ポチョムキン理解」とは？ | XenoSpectrum https://share.google/663aiIAHjtMPz8Hnu

これ日頃実感してるやつや
概念は理解してるのに実践出来ないの、エロのジャンルでたくさんあるよね

0538名無しさん＠ピンキー (ﾜｯﾁｮｲ 0332-SFEh)

2025/07/05(土) 11:50:02.67ID:7NwhbSYT0

バックでエチエチしてるって自分で言ってるのに正面からおっぱい揉み始めるアレか？

0539名無しさん＠ピンキー (ﾜｯﾁｮｲ cf6a-iUEm)

2025/07/05(土) 11:54:52.32ID:frlkdolv0

現状、ゴーストが宿ってる感は無いよな

0540名無しさん＠ピンキー (ｵｯﾍﾟｹ Src7-TXXJ)

2025/07/05(土) 12:15:53.33ID:v7FjqLe/r

そんなこと一度使えばわかる話のような
この論文の主旨は計測ベンチマークを設計したよって話じゃないの

ベンチマークでスコアが算出できればあっという間に出来るようになるわけだから、遠くない未来に解決されますと言ってるようなもんでは

0541名無しさん＠ピンキー (ﾜｯﾁｮｲ cf6a-iUEm)

2025/07/05(土) 12:24:12.20ID:frlkdolv0

このベンチマークに合格できるAIを開発できるか？という問いにはYesだが、それをもって「ポチョムキン理解」問題は解決かというとNoじゃね

0542名無しさん＠ピンキー (ﾜｯﾁｮｲ 33cc-8TIs)

2025/07/05(土) 12:25:59.57ID:5tq/75+s0

例えばペニバン装着しておっさんを掘らせると速攻で女にちんちんが生えておっさんにおまんまんが生成されちゃうのは
コンテキスト長の問題で男女の設定が消え去るからなのか、
ペニバンについての知識が学習されてないからなのか、
そもそも男女の概念すら実は実践出来ないのか、どれだよって話になるからなあ
ポチョムキン理解が原因とすると改善は難航するんじゃないの
今までと全く異なるアプローチが必要になりそうどし

0543名無しさん＠ピンキー (ﾜｯﾁｮｲ f36a-P7Ho)

2025/07/05(土) 14:46:57.18ID:qFps80Dd0

ポチョムキン理解の問題はillusion

0544名無しさん＠ピンキー (ﾜｯﾁｮｲ a37a-EYel)

2025/07/05(土) 16:10:12.46ID:I2wLgvkC0

https://huggingface.co/datasets/Aratako/Japanese-Creative-Writing-39.6k
NSFWもいける?

0545名無しさん＠ピンキー (ﾜｯﾁｮｲ cf7a-On7B)

2025/07/05(土) 18:42:17.63ID:QlfJmyHr0

まぁAIよりよっぽど頭が悪いようなタイプの人間ですら間違えないようなことを頭がよく見えるAIが
何の疑問も抱かずにさらっと間違ってるとことか見せられるとそれはちょっと思うよな
各AIのコスパとか分析させてる時に自信満々に「私、ＣｈａｔGPTのPro版は月々1780円からです！」とか言うんじゃねえ
怖いわ

0546名無しさん＠ピンキー (ﾜｯﾁｮｲ cf7a-On7B)

2025/07/05(土) 18:54:23.10ID:QlfJmyHr0

そういえば昨日Gensparkを何人か課金した人を見たけど、Opus使えてる？
公式説明でも紹介記事でもいまいち各社AIは書いててもバージョンをボカしてるというか曖昧にしてる気配がするんで
いろいろなAIでDeepSearchさせてたんだが、海外の一部界隈では、Opus使えますってのはもしかしたら「営業的デマ」で、実際には3.7sonnetが使われてるかもって話が出てるそうな
言いたかないがGensparkは大本が中華系開発者なんでユーザーのプライバシー情報含めその手の問題は噂されてるぽい

以下GENSPARK Plusで利用可能なAIモデルの調査結果まとめ（勿論この情報自体の精査も必要だが）

確認済み：GPT-4.1、OpenAI o3（またはo3-pro）、Claude 3.7 Sonnet、Gemini 2.5 Flash、DeepSeek R1。

不明確：Claude 4 Opus（存在しない可能性高く、Claude 3.7 Sonnetの誤記か）、o4-mini-high（詳細不明）、その他モデル（Qwen VL Plusなど）は公式情報不足。

情報の曖昧さ：GENSPARKの公式サイトやアプリストアではモデルバージョンの詳細が不足し、X投稿に誇張や誤情報（例：Claude 4 Opus）が含まれる。信頼性確保のため、genspark.aiで最新情報を確認することを推奨。

0547名無しさん＠ピンキー (ﾜｯﾁｮｲ cf7a-On7B)

2025/07/05(土) 18:55:43.18ID:QlfJmyHr0

あっごめん
>>546は向こうのスレの話でした

0548名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fa6-qNg6)

2025/07/05(土) 20:48:50.78ID:u8G4q2Sn0

>>544
パット見た感じ、二手目以降の方向性を決められるわけじゃないからどの程度実用性があるのかはわからないけど面白そうね
必要なコンテキスト長も短そうだし試しに学習してみようかな

それはそれとしてマルチターンで会話しながら小説生成って実際どうなん? 後半に行くたびにゴミが積み重なっていくわけで完成させるの大変そうだけど

0549名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f9f-llbR)

2025/07/05(土) 23:58:05.14ID:nwcVl32h0

AIの真偽をAIに調べさせてるって世も末だな

0550名無しさん＠ピンキー (ﾜｯﾁｮｲ cf7a-On7B)

2025/07/06(日) 00:50:10.12ID:DNLSCMhm0

具体的に反論できないなら虚しく聞こえるかなぁ

0551名無しさん＠ピンキー (ﾜｯﾁｮｲ 33c6-OdFU)

2025/07/06(日) 01:06:12.43ID:IxA1OJx80

少なくともgrokやchatGPTはどこもopus使えると言っているし
情報の更新がない間に使えないとかsonnetしか無いと解釈しただけじゃないの
当然だが最新情報はすぐに反映されない

最近The Lustful Turk（1828年）みたけど
結構文体からキャラクター造形や倫理観から
AIの想定するポルノ小説にかなり近いと感じたなー
これ自体が土台じゃなく「源流」として多くの作品が痴を継承したって
ことだろうけど、写真ありきの説明文の淡白さを
ベースで構成されてるってのはわりと厄介ね

0552名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f9f-llbR)

2025/07/06(日) 01:12:01.17ID:1YwJa/wW0

ローカルをやってる人間としては如何にLLMがデタラメな回答を返すかって事を学んでるからな
企業の高性能モデルであってもその延長でしか無いから絶対とは言い切れん

deepsearchの情報ソースであるWeb検索の質が著しく落ちているなんて普段からググってたら気付くやろ
ネットで検索してきました！ソースはYahoo知恵袋ですみたいな回答を真に受けるんか

0553名無しさん＠ピンキー (ﾜｯﾁｮｲ 63a5-0ngJ)

2025/07/06(日) 02:35:32.38ID:xSal4HfN0

ネットだけじゃなくて書籍も学習してるんじゃなかったっけ

0554名無しさん＠ピンキー (ﾜｯﾁｮｲ 0332-SFEh)

2025/07/06(日) 05:58:22.85ID:5uc2OIcr0

Grokのdeepsearchの検索過程を見ていると検索ワードが酷すぎるんだよな

0555名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f68-J+MR)

2025/07/06(日) 08:26:10.06ID:dXiQMVbZ0

>>548
学習って3090でもできるかな？

0556名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f68-J+MR)

2025/07/06(日) 09:38:26.39ID:dXiQMVbZ0

複数名が登場するエチチ小説にチャレンジしてるんですが、複数名の会話の辻褄を合わせるのってどうやればいいでしょうか？

0557名無しさん＠ピンキー (ﾜｯﾁｮｲ d301-PJwe)

2025/07/06(日) 09:42:28.70ID:AfwWoSHe0

Googleアシスタントに
今の天気は？
今日なんにち？
今何時？
とかで使ってたんだが
geminiに取って変わられてから
ウソ教えてくるようになってそのクソさを思い知らされたよ

0558名無しさん＠ピンキー (ﾜｯﾁｮｲ ffed-EYel)

2025/07/06(日) 12:35:25.21ID:oyAfdCaV0

>>555
データセット見た感じコンテキスト長を4096~8192で済みそうだから4bit QLoRA + 最適化(liger karnel or FA2 +unsloth gradient checkpointingとか)を使えば24B~27BくらいまでならVRAM24GBに収まると思う

0559名無しさん＠ピンキー (ﾜｯﾁｮｲ 5373-FA3G)

2025/07/06(日) 12:48:52.12ID:+JXOHre80

>>557
数ヶ月前のGeminiはそんなんだったけど今は改善されてないか？

■ このスレッドは過去ログ倉庫に格納されています