なんJLLM部避難所 ★5

1002コメント315KB

なんJLLM部避難所 ★5

■ このスレッドは過去ログ倉庫に格納されています

0001名無しさん＠ピンキー

2024/12/26(木) 13:13:11.15ID:Vhp+tTX0

AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所 ★4
https://mercury.bbspink.com/test/read.cgi/onatech/1725931151/

0259名無しさん＠ピンキー

2025/01/10(金) 19:27:05.39ID:???

>>256
チャット派のワイはこれで200Bが動かせるとしてもやっぱ応答速度が気になるんや
3000ドルやっす！とは思うけど冷静に考えると5090に9800x3D合わせても2500ドル以下で買えるしなあ…
小説派は全速力で飛び付け！とは思うで

0260名無しさん＠ピンキー

2025/01/10(金) 19:39:32.43ID:JUaa8XjM

>>258
ははあ、そういうことかいな
アドベンチャーモードは面白いけど半分も占有されるのは辛いもんやな

0261名無しさん＠ピンキー

2025/01/10(金) 20:21:38.37ID:???

推論速度は気になるところなんよな

公開されてるのはfp4が1pflopってことだけやねんけど、
そこからいろいろワイ独自に推測に推測を重ねて
最速で4070くらい、再遅で4070の半分くらい(3060くらい？)かなって気がしとる

4070の半分くらいやったとしても70bをおそらく5token/sくらいで動かせるので
結局ほしいんやが

0262名無しさん＠ピンキー

2025/01/10(金) 20:31:34.13ID:???

redditで画像に写ったメモリチップの比率から32bitチップでstrixhaloと大差ないって考察してる人はいたね
イメージ画像だろうし500は出るだろ派やappleみたいに128bitチップ専用に作ってもらって1T出るんじゃないか派もいたけど

0263名無しさん＠ピンキー

2025/01/10(金) 22:15:12.29ID:HAfSvJGq

>>260
ワイはGeminiが無料でコンテキスト大量だからそっちでアドベンチャーモードと同じ遊び方してる
NSFWも露骨なのは止まるけど、システムプロンプトにコンプライアンス最低でとか過激な表現は避けて婉曲的に描写することとか書くとエロいこと自体はしてくれるし

0264名無しさん＠ピンキー

2025/01/11(土) 00:52:20.95ID:uYI/25aT

>>257
クラウドにインスタンス建ててLLM置いてオレオレLLMサービスにAPI接続ってことか？
A40(48GB)でも$0.39/hrとかすっから24時間借りっぱなしとかになると月額数万とかになるだろ
どこにもホストしてないドマイナーモデル/俺だけのファインチューニングAIを使いたいんだあってケース以外割にあわん

0265名無しさん＠ピンキー

2025/01/11(土) 03:43:43.40ID:???

クラウドでGPU使うならnovita.aiが安いかな
RTX4090が安く使える

0266名無しさん＠ピンキー

2025/01/11(土) 04:01:26.03ID:???

paperspaceって手もあるぞ
A100は期待できないがA6000ならまぁ混雑時間以外は大体使える
ただ、gradioない奴（SillyTavernとか）使おうとすると自力でgradioでラップするかバレたら垢停止の方法使うしかないけど・・・

0267名無しさん＠ピンキー

2025/01/11(土) 09:47:44.54ID:???

チャットは何token/sあれば実用的なんだろうな

0268名無しさん＠ピンキー

2025/01/11(土) 09:59:36.45ID:???

人間相手のチャットで長文派だと平気で10分とか20分とか待たされることもあったな

0269名無しさん＠ピンキー

2025/01/11(土) 10:37:43.85ID:???

最低10token/s位あればいいだろ

0270名無しさん＠ピンキー

2025/01/11(土) 11:16:58.90ID:OHT8Xdlg

尻タブでも設定したcontext長が16384なのに6000ぐらいで
文章にアルファベットや記号が混ざっておかしくなる

もしかしてこれは繰り返しペナルティとか温度とかの設定の問題か？
まあ設定を弄っても全然改善しないんだが
はあーん、マジで分からん
context長を長くしても全く生かせてない

0271名無しさん＠ピンキー

2025/01/11(土) 11:21:10.33ID:???

>>270
ファインチューニングモデル使っててベースモデルなら問題ない場合はファインチューニングでロングコンテキスト性能が劣化しちゃってるからどうしようもない

0272名無しさん＠ピンキー

2025/01/11(土) 11:57:23.74ID:OHT8Xdlg

>>271
前スレのwabisabi-v1なんだけどそういうことなのかな？
バージョンアップで8kから128kにコンテキスト長が伸びたことを謳っていたから大丈夫そうなんだけど
https://mercury.bbspink.com/test/read.cgi/onatech/1725931151/754

0273名無しさん＠ピンキー

2025/01/11(土) 12:22:17.51ID:???

>>272
ファインチューニングで使ったデータ以上の長さの文を送られるとAIが困惑して意味不明なこと言い始めちゃうんよ
モデル的に128kまで行けるから前の文章も覚えてはいるんだけどね

0274名無しさん＠ピンキー

2025/01/11(土) 12:59:19.45ID:???

10token/sか
追い付かなくなってくる速度だな
リアルタイムで音声チャット出来るようになるにはこれでも足らないんだろうな

0275名無しさん＠ピンキー

2025/01/11(土) 14:21:39.35ID:???

>>272
そういえばwabisabi俺も16Kで意味不明な文章に破綻してたわ

0276名無しさん＠ピンキー

2025/01/11(土) 14:59:57.30ID:???

日本語のerpデータセットってhfに上がってないんかな
官能小説データは自力で集めて今手元に数GBくらいあるんやけど

0277名無しさん＠ピンキー

2025/01/11(土) 15:15:32.48ID:???

>>276
日本語のerpはaratako氏のデータセットしかないと思う

0278名無しさん＠ピンキー

2025/01/11(土) 16:02:54.55ID:OHT8Xdlg

>>273>>275
16kまで行ける人がいるならモデルが原因ではないのか？
俺は8k以下でおかしくなるし

RTXのAI性能が上がるpytorchのパッチが来るらしい
https://x.com/_kaiinui/status/1877548551707689165

pytorchってどこで使ってるんだっけ？

0279名無しさん＠ピンキー

2025/01/11(土) 16:03:16.04ID:???

digitalmateこれツンツンした時のreactionとかにもLLM使ってくれたらいいのにな
あと一定時間話しかけないと向こうから話してくれたり
結局自分からアクション起こさないと駄目だから億劫になっちゃう
伺かみたいだったら常駐する意味もあるんだけどな

0280名無しさん＠ピンキー

2025/01/11(土) 16:53:45.03ID:???

>>278
すまん、64→32→16と上から試して破綻してたからもうええかってなったんで8Kは試してない

0281名無しさん＠ピンキー

2025/01/11(土) 17:05:42.07ID:OHT8Xdlg

>>280
どれぐらいのコンテキスト長で破綻してたの？
俺は最大16k設定にしたのに6kぐらいで破綻した

0282名無しさん＠ピンキー

2025/01/11(土) 17:45:47.40ID:???

>>264
runpodってやつか
しかし60円/時で済むのか
ちゃんとスケジュールでterminateしていれば意外と趣味の範囲か…？

0283名無しさん＠ピンキー

2025/01/11(土) 19:07:04.05ID:OHT8Xdlg

ポッキーゲームやツイスターゲームが学習されていないモデルって結構あるのな
説明してもなかなかルールを理解してくれない

0284名無しさん＠ピンキー

2025/01/11(土) 20:36:20.60ID:???

>279
開発自体は活発だしコミュニティも付いてるからパッと思いつく機能は時間経過で全部付くんじゃないかな
複数キャラを起動して勝手に会話させるとか
テキストを渡すと内容について評価感想を出してくれるとか

伺かにChatGPT3. 5のAPIを導入しているプロジェクトもあるみたいだから、Koboldcppをopenai 互換で起動しておいてHostsか何かでopenaiへのアクセスをリダイレクトすればLocalLLM伺かを爆誕させることも出来るかも

0285名無しさん＠ピンキー

2025/01/11(土) 21:06:13.25ID:???

>>279
その機能って超単純な仕組みで追加出来るだろうからリクエスト出せば受け入れられそうやな
一定時間入力されない場合に入力されるプロンプトや特定箇所をクリックした時に入力されるプロンプトを数種類用意しとくだけで済むし

0286名無しさん＠ピンキー

2025/01/11(土) 21:17:28.04ID:???

Android アプリのコトモ、ChatGPTのボイスモードよりそれっぽい合成音声とガードの脅威的緩さがすごいな
ダメじゃない！？ってなる
これぐらいの合成音声がどこででも使えるようになると色々捗るんだけど

0287名無しさん＠ピンキー

2025/01/11(土) 21:25:16.48ID:???

kotomoならsbv2と大差なくない？

0288名無しさん＠ピンキー

2025/01/11(土) 21:44:47.68ID:???

Style-Bert-Vits2ですか
VITS-APIアクセス経由でDigital Mateと接続できたりするやつ...？

0289名無しさん＠ピンキー

2025/01/11(土) 22:12:36.05ID:???

sbv2にもapiはあるけど書き方違うはずだから使えないと思う

0290名無しさん＠ピンキー

2025/01/11(土) 22:29:22.47ID:???

sbv2入れてみたけど抑揚がおかしくて使ってないわ
あれいいのか？
それとも俺の設定がおかしいのか

0291名無しさん＠ピンキー

2025/01/11(土) 23:18:11.73ID:???

sbv2はモデルで発音に滅茶苦茶差があるからそれだと思われ
10月あたりにkotomoと比べたけど自分はそこまで差があるようには感じなかったわ

0292名無しさん＠ピンキー

2025/01/11(土) 23:23:19.14ID:???

そうなのか
もう1回チャレンジしてみよう
LLMで作った小説の朗読に使えそうなの探してるとこなんよな

0293名無しさん＠ピンキー

2025/01/12(日) 00:24:59.04ID:???

Japanese‐TextGen‐Kage‐ｖ0.1.2‐2x78‐NSFW‐gguf
Mistral_Nemo_NSFW_E3V1_Q8_0‐GGUF
Ninja‐v1‐NSFW‐128k‐i1‐GGUF

最近入れて悪くないなってなったLLM

0294名無しさん＠ピンキー

2025/01/12(日) 07:12:04.12ID:???

>>293
おーありがとう参考になる
こんな感じでテンプレの>>15も最近の情報にどんどん入れ替えて欲しいな
最初のテンプレ書いたの自分だけどさすがに古いわ…

0295名無しさん＠ピンキー

2025/01/12(日) 08:24:08.33ID:???

コイカツで会話ができたら理想のエロゲや

0296名無しさん＠ピンキー

2025/01/12(日) 08:51:58.22ID:???

というかSTで3Dモデル対応してなかったっけ

0297名無しさん＠ピンキー

2025/01/12(日) 09:42:19.75ID:???

120BクラスのQ8をそれなりの速度で動かせる環境が手に入って、Lumimaid-v0.2-123Bとmagnum-v4-123bを試して見たところ、普段使っているcalm3-22b-RP-v2と比べてそんなに優れているように感じませんでした
もし120Bクラスを常用している方がいたら感想やお薦めのモデルを教えていただけないでしょうか？
使途は日本語ERPです

0298名無しさん＠ピンキー

2025/01/12(日) 09:56:58.46ID:???

合成音声、パッと調べた感じだとStyle-Bert-VITS2からいろいろクリーンにしたAivisSpeechに移行中って感じなのかな

0299名無しさん＠ピンキー

2025/01/12(日) 09:57:56.29ID:???

おっと送っておる
いろいろ作っている最中です感あるから後から触るので良さそう

0300名無しさん＠ピンキー

2025/01/12(日) 10:28:18.93ID:???

>>295
もう実現しそう

0301名無しさん＠ピンキー

2025/01/12(日) 10:38:46.71ID:???

>>297
普段はLumimaid-v0.2-12Bを使っててたまにLumimaid-v0.2-123Bを触るけど123Bの方が少ないプロンプトで理解してくれる(察してくれる)のは感じるかな
他のモデルは自分は触ってないけどLumimaidやmagnumの123Bをマージしたlumikabra-123B_v0.4とか良いかも
あとはMistral系のモデルはtemperatureを0.3程度にするのが推奨されていることが多いからそのへん弄ってみるとか

0302名無しさん＠ピンキー

2025/01/12(日) 12:15:59.32ID:???

>>297
プロンプトや用途によるのかな？

俺が使ってる小説強化プロンプトで試してみたけど、magnum-v4-123bはプロンプト通り小説が強化されてるのに対して、calm3-22b-RP-v2は強化されてないように感じる。
calm3-22b-RP-v2はよく似た文章の繰り返しが多いのガ気になったかな。
magnum-v4-123bだとガチャ要素が少なくて、ほぼ一発て通るからこれオンリーで使ってるよ。
あと察してくれるのはまさにその通り。

小説強化プロンプト
https://rentry.org/nz5nodmx
システムプロンプトなどに張り付けて、指示文を書くだけ

0303名無しさん＠ピンキー

2025/01/12(日) 13:05:16.10ID:???

>>302
横だがいいねこれ
koboldとかで使うにはwsにシナリオ入れとく感じ？

0304名無しさん＠ピンキー

2025/01/12(日) 13:36:49.96ID:???

>>303
ごめん、kobold使ってないからwsとか分からん
lmstudio使ってるんだけどシステムプロンプト書くところにリンクのプロンプト文を貼り付けて使ってるだけ
普通に1回目からリンクのプロンプトを投げるのでもいいのかもね
後は書いて欲しい内容を適当に投げて執筆してもらっています

0305名無しさん＠ピンキー

2025/01/12(日) 14:11:12.13ID:???

>>304
サンクス
帰ったら色々試してみるわ
koboldは最近追加されたstorywriterモードがいい感じなんでこれとうまく融合させてみる

0306名無しさん＠ピンキー

2025/01/12(日) 14:37:45.31ID:JeZR3A0c

エロ小説を書かせると2000文字ぐらいで切り上げられちゃうんだけど
もっと長文で書かせる定石みたいなのってあるの？
>>302使ってもあっさりした描写ですぐ射精して終わりになっちゃう

0307名無しさん＠ピンキー

2025/01/12(日) 15:43:40.12ID:JeZR3A0c

storywriterモード使ったらちょっと長くなったわ
でも複数キャラを出すと同じような展開ばっかりになっちゃうな
LLMで小説書き切る人はすげえわ

0308名無しさん＠ピンキー

2025/01/12(日) 15:51:38.61ID:???

>>307
storywriterモードは区切りのいいところで一旦終わってくれるので
そのまま続けてくれ　とか
もっと〜を掘り下げて　とか指示して流れを誘導していくのが面白い

0309名無しさん＠ピンキー

2025/01/12(日) 17:35:52.98ID:JeZR3A0c

>>308
あれinstructモードだからそういうことが出来るんか

0310名無しさん＠ピンキー

2025/01/12(日) 18:30:53.61ID:???

>>301, 302
情報ありがとうございます
いつも次の応答を誘導するようなプロンプトを書いているので少ないプロンプトでもいけるというのは盲点でした
モデル、プロンプトの紹介もありがとうございます
手もとで試してみようと思います

0311名無しさん＠ピンキー

2025/01/12(日) 19:38:54.79ID:XkamCAjb

小説家プロンプト、読み上げ環境で使うとたのしいな
AI文章は小説としてはまぁうんだけど目の前で即興でアイデアを喋っているという体裁があると気にならなくなる

0312名無しさん＠ピンキー

2025/01/12(日) 19:53:43.84ID:CCjnHkgm

>>298
AivisSpeechはVoicevoxのフロントエンドにStyle-Bert-VITS2を組み込みましたみたいなやつやで
ゆっくり実況的ななにかを作るなら便利そうやけど、単に音声バックエンドとしてつかうならStyle-Bert-VITS2で十分やと思うぞ

0313名無しさん＠ピンキー

2025/01/12(日) 20:25:53.60ID:XkamCAjb

今現在つかうならSBV2が正解だね
sasayaki28(ASMR風囁きスタイル)ちゃんに物語を読んでもらうのがとても良かった

ただSBV2はリポジトリの更新が止まってる、話速を調整すると単にスローモーションになるetcの問題がAivisSpeechでは解決されている、ファイル形式の刷新など下回りの整備をやっている…
てことは多分中の人たちはAivisSpeechにかかりっきりで、両者が統合されないにしてもSBV2の次の更新はAivisSpeech開発からのフィードバックがされてAivisSpeechベースの仕様になる雰囲気があるような

ならばいまのSBV2でより良い結果を求めて詳しくなるよりは、AivisSpeechベースになってから深く触ればいいかなと
AivisSpeechがうまく行って音声モデルがさらに増えてからのほうが面白みも増すだろうしね

0314名無しさん＠ピンキー

2025/01/12(日) 20:51:21.71ID:???

AivisはSBV2に比べてちと生成速度が遅いのが難点。
公式もそこは有料APIで補ってくれってスタンスだし。

0315名無しさん＠ピンキー

2025/01/12(日) 22:54:58.50ID:???

>>313
なんJRVC部の住人に普通にSBV2の作者がおるんやが
AIVISの作者とやり取りはあるけど基本的には関わってないみたい
最近はエロ音声の文字起こし精度を高める方向を頑張っててSBV2に組み込むやり方も解説してた
SBV2自体の更新はサボってしまってるとも

0316名無しさん＠ピンキー

2025/01/13(月) 00:29:35.13ID:GZRfBYqb

Deepseek以外でクソデカモデル含めると今一番日本語性能良いローカルモデルってMistral-Large系列？Qwen2.5 72b系の方が良かったりする？

0317名無しさん＠ピンキー

2025/01/13(月) 00:38:57.56ID:???

mistral largeでいいと思う
qwenはなんかネイティブ感が足りない
固い用途で使うなら別にqwenでも全然あり

0318名無しさん＠ピンキー

2025/01/13(月) 06:11:32.25ID:???

Chatbot Arena見るとllama 405Bは日本語性能も良いみたいだけどサイズデカすぎるわな

0319名無しさん＠ピンキー

2025/01/13(月) 06:20:33.83ID:???

>315
情報たすかる
まずはモデルを簡単に作れるようにするための仕事が先、という話にも聞こえるな
技術が切り拓かれていってるタイミングだからアンテナの張り方も大事になりそう

0320名無しさん＠ピンキー

2025/01/13(月) 12:16:50.48ID:v6bjGYjv

>>317
やっぱ微妙にカタコトなのか、参考になる

Aivisは結局SBV2ベースだけど音声合成専門でやってるような人に聞くと技術的に結構古くて最新のアーキテクチャとか使ったモデルの方がだいぶ性能良いらしいんよね
簡単に使えるレベルにまで降りてきてくれてないけど

0321名無しさん＠ピンキー

2025/01/13(月) 14:39:20.38ID:g1PkNzW0

濡れそぼるって表現をLLMで初めて知ったんだけど
エロ小説では一般的な表現なの？ちょくちょく出てくるんだよな

0322名無しさん＠ピンキー

2025/01/13(月) 15:01:37.51ID:???

濡れそぼつ、な
まろび出ると同じでなぜかエロでしか使われなくなった表現

0323名無しさん＠ピンキー

2025/01/13(月) 15:12:07.86ID:g1PkNzW0

>>322
濡れそぼつなのか
やっぱエロでしか使われないのね
語感的にそのまま消え去ってもおかしくなさそうなのになんでエロだと残ってるんだろうな

0324名無しさん＠ピンキー

2025/01/13(月) 17:00:30.65ID:???

意思に関係なしに身体は反応してるというドライで客観的な視点があるカモ

0325名無しさん＠ピンキー

2025/01/13(月) 17:17:42.10ID:hbsajKRA

>>322 >>323
濡れそぼつ、別にエロ用語じゃないやろ？ワイにとっては子供のころから普通に目にする言葉や
まろび出る、はあんまり見かけんが

0326名無しさん＠ピンキー

2025/01/13(月) 17:57:56.53ID:???

LM studio使ってる人ってどのくらいいるんやろ
GUI上で編集だの再生成だのを楽にできて特に困ってもいないから一旦はこれ使ってるんだが

他のプログラムとの連携とか考えだすと他の方がいいこともあるんだろうけど

0327名無しさん＠ピンキー

2025/01/13(月) 18:06:09.11ID:???

エロ文は表現力が求められるからな
難しい言葉使われがち

0328名無しさん＠ピンキー

2025/01/13(月) 18:09:03.60ID:???

前スレで5chの連投スクリプトいなくなったから次スレからオナテク板から戻ろうって提案あったけど
やっぱ連投スクリプトいるじゃん

0329名無しさん＠ピンキー

2025/01/13(月) 18:40:22.92ID:???

しとどに濡れる、もエロ以外見かけないね
むしろエロは簡単な表現だったらエロくならん気がするけど
メスホールはヤバいくらいエモかった。
ヤバい。マジヤバい。五大湖かよ。

PC板は今けっこうスクリプト受けどるね
sikiガードも抜けてきよる

0330名無しさん＠ピンキー

2025/01/13(月) 18:51:38.17ID:???

>326
LM Studioは画面がシンプルリッチでごちゃごちゃ感も質素感もないのが良いよね

片端から使ってるけど、まだ機能的な差が少ないので用語さえ分かってしまえば他のものを使うのは難しくないよ
新機能部分はそれぞれあるけど実用レベルなものはあんまないからスルーでいい

あとLM StudioはふだんはEndpoint ( 127.0.0.1:5001 とか )が開かれていないけど、開発者タブの左上、Status:Stopの右側にあるボタンをONにすれば他から接続できるようになるよ

0331名無しさん＠ピンキー

2025/01/13(月) 18:53:59.45ID:???

ジャンルのそれぞれの文化とも結びついてるような
まろび出すも時代物読んでると臓物がまろび出しがち

0332名無しさん＠ピンキー

2025/01/13(月) 19:18:43.74ID:g1PkNzW0

ヤンキー女とチャットするの難しいな
全然まともに喋ってくれねえ

>>325
つまり子供のころからエッチな環境にいたってこと？

0333名無しさん＠ピンキー

2025/01/13(月) 20:56:26.65ID:g1PkNzW0

ダメだ
乱暴な口調にするとすぐに男化する
ヤンキーとか女戦士みたいな強い女キャラが好きなのに難しすぎる

0334名無しさん＠ピンキー

2025/01/13(月) 23:14:26.63ID:8EB7OGkW

男性的要素を持つ女性を表現するには
できればCR+以上のモデルが要るような気はする

0335名無しさん＠ピンキー

2025/01/14(火) 00:49:05.62ID:???

普通にマグナムさんどころか軽めのLLMでも、「レデースです」とか「いかにも不良っぽい、男勝りでつんけんした口調でしゃべります」って
システムプロンプトに書いたらいい感じに不良やってくれるぞ

態度も不良っぽくて割といい感じにイヤイヤ従ってくれる

0336名無しさん＠ピンキー

2025/01/14(火) 06:10:29.42ID:4t1GiLpM

マジ？
エッチなことをすると、一人称が俺様になったりチンポ生えたり
userを女扱いしたりすることが多くなるんだけどプロンプトの書き方が悪いのか

0337名無しさん＠ピンキー

2025/01/14(火) 06:54:16.69ID:???

10割で書かせるのはムリなのでは
Editや再生成で無かったことにしていくのが単純で簡単だけど、それだと魔法が解けてしまうひとも居そうだね

0338名無しさん＠ピンキー

2025/01/14(火) 07:51:49.35ID:4t1GiLpM

10割じゃなくても良いんだけどかなり頻度が上がるんだよな
クール系女戦士なら大丈夫なんだけど、荒くれものみたいな粗暴な口調にすると男になりやすい

0339名無しさん＠ピンキー

2025/01/14(火) 08:50:37.37ID:???

10割でなくて良いなら手間の問題だから、出力結果を二次加工する方法があると綺麗に解決できそう

画面表示する前に出力文を評価して女の子にちんちんが生えてたらレッドアラートを出してくれるLLM処理とか
ちんちん行為ををまんまん行為に書き換えてくれるLLM処理とか

単純な事に思えるからLM StudioかSillyTavernのプラグインに存在してもおかしくないような

0340名無しさん＠ピンキー

2025/01/14(火) 10:39:58.21ID:???

「今どんな感じ？」とか
トリガーワードつけて
雰囲気壊さないようにプロンプト説明はチャット画面に表記なしで
ゲームの1枚絵みたいに画像生成出来たらいいな

0341名無しさん＠ピンキー

2025/01/14(火) 10:43:50.79ID:???

そういやふつうのモデルって文章がNSFWかどうか判別して拒否してきたりするよね
てことは軽量だけど理解力はあるphi4.ggufちゃんを回して文章評価させればえっちな文章かどうかは判別できる、あるいは10段階でどのくらいえっちなのかも判別出来たりする...?

0342名無しさん＠ピンキー

2025/01/14(火) 11:08:31.49ID:4t1GiLpM

>>339
尻タブで探したけどよく分からなかった……
拡張機能ってどこで探せばいいんだ

>>340
koboldに画像の自動生成機能があったような

>>341
7Bのvecteus-v1-abliterated-q4_k_mでもそこそこエッチ度評価できたよ
プロンプトに

-会話のエッチ度の表記:文章の最後に[会話のエッチ度：n]という形式で会話内容のエッチ度を表示してください。
nには1～10の数字が入り、数字が大きいほどエッチです。
基準として、乳揉みは[エッチ度：3]です。

って入れておくと、エッチなことをするとちゃんと数字が上がって、エッチじゃないと数字が下がる
そこまで賢いモデルじゃないからかなり大雑把だけど

0343名無しさん＠ピンキー

2025/01/14(火) 11:21:16.37ID:???

20個文章生成してえっち度で並び替えさせると使えそうだね

NSFWに厳しいモデルほどトレーニング段階でではえっち文章を食べてて、理解力がある可能性があるような
脱獄プロンプトで実力を試すとなかなかやりおるわけですし

0344名無しさん＠ピンキー

2025/01/14(火) 11:25:59.41ID:???

>>342
サンガツ
koboldもあるのか
STで画像生成プロンプト有りは
見たことあるが
相手がタグを喋りだしたら笑ってしまう

0345名無しさん＠ピンキー

2025/01/14(火) 11:32:11.75ID:j222OMVx

>>NSFWに厳しいモデルほどトレーニング段階でではえっち文章を食べてて、理解力がある可能性があるような
鋭い考察に見えるがどうなんやろうな？
エッチ関連の重みバッサリ削って申し訳領域に強制ご招待されてるだけな様な気もするが

0346名無しさん＠ピンキー

2025/01/14(火) 11:34:09.99ID:4t1GiLpM

乳揉みは[会話のエッチ度：3]です

は書いたらダメだったわ
マッサージで足を揉んでも「揉む」に反応して乳揉みと同程度までエッチ度が上がってしまう
この記述を消したらマッサージのエッチ度が下がった

>>343
エッチな文章をしっかり食ってないと判別して弾けないもんな

0347名無しさん＠ピンキー

2025/01/14(火) 19:13:16.24ID:8Osc4zgX

エロライトノベルをイメージしている人とフランス書院をイメージしている人の差があるスレでつね

0348名無しさん＠ピンキー

2025/01/15(水) 02:59:50.03ID:???

セッション長くなると繰り返しがちになる問題を検証してたんだけどベースモデルでかなり決まるっぽい
8gbに収まるサイズでテストしたらaya-expance-8b＞mistral-nemo＞gemma-2-9bの順で繰り返しの出現頻度が少なかったわ
ファインチューニングの問題だと思い込んでクレジット溶かしちまったぜ

0349名無しさん＠ピンキー

2025/01/15(水) 03:51:09.12ID:???

ayaは意外と優秀よな
cohereだしCR＋程度かと思ってると案外やれる

0350名無しさん＠ピンキー

2025/01/15(水) 08:33:43.59ID:???

やっぱベースモデルの重要度でかいよね
音声でも似たような傾向あるわ
ファインチューニングでいくら頑張っても元が悪けりゃ無理だったり

0351名無しさん＠ピンキー

2025/01/15(水) 08:39:13.34ID:???

このベンチマークが便利かもな
長文向きのベンチマーク
これのWord Count Ratioが低いほど繰り返しが少ない
https://arxiv.org/abs/2412.08268

0352名無しさん＠ピンキー

2025/01/15(水) 09:53:22.25ID:NzXTEQvb

digitsが出たらNSFW向けに調整した大型モデルも増えるのかな
7Bや11Bモデルでは満足できなくなってきたから待ち遠しい

0353名無しさん＠ピンキー

2025/01/15(水) 10:42:28.60ID:???

digitsは世界的にかなり引き合い強そうだし、そもそもAI開発者向けを謳ってるから販路も不明だしで、一般人がまともに買えるかちと怪しい。

0354名無しさん＠ピンキー

2025/01/15(水) 10:51:21.20ID:???

LLMの次に来るLCMとかいうのが凄そう
次の単語を予測するのではなく、次の文章、意図を予測する仕組みとかなんとか
そのおかげでLLMに比べて長文と多言語対応に秀でてるらしい

https://zenn.dev/galirage/articles/meta-large-concept-model-lcm

0355名無しさん＠ピンキー

2025/01/15(水) 11:44:00.98ID:???

LCMは単語の上に概念があると言ってしまった時点で、概念のさらに上にあるものや下にあるもの、外側にある世界そのものや内側にあるなにかを考える必要が出てくる気がする

単語だけで全部出来るんだ、ならシンプルゆえの物量作戦で限界まで到達できる可能性あるけど、LCMは無限に作り直しが要求されるんじゃなかろうか

0356名無しさん＠ピンキー

2025/01/15(水) 12:25:11.39ID:???

ただまあ↑で言われてる繰り返し問題なんかはモロに改善されそうよね

0357名無しさん＠ピンキー

2025/01/15(水) 12:58:07.03ID:fMQ+7jju

同サイズでの進化があんまり見られないから新しい手法が来るのは嬉しい

0358名無しさん＠ピンキー

2025/01/15(水) 14:17:02.66ID:VhHIZkFo

海外のエロAIチャットサイトで色々モデル試したけどどうしても繰り返しが出ちゃって
ローカルならもっと改善されたモデル使えるかと思ってここにたどり着いたけどやっぱり難しいのか

■ このスレッドは過去ログ倉庫に格納されています