なんJLLM部避難所 ★2

1002コメント390KB

なんJLLM部避難所 ★2

レス数が900を超えています。1000を超えると表示できなくなるよ。

0001名無しさん＠ピンキー転載ダメ (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:27:25.10ID:???0

!extend::vvvvv:1000:512
!extend::vvvvv:1000:512
AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(スクリプト攻撃継続中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所
https://mercury.bbspink.com/test/read.cgi/onatech/1702817339/

-
VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured

VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured

0827名無しさん＠ピンキー (ﾜｯﾁｮｲ 36a0-TEJs)

2024/06/02(日) 13:20:28.68ID:???0

今Ninjaで一番エロいのどれ？キメラも含めて

0828名無しさん＠ピンキー (ﾜｯﾁｮｲ 72c7-4jMC)

2024/06/02(日) 14:19:53.01ID:???0

>>741
>>742
USBライザー接続やめて、x16スロット4分岐拡張カードに変えてみたら、0.4t/s上がったわ
ちょっとだけのアップだけど、このスピードだと無視できない数字

IQ4_XS(56.2GB) ・・・ 3.9t/s
RTX3090 1枚 x16 gen3
RTX3090 1枚 x4 gen3
RTX3070 1枚 x4 gen3
RTX3060 1枚 x1 gen2 USBライザー経由
マザボ ROG STRIX Z490-F

IQ4_XS(56.2GB) ・・・ 4.3t/s
RTX3090 1枚 x4 gen3(x16を4分岐)
RTX3090 1枚 x4 gen3(サウスブリッジ)
RTX3070 1枚 x4 gen3(x16を4分岐)
RTX3060 1枚 x4 gen3(x16を4分岐)
マザボ TUF GAMING B550 PLUS
x4+x4+x4+x4分岐拡張カード

変更点
・x16からx4に変更
・USBライザーx1からx4に変更
・x4分岐に対応したマザボに変更

X16からX4に変更で約1t/sの低下あり
でもUSBライザーからx4に変更で1.4t/sアップ

0829名無しさん＠ピンキー (ﾜｯﾁｮｲ 72c7-4jMC)

2024/06/02(日) 14:20:18.18ID:???0

>>828
追記

しばらくすると1台のGPU(RTX3070)が休んでる状態になるのに気がついて、GPUの負荷をかけ続けてみたら、7.8t/sまでアップした
ほぼ問題ないスピードになったので満足

分かったこと
・3060がボトルネックではなかったこと
・接続数が増える程度ではあまり性能低下しないこと

分からないこと
RTX3070がすぐ休んでしまうこと
NVIDIAコンパネの電源とOSの電源をハイパフォーマンスに変更してもダメ
なんでだろう？

0830名無しさん＠ピンキー (ﾜｯﾁｮｲ 4fbe-hJA7)

2024/06/02(日) 14:43:58.55ID:???0

GDDR6って8GBで4000円しかしなくてDDR5と値段変わらないのに
16GBやそれ以上のモデルの値段のぼったくり具合と来たらしゃれにならないよな
いい加減どこか良心的な価格で出して欲しいわ

0831名無しさん＠ピンキー (ﾜｯﾁｮｲ c7c5-okHx)

2024/06/02(日) 14:48:25.76ID:???0

>>826
CR+でそこまで申し訳されるの逆に難しいと思うんだけど、AIにロールを与えたりはしてる？小説ならAIに小説家のロールを、ロールプレイならキャラクターのロールを与えたら、GPTやOpusではどんな脱獄でも記述してくれないようなドン引きシチュを書いてくれるけど
行為だけを記述した場合流石に申し訳されたからセリフを混ぜたりするといいかも

0832名無しさん＠ピンキー (ﾜｯﾁｮｲ d2fc-NnhK)

2024/06/02(日) 15:03:42.36ID:???0

>>829
7.8いいなあ
公式が無料枠を減らしてきたら自分も試してみようかな

0833名無しさん＠ピンキー (ﾜｯﾁｮｲ db48-hUe9)

2024/06/02(日) 16:05:39.96ID:???0

同じサイズの巨乳でもハイエンド美人さんに付くのとローエンド不美人さんに付くのでは価値が違うってことなのかな

0834名無しさん＠ピンキー (ｻｻｸｯﾃﾛﾗ Spd7-VkBD)

2024/06/02(日) 16:21:10.52ID:???p

web版のcr+って量子化したモデル使ってない？
導入時に比べて質↓速度↑な気がするんだが

0835名無しさん＠ピンキー (ﾜｯﾁｮｲ 7732-hJA7)

2024/06/02(日) 17:01:02.33ID:???0

koboldのチャットのAI Nameに複数名入れたら
二人目のセリフが途中で中断されるんだけど何が原因かエスパーできる人いる？

設定はこうやってるんだけど、AI Nameの書き方間違えてる？
https://imgur.com/a/57LK0dA
ユーザー
キャラ1
ユーザー
キャラ2

って順番に会話することはできるけど

ユーザー
キャラ1
キャラ2

って表示が出来ない

0836名無しさん＠ピンキー (ﾜｯﾁｮｲ d2fc-NnhK)

2024/06/02(日) 17:34:13.23ID:???0

チャットだったらSilly Tavernがいいかも
かなり良く出来てる
会話例を入れる箇所もあったり
プロンプトも見れるから試行錯誤がやりやすい

0837名無しさん＠ピンキー (ﾜｯﾁｮｲ 7732-hJA7)

2024/06/02(日) 18:30:18.00ID:???0

>>836
silly tavernを起動できたんだけど、これって自分でダウンロードしてきたモデルは使えない感じ？

0838名無しさん＠ピンキー (ﾜｯﾁｮｲ 2f32-VkBD)

2024/06/02(日) 19:09:15.13ID:???0

>>837
裏でkobold立ち上げてモデル読み込み後に尻と接続する

0839名無しさん＠ピンキー (ﾜｯﾁｮｲ 7732-hJA7)

2024/06/02(日) 19:27:53.29ID:???0

>>838
ここのSTEP5の説明にある画像だとAPI urlを入力する欄があるけど
レイアウトが変わったのか、今開いてる尻にはこの欄が無いんだけどどうやって接続すればいい？
https://rentry.org/llama_v2_sillytavern

0840名無しさん＠ピンキー (ﾜｯﾁｮｲ 22a3-fd0q)

2024/06/02(日) 19:39:57.55ID:???0

>>839
横だけど
APIに Text Completion を選択
API Typeは KoboldCpp
API keyは不要
API URLに http://localhost:5001/
これでいける

0841名無しさん＠ピンキー (ﾜｯﾁｮｲ ef4b-hJA7)

2024/06/02(日) 19:43:52.08ID:ZkqQuWPj0

>>839
一番上のAPIをTextCompilationにするとApi TypeとAPI Urlの欄が出てくると思うで？
https://imgur.com/a/qk8jZSg

0842名無しさん＠ピンキー (ﾜｯﾁｮｲ 7732-hJA7)

2024/06/02(日) 21:13:43.55ID:???0

>>840-841
ありがとう！グループチャット出来た！

0843名無しさん＠ピンキー (ﾜｯﾁｮｲ 2f32-TEJs)

2024/06/02(日) 21:21:55.98ID:???0

自分も久々に尻起動したけど、RAG機能ってどうやって使うんかな？
最新の1.12.0にアプデしても拡張機能にDATA BANKのタグ出てこない（拡張機能を管理の画面では導入済みになってる）
そんで、web searchをインストールしたらいいのかと思って導入して実行したけど、
バッククオート「`」で囲んだ項目を「について教えて」をトリガーに設定して、In-chatにして聞いてみたけど、トンチンカンな回答しかしてくれない
sorceはSelenium Plugin で、Engineはgoogleにしてる

0844名無しさん＠ピンキー (ﾜｯﾁｮｲ 9311-KIU9)

2024/06/02(日) 21:44:17.98ID:dnjVV3qJ0

SillyTavernのRAGって埋め込みモデル何使ってるん？

0845名無しさん＠ピンキー (ﾜｯﾁｮｲ 7b4d-4j/2)

2024/06/02(日) 22:04:51.61ID:???0

セクハラ上司を演じたい場合はどのモデルがええんや
隠語連発で発散したいンゴ～

0846名無しさん＠ピンキー (ﾜｯﾁｮｲ 2f32-TEJs)

2024/06/02(日) 22:08:07.90ID:???0

>>844
あれ？
もしかして、モデルってなんでもいいわけじゃなかった？
なにも考えずにkarakuri-70B使ってたわ

0847名無しさん＠ピンキー (ﾜｯﾁｮｲ 9311-KIU9)

2024/06/02(日) 22:14:34.29ID:dnjVV3qJ0

>>846
SillyTavernの詳しいことは分からんが、一般論としてRAGを行うときの埋め込みモデルはLLMとは別に専用のモデルを用意して行うよ
何ヶ月も前だったからよくは覚えてないけど、自分で試した時はkarakuri-70Bの埋め込みはダメダメだった記憶がある
(SillyTavernで使ってるわけではないが)俺はmultilingual-e5ってモデルをこのスレで教えてもらったから今はそれ使ってる

0848名無しさん＠ピンキー (ﾜｯﾁｮｲ 2f32-TEJs)

2024/06/02(日) 22:55:44.98ID:???0

>>847
サンキュー
やっぱそうなんか残念

0849名無しさん＠ピンキー (ﾜｯﾁｮｲ 7732-hJA7)

2024/06/03(月) 05:18:09.23ID:???0

silly tavernのUIめちゃくちゃ分かり辛いな
world infoってどこで設定すればいいんだ……

0850名無しさん＠ピンキー (ﾜｯﾁｮｲ 7732-hJA7)

2024/06/03(月) 08:06:34.95ID:???0

なんとかworld info見つけた
character loreとかもあるみたいだしこれは使いこなすのが大変そうだ

0851名無しさん＠ピンキー (ﾜｯﾁｮｲ effe-hJA7)

2024/06/03(月) 08:40:32.85ID:6bA4dcQ30

尻タブはひたすら機能の増築が行われ続けてるのでUIは確かに複雑やが最低限の一貫性はあるから慣れるしかない
ハーレムチャットやキャラの表情、コンテクストの要約記憶、音声読み上げ、SD連動と使いこなせば最高のプラットフォームだとは思うで
音声読み上げがStyle-Bert-Vit2に対応してくれったら完璧なんやが
Python分かるニキ、頼むで！（他力本願時

0852名無しさん＠ピンキー (ﾜｯﾁｮｲ db6d-V1VE)

2024/06/03(月) 09:02:47.16ID:???0

sillytavernは要らない機能ばかり多くて欲しい機能が無いんだよなあ

0853名無しさん＠ピンキー (ﾜｯﾁｮｲ effe-hJA7)

2024/06/03(月) 09:07:37.49ID:6bA4dcQ30

ちなどんな機能が欲しいんや？

0854名無しさん＠ピンキー (ﾜｯﾁｮｲ f668-okHx)

2024/06/03(月) 09:21:29.43ID:???0

むしろ何の機能欲しいんだ
これ欲しいっていう機能の集まりじゃね

0855名無しさん＠ピンキー (ﾜｯﾁｮｲ db6d-V1VE)

2024/06/03(月) 09:24:56.62ID:???0

一番欲しいのは、出力の先頭を固定する機能

0856名無しさん＠ピンキー (ﾜｯﾁｮｲ effe-hJA7)

2024/06/03(月) 09:32:54.73ID:6bA4dcQ30

>>855
出力の先頭を固定？
もうちょい噛み砕いてくれんか？

>>854
ワイは上にあげたSBV2連動と、あとは表情差分を作成＆PNGのアルファ抜きを尻タブ内で完結させて欲しい...
あと表情差分だけでなく服装差分対応して欲しい...

0857名無しさん＠ピンキー (ﾜｯﾁｮｲ fe55-j0vd)

2024/06/03(月) 09:48:58.35ID:tvN01nRf0

尻は良いツールだと思うわ
一日あれば慣れる範疇だったし痒いところに手が届く
SD連動は日本語環境だとプロンプトにそのまま日本語が乗るから、
今のところは共通部以外手動でプロンプト入力してるわ

0858名無しさん＠ピンキー (ﾜｯﾁｮｲ 7732-hJA7)

2024/06/03(月) 11:00:09.58ID:???0

まだ尻は使いこなせてないから見当違いかもしれないけど
メッセージの削除が「編集」→「ゴミ箱」→「SwipeかMessageを選択」→「削除」
って4回もの工程を必要とするのがすごく面倒臭い

0859名無しさん＠ピンキー (ﾜｯﾁｮｲ f21f-d6y6)

2024/06/03(月) 11:28:24.12ID:???0

またフルCPUの話で恐縮ですが、速度的な事はおいといて、
例えばメモリ192GBのPC組んだら、MacのUltraみたいに大きなモデルを大きなコンテキストで
扱えるのでしょうか？何か見落としている事ありますかね。

今はメモリ64GBのフルCPUでCR+使ってて、速度は別に0.6t/s位で困らないんですけど、
コンテキストとか精度の面にメモリを使えるようにしたいと思っています。

0860名無しさん＠ピンキー (ﾜｯﾁｮｲ efa6-hJA7)

2024/06/03(月) 11:56:08.05ID:fdGZozKr0

Macはメモリの帯域広いかなんかそんな理由で早いんやろ？
Winでもメモリ詰めば動くは動くと思うけど、ふつーのメモリにデカいモデル詰んだら、アホ程遅くなるんちゃうか？

0861名無しさん＠ピンキー (ﾌﾞｰｲﾓ MMab-jN4h)

2024/06/03(月) 12:17:11.07ID:???M

SillyTevernのVIT2対応は本当にどなたかお願いします…
RAGの件ですが
立方体3つのアイコン、拡張機能のウィンドウの右下、ベクター機能をオンにした上で
チャット入力枠左から2番目のアイコンからRAG機能にアクセスできる
けど日本語の理解力はかなり低い気がする

0862名無しさん＠ピンキー (ﾌﾞｰｲﾓ MMab-jN4h)

2024/06/03(月) 12:22:22.62ID:???M

>>856
ちなみに服装切り替えは知ってる？
キャラ画像フォルダにさらにフォルダを作り、同じように表情ファイル入れる
チャットで/costume \swimsuiteとかやると切り替わる
元に戻すときは/costumeだけ入れる

0863名無しさん＠ピンキー (ｽｯｯﾌﾟ Sd92-fd0q)

2024/06/03(月) 12:32:57.41ID:???d

お気に入りのキャラ画像はSDでお気楽につくってるけど表情の変化をつくるのが面倒で1枚絵だけだ
なにか簡単につくるコツとかあるかな
すまん画像スレ案件か？

0864名無しさん＠ピンキー (ﾜｯﾁｮｲ efa6-hJA7)

2024/06/03(月) 12:39:23.70ID:fdGZozKr0

>>862
あー、知らんかったわ、サンガツ！
>>863
一枚絵から差分作るWebUIかアプリあったで？ちょっとワンパターンな感じになるけど
ワイは最近使ってなくてSSD見たけど見つからんかった
検索すればすぐ出てくると思うで？

0865名無しさん＠ピンキー (ﾜｯﾁｮｲ 367a-NKtZ)

2024/06/03(月) 12:49:26.51ID:???0

Silly Tavernってキャラの台詞と地の文を分けてウインドウ表示とかできる？
キャラは吹き出し、地の文は画面下のウインドウみたいな感じで

0866名無しさん＠ピンキー (ﾜｯﾁｮｲ 7732-hJA7)

2024/06/03(月) 19:54:01.92ID:???0

Chunkllamaってのがいまいちよく分かってないんだけど
RP-expressiveを使ってるなら適用できるの？

0867名無しさん＠ピンキー (ﾜｯﾁｮｲ 2209-hJA7)

2024/06/03(月) 22:19:03.38ID:???0

>>851
SillyTevernのttsは自分用に改造していたので良ければどうぞ．
public\scripts\extensions\tts に上書きでOK．
適当に書いてあるので，誰かきれいにしてPR出してほしい．．．
http://nkgpgc.sx3.jp/uploader51/upload.cgi?get=00413

0868名無しさん＠ピンキー (ﾜｯﾁｮｲ ef39-hJA7)

2024/06/03(月) 23:15:55.03ID:fdGZozKr0

>>867
おおおおおお！サンガツ！
ちょっとまだ使いこなせてないけど、SBV2での読み上げはきちんとイケたで！
調子乗ってserver limit = 3000とかにしたらクラッシュしたわｗ

0869sage (ﾃﾃﾝﾃﾝﾃﾝ MM7e-hJA7)

2024/06/04(火) 00:43:11.24ID:BkgD360lM

>>867
すごーい！私も動きました。ありがとう。

0870名無しさん＠ピンキー (ﾜｯﾁｮｲ 2209-hJA7)

2024/06/04(火) 01:03:02.69ID:???0

動いたようで何より．
素のVITSが必要な人は，vits-simple-apiに対応しているのでそのように使ってもらえれば．
# vits-simple-apiはVITS以外は未対応です．(手抜き)

0871名無しさん＠ピンキー (ﾜｯﾁｮｲ cf1b-hJA7)

2024/06/04(火) 01:11:48.17ID:/B8gZBuh0

https://pilgrimgirls.xobor.de
https://secretstars.xobor.de

0872名無しさん＠ピンキー (ﾜｯﾁｮｲ bea8-j5Hd)

2024/06/04(火) 11:45:39.62ID:???0

>>526このモデルほんといいわ
欠点としては入力が4092トークンしか入らないことかな

0873名無しさん＠ピンキー (ﾜｯﾁｮｲ 7732-hJA7)

2024/06/04(火) 12:47:43.29ID:???0

>>872
ChunkLlamaで65000まで増やせるみたいだけど俺にはやり方が分からん……
https://github.com/HKUNLP/ChunkLlama
https://qiita.com/Aratako/items/2372bd13b5368f3a959a
https://x.com/Aratako_LM/status/1796892802846282214

huggingface_loader関数内に追加ってどこに追加すればいいんだ

0874名無しさん＠ピンキー (ﾜｯﾁｮｲ dbf9-G58Q)

2024/06/04(火) 15:29:50.06ID:???0

ちょっと試したけどこんな感じでできた
ChunkllamaのGitHubからchunkllama_attn_replace.pyを持ってきてtext-generation-webuiのmodulesフォルダに入れる
同じmodulesフォルダの中にあるmodels.py開いて
上のimport文に
from .chunkllama_attn_replace import replace_with_chunkmistral
を追加
同じmodels.pyの133行目にhuggingface_loaderがあるからこの中のどこか（一番最初とか）に
replace_with_chunkmistral(pretraining_length=4096)
を追加
text-generation-webuiからTransformers形式でモデル読み込み（GGUFとかは無理）

0875名無しさん＠ピンキー (ﾜｯﾁｮｲ 367a-TEJs)

2024/06/04(火) 15:37:54.17ID:???0

Cohere、右上のほうにある「Chat」じゃなくて「PlayGround」から改めて左上の「Chat」選ぶと
普通にできている感じだな

ただちょっと表現が弱くなったような、短くなったような……これは気のせいかも

0876名無しさん＠ピンキー (ﾜｯﾁｮｲ 367a-TEJs)

2024/06/04(火) 16:01:47.61ID:???0

あ、ここLLMスレだったごめん

0877名無しさん＠ピンキー (ﾜｯﾁｮｲ e641-hJA7)

2024/06/04(火) 16:08:24.18ID:W8u18g9h0

CohereもまたLLMでは？

0878名無しさん＠ピンキー (ﾜﾝﾄﾝｷﾝ MMa2-6ljc)

2024/06/04(火) 16:44:40.48ID:???M

cohereの不具合？トークは向こうの流れだからでしょ
あと厳密ではないがこちらはローカルLLM寄り、向こうは大規模系のwebやAPI寄りって感じか

0879名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f7a-DKSk)

2024/06/04(火) 16:51:26.73ID:???0

いや、あっちはopusopusで話にならねーわ

0880名無しさん＠ピンキー (ﾜｯﾁｮｲ 67c0-R3YG)

2024/06/04(火) 17:12:54.51ID:lxZLkGyk0

llama3版swallowは
llama3+(swallow-llama2)じゃ作れんかね

0881名無しさん＠ピンキー (ﾜｯﾁｮｲ 7732-hJA7)

2024/06/04(火) 17:54:06.33ID:???0

ありがとう！試してみる！

ところすごく基本的なことが聞きたいんだけどさ

i9 10900KF、3080 10GB、メモリ64GB

という構成でNinja-v1-RP-expressive-breadcrumbsを使ってるんだけど、
chatで1秒当たり1.5文字ぐらいしか生成されないのは普通のことなの？
何か設定おかしいのかな？
https://huggingface.co/Aratako/Ninja-v1-RP-expressive-breadcrumbs/tree/main

0882名無しさん＠ピンキー (ﾜｯﾁｮｲ b68e-TEJs)

2024/06/04(火) 18:09:37.59ID:???0

7Bモデルだと量子化無しなら14GBくらいのサイズだからVRAMに乗り切ってないよ
GGUFの方で8bit以下の量子化モデルなら高速に生成できるはず

0883名無しさん＠ピンキー (ﾜｯﾁｮｲ f662-V1VE)

2024/06/04(火) 18:09:58.83ID:???0

まあ仕方ない
opusの表現力は頭3個くらい抜けてるから

0884881 (ﾜｯﾁｮｲ 7732-hJA7)

2024/06/04(火) 18:11:44.49ID:???0

こういう設定にしたらめちゃくちゃ早くなったわ！
でも何か設定がおかしいところがあったら教えてくれ
https://imgur.com/a/C3jpgJC

>>874
お礼の安価忘れてた！

0885名無しさん＠ピンキー (ﾜｯﾁｮｲ 7732-hJA7)

2024/06/04(火) 18:19:27.85ID:???0

>>882
VRAM足りてないのか……
設定弄ったら秒間10文字ぐらいになったんだけど、乗り切ってないとどういう問題が発生するの？
グラボへの負荷が大きすぎるとか？

0886名無しさん＠ピンキー (ﾜｯﾁｮｲ c75a-Y7pC)

2024/06/04(火) 18:32:20.79ID:???0

VRAMからあふれるとメインメモリに載る
(macの高いやつみたいな例外はあるけど)VRAMに比べてメインメモリは桁一つレベルで遅すぎる
そこでつっかえて遅くなる

0887名無しさん＠ピンキー (ﾜｯﾁｮｲ 7732-hJA7)

2024/06/04(火) 18:34:31.40ID:???0

なるほど
自分が満足する速度が出ているなら問題は特にないってことか
ありがとう
とりあえずこのままちょっと様子を見てみるよ

0888名無しさん＠ピンキー (ﾜｯﾁｮｲ b68e-TEJs)

2024/06/04(火) 18:35:57.34ID:???0

>>885
乗り切ってないとRAMに溢れるのでめちゃくちゃ推論が遅くなる
ただ設定変更したの見る限りではロード時に4bit量子化してるみたいだからそれならVRAM容量は問題ないと思う
GGUFって形式の量子化済みのモデルもあるからそっち使ってる人の方が多分多いんじゃないかな

0889名無しさん＠ピンキー (ﾜｯﾁｮｲ d28a-DG+E)

2024/06/04(火) 18:39:19.09ID:???0

mradermacher/Berghof-NSFW-7B-GGUF のQ8を１日使ってみたけど良さそうだった。自分が好きな展開になっただけかもしれんけど

i1ってなんだ　mradermacher/Berghof-NSFW-7B-i1-GGUF
量子化前　Elizezen/Berghof-NSFW-7B

0890名無しさん＠ピンキー (ﾜｯﾁｮｲ 2f32-TEJs)

2024/06/04(火) 18:54:02.42ID:???0

macまだ持ってないからよく分からんのだが、VRAMの上限上げなくても、
同じユニファイドメモリなんだがら、なにも考えずにメインメモリにロードすれば速度出るんじゃないの？
無理にVRAMに当てて、そこにロードする意味ってあるの？

0891名無しさん＠ピンキー (ﾜｯﾁｮｲ 7732-hJA7)

2024/06/04(火) 18:59:59.20ID:???0

>>888
GGUFだとChunkllamaが使えないみたいだからなんとかしようとしてたんだけど
もしかして4bit量子化してたら使えないってことなのかな？

なんか尻タブでトークンがどうとかエラーが出てたけど
ちゃんと適用できてるかはどこで見ればいいんだろう

0892名無しさん＠ピンキー (ﾜｯﾁｮｲ 4fbe-hJA7)

2024/06/04(火) 19:35:05.34ID:???0

AIは決して文章を理解してる訳じゃないから類似した内容が見つからないユニーク過ぎる設定で小説書かせようとすると
CommandR+も指示書のオウム返しみたいな内容のない文章しか生成できないのな
AIのなんか偉い人が言った”生成型検索エンジン”とは確かに良く言ったものだと思う
いつかは本物の創造力を持つ日が来るんだろうか？

0893名無しさん＠ピンキー (ﾜｯﾁｮｲ 2f32-TEJs)

2024/06/04(火) 19:42:38.21ID:???0

>>892
その設定、よければrentryにあげてもらえないだろうか？
自分もいろいろな奇抜な設定与えてモデルの評価してるんだけど、なかなかいいのが思いつかんのです

0894名無しさん＠ピンキー (ﾜｯﾁｮｲ e6ce-okHx)

2024/06/04(火) 20:01:16.62ID:???0

Pixiv小説やノクターンノベルズの小説も99.9％は読む価値すら無い駄文やしそれに比べたら良い文章を書いてくれるよ

0895名無しさん＠ピンキー (ﾜｯﾁｮｲ a36a-MSF/)

2024/06/04(火) 20:30:01.23ID:???0

1tbあたりの超高速SSDに流しても135bて無理？

0896名無しさん＠ピンキー (ﾜｯﾁｮｲ bebd-H12y)

2024/06/04(火) 20:44:46.29ID:???0

動かないことはまあないだろうけど、SSDだと遅いなんてもんじゃないし
仕様上、寿命がゴリゴリ削れていきそうだな

0897名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f7a-DKSk)

2024/06/04(火) 21:35:38.95ID:???0

そんな事あるぅ？とか思うけど
奇抜じゃなくて筋が通ってないから従えないだけじゃないの？

0898名無しさん＠ピンキー (ﾜｯﾁｮｲ 7732-hJA7)

2024/06/04(火) 22:01:34.60ID:???0

筋が通ってなかったり意味不明なネタで笑わせることって現実だと割とあるから
そこに対応してくれないと困るよね

0899名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f7a-DKSk)

2024/06/04(火) 22:21:49.58ID:???0

？
指示文が意味不明だって話なんだけど笑い取ってどうすんの？

0900名無しさん＠ピンキー (ﾜｯﾁｮｲ 67c0-kPtO)

2024/06/04(火) 22:30:04.61ID:???0

kobold.cppで動かしてるけど、100文字ほど出力した後、削除されて5文字くらいか出力されないのは何が悪いんでしょうか
あんまりあってなかったらlhamaへいこうかな…

0901名無しさん＠ピンキー (ﾜｯﾁｮｲ db63-oCi8)

2024/06/04(火) 23:08:01.09ID:???0

ハチャメチャなプロンプトはのべりすとの方が向いとるやろね

0902名無しさん＠ピンキー (ﾜｯﾁｮｲ 2f32-TEJs)

2024/06/05(水) 01:05:14.97ID:???0

>>900
settingのtrim sentenceをオフにする

0903名無しさん＠ピンキー (ﾜｯﾁｮｲ f388-V1VE)

2024/06/05(水) 08:16:05.85ID:???0

>>892
ローカルモデルのほとんどは過学習なのでそういうことになるんだろうね
CR+ですら
逆に言えばローカルモデルの柔軟性を評価する良い手法になる

0904名無しさん＠ピンキー (ﾜｯﾁｮｲ e6ce-okHx)

2024/06/05(水) 08:20:54.63ID:???0

過学習の意味が分かってなくない？

0905名無しさん＠ピンキー (ﾜｯﾁｮｲ 67c0-kPtO)

2024/06/05(水) 08:21:38.60ID:???0

>>902
ありがとうございます。
それもだけど、Multiline Repliesをオンにしたらいけました

0906名無しさん＠ピンキー (ﾜｯﾁｮｲ f388-V1VE)

2024/06/05(水) 08:49:33.22ID:???0

>>904
入力を無視してほぼ同じ出力を繰り返すのが過学習じゃなければなんなんだ

0907名無しさん＠ピンキー (ﾜｯﾁｮｲ e6ce-okHx)

2024/06/05(水) 08:55:11.82ID:???0

>>906
CR+の事言ってるならプロンプトフォーマットが間違ってるんだろうなと

0908名無しさん＠ピンキー (ﾜｯﾁｮｲ 9311-KIU9)

2024/06/05(水) 08:58:16.62ID:o9Fmpo040

>>904
学習データセットのデータにある程度近くないとまともな文章が生成されないと言う話なら、過学習と言ってもいいんじゃないか？
ちょっと単語がユニークになると、潜在空間での距離が(学習データの埋め込みが作るクラスターと比較して)思いの外離れてしまうって事だと思うんだけど

0909名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f7a-DKSk)

2024/06/05(水) 09:00:27.68ID:???0

>>907
同感。変な中二病多すぎるよ

0910名無しさん＠ピンキー (ｽｯｯﾌﾟ Sd92-mHyR)

2024/06/05(水) 09:02:26.84ID:???d

>>908
それって過学習と言うよりはデータセットの多様性が足りてないのでは？

0911名無しさん＠ピンキー (ﾜｯﾁｮｲ f388-V1VE)

2024/06/05(水) 09:09:43.71ID:???0

>>907
つーても同じプロンプトで繰り返しちゃうモデルと繰り返さないモデルがあるからなあ
モデルそのものに問題があるのは間違いない

0912名無しさん＠ピンキー (ﾜｯﾁｮｲ 7732-hJA7)

2024/06/05(水) 09:11:25.51ID:???0

三人相手にチャットをしていると全員の言ってることが混ざってしまう
もっと設定を詰めたら良くなるのかな

0913名無しさん＠ピンキー (ﾜｯﾁｮｲ e6ce-okHx)

2024/06/05(水) 09:11:38.11ID:???0

>>911
意味がわからんけどCR+が問題のあるモデルってこと‥？
俺は普通に使えてるからお前の使い方が悪いだけじゃない？

0914名無しさん＠ピンキー (ﾜｯﾁｮｲ 9311-KIU9)

2024/06/05(水) 09:12:28.92ID:o9Fmpo040

>>910
データセットの多様性が足りないのか、学習方法自体に問題があって過学習起こしてるのかは、側から見て判断つくのか？
学習曲線公開されてればある程度予想はできるのかもしれないけど

0915名無しさん＠ピンキー (ﾜｯﾁｮｲ e6ce-okHx)

2024/06/05(水) 09:17:44.69ID:???0

>>912
どうしても前の発言に一番影響受けるから間にワイくんを挟むしかない

0916名無しさん＠ピンキー (ﾜｯﾁｮｲ f388-V1VE)

2024/06/05(水) 10:03:46.53ID:???0

>>913
それ複雑なことやユニークなことを言わせてないだけだと思うよ…

0917名無しさん＠ピンキー (ﾜｯﾁｮｲ e6fa-Soyn)

2024/06/05(水) 10:26:43.61ID:???0

PC3台用意して別々のモデルで仮想ガールズトークってできるんやろか？

0918名無しさん＠ピンキー (ﾜｯﾁｮｲ 9330-mHyR)

2024/06/05(水) 10:32:30.71ID:???0

わざわざPC分けなくてもSillyTavern使えばできるんじゃない？

0919名無しさん＠ピンキー (ﾜｯﾁｮｲ f29f-hUe9)

2024/06/05(水) 14:33:50.03ID:EeNKsAFQ0

Q&Aタイプのプロンプトで学習させると2回目以降の応答が繰り返しやすくなるって聞いた

0920名無しさん＠ピンキー (ﾜﾝﾄﾝｷﾝ MMa2-6ljc)

2024/06/05(水) 15:39:32.85ID:???M

>>911
ちなみに同じプロンプトで繰り返さないやつって例えばどんなので試した？
俺もcohereメインでプロンプト工夫してエロ小説家として調教してるとこだけど、
まぁちょいちょい似たようなフレーズの繰り返しが起きるよね
厳密に言うと主語が同じでニュアンスが同じ文章を延々吐く
かいつまむとこんな感じ
「花子は初めての快感に震えた
花子は抵抗したが無駄だった
花子は快感を受け入れた
花子は性奴隷になった」
流石にここまで酷くないが、突き詰めるとこんな印象になる

対策として一回の指示で内容を段階分けて細かめに与えるとか、
回答の文章量を指示内容に見合う程度に少なくさせるとかしてるが、
システムプロンプトで回避できるなら面倒がなくていいのでそうしたい

0921名無しさん＠ピンキー (ﾜｯﾁｮｲ c75a-Y7pC)

2024/06/05(水) 15:40:38.40ID:???0

長文要求されたときのcohereくんのヤケクソモードって勝手に呼んでる

0922名無しさん＠ピンキー (ﾜｯﾁｮｲ 7732-hJA7)

2024/06/05(水) 15:44:45.88ID:9pGmxMss0

頻出単語があると繰り返ししやすくなるよね
繰り返しペナルティを上げればいいのかもしれないけど

0923名無しさん＠ピンキー (ﾜﾝﾄﾝｷﾝ MMa2-6ljc)

2024/06/05(水) 15:46:43.14ID:???M

あと、これはいいとこでもあると思うけどcohereはやたらがんばって長い回答をしがちな印象がある
指示者が「花子が犯されて快楽堕ちする」みたいな雑な指示しても必死に文章量稼ごうとして上記みたいな事が起きるのかも
ただ、やったことないんだけどopusでこういう指示だすとオリジナリティのある内容とか吐くんだろうか？

0924名無しさん＠ピンキー (ﾜﾝﾄﾝｷﾝ MMa2-6ljc)

2024/06/05(水) 15:50:23.17ID:???M

>>921
そうそう
ヤケクソな感じよね
え？なんか怒ってる？って思う

0925名無しさん＠ピンキー (ﾜｯﾁｮｲ c75a-Y7pC)

2024/06/05(水) 15:56:57.90ID:???0

cohereくん出力早いからますますキレてる感あるよな

0926名無しさん＠ピンキー (ﾜｯﾁｮｲ fb75-V1VE)

2024/06/05(水) 16:30:33.53ID:???0

>>923
ものによる
書きやすい内容・膨らませやすい内容なら読み応えのある話を書いてくれる
でも常識的に考えて書くことが限られてると、繰り返しにはならないにしても、話が勝手に進んでしまう
例えばアイドルの快楽墜ちなんて膨らませやすいテーマなら陳腐なりにそれなりに読めるものが出てくる
ヒントを与えればなおさら
一方で挿入シーンだけで4000文字みたいな無茶な指示すると、勝手にピストンして勝手に射精されてしまう

0927名無しさん＠ピンキー (ﾜｯﾁｮｲ 43c0-ygI9)

2024/06/05(水) 17:28:52.66ID:???0

>>867
動いたわサンガツ!
できればauto_split (改行で分けて生成) とsplit_interval (分けた場合に挟む無音の長さ（秒）)も実装してくれると長文時のレスポンスが改善されそうでたすかる
sdp_ratio, noise周り, length, Style周りがあれは言う事なしや……

レス数が900を超えています。1000を超えると表示できなくなるよ。