なんJLLM部避難所

0001名無しさん＠ピンキー転載ダメ (ﾜｯﾁｮｲ e249-iArR)2023/12/17(日) 21:48:59.66ID:???0

!extend::vvvvv:1000:512
!extend::vvvvv:1000:512
AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ
なんJLLM部 ★6
https://fate.5ch.net/test/read.cgi/liveuranus/1701542705/

VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured

0952名無しさん＠ピンキー (ﾜｯﾁｮｲ 43c6-WRNM)2024/05/02(木) 01:16:21.06ID:???0

>>922
使ってみたけどこっちはちゃんと指示に従うし描写の種類も豊富でかなり良い
NSFW版でもお断り率が高い感じするけど、ここは書き直せば良いから無問題
個人的にVecteusはアウトプットの方の文脈を優先で指示に従わない感じがあって使いにくかった
めっちゃ良いモデルありがとうやで

0953名無しさん＠ピンキー (ﾜｯﾁｮｲ e384-/xY8)2024/05/02(木) 01:34:26.54ID:???0

Don't be evil
邪悪になるな(ズルしていいのは俺だけ)
がテック業界の標語なんでェ

0954名無しさん＠ピンキー (ﾜｯﾁｮｲ ff1e-1wV0)2024/05/02(木) 02:00:06.27ID:???0

>>916
koboldでエロプロンプトで試させて貰いました！
金玉を「パンパンに張り詰めた長靴下」と表現したのは茶吹きましたｗ

ところでこれはモデルと関係ないかもですが、koboldで生成してる途中の黄色い文字が、生成結果では最後の方だけ消されて文章が減る現象が結構起こるんですが、これは設定で調整できるんでしょうか？

0955名無しさん＠ピンキー (ﾜｯﾁｮｲ f310-7iwU)2024/05/02(木) 02:45:32.84ID:1tIZbkbs0

Settings>Advancedの左下の方のTrim Sentecesのチェック外すと全部表示されるはずやで
文末まで出力できなかった文章を表示するか否かの設定や

0956名無しさん＠ピンキー (ﾜｯﾁｮｲ 53e2-7iwU)2024/05/02(木) 08:04:56.89ID:???0

EasyNovelAssistantへの追加ありがとナス
キャラ設定なげるだけでStable Diffusion用プロンプト生成できるプロンプトも用意したで、NSFWコンテンツも出してくれるのはローカルLLMの特権よ
https://github.com/kgmkm/goalseek_ad/blob/main/init_imager.txt

画像は野郎の手じゃなきゃ10000点やったやつ
https://imgur.com/a/ZPiYEpr

0957名無しさん＠ピンキー (ﾜｯﾁｮｲ 83be-7iwU)2024/05/02(木) 09:25:53.69ID:???0

kobolcCppをAPIから利用するときChat ModeとかInstruct Modeってどうやって設定するの？
もしかしてAPIからは設定不可能？

0958名無しさん＠ピンキー (ﾜｯﾁｮｲ f310-7iwU)2024/05/02(木) 10:19:56.49ID:1tIZbkbs0

>>957
Instructionモードとか、ChatモードってのはあくまでもWebUIの機能で
API経由でKoboldや大葉使う場合は自前で渡すシステムプロンプトでInstruction的な振る舞いを課したり、
Chat的な振る舞いを課すってのがワイの理解や

0959名無しさん＠ピンキー (ﾜｯﾁｮｲ f310-7iwU)2024/05/02(木) 10:32:18.71ID:1tIZbkbs0

ところでSillyTavernでCohereのCommand-r-plus使いたいんだが、上手く接続できん
トライアルAPIはValid表示されるが、メッセージのやり取りしようとするとスクショの様なBad Requestエラーがでてしまう
何を見落としてるんやろうか？SillyTavernでCommand-r-plusイケてるニキおったら、教えてくれんか？
https://imgur.com/a/dN0VxYR

0960名無しさん＠ピンキー (ﾜｯﾁｮｲ 83be-7iwU)2024/05/02(木) 10:36:00.00ID:???0

>>958
う～ん、だとするとAPIからはやっぱ無理なのか
Ninjaはどのモデル使ってもAPIからではチャットしてくれないわ、Web UIのChat Modeでないと無理

0961名無しさん＠ピンキー (ﾜｯﾁｮｲ a3ff-joKd)2024/05/02(木) 10:39:18.41ID:???0

自分はどこもいじらずcohere選んでAPIキーをペーストしてconnectしたら繋がったな
スクショ見る限り自分と同じに見える
とはいえそれは数日前の話で今帰省中だから再現を確認できん
とりあえずどこか別の画面で設定が必要とかはなさそうよということで

0962名無しさん＠ピンキー (ﾌﾞｰｲﾓ MM47-uLBv)2024/05/02(木) 10:59:58.46ID:???M

>>960
興味あるんだけど、挨拶送るとどんな出力を返してるのかな
関係なしに小説を書き始めるのかな

0963名無しさん＠ピンキー (ﾜｯﾁｮｲ f308-7iwU)2024/05/02(木) 11:01:40.74ID:1tIZbkbs0

>>961
サンガツ、と言うことはちょっと根が深そうやな…。
>>960
NinjaはAPIからは無理って意味がちょっとよく分からんのだが？
ワイはKobold.cppをバックエンドにしてSilly TavernでNinja遊んどるけどふつーに遊んどるが
この際Kobold.cppのAPIをSilly Tavernが叩くって構図なのでSilly TavernをInstructにしておけばえーやろの気持ちや

0964名無しさん＠ピンキー (ﾜｯﾁｮｲ a3ff-joKd)2024/05/02(木) 11:26:30.02ID:???0

>>963
とりあえずCohereのアカウント新規に作ってトライアルAPIも取得し直してみるのはどうかな
RedditのSillyTavernスレでBad requestで検索したらCohere以外でも悩まされてる人結構いるわ

0965名無しさん＠ピンキー (ﾜｯﾁｮｲ 83be-7iwU)2024/05/02(木) 12:12:36.19ID:???0

>>963
音声でリアルタイム会話できるようにした自作アプリからNinja使おうと試してるんだよ
でSilly Tavernがどうやってチャットしてるのか確認したら初手「こんばんわ」って挨拶するだけで
5000文字超の長大なプロンプト送信してたわ、今必死に中身解析してるところ

0966名無しさん＠ピンキー (ﾜｯﾁｮｲ 83be-7iwU)2024/05/02(木) 12:25:30.76ID:???0

Silly Tavernのリクエストの中身見て大体理解したわ
結局どんなモデルにも強制的にチャットさせてる方法は世間で言われてるプロンプトで頑張るやり方じゃなくて
最初からユーザーとAI双方の名前を付けて途中まで会話が進行した履歴をでっち上げてその続きから始めさせるようにして
AIが勝手にユーザーの発言始めるのをストップワードにユーザー名入れてそこで強制的に打ち切るってパワープレイやったわ

0967名無しさん＠ピンキー (ﾜｯﾁｮｲ cf13-6o3J)2024/05/02(木) 12:29:56.16ID:???0

>>956
サンガツやで！
もうちょっと見やすいようにメニューを構成するのとエロに直接リンク貼れない問題への対処を入れ込んどる

画像生成プロンプト生成なんやがNinjaやVecteusでもそこそこの結果が出とるっぽい
使えそうやったら記事でも補足しておいてもらえたらありがたいで

0968名無しさん＠ピンキー (ｱｳｱｳｳｰ Sa47-zsX1)2024/05/02(木) 12:40:32.26ID:???a

提案になるけどChub aiみたいなキャラカード共有するサイトの日本語版みたいなのがあったら需要ある気がする
他人の書いたキャラカを使い回しできたら文才なくても文章書く手間を省けるからな

0969名無しさん＠ピンキー (ﾜｯﾁｮｲ e387-6o3J)2024/05/02(木) 13:21:23.57ID:BxbvsKPT0

Vecteusのf16使ってるけど賢くて楽しいわ
小説向けだからかハルシネーションちょっと強めやけど、要約とか一般タスクもサクサクしてくれるのほんと助かる。あと文脈の拾いかたすごいわ
Ninjaの方はQ8の方使ってるからか案外Vecteusよりも更にハルシネーション強めやけど、ミドルスペックでも40t/s出るのはほんまストレスフリーや。f16も試してみたいわ

0970名無しさん＠ピンキー (ﾜｯﾁｮｲ bf77-joKd)2024/05/02(木) 13:29:55.46ID:???0

>>963
実家に置いてたN100ミニPCにSTインストールしてCohereのトライアルAPI入れたらちゃんと繋がったよ
https://i.imgur.com/zA6LvRx.jpeg
Seraphinaちゃんとチャットできるのも確認した
やはりST側の設定じゃなくて、そちらの接続がうまくいってないんじゃないかと思う
プロキシが悪さしてたりAPIがいつの間にか失効してたりとか色々なケースがあるみたいだ

0971名無しさん＠ピンキー (ﾜｯﾁｮｲ cf13-6o3J)2024/05/02(木) 14:01:41.07ID:???0

>>956
EasyNovelAssistantを更新して「特集テーマ」メニューにゴールシーク関連をまとめるようにしといたで
「作例や記事」メニューからもリンク貼っといた

0972名無しさん＠ピンキー (ﾜｯﾁｮｲ 83be-7iwU)2024/05/02(木) 14:45:14.02ID:???0

Silly Tavernを参考に何とかNinja使ってローカルだけで無制限に音声会話できるようになったわ
commandR+みたいな大型モデルと違って音声認識で1文字でも誤字があると正確な応答してくれないのは流石にしょうがないな
話してる女の子の名前がハルナだとしてwhisperの誤認識でアルナになってもcommnadR+は察してくれるけど
Ninjaその他の7Bモデルは別人の話だと思ってしまう

0973名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f69-7iwU)2024/05/02(木) 16:19:35.70ID:aApmX5gk0

>>970
別垢作ってもダメだったんで、Silly Tavernをクリーンインストールしたらすんなりいけたわ！
色々検証してもらったりで助かったで、ありがとうさんや！

0974名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f69-7iwU)2024/05/02(木) 16:28:11.16ID:aApmX5gk0

>>972
おお、おめでとうさん
>>大型モデルと違って音声認識で1文字でも誤字があると正確な応答してくれない
名前と誤認識のパターンによってはあかんケースもあると思うが、せっかくAPI使ってるなら誤認識の結果の単語の辞書作って、
それらはNinjaに渡す前にアプリ側で全部”ハルナ”に置き換えてからNinjaに渡す方法でどうや？ワイは自作アプリではそんな感じでやってそこそこ機能しとった
なんか面白いアプリ出来たら是非遊ばせてや？

0975名無しさん＠ピンキー (ﾜｯﾁｮｲ bf77-joKd)2024/05/02(木) 16:30:50.07ID:???0

>>973
あまり役に立たなかった気もするが繋がってなにより
CohereのAPIは無料だし速いし性能良いしでありがたいな

0976名無しさん＠ピンキー (ﾃﾃﾝﾃﾝﾃﾝ MM7f-uLBv)2024/05/02(木) 17:22:06.82ID:???M

自作アプリおじさん複数いて話の流れが掴めないな
Ninjaと会話できるの？小説しか無理なの？

0977名無しさん＠ピンキー (ﾜｯﾁｮｲ ff7c-2TDZ)2024/05/02(木) 17:50:20.76ID:???0

たまたま安かったとはいえRTX3050買ったことを後悔しとる
画像生成は何とかなっとるけどVRAM8GBじゃローカルLLMはかなり厳しそうやな

0978名無しさん＠ピンキー (ﾜｯﾁｮｲ 63c0-joKd)2024/05/02(木) 17:52:18.79ID:???0

次スレはこのままpinkに立てるとして冒頭のテンプレは結構見直す所が多そうだよね
お奨めモデルもかなり入れ替わったしEasyNovelAssistantもテンプレに入れたいな

0979名無しさん＠ピンキー (ﾜｯﾁｮｲ cf7a-rdsl)2024/05/02(木) 17:53:00.42ID:???0

メルカリにでも出して3060にしちゃえば？
今4万円くらいでしょ

なんなら3060もメルカリで買えばもっと安いかも
4060Tiとか3090・4090にいって放出する人いそうだし

0980名無しさん＠ピンキー (ﾜｯﾁｮｲ 93a7-MiRA)2024/05/02(木) 17:59:07.71ID:???0

EasyNovelAssistantをアプデしたら地の文を読み上げてくれなくなっちゃったのだ
女の子の一人称視点で書かせて読み上げてもらうの最高だったのだ

0981名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f31-7iwU)2024/05/02(木) 18:09:10.65ID:aApmX5gk0

>>976
完全ではないけど、ほぼストレスない形でNinjaと会話できるで
ワイはKobold.cpp + Silly Tavernでチャット形式であそんどる
ただ、小説書かせる方がモデルの性能発揮されるな、と感じた

0982名無しさん＠ピンキー (ﾜｯﾁｮｲ ff7c-2TDZ)2024/05/02(木) 18:11:23.31ID:???0

>>979
それも検討するわ
せやけどvecteus？のggml-model-Q4_K.ggufっていうやつ
EasyLightChatAssistantに放り込んで適当に設定したら一応動いたわ
めちゃめちゃ賢くてビビっとるんやけど

0983名無しさん＠ピンキー (ﾜｯﾁｮｲ 63c0-joKd)2024/05/02(木) 18:25:04.33ID:???0

次スレ立ててみるわ

0984名無しさん＠ピンキー (ﾜｯﾁｮｲ 63c0-joKd)2024/05/02(木) 18:34:45.97ID:???0

立ててみたでー
なんJLLM部避難所 ★2
https://mercury.bbspink.com/test/read.cgi/onatech/1714642045/

0985名無しさん＠ピンキー (ﾜｯﾁｮｲ 83be-7iwU)2024/05/02(木) 18:36:27.41ID:???0

>>>974
なるほどな、whisperはいつも同じ間違いするから辞書作っておくのは有効そうだな

0986名無しさん＠ピンキー (ﾜｯﾁｮｲ cf13-6o3J)2024/05/02(木) 18:42:38.96ID:???0

>>980
読み上げメニューのその他自動読み上げを有効にしたら読み上げるやろか？
デフォルトでその他をオフにしたんは失敗やったかもしらんな
手抜き実装しとるんでアプデでは治らんのやが新規インストール民がおんなじ目に合わんように今デフォルト変更しといたで

あとEasyNovelAssistantにファイル監視機能いれといた
お好みエディタをリアルタイムに使えるのもローカルLLMの利点やね
https://raw.githubusercontent.com/wiki/Zuntan03/EasyNovelAssistant/img/ChangeLog/file_watch.png

一応やがNinjaの使い方や
先に自動起動のサーバーを落としてから起動してな
https://raw.githubusercontent.com/wiki/Zuntan03/EasyNovelAssistant/img/ChangeLog/Ninja.png

>>984
サンガツ！

0987名無しさん＠ピンキー (ﾜｯﾁｮｲ 93a7-MiRA)2024/05/02(木) 19:47:12.25ID:???0

>>986
その他にチェック入れても地の文読んでくれませぬ…
名前無しの「」はその他の声で読んでくれました
「」が付いてない文だと読んでくれないみたいです

0988名無しさん＠ピンキー (ﾜｯﾁｮｲ ffa3-muh7)2024/05/02(木) 21:03:30.85ID:???0

>>979
時々画面にノイズが乗る3060が2万円代前半ぐらいであるね
ゲームやらないならわんちゃん

0989名無しさん＠ピンキー (ﾜｯﾁｮｲ cf13-6o3J)2024/05/02(木) 21:18:41.09ID:???0

>>987
不具合報告サンガツ！
アプデしてもろうたら直ってるはずや

0990名無しさん＠ピンキー (ｽﾌﾟﾌﾟ Sd9f-EkDX)2024/05/02(木) 21:31:58.30ID:???d

中古のしかもメルカリでGPU買うのってどうなん

0991名無しさん＠ピンキー (ﾜｯﾁｮｲ 53cc-TlR/)2024/05/02(木) 21:36:28.59ID:???0

ゴミが増えない分直接ドブに金捨てたほうがマシレベル

0992名無しさん＠ピンキー (ﾜｯﾁｮｲ 93a7-MiRA)2024/05/02(木) 21:49:21.51ID:???0

>>989
アプデしたら直りました！
ホンマにサンガツです！

0993名無しさん＠ピンキー (ﾜｯﾁｮｲ 83be-7iwU)2024/05/02(木) 22:06:38.56ID:???0

Ninjaは創作物から学習した比重高いんかな？プロンプト工夫してチャットさせてるけど
現実的な設定よりRPG世界で女の子と冒険するみたいな設定のほうが自然な流れで会話してくれる

0994名無しさん＠ピンキー (ﾜｯﾁｮｲ 73d4-2TDZ)2024/05/02(木) 22:54:42.00ID:???0

これ軽いから使ってる soramikadukiStarling-RP-ja-westlake-chatvector

0995名無しさん＠ピンキー (ﾜｯﾁｮｲ cf13-6o3J)2024/05/02(木) 23:27:28.80ID:???0

>>992
こちらこそ不具合報告ホンマに助かっとるんでサンガツや

>>934
VecteusとNinjaのポエムやで

- Vecteus Q4_Kのコスパが凄まじいのでIQ4_XS版も触ってみたい
　- Vecteusのコンテキスト広げた版にも期待

- Ninjaも128Kでない版を4Kコンテキストで動かしていると良好
　- 128K版ではコンテキスト16Kあたりから品質に悪影響があるような気がする？（LCA 32K感覚比）
　　- とりあえず128K版を8K運用
- NinjaにInstruction formatを適用すると申し訳率が上がる？
- Ninjaの量子化がQ_8_0までしか無い
　- IQ4_XS版を触ってみたい

https://gist.github.com/Artefact2/b5f810600771265fc1e39442288e8ec9#kl-divergence-statistics-for-mistral-7b
↑は確かLCAニキが紹介してくれたやつやが
数値よりもこのスレで何度もIQ4_XSと他の量子化を比較してて「なんかコスパええやん」な印象や

0996名無しさん＠ピンキー (ﾜｯﾁｮｲ cf13-6o3J)2024/05/02(木) 23:43:05.97ID:???0

と思ったら出とった

https://twitter.com/WMjjRpISUEt2QZZ/status/1785730059963367889
https://huggingface.co/mmnga/Vecteus-v1-gguf

https://twitter.com/WMjjRpISUEt2QZZ/status/1785729813594116236
https://huggingface.co/mmnga/Ninja-v1-NSFW-128k-gguf
https://huggingface.co/mmnga/Ninja-v1-128k-gguf

0997名無しさん＠ピンキー (ﾜｯﾁｮｲ bf77-joKd)2024/05/03(金) 04:59:24.63ID:???0

いつものモモンガ先輩か

0998名無しさん＠ピンキー (ﾜｯﾁｮｲ 73f4-5fNx)2024/05/03(金) 06:52:05.42ID:???0

mmng氏の量子化モデルってK量子化にもiMatrixやってるのかな？
K量子化は見た目で分からんからなぁ

0999名無しさん＠ピンキー (ﾜｯﾁｮｲ cf13-6o3J)2024/05/03(金) 07:48:10.92ID:???0

>>936
言ったからにはやってみた
絵・文章・音声の同時生成を再びや

https://twitter.com/Zuntan03/status/1786165587573715394

1000名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f31-7iwU)2024/05/03(金) 09:43:07.63ID:3NEtr/p00

>>966
>>最初からユーザーとAI双方の名前を付けて途中まで会話が進行した履歴をでっち上げてその続きから始めさせるようにして
AIが勝手にユーザーの発言始めるのをストップワードにユーザー名入れてそこで強制的に打ち切るってパワープレイやったわ
この、でっちあげるって、Silly Tavernそのものが会話をでっちあげてる、って意味なんか？

10011001Over 1000Thread

このスレッドは１０００を超えました。
もう書けないので、新しいスレッドを立ててくださいです。。。
life time: 137日 11時間 54分 9秒

10021002Over 1000Thread

BBSPINKの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。

───────────────────
《プレミアム会員の主な特典》
★ 専用ブラウザからの広告除去
★ 過去ログを取得
★ 書き込み規制の緩和
───────────────────

会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。

▼ プレミアム会員登録はこちら ▼
https://premium.5ch.net/

▼ 浪人ログインはこちら ▼
https://login.bbspink.com/login.php

なんJLLM部 避難所

なんJLLM部避難所