なんJLLM部 避難所
レス数が950を超えています。1000を超えると書き込みができなくなります。
0001名無しさん@ピンキー 転載ダメ (ワッチョイ e249-iArR)2023/12/17(日) 21:48:59.66ID:???0
!extend::vvvvv:1000:512
!extend::vvvvv:1000:512
AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC(できれば+3060 12GB以上)でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ
なんJLLM部 ★6
https://fate.5ch.net/test/read.cgi/liveuranus/1701542705/
VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured
0880名無しさん@ピンキー (ワッチョイ 0369-5N3P)2024/04/30(火) 20:43:06.12ID:???0
音声良いね
音声ありはどちらかというと小説読み上げよりもロールプレイとかなりきりチャット的な用途で欲しいな…(俺がエロチャ大好きなだけかもしれんが)
0881名無しさん@ピンキー (ワッチョイ f314-BrOF)2024/04/30(火) 20:56:46.66ID:Iv4x6b4N0
Llama3 70Bよりもcommand R +の方が自然な日本語を返してくれる気がする。
日本語のベンチマークではどっちが上なんだろうね?
0882名無しさん@ピンキー (ワッチョイ f314-M43A)2024/04/30(火) 20:57:00.91ID:Iv4x6b4N0
Llama3 70Bよりもcommand R +の方が自然な日本語を返してくれる気がする。
日本語のベンチマークではどっちが上なんだろうね?
0883名無しさん@ピンキー (ワッチョイ f34f-5N3P)2024/04/30(火) 21:06:13.88ID:???0
Command R+の方が上のはず
そもそもllama-3は公式的には多言語対応じゃない(多言語対応版も後で出しますよみたいなのをリリース文に入れてたはず)
0884名無しさん@ピンキー (ワッチョイ 5380-7iwU)2024/04/30(火) 21:20:09.31ID:MXycCz7k0
GPT2を変な形でお披露目したOpenAIの真意はなんだろな?
0888名無しさん@ピンキー (ワッチョイ d311-h5/x)2024/04/30(火) 22:44:22.41ID:fAUnlGYu0
LLMの読み上げは、BOOTHに上がってるAnneliとかいうNSFWのstyle-bert-vits2のモデル(を自分で学習したモデルとマージしたやつ)使ってるんだけど、学習データの出所不明で人に勧めづらいんだよな
ここで読み上げやってるやつは何使ってるの?
0891名無しさん@ピンキー (ワッチョイ d311-h5/x)2024/05/01(水) 00:06:01.28ID:5ix3SE930
俺もそうだが、やっぱりASMRとかで学習させてるやつが多いか
まあ背景に変な音とかなくて使いやすいよね
0893名無しさん@ピンキー (ワッチョイ 7fe6-1wV0)2024/05/01(水) 08:15:54.11ID:???0
Command +RをAPI経由かウェブかローカルでもいいのでお手軽に実行できる環境ってある?
ローカルだと4090+64GBメモリでもキツイと聞いたので。。。
0896名無しさん@ピンキー (ワッチョイ d311-h5/x)2024/05/01(水) 09:47:53.49ID:5ix3SE930
公式ページにも普通にChat UIあるからそれでもいいと思う
0898名無しさん@ピンキー (ワントンキン MM1f-jMJY)2024/05/01(水) 12:10:06.00ID:???M
NovelHacja/vecters-v1
5/1の人のモデルかな?
今日やってるLOCAL AI HACKATHON #001で出したモデルらしい
メンバーがHFに出してたモデル見ると、Antler系とchatntqを使ってる
これもそうだったら、このスレの功績がまた一つ増えたことになるな
0900名無しさん@ピンキー (スップ Sd9f-zsX1)2024/05/01(水) 13:59:00.72ID:???d
まあ最近出てきてるMistralの日本語強いやつは皆LCAの影響受けてんじゃね
あれから一気に数出てくるようになったし
願わくばこのままどんどん良くなっていってほしいもんだ
0902名無しさん@ピンキー (ワッチョイ 73c6-2TDZ)2024/05/01(水) 14:40:47.10ID:???0
面白そうだがLMstudioユーザーで知識も環境もないワイはgguf待ちやな…
Vecteus-v1はggufあるみたいだがVRAM 16GBじゃ乗らんわ
ハッカソンとやらは覗いてみるか
0903マジカル (ワッチョイ a3dd-aBMh)2024/05/01(水) 14:44:53.87ID:gKfC050z0
ggufも順次公開予定です。少々お待ちください
0905名無しさん@ピンキー (ワントンキン MM1f-jMJY)2024/05/01(水) 15:12:37.00ID:???M
>>901のモデル、yarnのコンテキスト拡張を使っとるんやね
128k対応とかオーバーキル過ぎる
マージレシピ的には、chatntqに各々の抽出vectorを足した感じか
当時はevolveも無かったし、重み調整が大変そうやな
ホントにお疲れ様やで

(これでLCAフォロワーの優れたモデルがまた一つ生まれたわけやな…)
0906マジカル (ワッチョイ a3dd-aBMh)2024/05/01(水) 15:18:11.50ID:gKfC050z0
>>904
Antlerがマージされている開発版だったと思います
0907名無しさん@ピンキー (ワントンキン MM1f-jMJY)2024/05/01(水) 15:32:01.39ID:???M
>>906
開発版だったんか。リリース版は更に改良されていると。凄いなあ

差し障りなかったら尋ねたいんやけど、今後はどんなモデルを作るとかの予定あったりします?
mergekit-evolve使うとか、他のベースやパラメータのを作るとか
内緒なら、この質問はスルーしてください

改めて、お疲れ様でした。良いモデルをリリースしてくれてありがとう
0911名無しさん@ピンキー (ワッチョイ 63c0-joKd)2024/05/01(水) 15:44:04.83ID:???0
それにしてもこの1ヶ月の進捗は劇的だったと思う
>>80が公開されたのが4月3日
それまでは70B以上のモデルで何とかまともな日本語が出せるかという世界だったのになあ
改めて開発者諸ニキに感謝と敬意を捧げるわ
この先の展開が楽しみでたまらない
0919マジカル (ワッチョイ a3dd-4Xr2)2024/05/01(水) 16:54:22.85ID:gKfC050z0
>>907
今日には間に合いませんでしたが、フランケンマージやEvo-mergeモデルも作成しています。
その他モデルのアップデートもすると思います。
Ninjaの強さの秘密はWizard2なのでMistralベース以外のモデルはおそらく作れないと思います。
0921マジカル (ワッチョイ a3dd-4Xr2)2024/05/01(水) 17:08:45.34ID:gKfC050z0
>>909
そうですね
Ninjaと開発途中だったモデルも混ぜて性能を上げてるらしいです
0923名無しさん@ピンキー (ワッチョイ f3fc-7iwU)2024/05/01(水) 17:48:14.71ID:7eBcySVV0
>>922
Kobold.cpp+SillyTavernでNinja-v1-NSFW_Q_8_0.gguf遊ばせてもらってるが、なかなか素晴らしいな
ワイのロールプレイの進め方も関係してるかと思うが、コンテクストサイズのデカさがキャラクターのはがれにくさにつながる反面、やや意固地に感じる部分もあるな
モデルそのものはエロを許容しつつもわりと倫理観しっかりしているなと感じる
素晴らしいモデルの公開サンガツや
0924名無しさん@ピンキー (ワンミングク MM1f-jMJY)2024/05/01(水) 18:01:31.06ID:???M
>>919
返答ありがとう!それは楽しみや!
Wizard2かなるほどなあ。そこが他の子と違うとこやね
確かにWizard2は優秀だし、それを活かしたのがこの凄さに繋がってるのか
参考になります

と思ったらまだWizard2の公式取り消されたままだったわ
MSよ、Wizard2の復活はよ!
0925名無しさん@ピンキー (ワッチョイ 83be-7iwU)2024/05/01(水) 18:30:55.58ID:???0
大きなモデルばっか使ってたから7Bモデルだとチャットを上手くしてくれないんだけど
7Bモデルでも効く良さげなプロンプトってどっかでまとまってたりする?
自分と女の子で会話しようとしてもAIが1人2役でずっと話続けてしまう
0927マジカル (ワッチョイ a3dd-4Xr2)2024/05/01(水) 18:44:40.27ID:gKfC050z0
Vicunaプロンプトでやってみてください
0928名無しさん@ピンキー (ワッチョイ f310-7iwU)2024/05/01(水) 18:51:24.30ID:7eBcySVV0
このVicunaプロンプトで、ってのが正直ワイも今一つよー分からん
誰かKobold、大葉、尻タブを対象にしたチュートリアルまとめてくれんか?
0930名無しさん@ピンキー (ワッチョイ 0332-rdsl)2024/05/01(水) 19:42:27.55ID:???0
>>901
お疲れ様です。
NinjaとVecteusで、いくつか小説を書かせてみましたが、表現力はNinjaが高いですが、
話のまとまりやシナリオの辻褄や整合性はVecteusの方が高い気がしました。
いずれにせよ7Bでこれはすごいですね。
もっと高いパラメータになったら、どうなるか期待です
0932マジカル (ワッチョイ 03b2-4Xr2)2024/05/01(水) 20:52:24.49ID:8IDFQiKt0
大変嬉しいです!ありがとうございます
0934マジカル (ワッチョイ 03b2-4Xr2)2024/05/01(水) 20:54:34.64ID:8IDFQiKt0
NinjaやVecteusを使った感想や問題点をいただけると非常にありがたいです。
0935名無しさん@ピンキー (ワッチョイ 83be-7iwU)2024/05/01(水) 20:57:21.81ID:???0
ChatGPT用に練り込まれたプロンプトならかなりいい結果出るね > Vecteus-v1-gguf
CommandR+は元々ちょっと癖があるからそっち用のプロンプトでは上手くいかない感じだ
0937マジカル (ワッチョイ 03b2-4Xr2)2024/05/01(水) 21:45:22.83ID:8IDFQiKt0
宣伝させていただきます。
https://twitter.com/int_float_
ここのアカウントでNinjaなどの情報を発信する予定です。(もちろんここでも発信します)
0941名無しさん@ピンキー (スップ Sd9f-zsX1)2024/05/01(水) 22:49:51.15ID:???d
記憶を頼りに最近のモデルを纏めてみた
抜けがあったら補足してくれ

話題になったモデル(時系列順)

Mistral-7B系:
LightChatAssistant
Antler-7B-RP
Japanese-Starling-ChatV
Antler-7B-Novel-Writing
SniffyOtter-7B-Novel-Writing-NSFW
Ninja-v1
Vecteus-v1

Llama2-70B系:
karakuri-lm-70b-chat-v0.1
karakuri-MS-01

Cohere系:
c4ai-command-r-v01 (35B)
c4ai-command-r-plus (104B)
0945名無しさん@ピンキー (ワッチョイ 43c6-LnU8)2024/05/01(水) 23:32:08.01ID:???0
最近の軽めモデルは文章は良いんだけど入力指示に従ってくれる感じなのは現状LCAが一番強い感じする
百合書いたらいきなり関係ないおっさんが出てくる感じがある
0947名無しさん@ピンキー (スップ Sd9f-zsX1)2024/05/01(水) 23:45:33.75ID:???d
>>944
HuggingFaceに無くなってるなら追加無しで良いか

mergekit-evolveやってみてるが、メモリ64GB+3060-12GBでも一応全部ローカルで動かせるな
ただマージ後モデルが全部収まるVRAM容量無いと回答生成が遅い
0948名無しさん@ピンキー (ワッチョイ 73b2-dYyJ)2024/05/02(木) 00:21:39.65ID:???0
>>944
ライセンス的にグレーかもしれないから非公開にしたようだ
具体的には評価に使うLLMがLlama系とかCommand R系とかだと出力データ自体に制限がかかるので、そこが懸念点らしい
どっちもウェイトを開示してるだけで、ライセンス的にはオープンソースではなかったからね
0949名無しさん@ピンキー (ワッチョイ d311-h5/x)2024/05/02(木) 00:26:46.73ID:/tw254900
>>941
Llama-3とかPhy-3はないみたいだけど、NSFWが行けるかを基準にしてる?
0950名無しさん@ピンキー (ワッチョイ 7358-5N3P)2024/05/02(木) 00:57:56.50ID:???0
英語圏ってライセンス全く気にしてない感じだけどアレどうなってるんだろう
当たり前のようにGPTの出力学習に使ってapache2.0とかのモデル作ってるし
そもそもllama系は公式のポリシー遵守するならNSFW用のモデルとか作成しちゃダメだけど腐るほどあるし
0952名無しさん@ピンキー (ワッチョイ 43c6-WRNM)2024/05/02(木) 01:16:21.06ID:???0
>>922
使ってみたけどこっちはちゃんと指示に従うし描写の種類も豊富でかなり良い
NSFW版でもお断り率が高い感じするけど、ここは書き直せば良いから無問題
個人的にVecteusはアウトプットの方の文脈を優先で指示に従わない感じがあって使いにくかった
めっちゃ良いモデルありがとうやで
0954名無しさん@ピンキー (ワッチョイ ff1e-1wV0)2024/05/02(木) 02:00:06.27ID:???0
>>916
koboldでエロプロンプトで試させて貰いました!
金玉を「パンパンに張り詰めた長靴下」と表現したのは茶吹きましたw

ところでこれはモデルと関係ないかもですが、koboldで生成してる途中の黄色い文字が、生成結果では最後の方だけ消されて文章が減る現象が結構起こるんですが、これは設定で調整できるんでしょうか?
0955名無しさん@ピンキー (ワッチョイ f310-7iwU)2024/05/02(木) 02:45:32.84ID:1tIZbkbs0
Settings>Advancedの左下の方のTrim Sentecesのチェック外すと全部表示されるはずやで
文末まで出力できなかった文章を表示するか否かの設定や
0958名無しさん@ピンキー (ワッチョイ f310-7iwU)2024/05/02(木) 10:19:56.49ID:1tIZbkbs0
>>957
Instructionモードとか、ChatモードってのはあくまでもWebUIの機能で
API経由でKoboldや大葉使う場合は自前で渡すシステムプロンプトでInstruction的な振る舞いを課したり、
Chat的な振る舞いを課すってのがワイの理解や
0959名無しさん@ピンキー (ワッチョイ f310-7iwU)2024/05/02(木) 10:32:18.71ID:1tIZbkbs0
ところでSillyTavernでCohereのCommand-r-plus使いたいんだが、上手く接続できん
トライアルAPIはValid表示されるが、メッセージのやり取りしようとするとスクショの様なBad Requestエラーがでてしまう
何を見落としてるんやろうか?SillyTavernでCommand-r-plusイケてるニキおったら、教えてくれんか?
https://imgur.com/a/dN0VxYR
0961名無しさん@ピンキー (ワッチョイ a3ff-joKd)2024/05/02(木) 10:39:18.41ID:???0
自分はどこもいじらずcohere選んでAPIキーをペーストしてconnectしたら繋がったな
スクショ見る限り自分と同じに見える
とはいえそれは数日前の話で今帰省中だから再現を確認できん
とりあえずどこか別の画面で設定が必要とかはなさそうよということで
0963名無しさん@ピンキー (ワッチョイ f308-7iwU)2024/05/02(木) 11:01:40.74ID:1tIZbkbs0
>>961
サンガツ、と言うことはちょっと根が深そうやな…。
>>960
NinjaはAPIからは無理って意味がちょっとよく分からんのだが?
ワイはKobold.cppをバックエンドにしてSilly TavernでNinja遊んどるけどふつーに遊んどるが
この際Kobold.cppのAPIをSilly Tavernが叩くって構図なのでSilly TavernをInstructにしておけばえーやろの気持ちや
0964名無しさん@ピンキー (ワッチョイ a3ff-joKd)2024/05/02(木) 11:26:30.02ID:???0
>>963
とりあえずCohereのアカウント新規に作ってトライアルAPIも取得し直してみるのはどうかな
RedditのSillyTavernスレでBad requestで検索したらCohere以外でも悩まされてる人結構いるわ
0965名無しさん@ピンキー (ワッチョイ 83be-7iwU)2024/05/02(木) 12:12:36.19ID:???0
>>963
音声でリアルタイム会話できるようにした自作アプリからNinja使おうと試してるんだよ
でSilly Tavernがどうやってチャットしてるのか確認したら初手「こんばんわ」って挨拶するだけで
5000文字超の長大なプロンプト送信してたわ、今必死に中身解析してるところ
0966名無しさん@ピンキー (ワッチョイ 83be-7iwU)2024/05/02(木) 12:25:30.76ID:???0
Silly Tavernのリクエストの中身見て大体理解したわ
結局どんなモデルにも強制的にチャットさせてる方法は世間で言われてるプロンプトで頑張るやり方じゃなくて
最初からユーザーとAI双方の名前を付けて途中まで会話が進行した履歴をでっち上げてその続きから始めさせるようにして
AIが勝手にユーザーの発言始めるのをストップワードにユーザー名入れてそこで強制的に打ち切るってパワープレイやったわ
0967名無しさん@ピンキー (ワッチョイ cf13-6o3J)2024/05/02(木) 12:29:56.16ID:???0
>>956
サンガツやで!
もうちょっと見やすいようにメニューを構成するのとエロに直接リンク貼れない問題への対処を入れ込んどる

画像生成プロンプト生成なんやがNinjaやVecteusでもそこそこの結果が出とるっぽい
使えそうやったら記事でも補足しておいてもらえたらありがたいで
0968名無しさん@ピンキー (アウアウウー Sa47-zsX1)2024/05/02(木) 12:40:32.26ID:???a
提案になるけどChub aiみたいなキャラカード共有するサイトの日本語版みたいなのがあったら需要ある気がする
他人の書いたキャラカを使い回しできたら文才なくても文章書く手間を省けるからな
0969名無しさん@ピンキー (ワッチョイ e387-6o3J)2024/05/02(木) 13:21:23.57ID:BxbvsKPT0
Vecteusのf16使ってるけど賢くて楽しいわ
小説向けだからかハルシネーションちょっと強めやけど、要約とか一般タスクもサクサクしてくれるのほんと助かる。あと文脈の拾いかたすごいわ
Ninjaの方はQ8の方使ってるからか案外Vecteusよりも更にハルシネーション強めやけど、ミドルスペックでも40t/s出るのはほんまストレスフリーや。f16も試してみたいわ
0970名無しさん@ピンキー (ワッチョイ bf77-joKd)2024/05/02(木) 13:29:55.46ID:???0
>>963
実家に置いてたN100ミニPCにSTインストールしてCohereのトライアルAPI入れたらちゃんと繋がったよ
https://i.imgur.com/zA6LvRx.jpeg
Seraphinaちゃんとチャットできるのも確認した
やはりST側の設定じゃなくて、そちらの接続がうまくいってないんじゃないかと思う
プロキシが悪さしてたりAPIがいつの間にか失効してたりとか色々なケースがあるみたいだ
0972名無しさん@ピンキー (ワッチョイ 83be-7iwU)2024/05/02(木) 14:45:14.02ID:???0
Silly Tavernを参考に何とかNinja使ってローカルだけで無制限に音声会話できるようになったわ
commandR+みたいな大型モデルと違って音声認識で1文字でも誤字があると正確な応答してくれないのは流石にしょうがないな
話してる女の子の名前がハルナだとしてwhisperの誤認識でアルナになってもcommnadR+は察してくれるけど
Ninjaその他の7Bモデルは別人の話だと思ってしまう
0973名無しさん@ピンキー (ワッチョイ 6f69-7iwU)2024/05/02(木) 16:19:35.70ID:aApmX5gk0
>>970
別垢作ってもダメだったんで、Silly Tavernをクリーンインストールしたらすんなりいけたわ!
色々検証してもらったりで助かったで、ありがとうさんや!
0974名無しさん@ピンキー (ワッチョイ 6f69-7iwU)2024/05/02(木) 16:28:11.16ID:aApmX5gk0
>>972
おお、おめでとうさん
>>大型モデルと違って音声認識で1文字でも誤字があると正確な応答してくれない
名前と誤認識のパターンによってはあかんケースもあると思うが、せっかくAPI使ってるなら誤認識の結果の単語の辞書作って、
それらはNinjaに渡す前にアプリ側で全部”ハルナ”に置き換えてからNinjaに渡す方法でどうや?ワイは自作アプリではそんな感じでやってそこそこ機能しとった
なんか面白いアプリ出来たら是非遊ばせてや?
0978名無しさん@ピンキー (ワッチョイ 63c0-joKd)2024/05/02(木) 17:52:18.79ID:???0
次スレはこのままpinkに立てるとして冒頭のテンプレは結構見直す所が多そうだよね
お奨めモデルもかなり入れ替わったしEasyNovelAssistantもテンプレに入れたいな
レス数が950を超えています。1000を超えると書き込みができなくなります。

ニューススポーツなんでも実況