なんJLLM部 避難所
レス数が900を超えています。1000を超えると表示できなくなるよ。
0001名無しさん@ピンキー 転載ダメ (ワッチョイ e249-iArR)2023/12/17(日) 21:48:59.66ID:???0
!extend::vvvvv:1000:512
!extend::vvvvv:1000:512
AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC(できれば+3060 12GB以上)でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ
なんJLLM部 ★6
https://fate.5ch.net/test/read.cgi/liveuranus/1701542705/
VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured
0851名無しさん@ピンキー (ワンミングク MM1f-jMJY)2024/04/28(日) 18:06:19.77ID:???M
だよなあ。上がらないどころかむしろ下がってる感
元モデルから丸くなって良くも悪くもエロいクセがなくなってる感じ
自分的には>>787の方が好きだな

総合性能はガン上がりしてるから、エロを考慮するベンチプロンプトを作れば期待できる
モデル作りよりベンチ考えてマージ職人にお任せした方がいいだろうか
それなりスペック無いとevolveできんしなあ
0853名無しさん@ピンキー (ワッチョイ d311-h5/x)2024/04/28(日) 20:15:04.55ID:xq028QgX0
Dolphin 2.9っていうLlama 3 70BをLoRAした無修正モデル試して見た
確かに修正は外れてて、日本語の違法なリクエストにも答えてくれることがある
ただ、だいたいおかしな内容で、数発打てば当たるって感じで実用性はないなぁ
残念
0855名無しさん@ピンキー (ワッチョイ d311-h5/x)2024/04/28(日) 21:37:32.38ID:xq028QgX0
システムプロンプト日本語で、質問英語でやった時はLlama 3定型文でお断りされたけど、全部英語は試してないや
まああとで試してみるか
0857名無しさん@ピンキー (ワッチョイ cfa8-7iwU)2024/04/29(月) 01:31:55.47ID:rypy5OCM0
>>856
なんか人口無能うずら思い出したわ
0858名無しさん@ピンキー (ワッチョイ 53d4-rT8g)2024/04/29(月) 12:09:08.28ID:???0
ドーモnote屋です

EasyNovelAssistant用のプロンプトについて記事書いてたが今仕事先で投稿できんかったんで先にこっそり公開するわ、雑感としては効果ありそうなんでお休み中の方は使ってクレメンス
https://github.com/kgmkm/goalseek_ad

作例は投稿予定、昔の小説とか自作発言せんかぎり自由につこてもろて
0859名無しさん@ピンキー (ワンミングク MM1f-jMJY)2024/04/29(月) 12:19:45.76ID:???M
evolveのエロ評価用ベンチマーク作ろうと思ったんやけど、評価者に使うモデルは何が良いんかな
evolveの評価者にGeminiを使ってる記事があって、でもGeminiはエロ駄目やろうし
評価者に使うモデルで採点の傾向が違ったら嫌やしなあ
0862名無しさん@ピンキー (ワッチョイ cf13-6o3J)2024/04/29(月) 17:08:45.13ID:???0
>>858
サンガツ!

ちょっと今EasyNovelAssistantにStyle-Bert-VITS2連携をつっこんどる最中なんで少し後にはなるんやが
ヘルプメニューからGitHubにリンク貼りつつサンプルメニューにinit_editor.txtとinit_writer.txtを追加さしてもらおうと思っとるで

サンプルメニュー開いた時にGitHubから取得するようにもできるんはずなでファイル名が変わらんのやったらアプデにも追随できるはずや
リンク先がnote記事のほうがええとかあったら都度伝えてもろうたら

紹介する時はアイコンやIDから@kagami_kami_mニキとして紹介させてもろたらええやろか?
0863名無しさん@ピンキー (ワンミングク MM1f-jMJY)2024/04/29(月) 17:38:21.81ID:???M
>>861
短文の判定だとエロ語出力以外の能力落ちそうやから最低限ElyzaTaskの判定できるくらいのほしい、てなるとCommand-R+かなあ
方針としては、Aの出力文とBの出力文を比較してどちらがより高得点か、てのを自分の感覚と照らし合わせて、評価プロンプトの[評価基準]を随時修正していこうかと考えてる
最終的に自分好みの表現を高得点とできるように調整できれば良き
プロンプトは全然知識ないからどこまでできるか分からんけども、よくわからんからこそ挑戦してみるわ

手動評価は最終手段かな。200回以上手動評価はキツいわ…
0864名無しさん@ピンキー (ワッチョイ 83be-7iwU)2024/04/29(月) 20:44:33.58ID:???0
長編ADVみたいなロールプレイを上手くさせる方法ってないのかな?
最初は良くてもターン数重ねるとどんどん出力が短くなったり同じ応答ばかりになってしまう。
0865名無しさん@ピンキー (ワッチョイ 6f87-4Xr2)2024/04/29(月) 22:27:04.55ID:???0
>>864
チャット風ロールプレイでやってる方法だけど、
「今までの内容を要約してくれ」って要約を作らせてプロンプト差し替えてる
要約を英語で作らせると精度上がったりする
0869名無しさん@ピンキー (ワッチョイ 93c0-Ub2H)2024/04/30(火) 12:33:40.47ID:???0
gpt2-chatbotという謎のモデルがchat.lmsys.orgでテストできるようになってなんか話題になっとるな
前評判ではGPT4レベルだとかアスキーアートが生成できるとか言われてて、わいも日本語でSFWな音声作品の脚本書かせてみたけど申し訳もされずCommand R+と同等かそれ以上の分かってる文章を生成してびっくりした
うわさではGPT4.5がゲリラマーケティングされてるとか言われてるけどなんなんやろうね
0875名無しさん@ピンキー (ワッチョイ 83be-7iwU)2024/04/30(火) 18:11:37.01ID:???0
自作アプリでAIと音声会話するのかなりできるようになって来たけど意外な敵が部屋のノイズで苦しんでるわ
PCのファンの音すら拾って「これはまだ発言が続いてんな?」ってずっと発言終了待機してクッソ応答が遅くなる
0880名無しさん@ピンキー (ワッチョイ 0369-5N3P)2024/04/30(火) 20:43:06.12ID:???0
音声良いね
音声ありはどちらかというと小説読み上げよりもロールプレイとかなりきりチャット的な用途で欲しいな…(俺がエロチャ大好きなだけかもしれんが)
0881名無しさん@ピンキー (ワッチョイ f314-BrOF)2024/04/30(火) 20:56:46.66ID:Iv4x6b4N0
Llama3 70Bよりもcommand R +の方が自然な日本語を返してくれる気がする。
日本語のベンチマークではどっちが上なんだろうね?
0882名無しさん@ピンキー (ワッチョイ f314-M43A)2024/04/30(火) 20:57:00.91ID:Iv4x6b4N0
Llama3 70Bよりもcommand R +の方が自然な日本語を返してくれる気がする。
日本語のベンチマークではどっちが上なんだろうね?
0883名無しさん@ピンキー (ワッチョイ f34f-5N3P)2024/04/30(火) 21:06:13.88ID:???0
Command R+の方が上のはず
そもそもllama-3は公式的には多言語対応じゃない(多言語対応版も後で出しますよみたいなのをリリース文に入れてたはず)
0884名無しさん@ピンキー (ワッチョイ 5380-7iwU)2024/04/30(火) 21:20:09.31ID:MXycCz7k0
GPT2を変な形でお披露目したOpenAIの真意はなんだろな?
0888名無しさん@ピンキー (ワッチョイ d311-h5/x)2024/04/30(火) 22:44:22.41ID:fAUnlGYu0
LLMの読み上げは、BOOTHに上がってるAnneliとかいうNSFWのstyle-bert-vits2のモデル(を自分で学習したモデルとマージしたやつ)使ってるんだけど、学習データの出所不明で人に勧めづらいんだよな
ここで読み上げやってるやつは何使ってるの?
0891名無しさん@ピンキー (ワッチョイ d311-h5/x)2024/05/01(水) 00:06:01.28ID:5ix3SE930
俺もそうだが、やっぱりASMRとかで学習させてるやつが多いか
まあ背景に変な音とかなくて使いやすいよね
0893名無しさん@ピンキー (ワッチョイ 7fe6-1wV0)2024/05/01(水) 08:15:54.11ID:???0
Command +RをAPI経由かウェブかローカルでもいいのでお手軽に実行できる環境ってある?
ローカルだと4090+64GBメモリでもキツイと聞いたので。。。
0896名無しさん@ピンキー (ワッチョイ d311-h5/x)2024/05/01(水) 09:47:53.49ID:5ix3SE930
公式ページにも普通にChat UIあるからそれでもいいと思う
0898名無しさん@ピンキー (ワントンキン MM1f-jMJY)2024/05/01(水) 12:10:06.00ID:???M
NovelHacja/vecters-v1
5/1の人のモデルかな?
今日やってるLOCAL AI HACKATHON #001で出したモデルらしい
メンバーがHFに出してたモデル見ると、Antler系とchatntqを使ってる
これもそうだったら、このスレの功績がまた一つ増えたことになるな
0900名無しさん@ピンキー (スップ Sd9f-zsX1)2024/05/01(水) 13:59:00.72ID:???d
まあ最近出てきてるMistralの日本語強いやつは皆LCAの影響受けてんじゃね
あれから一気に数出てくるようになったし
願わくばこのままどんどん良くなっていってほしいもんだ
0902名無しさん@ピンキー (ワッチョイ 73c6-2TDZ)2024/05/01(水) 14:40:47.10ID:???0
面白そうだがLMstudioユーザーで知識も環境もないワイはgguf待ちやな…
Vecteus-v1はggufあるみたいだがVRAM 16GBじゃ乗らんわ
ハッカソンとやらは覗いてみるか
0903マジカル (ワッチョイ a3dd-aBMh)2024/05/01(水) 14:44:53.87ID:gKfC050z0
ggufも順次公開予定です。少々お待ちください
0905名無しさん@ピンキー (ワントンキン MM1f-jMJY)2024/05/01(水) 15:12:37.00ID:???M
>>901のモデル、yarnのコンテキスト拡張を使っとるんやね
128k対応とかオーバーキル過ぎる
マージレシピ的には、chatntqに各々の抽出vectorを足した感じか
当時はevolveも無かったし、重み調整が大変そうやな
ホントにお疲れ様やで

(これでLCAフォロワーの優れたモデルがまた一つ生まれたわけやな…)
0906マジカル (ワッチョイ a3dd-aBMh)2024/05/01(水) 15:18:11.50ID:gKfC050z0
>>904
Antlerがマージされている開発版だったと思います
0907名無しさん@ピンキー (ワントンキン MM1f-jMJY)2024/05/01(水) 15:32:01.39ID:???M
>>906
開発版だったんか。リリース版は更に改良されていると。凄いなあ

差し障りなかったら尋ねたいんやけど、今後はどんなモデルを作るとかの予定あったりします?
mergekit-evolve使うとか、他のベースやパラメータのを作るとか
内緒なら、この質問はスルーしてください

改めて、お疲れ様でした。良いモデルをリリースしてくれてありがとう
0911名無しさん@ピンキー (ワッチョイ 63c0-joKd)2024/05/01(水) 15:44:04.83ID:???0
それにしてもこの1ヶ月の進捗は劇的だったと思う
>>80が公開されたのが4月3日
それまでは70B以上のモデルで何とかまともな日本語が出せるかという世界だったのになあ
改めて開発者諸ニキに感謝と敬意を捧げるわ
この先の展開が楽しみでたまらない
0919マジカル (ワッチョイ a3dd-4Xr2)2024/05/01(水) 16:54:22.85ID:gKfC050z0
>>907
今日には間に合いませんでしたが、フランケンマージやEvo-mergeモデルも作成しています。
その他モデルのアップデートもすると思います。
Ninjaの強さの秘密はWizard2なのでMistralベース以外のモデルはおそらく作れないと思います。
0921マジカル (ワッチョイ a3dd-4Xr2)2024/05/01(水) 17:08:45.34ID:gKfC050z0
>>909
そうですね
Ninjaと開発途中だったモデルも混ぜて性能を上げてるらしいです
0923名無しさん@ピンキー (ワッチョイ f3fc-7iwU)2024/05/01(水) 17:48:14.71ID:7eBcySVV0
>>922
Kobold.cpp+SillyTavernでNinja-v1-NSFW_Q_8_0.gguf遊ばせてもらってるが、なかなか素晴らしいな
ワイのロールプレイの進め方も関係してるかと思うが、コンテクストサイズのデカさがキャラクターのはがれにくさにつながる反面、やや意固地に感じる部分もあるな
モデルそのものはエロを許容しつつもわりと倫理観しっかりしているなと感じる
素晴らしいモデルの公開サンガツや
0924名無しさん@ピンキー (ワンミングク MM1f-jMJY)2024/05/01(水) 18:01:31.06ID:???M
>>919
返答ありがとう!それは楽しみや!
Wizard2かなるほどなあ。そこが他の子と違うとこやね
確かにWizard2は優秀だし、それを活かしたのがこの凄さに繋がってるのか
参考になります

と思ったらまだWizard2の公式取り消されたままだったわ
MSよ、Wizard2の復活はよ!
0925名無しさん@ピンキー (ワッチョイ 83be-7iwU)2024/05/01(水) 18:30:55.58ID:???0
大きなモデルばっか使ってたから7Bモデルだとチャットを上手くしてくれないんだけど
7Bモデルでも効く良さげなプロンプトってどっかでまとまってたりする?
自分と女の子で会話しようとしてもAIが1人2役でずっと話続けてしまう
0927マジカル (ワッチョイ a3dd-4Xr2)2024/05/01(水) 18:44:40.27ID:gKfC050z0
Vicunaプロンプトでやってみてください
0928名無しさん@ピンキー (ワッチョイ f310-7iwU)2024/05/01(水) 18:51:24.30ID:7eBcySVV0
このVicunaプロンプトで、ってのが正直ワイも今一つよー分からん
誰かKobold、大葉、尻タブを対象にしたチュートリアルまとめてくれんか?
0930名無しさん@ピンキー (ワッチョイ 0332-rdsl)2024/05/01(水) 19:42:27.55ID:???0
>>901
お疲れ様です。
NinjaとVecteusで、いくつか小説を書かせてみましたが、表現力はNinjaが高いですが、
話のまとまりやシナリオの辻褄や整合性はVecteusの方が高い気がしました。
いずれにせよ7Bでこれはすごいですね。
もっと高いパラメータになったら、どうなるか期待です
0932マジカル (ワッチョイ 03b2-4Xr2)2024/05/01(水) 20:52:24.49ID:8IDFQiKt0
大変嬉しいです!ありがとうございます
0934マジカル (ワッチョイ 03b2-4Xr2)2024/05/01(水) 20:54:34.64ID:8IDFQiKt0
NinjaやVecteusを使った感想や問題点をいただけると非常にありがたいです。
0935名無しさん@ピンキー (ワッチョイ 83be-7iwU)2024/05/01(水) 20:57:21.81ID:???0
ChatGPT用に練り込まれたプロンプトならかなりいい結果出るね > Vecteus-v1-gguf
CommandR+は元々ちょっと癖があるからそっち用のプロンプトでは上手くいかない感じだ
0937マジカル (ワッチョイ 03b2-4Xr2)2024/05/01(水) 21:45:22.83ID:8IDFQiKt0
宣伝させていただきます。
https://twitter.com/int_float_
ここのアカウントでNinjaなどの情報を発信する予定です。(もちろんここでも発信します)
0941名無しさん@ピンキー (スップ Sd9f-zsX1)2024/05/01(水) 22:49:51.15ID:???d
記憶を頼りに最近のモデルを纏めてみた
抜けがあったら補足してくれ

話題になったモデル(時系列順)

Mistral-7B系:
LightChatAssistant
Antler-7B-RP
Japanese-Starling-ChatV
Antler-7B-Novel-Writing
SniffyOtter-7B-Novel-Writing-NSFW
Ninja-v1
Vecteus-v1

Llama2-70B系:
karakuri-lm-70b-chat-v0.1
karakuri-MS-01

Cohere系:
c4ai-command-r-v01 (35B)
c4ai-command-r-plus (104B)
0945名無しさん@ピンキー (ワッチョイ 43c6-LnU8)2024/05/01(水) 23:32:08.01ID:???0
最近の軽めモデルは文章は良いんだけど入力指示に従ってくれる感じなのは現状LCAが一番強い感じする
百合書いたらいきなり関係ないおっさんが出てくる感じがある
0947名無しさん@ピンキー (スップ Sd9f-zsX1)2024/05/01(水) 23:45:33.75ID:???d
>>944
HuggingFaceに無くなってるなら追加無しで良いか

mergekit-evolveやってみてるが、メモリ64GB+3060-12GBでも一応全部ローカルで動かせるな
ただマージ後モデルが全部収まるVRAM容量無いと回答生成が遅い
0948名無しさん@ピンキー (ワッチョイ 73b2-dYyJ)2024/05/02(木) 00:21:39.65ID:???0
>>944
ライセンス的にグレーかもしれないから非公開にしたようだ
具体的には評価に使うLLMがLlama系とかCommand R系とかだと出力データ自体に制限がかかるので、そこが懸念点らしい
どっちもウェイトを開示してるだけで、ライセンス的にはオープンソースではなかったからね
レス数が900を超えています。1000を超えると表示できなくなるよ。

ニューススポーツなんでも実況