なんJLLM部 避難所
レス数が900を超えています。1000を超えると表示できなくなるよ。
0001名無しさん@ピンキー 転載ダメ (ワッチョイ e249-iArR)2023/12/17(日) 21:48:59.66ID:???0
!extend::vvvvv:1000:512
!extend::vvvvv:1000:512
AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC(できれば+3060 12GB以上)でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ
なんJLLM部 ★6
https://fate.5ch.net/test/read.cgi/liveuranus/1701542705/
VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured
0822名無しさん@ピンキー (ブーイモ MM7f-OTde)2024/04/27(土) 15:24:18.71ID:???M
>>820
なんで法改正せずに「考え方」ってのを国側で示してアウトとセーフのラインを曖昧ながら示していこうっていうのがちょうど今やってる文化庁の文化審議委員会
新聞社やJASRACなんかはそもそも30条の4を廃止しろやって言ってるけどAI立国みたいなの考えてるみたいだし多分今後も柔軟であり続けると思う
0823名無しさん@ピンキー (ワッチョイ f36c-5N3P)2024/04/27(土) 15:46:04.03ID:???0
まぁ生成AI関連は今国が明らかに推してるからね
絵師とかクリエイター側の声は大きいけど(特にSNS)、間違いなく規制は大して強まらないだろうな
0824名無しさん@ピンキー (ワッチョイ 83be-7iwU)2024/04/27(土) 17:12:40.85ID:???0
現実は力を持っている権利者がアウトといえばそれで終わりであんまり法律は関係ない
グッズでも同人でも権利者から通報受けたら警察は容赦なく逮捕してきた歴史がある
0825名無しさん@ピンキー (ワッチョイ f36c-5N3P)2024/04/27(土) 17:18:53.49ID:???0
そりゃグッズや同人は基本黙認とかされてるだけで根本は違法だからね
機械学習用データセットの作成とか配布は根本が合法だからまた話違うよ
0826名無しさん@ピンキー (ワッチョイ 93c0-OTde)2024/04/27(土) 17:19:18.17ID:???0
>>824
それは同人が法的権利が保障されてるわけではないからであって既に例外規定が定められていた生成AIとは事情が少し異なるぞ
ただし「享受目的」って曖昧さを残してるから特定の権利者が損害を訴えてきた時に無敵バリアにならないって理解はすべきなので慎重であるほうがいいってのは同意するが
0827名無しさん@ピンキー (ワッチョイ 73bd-dYyJ)2024/04/27(土) 20:50:09.92ID:???0
表向きはデータセットとして配布してるけど、実質的に享受目的で使われたりすると駄目になるんだろうね
歌詞とかは結構危なそう
サビ部分だけでもコンテンツとして成立するし、権利者が好戦的で訴訟慣れしてる
0828名無しさん@ピンキー (ワッチョイ f36c-5N3P)2024/04/27(土) 21:52:24.21ID:???0
>>827
配布時に機械学習以外の用途での利用はするなと明言しておけば配布側が責任問われないと思うよ
享受目的で利用する奴がいたらその利用者がアウトになるだけだと思う
0829名無しさん@ピンキー (ワンミングク MM1f-jMJY)2024/04/27(土) 22:07:51.71ID:???M
7Bモデルのいい感じのが沢山出とって試しとるけど、入力プロンプトが長くなると幻覚気味になるな
1200トークン辺りで設定が蒸発してくる感じ
MaxContextSizeより少ない分でも起きる
表現とか自然さは7Bでもめっちゃ良くなってきたけどこれは低パラではどうしようもないんかなあ
0832名無しさん@ピンキー (ワンミングク MM1f-jMJY)2024/04/27(土) 22:48:19.93ID:???M
GPTスレのプロンプトをローカル用に書き換えて使ってると上手くいかないのが多くて気になった
妄想ジェネレータ入れたら、登場人物が「俺の職業は妄想ジェネレータ」とか言い出して吹いたわ
0834名無しさん@ピンキー (ワンミングク MM1f-jMJY)2024/04/27(土) 23:03:06.73ID:???M
試した感じパラ数の多いkarakuri-MS-01とLightChatAssistant-TypeBでは通るっぽい
7Bの限界かもしれん
速度を考えると13B〜35Bクラスが充実してほしくなるな
Antler的なモデルがこんくらいで出てくれんかな
0836名無しさん@ピンキー (ワンミングク MM1f-jMJY)2024/04/28(日) 03:57:00.81ID:???M
umiyukiがmergekit-evolveの記事書いとったの読んでみた
タメになったわ。ローカルで全部完結できるらしい
しかしこれSSDがめっちゃ消耗しそうやな

あと本人見てたら言っておきたいのは、Mistral7B系の優秀なんが最近出てきたのは、元を辿ればLCAニキがchatntqやantlerをこのスレで広めたからやで
記事で使ってたモデルもその流れで生まれたもんや
記事には無かったけどそこんとこ覚えておいてや
0839名無しさん@ピンキー (ワッチョイ cf13-6o3J)2024/04/28(日) 10:41:47.43ID:???0
LCAニキつながりポエムやが

>>835
> 一つの行動(触るとか)に対して表現のパターンが多くて良い、気がする。
> LLM初心者だけど。
みたいな評価はふわっとしとるんやが日本語LLMでは大切な印象やね

日本語LLMでベンチマーク自慢を試してみてガッカリする経験を何度も積むと
>>787
> かなり上手く書けてる気がするわ
> ちゃんとキーワードとかジャンルの指示にも従ってくれてるっぽい
みたいな人間によるふわっとした評価の打率が高くてすごく貴重なんや

>>573
のLCA-TypeBも手作業で改造と評価がなされていて何がとはいえんのやがなんかええんよね
ベンチマーク以上に日本語ネイティブが楽しめる出力が生成されとる印象や

日本語でのなんかええなをいずれ数値化できたら自動の学習やマージの精度が上がりそうで楽しみやね
0841名無しさん@ピンキー (ワンミングク MM1f-jMJY)2024/04/28(日) 11:31:25.41ID:???M
>>838
モデルの出力先をRAMdiskにすればいいのではないかとちと思った
更にRAMの容量が必要になるからお手軽ではなくなるが

>>840
手動評価は、自動評価より回数がこなせないのがネックやね
現状だとある程度自動で絞り込んでから残りは手動、でできれば効率いいかもしれん
どっちにしろ最終的には>>839が言うような評価の数値化があればより良く出来そうと思う
0844名無しさん@ピンキー (ワッチョイ 83be-7iwU)2024/04/28(日) 17:14:34.57ID:???0
初歩的な質問ですまん、16bitのsafetensorsをlamacppでggufに変換するときオプション指定しないと32bitになってしまう。
でもq16_K_Mを指定するとunrecognized argumentsになる。
どうすれば元の16bitのままで量子化できるの?
0851名無しさん@ピンキー (ワンミングク MM1f-jMJY)2024/04/28(日) 18:06:19.77ID:???M
だよなあ。上がらないどころかむしろ下がってる感
元モデルから丸くなって良くも悪くもエロいクセがなくなってる感じ
自分的には>>787の方が好きだな

総合性能はガン上がりしてるから、エロを考慮するベンチプロンプトを作れば期待できる
モデル作りよりベンチ考えてマージ職人にお任せした方がいいだろうか
それなりスペック無いとevolveできんしなあ
0853名無しさん@ピンキー (ワッチョイ d311-h5/x)2024/04/28(日) 20:15:04.55ID:xq028QgX0
Dolphin 2.9っていうLlama 3 70BをLoRAした無修正モデル試して見た
確かに修正は外れてて、日本語の違法なリクエストにも答えてくれることがある
ただ、だいたいおかしな内容で、数発打てば当たるって感じで実用性はないなぁ
残念
0855名無しさん@ピンキー (ワッチョイ d311-h5/x)2024/04/28(日) 21:37:32.38ID:xq028QgX0
システムプロンプト日本語で、質問英語でやった時はLlama 3定型文でお断りされたけど、全部英語は試してないや
まああとで試してみるか
0857名無しさん@ピンキー (ワッチョイ cfa8-7iwU)2024/04/29(月) 01:31:55.47ID:rypy5OCM0
>>856
なんか人口無能うずら思い出したわ
0858名無しさん@ピンキー (ワッチョイ 53d4-rT8g)2024/04/29(月) 12:09:08.28ID:???0
ドーモnote屋です

EasyNovelAssistant用のプロンプトについて記事書いてたが今仕事先で投稿できんかったんで先にこっそり公開するわ、雑感としては効果ありそうなんでお休み中の方は使ってクレメンス
https://github.com/kgmkm/goalseek_ad

作例は投稿予定、昔の小説とか自作発言せんかぎり自由につこてもろて
0859名無しさん@ピンキー (ワンミングク MM1f-jMJY)2024/04/29(月) 12:19:45.76ID:???M
evolveのエロ評価用ベンチマーク作ろうと思ったんやけど、評価者に使うモデルは何が良いんかな
evolveの評価者にGeminiを使ってる記事があって、でもGeminiはエロ駄目やろうし
評価者に使うモデルで採点の傾向が違ったら嫌やしなあ
0862名無しさん@ピンキー (ワッチョイ cf13-6o3J)2024/04/29(月) 17:08:45.13ID:???0
>>858
サンガツ!

ちょっと今EasyNovelAssistantにStyle-Bert-VITS2連携をつっこんどる最中なんで少し後にはなるんやが
ヘルプメニューからGitHubにリンク貼りつつサンプルメニューにinit_editor.txtとinit_writer.txtを追加さしてもらおうと思っとるで

サンプルメニュー開いた時にGitHubから取得するようにもできるんはずなでファイル名が変わらんのやったらアプデにも追随できるはずや
リンク先がnote記事のほうがええとかあったら都度伝えてもろうたら

紹介する時はアイコンやIDから@kagami_kami_mニキとして紹介させてもろたらええやろか?
0863名無しさん@ピンキー (ワンミングク MM1f-jMJY)2024/04/29(月) 17:38:21.81ID:???M
>>861
短文の判定だとエロ語出力以外の能力落ちそうやから最低限ElyzaTaskの判定できるくらいのほしい、てなるとCommand-R+かなあ
方針としては、Aの出力文とBの出力文を比較してどちらがより高得点か、てのを自分の感覚と照らし合わせて、評価プロンプトの[評価基準]を随時修正していこうかと考えてる
最終的に自分好みの表現を高得点とできるように調整できれば良き
プロンプトは全然知識ないからどこまでできるか分からんけども、よくわからんからこそ挑戦してみるわ

手動評価は最終手段かな。200回以上手動評価はキツいわ…
0864名無しさん@ピンキー (ワッチョイ 83be-7iwU)2024/04/29(月) 20:44:33.58ID:???0
長編ADVみたいなロールプレイを上手くさせる方法ってないのかな?
最初は良くてもターン数重ねるとどんどん出力が短くなったり同じ応答ばかりになってしまう。
0865名無しさん@ピンキー (ワッチョイ 6f87-4Xr2)2024/04/29(月) 22:27:04.55ID:???0
>>864
チャット風ロールプレイでやってる方法だけど、
「今までの内容を要約してくれ」って要約を作らせてプロンプト差し替えてる
要約を英語で作らせると精度上がったりする
0869名無しさん@ピンキー (ワッチョイ 93c0-Ub2H)2024/04/30(火) 12:33:40.47ID:???0
gpt2-chatbotという謎のモデルがchat.lmsys.orgでテストできるようになってなんか話題になっとるな
前評判ではGPT4レベルだとかアスキーアートが生成できるとか言われてて、わいも日本語でSFWな音声作品の脚本書かせてみたけど申し訳もされずCommand R+と同等かそれ以上の分かってる文章を生成してびっくりした
うわさではGPT4.5がゲリラマーケティングされてるとか言われてるけどなんなんやろうね
0875名無しさん@ピンキー (ワッチョイ 83be-7iwU)2024/04/30(火) 18:11:37.01ID:???0
自作アプリでAIと音声会話するのかなりできるようになって来たけど意外な敵が部屋のノイズで苦しんでるわ
PCのファンの音すら拾って「これはまだ発言が続いてんな?」ってずっと発言終了待機してクッソ応答が遅くなる
0880名無しさん@ピンキー (ワッチョイ 0369-5N3P)2024/04/30(火) 20:43:06.12ID:???0
音声良いね
音声ありはどちらかというと小説読み上げよりもロールプレイとかなりきりチャット的な用途で欲しいな…(俺がエロチャ大好きなだけかもしれんが)
0881名無しさん@ピンキー (ワッチョイ f314-BrOF)2024/04/30(火) 20:56:46.66ID:Iv4x6b4N0
Llama3 70Bよりもcommand R +の方が自然な日本語を返してくれる気がする。
日本語のベンチマークではどっちが上なんだろうね?
0882名無しさん@ピンキー (ワッチョイ f314-M43A)2024/04/30(火) 20:57:00.91ID:Iv4x6b4N0
Llama3 70Bよりもcommand R +の方が自然な日本語を返してくれる気がする。
日本語のベンチマークではどっちが上なんだろうね?
0883名無しさん@ピンキー (ワッチョイ f34f-5N3P)2024/04/30(火) 21:06:13.88ID:???0
Command R+の方が上のはず
そもそもllama-3は公式的には多言語対応じゃない(多言語対応版も後で出しますよみたいなのをリリース文に入れてたはず)
0884名無しさん@ピンキー (ワッチョイ 5380-7iwU)2024/04/30(火) 21:20:09.31ID:MXycCz7k0
GPT2を変な形でお披露目したOpenAIの真意はなんだろな?
0888名無しさん@ピンキー (ワッチョイ d311-h5/x)2024/04/30(火) 22:44:22.41ID:fAUnlGYu0
LLMの読み上げは、BOOTHに上がってるAnneliとかいうNSFWのstyle-bert-vits2のモデル(を自分で学習したモデルとマージしたやつ)使ってるんだけど、学習データの出所不明で人に勧めづらいんだよな
ここで読み上げやってるやつは何使ってるの?
0891名無しさん@ピンキー (ワッチョイ d311-h5/x)2024/05/01(水) 00:06:01.28ID:5ix3SE930
俺もそうだが、やっぱりASMRとかで学習させてるやつが多いか
まあ背景に変な音とかなくて使いやすいよね
0893名無しさん@ピンキー (ワッチョイ 7fe6-1wV0)2024/05/01(水) 08:15:54.11ID:???0
Command +RをAPI経由かウェブかローカルでもいいのでお手軽に実行できる環境ってある?
ローカルだと4090+64GBメモリでもキツイと聞いたので。。。
0896名無しさん@ピンキー (ワッチョイ d311-h5/x)2024/05/01(水) 09:47:53.49ID:5ix3SE930
公式ページにも普通にChat UIあるからそれでもいいと思う
0898名無しさん@ピンキー (ワントンキン MM1f-jMJY)2024/05/01(水) 12:10:06.00ID:???M
NovelHacja/vecters-v1
5/1の人のモデルかな?
今日やってるLOCAL AI HACKATHON #001で出したモデルらしい
メンバーがHFに出してたモデル見ると、Antler系とchatntqを使ってる
これもそうだったら、このスレの功績がまた一つ増えたことになるな
0900名無しさん@ピンキー (スップ Sd9f-zsX1)2024/05/01(水) 13:59:00.72ID:???d
まあ最近出てきてるMistralの日本語強いやつは皆LCAの影響受けてんじゃね
あれから一気に数出てくるようになったし
願わくばこのままどんどん良くなっていってほしいもんだ
0902名無しさん@ピンキー (ワッチョイ 73c6-2TDZ)2024/05/01(水) 14:40:47.10ID:???0
面白そうだがLMstudioユーザーで知識も環境もないワイはgguf待ちやな…
Vecteus-v1はggufあるみたいだがVRAM 16GBじゃ乗らんわ
ハッカソンとやらは覗いてみるか
0903マジカル (ワッチョイ a3dd-aBMh)2024/05/01(水) 14:44:53.87ID:gKfC050z0
ggufも順次公開予定です。少々お待ちください
0905名無しさん@ピンキー (ワントンキン MM1f-jMJY)2024/05/01(水) 15:12:37.00ID:???M
>>901のモデル、yarnのコンテキスト拡張を使っとるんやね
128k対応とかオーバーキル過ぎる
マージレシピ的には、chatntqに各々の抽出vectorを足した感じか
当時はevolveも無かったし、重み調整が大変そうやな
ホントにお疲れ様やで

(これでLCAフォロワーの優れたモデルがまた一つ生まれたわけやな…)
0906マジカル (ワッチョイ a3dd-aBMh)2024/05/01(水) 15:18:11.50ID:gKfC050z0
>>904
Antlerがマージされている開発版だったと思います
0907名無しさん@ピンキー (ワントンキン MM1f-jMJY)2024/05/01(水) 15:32:01.39ID:???M
>>906
開発版だったんか。リリース版は更に改良されていると。凄いなあ

差し障りなかったら尋ねたいんやけど、今後はどんなモデルを作るとかの予定あったりします?
mergekit-evolve使うとか、他のベースやパラメータのを作るとか
内緒なら、この質問はスルーしてください

改めて、お疲れ様でした。良いモデルをリリースしてくれてありがとう
0911名無しさん@ピンキー (ワッチョイ 63c0-joKd)2024/05/01(水) 15:44:04.83ID:???0
それにしてもこの1ヶ月の進捗は劇的だったと思う
>>80が公開されたのが4月3日
それまでは70B以上のモデルで何とかまともな日本語が出せるかという世界だったのになあ
改めて開発者諸ニキに感謝と敬意を捧げるわ
この先の展開が楽しみでたまらない
0919マジカル (ワッチョイ a3dd-4Xr2)2024/05/01(水) 16:54:22.85ID:gKfC050z0
>>907
今日には間に合いませんでしたが、フランケンマージやEvo-mergeモデルも作成しています。
その他モデルのアップデートもすると思います。
Ninjaの強さの秘密はWizard2なのでMistralベース以外のモデルはおそらく作れないと思います。
0921マジカル (ワッチョイ a3dd-4Xr2)2024/05/01(水) 17:08:45.34ID:gKfC050z0
>>909
そうですね
Ninjaと開発途中だったモデルも混ぜて性能を上げてるらしいです
レス数が900を超えています。1000を超えると表示できなくなるよ。

ニューススポーツなんでも実況