なんJLLM部避難所 ★2

1002コメント390KB

なんJLLM部避難所 ★2

■ このスレッドは過去ログ倉庫に格納されています

0001名無しさん＠ピンキー転載ダメ (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:27:25.10ID:???0

!extend::vvvvv:1000:512
!extend::vvvvv:1000:512
AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(スクリプト攻撃継続中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所
https://mercury.bbspink.com/test/read.cgi/onatech/1702817339/

-
VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured

VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured

0333名無しさん＠ピンキー (ﾜｯﾁｮｲ 6ff8-CcWV)

2024/05/15(水) 16:38:21.25ID:???0

>>332
わかる
動揺すると文章もカオスになるから感情を感じるわ

0334名無しさん＠ピンキー (ﾜﾝﾄﾝｷﾝ MM7f-ORsk)

2024/05/15(水) 17:09:41.54ID:???M

nejumおせえんだけどこんなんでいいと思ってんの？作り直せよ

0335名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr5f-T/4c)

2024/05/15(水) 17:33:04.98ID:???r

>>332
どんな風に投げてるのか是非知りたい

0336名無しさん＠ピンキー (ﾜｯﾁｮｲ cb13-l/GH)

2024/05/15(水) 20:45:04.25ID:???0

来月には27BのGemma2がリリース予定、Llama3に匹敵
現行のGemmaでも日本語そこそこで商業利用OKだし期待

0337名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f7a-vfni)

2024/05/15(水) 20:47:16.88ID:???0

ぬわーっ！

0338名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f82-JZQp)

2024/05/15(水) 22:48:33.94ID:Q+EZVuAM0

初心者丸出しの質問で申し訳ないんですけど、EasyNovelAssistantってファイルや文章をもとに学習させることって出来るんでしょうか？

0339!donguri (ﾜｯﾁｮｲ bba0-aVBI)

2024/05/15(水) 22:51:41.78ID:???0

基本的な学習は家庭環境では無理です。
LoRAという簡易学習ができるくらい

0340名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f7a-AdtJ)

2024/05/15(水) 23:06:59.98ID:???0

AIにまでなんJの奴らみたいな返事されたら萎えるわｗ

0341名無しさん＠ピンキー (ﾜｯﾁｮｲ 5b7a-Bhq0)

2024/05/15(水) 23:37:44.95ID:???0

なんJシミュレータプロンプト誰か考えて

0342名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f71-3+jw)

2024/05/16(木) 00:10:58.70ID:???0

作った世界設定や人物設定とかをいちいちプロンプト書き換えるの面倒だから使ってるモデル合わせて学習させてぇ

0343名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f80-yODs)

2024/05/16(木) 00:13:38.81ID:???0

chatgptでGPT-4oを選択

5chの何でも実況Jのスレッドをシミュレートして下さい。
スレッドのタイトルは「なんJ◯◯部」

とりまこれでできた

0344名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f0a-XTDy)

2024/05/16(木) 00:27:49.35ID:???0

昔opus用のやつがあのスレに転がってたよな

0345名無しさん＠ピンキー (ﾜｯﾁｮｲ 1bbe-JZQp)

2024/05/16(木) 01:25:59.65ID:???0

>>282の問題、GPT-4oでも答えられなくて現行のAIの限界を感じる

0346名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b8d-/Dhl)

2024/05/16(木) 01:31:28.31ID:???0

AI技術の行き着く先がなんjのシミュレートは嫌過ぎる

0347名無しさん＠ピンキー (ﾜｯﾁｮｲ 4bc9-JZQp)

2024/05/16(木) 07:12:22.46ID:???0

ウミユキ＝サンが紹介してたMoE-TESTのひとの新モデルも良さそうね
プロット段階だけど安定してる
だけど違い解っとらん

https://huggingface.co/dddump/Japanese-Chat-Evolve-TEST-7B-NSFW-gguf

0348名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b32-vfni)

2024/05/16(木) 07:21:01.24ID:???0

>>344
◯問題
東京駅で山手線に乗り、有楽町駅を過ぎて新橋駅で降りた。明日は、この駅ではなく次の駅に用事がある。
ここでいう、「この駅」の名前を答えよ

↑
こうすると、今調整してるモデルなら正解する。
ちなcommand-r-plusで試したら、これでも間違える

0349名無しさん＠ピンキー (ﾜｯﾁｮｲ 4f70-5B/7)

2024/05/16(木) 14:42:18.02ID:IWtMJ9ws0

俺もいつもこれで賢さの確認してたんだけど
chatGPT4oはちゃんと答えられるようになってるな

https://chat.openai.com/share/e5e5c497-0e9a-4b94-8627-417d6319f8fe

なお番組は出禁になる

0350名無しさん＠ピンキー (ﾜｯﾁｮｲ ab5d-EQUo)

2024/05/16(木) 15:07:57.16ID:???0

おれ「こんにちは」
ChatGPT４o「ニキは元気なんけ？」

0351名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f7a-Mwej)

2024/05/16(木) 15:58:56.59ID:???0

そういやもはやこのスレなんJでもなんでもないな…いやめんどくさいからいいんだけど

0352名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b21-iBKv)

2024/05/16(木) 16:09:49.03ID:4moxrP400

フルスクラッチの日本語100Bモデル作ったらしいけどどんなもんやろね
GGUF上がったら試してみたいわ
https://huggingface.co/stockmark/stockmark-100b

0353名無しさん＠ピンキー (ﾜｯﾁｮｲ 2bb3-CDIS)

2024/05/16(木) 16:26:06.14ID:???0

ベースモデルはともかく、インストラクション版はIchikara-instructionだけでファインチューニングされてるみたいだからスレ民的には使えないだろうなぁ

0354名無しさん＠ピンキー (ﾜｯﾁｮｲ 1bbe-JZQp)

2024/05/16(木) 16:32:36.70ID:???0

FaceBookから盗まれたモデルを使わずゼロから学習させたデータか…多分駄目だろうな
このへんのダーティさの問題をクリアしようって試みはみんなパフォーマンス出ずに失敗してる
画像生成モデルなんて学習元どころか作成元すら匿名な奴しか生き残ってないしな

0355名無しさん＠ピンキー (ﾜｯﾁｮｲ 4f70-5B/7)

2024/05/16(木) 16:51:49.07ID:IWtMJ9ws0

学習なんて昔からダーティだからな
わーくにの学問の基礎なんて遣隋使が「写しちゃダメ」って言われてる書物を勝手に写して持って帰ってきたものだし
その教典だって元はインドから勝手に持ち出してるし
なんならホモサピエンスのミラーニューロンは生物的に反則技で、余所の特技を模倣して後天的にスキルを身に付けていくのはあまりにもズルすぎる
学習から道具？とかいうものを作り出して牙と爪を外付けすることで、本来狩る側が支払うべきコストを踏み倒してるのも汚い
強い生物はその体重・膂力に見合ったエネルギーを消費する点で被捕食者より劣っていてバランスがとれていたのに
本来スカベンジャーに過ぎない猿どもが我々から牙を盗んだことは許されないクマよ

0356名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fc8-PuMj)

2024/05/16(木) 17:11:09.05ID:???0

ってかこれGENIACなのか
プロジェクト自体の名前は知ってるけど成果物見るのは初めてや

0357名無しさん＠ピンキー (ﾜｯﾁｮｲ db74-JPwS)

2024/05/16(木) 18:02:53.02ID:???0

48 nodes of a3 (8*H100) instancesを7 weeksってごいすー
ゼロから学習しようとしたらそのくらいかかるってことか

0358名無しさん＠ピンキー (ﾌﾞｰｲﾓ MMff-C9Al)

2024/05/16(木) 18:09:55.06ID:???M

何ならクローズドモデル提供してるとこだって学習のためのデータにかかる著作権法や個人情報保護法周りで完全にクリアなデータだけで構成されてるか？っていう問いには口もごもごせざるを得ないだろうしな
ダーティでないものであろうって姿勢は尊重したいが

0359名無しさん＠ピンキー (ﾌﾞｰｲﾓ MMff-C9Al)

2024/05/16(木) 18:16:37.87ID:???M

あーいやこれ経産省主導のやつか
パブコメの反響的にも綺麗なものですよってアピールしないとあかんって意識もあるんやろね

0360名無しさん＠ピンキー (ﾜｯﾁｮｲ bb26-Ivpr)

2024/05/16(木) 18:17:59.15ID:???0

AIに限らずテック系なんざEvilになったやつしか勝たんし残ってない

0361名無しさん＠ピンキー (ﾜｯﾁｮｲ 2bb3-CDIS)

2024/05/16(木) 18:29:33.92ID:???0

>>356
同じGENIACでPFNも100Bと1TのLLM作ってるはず
1Tが公開されたら（動かせんが）ガチでやばそう
とはいえそのレベルのモデルに十分学習させられるほど日本語データがないのではという気もするが

0362名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f13-5B/7)

2024/05/16(木) 18:30:14.83ID:???0

EasyNovelAssistantに
>>347 のモデルと同作者の新モデルJapanese-TextGen-Kageを追加しといたで

最大コンテキストサイズが伸びてきとるっぽい

https://huggingface.co/dddump/Japanese-TextGen-Kage-v0.1-2x7B-gguf
https://twitter.com/Zuntan03/status/1791037360588927169

0363名無しさん＠ピンキー (ﾜｯﾁｮｲ 2bb3-CDIS)

2024/05/16(木) 18:31:09.83ID:???0

Stockmarkの100BはMITだからUncensoredにファインチューニングしたりも自由だよ
とはいえ事前学習データも綺麗そうだからNSFW用途では難しいだろうな

0364名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f23-mzba)

2024/05/16(木) 19:58:40.58ID:???0

今Text generation web UIで使っているggufモデルを使って、
NSFWな文字列を含むコードやデータを生成させたいんですけど、
ChatGPTみたいなUIで使いたいときって、何かおすすめありますか？
今のところ候補はChatbotUIを考えています。

0365名無しさん＠ピンキー (ﾜｯﾁｮｲ bb9f-AdtJ)

2024/05/17(金) 03:17:09.58ID:D6edv+6v0

EasyNovelAssistant
UIからJapanese-TextGen-MoE-TEST-2x7B-NSFW落とそうとしたら良くわからんエラー出た
直接落としたJapanese-TextGen-MoE-TEST-2x7B-NSFW_iMat_Ch10_IQ4_XS.ggufを
Japanese-TextGen-MoE-TEST-2x7B-NSFW_iMat_IQ4_XS.ggufに改名したら使えた

0366名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f83-jKRS)

2024/05/17(金) 04:50:35.86ID:???0

>>365
↓のコミットでリネームされてダウンロードURLが変わったのが原因。
https://huggingface.co/dddump/Japanese-TextGen-MoE-TEST-2x7B-NSFW-gguf/commit/f39f2353116283a863d86d7406375c6904007364

0367名無しさん＠ピンキー (ﾜｯﾁｮｲ 4f21-0f0G)

2024/05/17(金) 07:13:14.57ID:???0

>>365
ワイもついさっき全く同じことしたわ

0368名無しさん＠ピンキー (ｴﾑｿﾞﾈ FF7f-eNi+)

2024/05/17(金) 07:14:03.52ID:???F

あれおま環じゃなかったのか

0369名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f13-5B/7)

2024/05/17(金) 09:12:47.83ID:???0

>>365-368
不具合報告サンガツやで
修正しといた

0370名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f7a-Mwej)

2024/05/17(金) 10:54:32.87ID:???0

ﾊｷﾞﾁｬ＆コマR+である程度満足してたんだけど、そろそろEasyNovelAssistantでエロ文章実績解除したいんだけど
走らせるLLMはみなさん今のとこ何がおすすめでやんしょ？
日本語のエロ文が自然に出せるやつも日進月歩みたいだから色々ありそうだけども

0371名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f3c-eNi+)

2024/05/17(金) 11:06:57.37ID:???0

>>370
すぐ上の
Japanese-TextGen-MoE-TEST-2x7B-NSFW_iMat_Ch10_IQ4_XS
がホット

0372名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f7a-Mwej)

2024/05/17(金) 11:09:00.84ID:???0

>>371
ｻﾝｸｽ！

0373名無しさん＠ピンキー (ﾜｯﾁｮｲ 0bc0-Ag1v)

2024/05/17(金) 12:54:44.40ID:???0

>>291
かくいうワイも使うUIによって応答の印象が微妙に違ったりして困ってるが、Silly Tavernに関して言えばてキャラクターカード以外にも色々Jailbreakプロンプトとか知らんうちに適用されたりするから左のパネルの下の方あるチェックでいらんプロンプトは切ったほうがええで
https://files.catbox.moe/xuo61c.jpg

0374名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b52-mzba)

2024/05/17(金) 16:45:33.36ID:???0

色々組み合わせたくなって、Pythonで直に出力させてみているんだけど、
全く思うような出力にならなくて、改めて大葉やkoboldのありがたみを感じる
「こんにちは」にさえも、まともな回答が返ってこない
そして、少しでもエロい話題を振ると、かなりの確率で「1 :名無しさん@お腹いっぱい。」とか
スレッドを模した長文が出力される
ちなみにモデルはc4ai-command-r-v01

0375名無しさん＠ピンキー (ﾜｯﾁｮｲ 5bd8-JZQp)

2024/05/17(金) 16:54:31.27ID:nQBmVgaP0

Pythonで直ってことはローカル？量子化の影響なんかな？
ワイ、APIで触った感じでは結構ふつーにいう事聞いてくれた印象なんやが

0376名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fbf-PuMj)

2024/05/17(金) 17:02:13.37ID:???0

>>374
Command Rのテンプレートに従ってる？
<|START_OF_TURN_TOKEN|><|CHATBOT_TOKEN|>
ではじめないとまともな返答返さないよ

0377名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b52-mzba)

2024/05/17(金) 17:06:38.13ID:???0

>>375
はい、ローカルで、ollamaやllama-cpp-python経由で出力させています。
場合によっては一応「こんにちは」への回答っぽい語句も含まれる事ありますけど、余計な長文が付け足されたり、
あと大抵はどこかの一般的なブログの記事みたいなのが出力されます。
で、エロい内容だと何故かここのスレみたいな長文にw
モデルはc4ai-command-r-v01-Q8_0.ggufですが、とりあえず今他のも試し中です。

0378名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fbe-CcWV)

2024/05/17(金) 17:08:13.06ID:???0

silly tavernの日本語の情報全然無いから使い方よくわからんと使ってるわ

0379名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fbf-PuMj)

2024/05/17(金) 17:08:44.77ID:???0

llama-cpp-pythonは勝手に頭に<BOS_TOKEN>加えるから、それで変になってないかも見たほうがいい

0380名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b52-mzba)

2024/05/17(金) 17:16:19.44ID:bDW/lnbV0

>>376
>>379
情報ありがとうございます。確認してみます。

0381名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fbf-PuMj)

2024/05/17(金) 17:50:24.21ID:???0

>>380
なんとなく今は
from llama_cpp import Llama
model = Llama(...)
output = model("こんにちは")
みたいなことやってるんじゃないかと想像するけどこれはダメで、HuggingFaceに書いてあるフォーマットに従う必要がある

0382名無しさん＠ピンキー (ｵｲｺﾗﾐﾈｵ MMdf-bNnz)

2024/05/17(金) 19:15:14.00ID:eLiIPOkOM

一瞬R PlusをQ8で動かしてるのかと思ってビビった

0383名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr5f-mzba)

2024/05/17(金) 20:17:16.50ID:???r

>>376
https://docs.cohere.com/docs/prompting-command-r
このテンプレートに沿った内容で組み直したら、正しく出力してくれました。
ありがとうございます！

>>382
R+はiq2_xxsが精一杯...

0384名無しさん＠ピンキー (ﾜｯﾁｮｲ cb11-+EhW)

2024/05/17(金) 20:24:00.27ID:zuYrt3Vi0

>>383
R/R+含め最近のinstructモデルは基本こういうテンプレートがあってそれに従わないとまともに推論できないから、新しいモデル使う時は気をつけた方がいいかも
Llama 2ベースのモデル(KarakuriとかSwallowとか)とかは割と適当にやっても大丈夫だったんだけどね

0385名無しさん＠ピンキー (ﾜｯﾁｮｲ cb11-+EhW)

2024/05/17(金) 20:25:19.57ID:zuYrt3Vi0

ちなみにR+もテンプレートはRと一緒だったはずだから、そのプロンプトはR+でもそのまま使えるで

0386名無しさん＠ピンキー (ﾜｯﾁｮｲ 0a5c-Pd4t)

2024/05/18(土) 05:40:26.72ID:???0

>>385
ありがとうございます。iq2_xxsですが、ちゃんと出力されました。
ただ日本語のおかしい感じがRのQ8より目立ってて
せめてQ4以上が動く環境が欲しくなりました。
※今はM1Max64GBです。

0387名無しさん＠ピンキー (ﾜｯﾁｮｲ 6b32-9INB)

2024/05/18(土) 06:40:00.12ID:???0

>>386
macいいのぉ
64Gならkarakuri70bのQ5_K_Mがヌルヌル動くんかな？

0388名無しさん＠ピンキー (ﾜｯﾁｮｲ 1f11-y1Cx)

2024/05/18(土) 08:22:48.53ID:pfpFpeeW0

>>386
俺M2 Maxの64GBだけどiq4_xs(contextは8K)無理やり動かしてるよｗ
swap 8GBくらい行くけど一応macOSハングアップせず動く

0389名無しさん＠ピンキー (ｻｻｸｯﾃﾛﾗ Sp23-9INB)

2024/05/18(土) 09:02:04.78ID:???p

>>388
メモリ割り当て上限上げればQ5kmいけない？

0390名無しさん＠ピンキー (ﾜｯﾁｮｲ 0bbe-G7oj)

2024/05/18(土) 09:02:15.82ID:???0

IntelかAMDがVRAM大量に積んだ統合型CPU出せば結構需要あるだろうにな
LLMはメモリ勝負で画像生成とは全然違うんだし

0391名無しさん＠ピンキー (ｻｻｸｯﾃﾛﾗ Sp23-9INB)

2024/05/18(土) 09:03:09.76ID:???p

ああごめん
command-r+か

0392名無しさん＠ピンキー (ﾜｯﾁｮｲ e326-ErG6)

2024/05/18(土) 09:15:07.94ID:???0

AMDが出すだろ
帯域500ぐらいのメモリ64までツンだAPU

0393名無しさん＠ピンキー (ﾜｯﾁｮｲ 07a0-1/cm)

2024/05/18(土) 09:28:43.66ID:???0

64GBまでってのが残念だよな
256GBくらい行ければいいのに

0394名無しさん＠ピンキー (ﾜｯﾁｮｲ 3bf9-dsTG)

2024/05/18(土) 10:24:29.90ID:???0

あれ内蔵GPU相当よさそうだから、文章AIとかお絵かきAI推論させながら別のグラボで作業とかゲームとかしたいけど、別のグラボ接続するの無理らしいんだよね
悲しい……

0395名無しさん＠ピンキー (ﾜｯﾁｮｲ e326-ErG6)

2024/05/18(土) 11:07:05.15ID:???0

ニューラルボードも個人に売るより企業に売ったほうが儲かるし
個人が買って使う分にはnvidiaのGPUに比べて優位性あるわけじゃないから
LLM元年こねえなあ…

0396名無しさん＠ピンキー (ﾜｯﾁｮｲ 6aca-l6Q5)

2024/05/18(土) 12:40:12.94ID:???0

直に改善されるよ

0397名無しさん＠ピンキー (ﾜｯﾁｮｲ 4677-Fooe)

2024/05/18(土) 14:22:21.03ID:???0

>>387
karakuri70bのQ5_K_Mはまだ試していないですけど、
Q4_K_Mだったら結構余力がある感じだったので、多分いけそうですね。
command-r/r+が一段落したら、そっちでもやってみるつもりです。

0398名無しさん＠ピンキー (ﾜｯﾁｮｲ 4677-Fooe)

2024/05/18(土) 14:26:41.20ID:???0

>>388
それは朗報です。今早速ダウンロード中。
今やりたい事が、さほど速度は求めていないので（寝ている間に作成でもOKなくらい）
とりあえず動けばいいんですけどね〜。
将来もっと環境が良くなった時のための、下地作りみたいなものなので。

0399名無しさん＠ピンキー (ﾜｯﾁｮｲ fa09-8DGq)

2024/05/18(土) 15:25:00.73ID:???0

LLM赤ちゃんなんやが
箇条書きを文章のように清書したいんやが
そういうのに向いた設定とかモデルがあったら教えてほしい
試しにEasyNovelに投げたら箇条書きの続きを書き始めた

0400名無しさん＠ピンキー (ﾜｯﾁｮｲ 1e7a-8DGq)

2024/05/18(土) 15:29:05.04ID:???0

ChatGPTでは

0401名無しさん＠ピンキー (ﾜｯﾁｮｲ fa09-8DGq)

2024/05/18(土) 15:35:32.26ID:???0

>>400
Bingコパイに投げたら長すぎなのとエッチすぎた…

0402名無しさん＠ピンキー (ﾜｯﾁｮｲ 1b74-2zf9)

2024/05/18(土) 15:41:03.54ID:???0

日本語の理解がよくてエロも行けるとなると真っ先に思いつくんはCommand R+やな

0403名無しさん＠ピンキー (ﾜｯﾁｮｲ e312-HkKw)

2024/05/18(土) 15:44:42.83ID:???0

そういう用途ならGPT4やopusで脱獄するかcommandR+やろうね

0404名無しさん＠ピンキー (ﾜｯﾁｮｲ fa09-8DGq)

2024/05/18(土) 15:57:32.48ID:???0

>>402,403
サンガツ
SDのお絵描きAIの方とはまったく勝手が違うから
調べて一から勉強するわ

0405名無しさん＠ピンキー (ﾜｯﾁｮｲ e312-HkKw)

2024/05/18(土) 15:57:44.40ID:???0

>>399
ちなみにopusだとこんな感じ
むりやり一回に収めたから展開がめちゃくちゃ駆け足だけど

ttps://files.catbox.moe/w7evwc.png
ttps://files.catbox.moe/l8ruxf.png
ttps://files.catbox.moe/pajst7.png
ttps://files.catbox.moe/c96udt.png

0406名無しさん＠ピンキー (ﾜｯﾁｮｲ fa09-8DGq)

2024/05/18(土) 16:17:25.84ID:???0

>>405
ｻﾝｶﾞﾂ
勢いにワロタ
ワイの場合セリフ読みの台本みたいな感じになってるからどうなるかちょっとやってみるわ
登場人物二人の百合ものなんやが
どっちのセリフかわかるように各所に名前が書かれてるから箇条書きっぽくなってる
端から7000文字あるからプロットにしちゃ長すぎる感もある

0407名無しさん＠ピンキー (ﾜｯﾁｮｲ 2ba1-PoTj)

2024/05/18(土) 17:18:06.10ID:???0

>>398
うちだと４.5tps位出るから、ギリギリではあるがパフォーマンスはリアルタイムチャットできるくらい出るよ

あと、そういや昨日言い忘れたんだが、llama-cpp-pythonででかいモデル走らせるとき、コンストラクタの引数でuse_mlockをTrueに設定したほうがいい
そうしないとmacOSが推論のたびにメモリを開放するせいで推論前の待ち時間がめっちゃ伸びる

0408名無しさん＠ピンキー (ﾜｯﾁｮｲ 239f-s06i)

2024/05/18(土) 18:06:52.75ID:ldYAm+3u0

Kobold直接起動するとチャットできるんか
ガチャチャットなんてアホなことしてたわ

0409名無しさん＠ピンキー (ﾜｯﾁｮｲ 1e02-8DGq)

2024/05/18(土) 21:09:39.27ID:???0

MacProにRTX4090のせて動いてくれるようにならないかね？
それでVRAMが192+24までいけるとサイコーなのに

0410名無しさん＠ピンキー (ﾜｯﾁｮｲ 1f11-y1Cx)

2024/05/18(土) 21:22:25.07ID:pfpFpeeW0

ちょい調べたけどCUDAは今macOSをサポートしてないみたいだから、Mac側だけじゃなくてNVIDIA側からの歩みよりもないと厳しそう

0411名無しさん＠ピンキー (ﾜｯﾁｮｲ 0a7d-Fooe)

2024/05/18(土) 22:46:26.63ID:???0

>>409-410
Appleシリコン版MacProのPCI Expressスロットはグラフィックスカード非対応だから、そもそも無理では？
Intel版だと海外で搭載事例あるみたいだけど、それなら最近のWinマシンでやっとけって話だし。

0412名無しさん＠ピンキー (ﾜｯﾁｮｲ 8ac7-Y30N)

2024/05/18(土) 23:24:40.31ID:???0

201だけど、中古の3090追加してみたら結構速くなった

モデル:command-R+ IQ3_M

3090x1台+3060×3台 3.5t/s
3090x2台+3060x1台 9.7t/s

ちなみに最初の構成は2.4t/sだったけどスロットの帯域見直して3.5t/s
こちらはもう少し上げることできなかったのかな

以下参考

・最初の構成(Ryzen5 3600+TUF GAMING B550 PLUS)
　3090x1(PCIe4.0 x16)
　3060x3 (PCIe3.0 x1) ※USBライザー

・見直し後の構成(Ryzen5 3600+TUF GAMING B550 PLUS)
　3090x1(PCIe4.0 x16)
　3060x1(PCIe3.0 x1) ※x16ライザーに変更
　3060x2 (PCIe3.0 x2) ※USBライザーGen2に変更(Gen3はエラー)

・3090追加後の構成(i3-10100F+ROG STRIX Z490-F GAMING)
　3090x1(PCIe3.0 x8)
　3090x1(PCIe3.0 x8) ※x16ライザー
　3060x1(PCIe3.0 x1) ※x16ライザー

0413名無しさん＠ピンキー (ﾜｯﾁｮｲ ea7c-Nu2v)

2024/05/19(日) 00:19:42.12ID:???0

リートンが利用規約改訂して性的表現をデータとして入力する行為を禁止事項に追加しとったわ
Xで既存のキャラがエロいこと言うようになったってポストもあったしそら気付くわな

0414名無しさん＠ピンキー (ﾜｯﾁｮｲ e368-LMIW)

2024/05/19(日) 01:19:46.85ID:???0

踏み台マンコにBAN以上のリスクが伴うんけ？
実例出たらローカルに篭らざるを得ない

0415名無しさん＠ピンキー (ｴﾑｿﾞﾈ FFaa-OdcE)

2024/05/19(日) 01:31:38.72ID:???F

ユーザーの入力学習させたらそりゃ汚染されるよね…

0416名無しさん＠ピンキー (ﾜｯﾁｮｲ 6a64-Kbp3)

2024/05/19(日) 04:28:32.57ID:???0

>>412
おつおつ
9.7もあれば実用で十分だなあ

0417名無しさん＠ピンキー (ﾜｯﾁｮｲ de51-/Jbo)

2024/05/19(日) 05:49:26.73ID:???0

リートンのあれは、客寄せでワザとやってんのかなと思ってた
建前上、規約には追加しておいて…みたいな

0418名無しさん＠ピンキー (ﾜｯﾁｮｲ 8e57-HkKw)

2024/05/19(日) 06:09:45.56ID:???0

あの手のサービスがモデル名書かないのはそういうことでしょ
元はエロ禁止モデル
提供元から怒られたんじゃねえの

0419名無しさん＠ピンキー (ﾜｯﾁｮｲ faa3-p7dv)

2024/05/19(日) 08:45:23.83ID:???0

ん？リートンのモデルってユーザーの使用履歴を後学習するのん？
どういう仕組みなんだ

0420名無しさん＠ピンキー (ﾜｯﾁｮｲ 1f11-y1Cx)

2024/05/19(日) 09:45:59.92ID:KjZ8NreF0

そんなリアルタイム学習みたいなことを実用化してるLLMがあるとは思えんが

0421名無しさん＠ピンキー (ﾜｯﾁｮｲ 07be-1/cm)

2024/05/19(日) 10:03:50.82ID:???0

定期的に追加学習してるのでは？

0422名無しさん＠ピンキー (ﾜｯﾁｮｲ 86de-G7oj)

2024/05/19(日) 10:05:38.77ID:ONjihcsU0

リアルタイム学習じゃなくて、ファインチューン用のデータセット作りたいのでは？

0423名無しさん＠ピンキー (ﾜｯﾁｮｲ 1f11-y1Cx)

2024/05/19(日) 10:30:44.18ID:KjZ8NreF0

ちゃんとデータセット作るんだったら、データのフィルタリングとかするだろうしそんな酷く汚染されることはない気がするが
ユーザーの入力を何も考えずそのままファインチューンに使うなんてあるんかね

0424名無しさん＠ピンキー (ﾜｯﾁｮｲ ff24-G7oj)

2024/05/19(日) 11:43:04.72ID:PHQckvvi0

いや、さすがにそのままは使わんやろ
ただ、有害プロンプト100パー弾くとかはやらんで、最後は人力でキュレーションするけど安全なモデルにしたいなら
最初から極端にNSFWなコンテクストは弾いておきたいだろうし
というかワイは今実際にそーゆー人力キュレーションの仕事しとるわ

0425名無しさん＠ピンキー (ﾜｯﾁｮｲ 5332-s4Gx)

2024/05/19(日) 12:45:55.31ID:???0

EasyNovelAssistantを使わせていただいてますが
Japanese-TextGen-MoE-TEST-2x7B-NSFW_iMat_Ch10_IQ4_XS.gguf
Japanese-Chat-Evolve-TEST-7B-NSFW_iMat_Ch10_IQ4_XS.gguf
がHFでリプレース発生して名前が変わっているみたいです

ところで「生成の開始／終了」をトグル方式でなく
「生成の開始」と「生成の終了」に操作を分けて頂けると嬉しいです
頻繁に開始／終了を操作していると停止したつもりが止まってなかったり混乱するもので

0426名無しさん＠ピンキー (ｽｯｯﾌﾟ Sdaa-KNHu)

2024/05/19(日) 14:42:40.87ID:???d

履歴を韓国か中国に持ってって売るだけでしょ

0427名無しさん＠ピンキー (ﾜｯﾁｮｲ de13-s4Gx)

2024/05/19(日) 15:00:21.92ID:???0

>>425
不具合報告サンガツ！リンクを修正したで
Japanese-Chat-Evolve-TEST-NSFWのコンテキストサイズ上限が8Kから4Kに下がってるみたいなんで注意や

F3で生成開始とF4で生成終了も追加しといたで

0428名無しさん＠ピンキー (ﾜｯﾁｮｲ 0783-L6Vs)

2024/05/19(日) 15:12:06.01ID:???0

前スレに貼られてた生徒会恋愛関係の問題を4oに投げてみたけど一発正解は出してくれんかった、拓郎は早苗が好きじゃないことと明美が誰かから愛されてることを遵守させてやっと正解(後者だけだと理解しなかった)
4oですらこういう論理パズルを解けないんやな…

0429名無しさん＠ピンキー (ﾜｯﾁｮｲ deec-bshs)

2024/05/19(日) 15:22:59.31ID:???0

LLMの論理能力ってロール指定とかstep-by-stepとかdeepbreathとか精度上げる手法使うかどうかでもかなり変わりそうだけど

0430名無しさん＠ピンキー (ﾜｯﾁｮｲ 0e21-wJd8)

2024/05/19(日) 16:31:36.48ID:???0

>>427
いつも対応早杉ですよ神

0431名無しさん＠ピンキー (ﾜｯﾁｮｲ 6ab7-l6Q5)

2024/05/19(日) 17:11:02.60ID:???0

シンボリック操作が弱いのは何でやろね
言語自体シンボルだからコーパスさえあればなんとかなりそうな気もするけど

0432名無しさん＠ピンキー (ﾜｯﾁｮｲ 5332-s4Gx)

2024/05/19(日) 17:53:58.09ID:???0

>>427
ありがとうございます！
マウスとキーボードを併用しているとShift+F5の操作が難しいので押し間違いしてましたが
とても楽になりました

■ このスレッドは過去ログ倉庫に格納されています