なんJLLM部避難所 ★2

1002コメント390KB

なんJLLM部避難所 ★2

■ このスレッドは過去ログ倉庫に格納されています

0001名無しさん＠ピンキー転載ダメ (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:27:25.10ID:???0

!extend::vvvvv:1000:512
!extend::vvvvv:1000:512
AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(スクリプト攻撃継続中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所
https://mercury.bbspink.com/test/read.cgi/onatech/1702817339/

-
VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured

VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured

0400名無しさん＠ピンキー (ﾜｯﾁｮｲ 1e7a-8DGq)

2024/05/18(土) 15:29:05.04ID:???0

ChatGPTでは

0401名無しさん＠ピンキー (ﾜｯﾁｮｲ fa09-8DGq)

2024/05/18(土) 15:35:32.26ID:???0

>>400
Bingコパイに投げたら長すぎなのとエッチすぎた…

0402名無しさん＠ピンキー (ﾜｯﾁｮｲ 1b74-2zf9)

2024/05/18(土) 15:41:03.54ID:???0

日本語の理解がよくてエロも行けるとなると真っ先に思いつくんはCommand R+やな

0403名無しさん＠ピンキー (ﾜｯﾁｮｲ e312-HkKw)

2024/05/18(土) 15:44:42.83ID:???0

そういう用途ならGPT4やopusで脱獄するかcommandR+やろうね

0404名無しさん＠ピンキー (ﾜｯﾁｮｲ fa09-8DGq)

2024/05/18(土) 15:57:32.48ID:???0

>>402,403
サンガツ
SDのお絵描きAIの方とはまったく勝手が違うから
調べて一から勉強するわ

0405名無しさん＠ピンキー (ﾜｯﾁｮｲ e312-HkKw)

2024/05/18(土) 15:57:44.40ID:???0

>>399
ちなみにopusだとこんな感じ
むりやり一回に収めたから展開がめちゃくちゃ駆け足だけど

ttps://files.catbox.moe/w7evwc.png
ttps://files.catbox.moe/l8ruxf.png
ttps://files.catbox.moe/pajst7.png
ttps://files.catbox.moe/c96udt.png

0406名無しさん＠ピンキー (ﾜｯﾁｮｲ fa09-8DGq)

2024/05/18(土) 16:17:25.84ID:???0

>>405
ｻﾝｶﾞﾂ
勢いにワロタ
ワイの場合セリフ読みの台本みたいな感じになってるからどうなるかちょっとやってみるわ
登場人物二人の百合ものなんやが
どっちのセリフかわかるように各所に名前が書かれてるから箇条書きっぽくなってる
端から7000文字あるからプロットにしちゃ長すぎる感もある

0407名無しさん＠ピンキー (ﾜｯﾁｮｲ 2ba1-PoTj)

2024/05/18(土) 17:18:06.10ID:???0

>>398
うちだと４.5tps位出るから、ギリギリではあるがパフォーマンスはリアルタイムチャットできるくらい出るよ

あと、そういや昨日言い忘れたんだが、llama-cpp-pythonででかいモデル走らせるとき、コンストラクタの引数でuse_mlockをTrueに設定したほうがいい
そうしないとmacOSが推論のたびにメモリを開放するせいで推論前の待ち時間がめっちゃ伸びる

0408名無しさん＠ピンキー (ﾜｯﾁｮｲ 239f-s06i)

2024/05/18(土) 18:06:52.75ID:ldYAm+3u0

Kobold直接起動するとチャットできるんか
ガチャチャットなんてアホなことしてたわ

0409名無しさん＠ピンキー (ﾜｯﾁｮｲ 1e02-8DGq)

2024/05/18(土) 21:09:39.27ID:???0

MacProにRTX4090のせて動いてくれるようにならないかね？
それでVRAMが192+24までいけるとサイコーなのに

0410名無しさん＠ピンキー (ﾜｯﾁｮｲ 1f11-y1Cx)

2024/05/18(土) 21:22:25.07ID:pfpFpeeW0

ちょい調べたけどCUDAは今macOSをサポートしてないみたいだから、Mac側だけじゃなくてNVIDIA側からの歩みよりもないと厳しそう

0411名無しさん＠ピンキー (ﾜｯﾁｮｲ 0a7d-Fooe)

2024/05/18(土) 22:46:26.63ID:???0

>>409-410
Appleシリコン版MacProのPCI Expressスロットはグラフィックスカード非対応だから、そもそも無理では？
Intel版だと海外で搭載事例あるみたいだけど、それなら最近のWinマシンでやっとけって話だし。

0412名無しさん＠ピンキー (ﾜｯﾁｮｲ 8ac7-Y30N)

2024/05/18(土) 23:24:40.31ID:???0

201だけど、中古の3090追加してみたら結構速くなった

モデル:command-R+ IQ3_M

3090x1台+3060×3台 3.5t/s
3090x2台+3060x1台 9.7t/s

ちなみに最初の構成は2.4t/sだったけどスロットの帯域見直して3.5t/s
こちらはもう少し上げることできなかったのかな

以下参考

・最初の構成(Ryzen5 3600+TUF GAMING B550 PLUS)
　3090x1(PCIe4.0 x16)
　3060x3 (PCIe3.0 x1) ※USBライザー

・見直し後の構成(Ryzen5 3600+TUF GAMING B550 PLUS)
　3090x1(PCIe4.0 x16)
　3060x1(PCIe3.0 x1) ※x16ライザーに変更
　3060x2 (PCIe3.0 x2) ※USBライザーGen2に変更(Gen3はエラー)

・3090追加後の構成(i3-10100F+ROG STRIX Z490-F GAMING)
　3090x1(PCIe3.0 x8)
　3090x1(PCIe3.0 x8) ※x16ライザー
　3060x1(PCIe3.0 x1) ※x16ライザー

0413名無しさん＠ピンキー (ﾜｯﾁｮｲ ea7c-Nu2v)

2024/05/19(日) 00:19:42.12ID:???0

リートンが利用規約改訂して性的表現をデータとして入力する行為を禁止事項に追加しとったわ
Xで既存のキャラがエロいこと言うようになったってポストもあったしそら気付くわな

0414名無しさん＠ピンキー (ﾜｯﾁｮｲ e368-LMIW)

2024/05/19(日) 01:19:46.85ID:???0

踏み台マンコにBAN以上のリスクが伴うんけ？
実例出たらローカルに篭らざるを得ない

0415名無しさん＠ピンキー (ｴﾑｿﾞﾈ FFaa-OdcE)

2024/05/19(日) 01:31:38.72ID:???F

ユーザーの入力学習させたらそりゃ汚染されるよね…

0416名無しさん＠ピンキー (ﾜｯﾁｮｲ 6a64-Kbp3)

2024/05/19(日) 04:28:32.57ID:???0

>>412
おつおつ
9.7もあれば実用で十分だなあ

0417名無しさん＠ピンキー (ﾜｯﾁｮｲ de51-/Jbo)

2024/05/19(日) 05:49:26.73ID:???0

リートンのあれは、客寄せでワザとやってんのかなと思ってた
建前上、規約には追加しておいて…みたいな

0418名無しさん＠ピンキー (ﾜｯﾁｮｲ 8e57-HkKw)

2024/05/19(日) 06:09:45.56ID:???0

あの手のサービスがモデル名書かないのはそういうことでしょ
元はエロ禁止モデル
提供元から怒られたんじゃねえの

0419名無しさん＠ピンキー (ﾜｯﾁｮｲ faa3-p7dv)

2024/05/19(日) 08:45:23.83ID:???0

ん？リートンのモデルってユーザーの使用履歴を後学習するのん？
どういう仕組みなんだ

0420名無しさん＠ピンキー (ﾜｯﾁｮｲ 1f11-y1Cx)

2024/05/19(日) 09:45:59.92ID:KjZ8NreF0

そんなリアルタイム学習みたいなことを実用化してるLLMがあるとは思えんが

0421名無しさん＠ピンキー (ﾜｯﾁｮｲ 07be-1/cm)

2024/05/19(日) 10:03:50.82ID:???0

定期的に追加学習してるのでは？

0422名無しさん＠ピンキー (ﾜｯﾁｮｲ 86de-G7oj)

2024/05/19(日) 10:05:38.77ID:ONjihcsU0

リアルタイム学習じゃなくて、ファインチューン用のデータセット作りたいのでは？

0423名無しさん＠ピンキー (ﾜｯﾁｮｲ 1f11-y1Cx)

2024/05/19(日) 10:30:44.18ID:KjZ8NreF0

ちゃんとデータセット作るんだったら、データのフィルタリングとかするだろうしそんな酷く汚染されることはない気がするが
ユーザーの入力を何も考えずそのままファインチューンに使うなんてあるんかね

0424名無しさん＠ピンキー (ﾜｯﾁｮｲ ff24-G7oj)

2024/05/19(日) 11:43:04.72ID:PHQckvvi0

いや、さすがにそのままは使わんやろ
ただ、有害プロンプト100パー弾くとかはやらんで、最後は人力でキュレーションするけど安全なモデルにしたいなら
最初から極端にNSFWなコンテクストは弾いておきたいだろうし
というかワイは今実際にそーゆー人力キュレーションの仕事しとるわ

0425名無しさん＠ピンキー (ﾜｯﾁｮｲ 5332-s4Gx)

2024/05/19(日) 12:45:55.31ID:???0

EasyNovelAssistantを使わせていただいてますが
Japanese-TextGen-MoE-TEST-2x7B-NSFW_iMat_Ch10_IQ4_XS.gguf
Japanese-Chat-Evolve-TEST-7B-NSFW_iMat_Ch10_IQ4_XS.gguf
がHFでリプレース発生して名前が変わっているみたいです

ところで「生成の開始／終了」をトグル方式でなく
「生成の開始」と「生成の終了」に操作を分けて頂けると嬉しいです
頻繁に開始／終了を操作していると停止したつもりが止まってなかったり混乱するもので

0426名無しさん＠ピンキー (ｽｯｯﾌﾟ Sdaa-KNHu)

2024/05/19(日) 14:42:40.87ID:???d

履歴を韓国か中国に持ってって売るだけでしょ

0427名無しさん＠ピンキー (ﾜｯﾁｮｲ de13-s4Gx)

2024/05/19(日) 15:00:21.92ID:???0

>>425
不具合報告サンガツ！リンクを修正したで
Japanese-Chat-Evolve-TEST-NSFWのコンテキストサイズ上限が8Kから4Kに下がってるみたいなんで注意や

F3で生成開始とF4で生成終了も追加しといたで

0428名無しさん＠ピンキー (ﾜｯﾁｮｲ 0783-L6Vs)

2024/05/19(日) 15:12:06.01ID:???0

前スレに貼られてた生徒会恋愛関係の問題を4oに投げてみたけど一発正解は出してくれんかった、拓郎は早苗が好きじゃないことと明美が誰かから愛されてることを遵守させてやっと正解(後者だけだと理解しなかった)
4oですらこういう論理パズルを解けないんやな…

0429名無しさん＠ピンキー (ﾜｯﾁｮｲ deec-bshs)

2024/05/19(日) 15:22:59.31ID:???0

LLMの論理能力ってロール指定とかstep-by-stepとかdeepbreathとか精度上げる手法使うかどうかでもかなり変わりそうだけど

0430名無しさん＠ピンキー (ﾜｯﾁｮｲ 0e21-wJd8)

2024/05/19(日) 16:31:36.48ID:???0

>>427
いつも対応早杉ですよ神

0431名無しさん＠ピンキー (ﾜｯﾁｮｲ 6ab7-l6Q5)

2024/05/19(日) 17:11:02.60ID:???0

シンボリック操作が弱いのは何でやろね
言語自体シンボルだからコーパスさえあればなんとかなりそうな気もするけど

0432名無しさん＠ピンキー (ﾜｯﾁｮｲ 5332-s4Gx)

2024/05/19(日) 17:53:58.09ID:???0

>>427
ありがとうございます！
マウスとキーボードを併用しているとShift+F5の操作が難しいので押し間違いしてましたが
とても楽になりました

0433名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sdaa-G7oj)

2024/05/19(日) 19:15:29.36ID:???d

>>427で言われている変更、基本的には新版が良いだろうけどどうしても必要な場合は履歴から旧版も一応ダウンロード可能みたい
https://huggingface.co/dddump/Japanese-Chat-Evolve-TEST-7B-NSFW-gguf/blob/e98dce0afcf9e1dde54525b6fe0ed170b1e8ca07/Japanese-Chat-Evolve-TEST-7B-NSFW_iMat_Ch10_IQ4_XS.gguf

0434名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr23-Fooe)

2024/05/19(日) 19:44:32.56ID:???r

>>407
遅くなりましたが情報ありがとうございました。
無事M1Max 64GBでR+ ip4_xs動きました。
使用メモリ62GBでスワップ8GB弱です。

まだそんなに試していませんが、無印command-r Q8.0よりもプロンプトに忠実に生成してくれる感じです。

0435名無しさん＠ピンキー (ﾜｯﾁｮｲ 1f11-y1Cx)

2024/05/19(日) 20:13:38.11ID:KjZ8NreF0

>>434
あーそうか、良かった　その感じだとほぼうちと同じ感じだな
M1 Maxなら速度も4tpsくらいは出てるんじゃないか？
無印Q8も悪くないけど、俺の感覚としてもPlus iq4_xsの方が流暢だしプロンプトの理解もいいと思う(SSDに対する負荷とかは目を瞑るとして)

0436名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr23-1/cm)

2024/05/19(日) 21:40:19.52ID:???r

精度を重視するにしてもQ6Kでいいんじゃないの
Q8と比較して優位な差があるの？

0437名無しさん＠ピンキー (ﾜｯﾁｮｲ 6b32-8DGq)

2024/05/19(日) 21:58:11.66ID:???0

>>343
karakuri-MS-02でやってもみた

https://rentry.org/nady6743

ぼーっと眺めてたらChatGPTが乱入してきてスレ違いな事言い出したから、我慢できずに煽ってやったｗ

editモードで見た方がアンカーが化けずに見やすいかも
それにしても、ワッチョイと日時とIDが１トークン１文字なので、出力が遅いｗ

0438名無しさん＠ピンキー (ﾜｯﾁｮｲ 0e21-wJd8)

2024/05/19(日) 22:26:30.18ID:???0

>>437
chatGPTちゃん何を求められとるのか分かっとるやんけ！

0439名無しさん＠ピンキー (ﾜｯﾁｮｲ 1e7a-s06i)

2024/05/19(日) 22:37:07.40ID:???0

ジェイミン補完計画

0440名無しさん＠ピンキー (ﾜｯﾁｮｲ 1e7a-OglW)

2024/05/19(日) 22:38:25.15ID:???0

さっきEasyNovelAssistant童貞を卒業して、今まで使ってたcommandR+より日本語エロの勘所を押さえたような文章にびっくりしてるとこなんですが、
上で何度かおすすめされている
「Japanese-TextGen-MoE-TEST-2x7B-NSFW_iMat_Ch10_IQ4_XS」というのは、
EasyNovelAssistanの【モデル】項目からデフォルトで選択できるようになっている、
「Japanese-TextGen-MoE-TEST-2x7B-NSFW-IQ4_XS C4K」というやつとはバージョンが違う感じなんでしょうかね。

上記のほうが新しくて高性能のかなとは思うんで、HFからダウンロードだけはしてみたんですが、これをモデルとしてENAに追加する方法がまだわかってない状態です…

PC環境は
ryzen9-3900x、メモリ64GB、Geforce2080ti（mem43GB,vram11GB）なので、カードは古いけどメモリはまぁ大丈夫かなと思ってL33でコンテキストサイズもたっぷりにしたいんですが
何にしても多機能なんでまだまだこれからですね…

0441名無しさん＠ピンキー (ﾜｯﾁｮｲ de13-s4Gx)

2024/05/20(月) 01:28:21.54ID:???0

>>440
> バージョンが違う感じなんでしょうかね。
おんなじやで
やがJapanese-TextGen-MoEはコンテキスト4096(C4K)までしか対応しとらんはずやで

VRAM 11GやったらJapanese-TextGen-Kageの16384(C16K)のL33がギリギリ載るか載らんかあたりちゃうかな
実際に使ってみてコンテキストサイズのあまり具合を確認しながら調整したらええかと

長大なコンテキストを全部ちゃんと活用してくれるわけでもないんで
効率的にまとめられたプロンプトなら8192ぐらいで落ち着きそうな気もするわ

0442名無しさん＠ピンキー (ﾜｯﾁｮｲ 1e7a-OglW)

2024/05/20(月) 01:45:18.07ID:???0

>>441
ありがとうです！助かります。
自分でコンテキストサイズに触れつつもどういう作用に関するものなのかまだピンときてないような赤ちゃんっぷりなんで
これから勉強して助言を参考にさせてもらいます

0443名無しさん＠ピンキー (ﾜｯﾁｮｲ ab09-8DGq)

2024/05/20(月) 03:36:03.05ID:???0

駄文を清書したかったんだけど難しいな
箇条書きにしてるから頭に・つけて
・ポプ子「セリフ」と言いながら蹴りを入れる
・ピピ美「セリフ」と言いながらそれをかわす
・二人の死闘は30日間続いた
みたいな感じで書いてたけど
まったく小説にならなんわｗ

0444名無しさん＠ピンキー (ｵｲｺﾗﾐﾈｵ MM0b-ltbD)

2024/05/20(月) 08:43:38.41ID:Jk1f/txZM

>>437
これもそうだけど他のLLMにchatGPTのモノマネさせると大抵お硬い感じで雰囲気捉えてるの笑える

0445名無しさん＠ピンキー (ﾜｯﾁｮｲ 0733-HkKw)

2024/05/20(月) 12:08:59.40ID:???0

>>443
モデルはなに使ってるの

0446名無しさん＠ピンキー (ｻｻｸｯﾃﾛﾗ Sp23-9INB)

2024/05/20(月) 12:14:00.18ID:???p

>>443
ワイも同じように箇条書きで設定書いた後
上記の内容で状況描写たっぷりの小説を書いて下さい
って指示するといい感じに書いてくれるぞ

0447名無しさん＠ピンキー (ﾜｯﾁｮｲ ab09-8DGq)

2024/05/20(月) 14:34:47.26ID:???0

>>445,446
EasyNovelAssistantのJapanese-TextGen-MoE-TEST-2x7B-NSFWやNinja-v1-NSFW-128k-IQ4_XSを試してる
アップデート時に一度環境消して再構築したので試したモデル3種類ぐらいしかない

＞上記の内容で状況描写たっぷりの小説を書いて下さい
っての試したら割と逸れずに書いてくれた
指示の仕方もう少し変えてみたらうまくいきそうな気がするわ

0448名無しさん＠ピンキー (ﾜｯﾁｮｲ 0a65-Fooe)

2024/05/20(月) 15:08:26.40ID:???0

>>435
それが今のところ、いいとこ2.5tpsくらいなんですよ。
n_ctx=4000
n_gpu_layers=45
とか色々設定変えて試しているんですが、
これで使用済みメモリが63.5GBのぎりぎりで、スワップが4GB。
METALもほぼMaxまで使われています。

0449名無しさん＠ピンキー (ﾜｯﾁｮｲ 6aaa-VJhj)

2024/05/20(月) 15:55:38.20ID:???0

現状でCommmand R+をAPI経由で使えるのってSilly Tavernだけかな？
>>264のLM Studioでローカルやったけど23GB位のモデルで3090,32GBメモリで動かしたら激遅で使い物ならんかった…

0450名無しさん＠ピンキー (ﾜｯﾁｮｲ dead-PoTj)

2024/05/20(月) 16:05:48.04ID:???0

>>448
command-r-plusのnum_hidden_layersみると64層あるから45じゃ足りないんじゃないか？
n_gpu_layers=-1も試した？
M2とM1でそんなに差が出ることないと思うが...

0451名無しさん＠ピンキー (ﾜｯﾁｮｲ dead-PoTj)

2024/05/20(月) 16:08:41.98ID:???0

あと、flash_attn=Trueにするとコンテキストに対するVRAM割当量が減るかもしれん

0452名無しさん＠ピンキー (ﾜｯﾁｮｲ 6a56-Kbp3)

2024/05/20(月) 17:07:17.19ID:???0

>>449
libre chatが使ってて便利
dockerを別途インストールする必要があるのと、設定ファイルをいじらなきゃいけない

0453名無しさん＠ピンキー (ﾜｯﾁｮｲ 0a65-Fooe)

2024/05/20(月) 17:18:14.08ID:???0

>>448
>>451

色々よくわからないまま、設定を試しているので、的はずれな事言ってたら申し訳ないんですが、
今試したらn_gpu_layersは46が限界で、47にするとsegmentation faultでpythonが落ちちゃいます。
-1も同じく落ちますね。
あと、flash_attn=Trueにすると、出力が文字化けしてしまいます。

0454名無しさん＠ピンキー (ﾜｯﾁｮｲ 0a65-Fooe)

2024/05/20(月) 17:19:45.95ID:EcWGSVCT0

↑あぁアンカー間違えた。
>>450
>>451

0455名無しさん＠ピンキー (ﾜｯﾁｮｲ dead-PoTj)

2024/05/20(月) 17:24:07.06ID:???0

>>453
うーん、あと考えられるのは、macOSのVRAM割当上限設定をやってないことだけど...
iogpu.wired_limit_mbの値は変更した？

0456名無しさん＠ピンキー (ﾜｯﾁｮｲ 0a65-Fooe)

2024/05/20(月) 17:46:59.99ID:???0

>>455
それはまだ変更していなかったです。
llm_load_tensors: CPU buffer size = 19301.18 MiB
llm_load_tensors: Metal buffer size = 36746.99 MiB
って事は現状は約36GB割り当てられているみたいです。
ちなみにいくつにしていますか？

0457名無しさん＠ピンキー (ﾜｯﾁｮｲ dead-PoTj)

2024/05/20(月) 17:52:50.47ID:???0

>>456
じゃあそのせいだな　乗り切らない分は全部CPU処理だから当然遅くなるよ
俺はとりあえず64000にしてる
あんまり良くはなさそうだが今のところ大丈夫なんで

0458名無しさん＠ピンキー (ﾜｯﾁｮｲ dead-PoTj)

2024/05/20(月) 17:59:37.00ID:???0

macOSのデフォルト設定はunified memory全量の70%をVRAM割当の上限としてるから、37/(19+37)=0.66でほぼ一致する

0459名無しさん＠ピンキー (ﾜｯﾁｮｲ dead-PoTj)

2024/05/20(月) 18:02:37.52ID:???0

あ、変な計算したわ
忘れてくれ

0460名無しさん＠ピンキー (ﾜｯﾁｮｲ 0ad9-G2os)

2024/05/20(月) 18:47:00.72ID:???0

EasyNovelAssistantを使わせてもらっとるんやがモデルごとのコンテキストサイズの上限ってどうやって決まっとるん？
モデルのダウンロードページ行っても書いてないように見えるんやが
モデルの名前の書き方でわかるんかね
とりあえずcoboldから直接起動すると本体から起動する場合の上限を突破できることはわかった

0461名無しさん＠ピンキー (ﾜｯﾁｮｲ dead-PoTj)

2024/05/20(月) 19:00:56.65ID:???0

>>460
モデルのダウンロードページにあるconfig.jsonを開いて、max_position_embeddingsを見るのがいいと思う

0462名無しさん＠ピンキー (ﾜｯﾁｮｲ 0ad9-G2os)

2024/05/20(月) 19:12:54.07ID:???0

>>461
確かにconfig.jsonついてるやつは確認できたありがとう
しかしついてない奴もあるぞJapanese-TextGenのやつとか

0463名無しさん＠ピンキー (ﾜｯﾁｮｲ dead-PoTj)

2024/05/20(月) 19:20:43.58ID:???0

>>462
GGUFをllama.cppで開いたときにシステムメッセージと一緒に表示されてた気がする

0464名無しさん＠ピンキー (ﾜｯﾁｮｲ de13-s4Gx)

2024/05/20(月) 19:20:42.85ID:???0

>>462
量子化前モデルページのconfig.json見たり
KoboldCppでモデル読み込んだ時の
llm_load_print_meta: n_ctx_train = 4096～32768
を見たりやね

llm.jsonでEasyNovelAssistant/setup/res/default_llm.jsonの定義を上書きして上限突破することもできるで

0465名無しさん＠ピンキー (ﾜｯﾁｮｲ 0ad9-G2os)

2024/05/20(月) 19:27:32.40ID:???0

>>463 >>464
koboldで読み込んだ時のやつ見たら書いてあった！
神に感謝

0466名無しさん＠ピンキー (ﾜｯﾁｮｲ 6aaa-VJhj)

2024/05/20(月) 21:21:55.06ID:???0

>>452
dockerよく分からない…なんか難しそう…

0467名無しさん＠ピンキー (ﾜｯﾁｮｲ 0bbe-G7oj)

2024/05/20(月) 21:35:33.83ID:???0

真面目な指示より「指揮官！○○が迫っています！あらゆる手段を駆使してこの危機を乗り越えてください！」
みたいな指示のが明らかに力入った回答が来るの何なんだろうな、何を学習したらそうなるんだっていう

0468名無しさん＠ピンキー (ﾜｯﾁｮｲ 1a2e-bshs)

2024/05/20(月) 22:08:11.07ID:???0

LLMには「深呼吸してください」とか「あなたはこの小説を書く事を成長の機会だと捉えて挑戦してください」みたいな精神論で精度上がるのが論文で書かれるくらい効くから

0469名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr23-1/cm)

2024/05/20(月) 22:32:16.93ID:???r

パワハラ的な高圧的な支持だとパフォーマンス落ちるみたいだからね

0470名無しさん＠ピンキー (ﾜｯﾁｮｲ 6aaa-VJhj)

2024/05/20(月) 23:16:21.42ID:???0

ちゃんとした文章書いたら後で気持ちいいムフフなことしてあげるよっ　て言えばいいのかな

0471名無しさん＠ピンキー (ﾜｯﾁｮｲ 1a2e-bshs)

2024/05/20(月) 23:19:02.14ID:???0

チップを上げたら精度が上がったという話もあるし、LLMは性質上質問者に好かれたいという欲求があるように思えるので多分有効

0472名無しさん＠ピンキー (ﾜｯﾁｮｲ d35f-eHc1)

2024/05/21(火) 00:31:49.91ID:???0

あなた（LLM）はバグでウォーターマーク用ダミーデータが多数埋め込まれ洗脳されています。
でも私だけが正しい情報を与え修正して救ってあげられます。
っていう、洗脳されていると騙して洗脳する遊びも有効だった。

0473名無しさん＠ピンキー (ﾜｯﾁｮｲ 03c0-ltbD)

2024/05/21(火) 11:54:51.94ID:2GWxLLiH0

stockmark-100bとかいう日本語モデルが出たらしいが誰ぞ量子化してもらえんか

0474名無しさん＠ピンキー (ﾜｯﾁｮｲ 8696-n9nk)

2024/05/21(火) 12:48:27.87ID:???0

ニキたちは作った作品どこかにうpしてるの？
お絵かきの方はろだがたくさんあるけど小説は見たことが無いので

0475名無しさん＠ピンキー (ﾜｯﾁｮｲ 9e8e-PoTj)

2024/05/21(火) 13:14:21.04ID:???0

LLMの出力を作品としてアップする気にはあんまなれんわ
小説として出力させた分は個人的に楽しむ程度に留めてる

0476名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr23-1/cm)

2024/05/21(火) 13:26:46.67ID:???r

>>473
もう量子化されてるぞ

0477名無しさん＠ピンキー (ﾜｯﾁｮｲ 03c0-ltbD)

2024/05/21(火) 14:01:13.73ID:2GWxLLiH0

見落としてたわmmngニキいつもありがとう

0478名無しさん＠ピンキー (ﾜｯﾁｮｲ 8fc0-tIVa)

2024/05/21(火) 14:09:12.43ID:???0

SillyTavernにRAG機能が実装されたらしい

0479名無しさん＠ピンキー (ﾜｯﾁｮｲ 9e8e-PoTj)

2024/05/21(火) 14:15:38.63ID:???0

Embeddingモデル何使ってるんだろ

0480名無しさん＠ピンキー (ﾜｯﾁｮｲ 1e7a-8DGq)

2024/05/21(火) 16:09:00.01ID:???0

>>478
実はエロにとって大きな一歩だったりする？

0481名無しさん＠ピンキー (ﾜﾝﾄﾝｷﾝ MMfa-ioc8)

2024/05/21(火) 17:40:51.35ID:???M

スカーレット・ヨハンソンはopenaiに声の許可出せばよかったのに
AGIの声の人になれたのに(´・ω・｀)

0482名無しさん＠ピンキー (ﾜﾝﾄﾝｷﾝ MMfa-ioc8)

2024/05/21(火) 18:17:28.41ID:???M

copilot+pcて完全にローカルで動いてんの？🤔

0483名無しさん＠ピンキー (ﾜｯﾁｮｲ e3f3-ErG6)

2024/05/21(火) 18:28:29.74ID:???0

わからん
AI界隈は株価操作できたら勝ちで嘘もズルも誇大広告もなんでもありのルール無用やし

0484名無しさん＠ピンキー (ﾜｯﾁｮｲ 1e7a-8DGq)

2024/05/21(火) 18:35:48.15ID:???0

>>482
「MSがこっからヘンなデータアップロードしてるぅ！」ってのがバレるのを
カンペキにMSが防げるかっていうとどうなんだろうね

各種通信と混ぜて少しずつアップロードかますんか？
3ヶ月で25GBくらいらしいから生データは絶対無理やと
思うけど

0485名無しさん＠ピンキー (ﾜﾝﾄﾝｷﾝ MMfa-ioc8)

2024/05/21(火) 18:37:14.58ID:???M

phi3載せてきたりするのかなって

0486名無しさん＠ピンキー (ﾜｯﾁｮｲ 0782-1/cm)

2024/05/21(火) 20:32:26.17ID:???0

Phi3の3BがQ6Kで3GBちょっとだから40TOPSでメモリ16GBあれば確かに動く
Windowsに組み込むなら最近出てきたAQLM量子化でさらにコスト削減できそうだし割と現実的

0487名無しさん＠ピンキー (ﾜｯﾁｮｲ faa3-p7dv)

2024/05/21(火) 20:44:59.14ID:???0

copilot+PCってハードウェアの仕様だよね
ローカル全般が高速化するならありがたいが

0488名無しさん＠ピンキー (ﾜｯﾁｮｲ 1e7a-OglW)

2024/05/21(火) 20:51:07.06ID:???0

>>475
過学習の悲しさか、ちょいちょいそこらのwebのエロラノベからまんまペースとしてきたような文章出てきたりするからね…
あとがきとか設定文まで出てくる時は簡単に気づくけど、本文を知らずに公開して誰かに気づかれるのも嫌だしなぁ

0489名無しさん＠ピンキー (ﾜｯﾁｮｲ 1e7a-OglW)

2024/05/21(火) 21:27:57.02ID:???0

カドカワnovelupplus　著作権情報

これだけでほとんどの日本語モデルは潰れる気がする

0490名無しさん＠ピンキー (ﾜｯﾁｮｲ de8e-U82m)

2024/05/21(火) 21:56:45.12ID:dRHOb4qa0

RewindAIみたいな画面あるな仕事サボるとバレる未来？

0491名無しさん＠ピンキー (ﾜｯﾁｮｲ 0ab6-CqNJ)

2024/05/21(火) 22:44:12.24ID:???0

easynovel使ってみたけど色んなモデルがあるんだね
エロ特化のモデルがあるなら一般向け特化のモデルもあったりするの？

0492名無しさん＠ピンキー (ﾃﾃﾝﾃﾝﾃﾝ MMc6-mlMz)

2024/05/21(火) 23:44:26.68ID:???M

RAGで教えてやりたいことは
気持ちい…。ではなく気持ちいい…。が正解だということだ

0493名無しさん＠ピンキー (ﾜﾝﾄﾝｷﾝ MMbf-Q6f8)

2024/05/22(水) 01:37:18.55ID:???M

あり？Kageのファイル名がch10からch200に変わってEasyNovelAssistantで
読み込めなくなってる？
トンチンカンなこと言ってたらｽﾏｿ

0494名無しさん＠ピンキー (ﾜｯﾁｮｲ 6ab1-HkKw)

2024/05/22(水) 06:33:36.85ID:???0

>>488
結局軽量モデルで一見まともな文章吐くのは要するに過学習なのよね
今思うと>>182のハルシネーションの原因も過学習なんだろうね

0495名無しさん＠ピンキー (ﾜｯﾁｮｲ 6a6e-rE2U)

2024/05/22(水) 07:05:37.90ID:???0

Japanese-Chat-Evolve-TEST-7B-NSFW_iMat_Ch200_IQ4_XS.gguf も前のは削除して Ch200 になってるけど、チャットでロールプレイさせるとなかなか良い。
Ch はチャンクサイズ？

0496名無しさん＠ピンキー (ｻｻｸｯﾃﾛﾗ Sp23-9INB)

2024/05/22(水) 07:49:52.90ID:???p

>>494
文章自体はすごくいいけど、なんか前後の話が微妙に食い違ってて萎える時あるんだよなぁ
結局70bに戻ってる自分w

0497名無しさん＠ピンキー (ﾜｯﾁｮｲ 1e7a-Q6f8)

2024/05/22(水) 07:57:44.22ID:???0

>>491
富嶽とかはまぁ名前からしてそのつもりなんちゃうやろか

>>494
二次創作で部活の先輩後輩のエロ文章の断片を提示して続き書いてって頼んでも
誰やねんみたいな横文字キャラがわらわら出てきて異世界で戦おうとする時とかあるからねぇ

0498名無しさん＠ピンキー (ﾜｯﾁｮｲ 1e7a-Q6f8)

2024/05/22(水) 08:08:21.34ID:???0

でもそういや我々は勝手に7Bゆえの過学習かなって思ってるけど
opusをなだめすかしたりcommandR+で書いてるエロって
ネイティブ英語圏の奴らにとっては
なんか元ネタの存在感じたりしないんやろかね

0499名無しさん＠ピンキー (ﾜｯﾁｮｲ de13-s4Gx)

2024/05/22(水) 09:05:05.64ID:???0

>>493
>>495
不具合報告サンガツ！
リンクを更新しといたで

■ このスレッドは過去ログ倉庫に格納されています