なんJLLM部避難所 ★2

1002コメント390KB

なんJLLM部避難所 ★2

レス数が1000を超えています。これ以上書き込みはできません。

0001名無しさん＠ピンキー転載ダメ (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:27:25.10ID:???0

!extend::vvvvv:1000:512
!extend::vvvvv:1000:512
AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(スクリプト攻撃継続中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所
https://mercury.bbspink.com/test/read.cgi/onatech/1702817339/

-
VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured

VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured

0928名無しさん＠ピンキー (ﾜｯﾁｮｲ dbf9-G58Q)

2024/06/05(水) 19:46:35.88ID:???0

上で上がってるようなRP用モデルはかなりのターン数のデータ使われてるみたいだからだいぶマシなんじゃない？

0929名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f7a-DKSk)

2024/06/05(水) 20:12:43.50ID:???0

お前らなんJLLM部だろ
今までローカルで何を動かしてきたんだよ
opusかGPTでも動かしてきたっての？

0930名無しさん＠ピンキー (ｵｲｺﾗﾐﾈｵ MM9f-wKyR)

2024/06/05(水) 21:37:37.97ID:???M

GPTとかopus使ったうえで、それらと比較してまだ問題点があるから話が膨らむんじゃないの

0931名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f7a-DKSk)

2024/06/05(水) 21:52:23.37ID:???0

つまりopusと比較してるんだろ？
なんかライトユーザーがopusと比較してローカルモデルは～だよねって言ってるように見えるんだが
サイズ何倍違うと思ってんねん
ここはローカルモデルについて研究する場だったと思うが、オナテク板に移動してなんか変なのが大量流入してきてないか

0932名無しさん＠ピンキー (ﾜｯﾁｮｲ 9311-KIU9)

2024/06/05(水) 22:42:19.89ID:o9Fmpo040

ローカルでサイズが小さいから性能も頭打ちだって話を終わらせたら、進化もへったくれも無いだろ
本当にopus並みになるとは思わんが、領域を絞ればある程度近づけそう、くらいの夢がないと面白みがないわ
幸いまだ性能が天井に達してるわけでもなさそうだし
プロンプトなりソフトウェア側の工夫で改善できそうな場所も残ってるなら、そこを議論するのは無駄でもなんでもないと思うが

0933名無しさん＠ピンキー (ﾜｯﾁｮｲ 7732-hJA7)

2024/06/05(水) 23:06:53.54ID:???0

ライトユーザー≒初心者も歓迎してるから>>2があるんじゃないの……？
板移動したら住民は変わるもんだよ

0934名無しさん＠ピンキー (ﾜﾝﾄﾝｷﾝ MMa2-6ljc)

2024/06/06(木) 02:00:54.50ID:???M

あ、なんかcohereお話題が出てたからつい乗っかったよスマンね
ローカルもやってて両方のスレ見てたからちょいちょいごっちゃになるんよな

0935名無しさん＠ピンキー (ｽｯｯﾌﾟ Sd92-fd0q)

2024/06/06(木) 06:39:49.87ID:???d

もしローカルの話題中心にするなら次スレからタイトルを「LLM部」から「ローカルLLM部」に変えるのもありかもな

0936名無しさん＠ピンキー (ｽｯｯﾌﾟ Sd92-fd0q)

2024/06/06(木) 06:42:46.91ID:???d

余談だけどLLM=ローカルと勘違いしてる人が他スレには結構いて、それはここがLLM部という名前でローカルを扱ってることも一役買ってるような気がしてるw
ほんとに余談だすまん

0937名無しさん＠ピンキー (ﾜｯﾁｮｲ 22a3-fd0q)

2024/06/06(木) 07:14:41.69ID:???0

ローカル導入の間口が広がるにつれてライト層が増えるのは避けられない流れだと思うんよね
このスレに限らず新しい技術を扱うスレは皆そういう流れになる
まあ硬軟織り交ぜてやっていけばいいんじゃないの

0938名無しさん＠ピンキー (ﾜｯﾁｮｲ ef8b-V1VE)

2024/06/06(木) 07:24:54.78ID:???0

ここの人はなんというかプライド高い人が多いよね
ローカルユーザーが偉くてオンラインモデルユーザーはライトユーザー！みたいな
でも「実用」に関してはオンラインモデルユーザーのほうが圧倒的に詳しいし、そういう人が流入してきたってことはローカルモデルも実用が見えてきたってことなので、そう邪険に扱うものではないと思うわ

0939名無しさん＠ピンキー (ｽｯｯﾌﾟ Sd92-fd0q)

2024/06/06(木) 07:48:21.50ID:???d

非ローカルを見下してるわけじゃなくて以前みたいなローカル研究の話題主体でありたいということじゃない？
とはいえ間口が広がれば人が増えるし人が増えればそういう雰囲気が薄まるのは避けられないことだと自分は思ってる

0940名無しさん＠ピンキー (ﾜｯﾁｮｲ bea8-j5Hd)

2024/06/06(木) 08:31:06.64ID:???0

LinuxどころかWindowsでコマンドプロンプト開いたこともない奴が質問しにきたら流石にライトユーザって言いたくなる

0941名無しさん＠ピンキー (ﾜｯﾁｮｲ e6ab-V1VE)

2024/06/06(木) 08:36:28.46ID:???0

オンラインはオナテクとしての実用手順がいまいちわからんからほーんとしかならないんよな
どっかに体系的にまとまってたりするんか？

0942名無しさん＠ピンキー (ﾜｯﾁｮｲ 5277-NKtZ)

2024/06/06(木) 08:36:48.16ID:???0

なんならchatgptに聞いたほうが初心者には優しく答えてくれる

0943名無しさん＠ピンキー (ﾜｯﾁｮｲ 9311-KIU9)

2024/06/06(木) 09:40:15.78ID:nINNjRbX0

>>940
その論法エンドレスだよね
多分自分でモデルのアーキテクチャ作ってるような人から見たらここにいる全員ライトユーザーだと思われてると思うよ

0944名無しさん＠ピンキー (ｽｯｯﾌﾟ Sd92-fd0q)

2024/06/06(木) 10:04:32.36ID:???d

EasyNovelAssistantなどの公開と前後してこのスレがどこかで宣伝されて新たな層が入ってきた感はある

0945名無しさん＠ピンキー (ﾜｯﾁｮｲ c741-Ffnw)

2024/06/06(木) 10:36:41.13ID:???0

お客さんひとつあしらえんとかJの看板下ろしたらどうや

0946名無しさん＠ピンキー (ｱｳｱｳｳｰ Sa13-MSF/)

2024/06/06(木) 10:58:21.38ID:???a

えっ、ううん＼(^o^)／

0947名無しさん＠ピンキー (ﾜｯﾁｮｲ c75e-Y7pC)

2024/06/06(木) 11:23:24.89ID:???0

ゲームエンドさん経由で無限に入ってくる

0948名無しさん＠ピンキー (ｻｻｸｯﾃﾛﾗ Spd7-VkBD)

2024/06/06(木) 16:11:43.77ID:???p

ライトとかじゃなく、こっちはモデルを如何に効率よく回すかとか、ローカルではどのモデルが有用とか、量子化やマージ手法の話題とかがメインで
オナニースレはプロンプトを駆使して如何にモデルのポテンシャルを引き出すかを追求するスレで、どっちも技術的なスレでいい感じに棲み分けできてると思うなぁ

0949名無しさん＠ピンキー (ﾜｯﾁｮｲ 67c0-R3YG)

2024/06/06(木) 19:15:28.60ID:RaA0K5uW0

Lora学習チャレンジしたけどあんまり上手くいかんわ

0950名無しさん＠ピンキー (ﾜｯﾁｮｲ 367a-7Hxz)

2024/06/06(木) 19:59:38.78ID:???0

まぁ向こうはスレタイでおよそ察しが付くけど
こっちはLLM全般ぽいスレタイなんで、ローカルメインを押し出して棲み分けるならスレタイにローカル付けてもいいかもね
これからも人は入ってくるだろうし

0951名無しさん＠ピンキー (ﾜｯﾁｮｲ f366-ooJY)

2024/06/06(木) 20:06:26.92ID:JrXMV8Jj0

オナテク板？であることもキツイけどな

0952名無しさん＠ピンキー (ﾃﾃﾝﾃﾝﾃﾝ MM7e-jN4h)

2024/06/06(木) 22:25:28.43ID:???M

俺もプロンプティングしかしてないライト寄りだけど
クラだけローカルで、そこからAPIサービスに繋ぐだけみたいな場合の話題は向こうだよねって思うわけ
ローカル明記は賛成だが移転前のような研究と専門用語ばかりの硬いスレにしなくてもいいと思うけど

0953名無しさん＠ピンキー (ﾜｯﾁｮｲ 4fbe-hJA7)

2024/06/06(木) 22:45:50.03ID:???0

ある種の検索エンジンだから望みの出力に近い内容が掲載されているであろう学習元の小説なり参考書なりに
引っ掛かる単語や文章をいかに選び出すかがカギになってるぽい
参考書によく出てくるお約束のフレーズを入れるだけでも精度が上がるとか
まあそうするとやっぱ現行の生成AIは著作系回避ツールだよなって感じはしてくるけど

0954名無しさん＠ピンキー (ﾜｯﾁｮｲ 9311-KIU9)

2024/06/06(木) 22:48:40.08ID:nINNjRbX0

RAGする時に何かしらreranker使ってるやつおる？
実際どれくらい質が改善するのか聞きたい

0955名無しさん＠ピンキー (ﾜｯﾁｮｲ bf29-apmL)

2024/06/06(木) 23:37:51.47ID:???0

(ﾃﾃﾝﾃﾝﾃﾝ MM7

0956名無しさん＠ピンキー (ﾜｯﾁｮｲ bf29-apmL)

2024/06/06(木) 23:38:07.83ID:???0

誤爆です

0957名無しさん＠ピンキー (ﾜｯﾁｮｲ 2209-hJA7)

2024/06/07(金) 00:40:02.54ID:L+384jCL0

>>927
auto_splitはデフォで有効になってて，これはレスポンス改善への効果はないよ．
API側にstreamingのサポートがあれば短くなるが...
一応，全オプション対応しておいたので，
https://github.com/Risenafis/SillyTavern/tree/sbvits2/public/scripts/extensions/tts
からsbvits2.jsを入手してください．

0958名無しさん＠ピンキー (ﾜｯﾁｮｲ db90-G58Q)

2024/06/07(金) 02:15:03.36ID:???0

Qwen2はエロどんなもんなんだろう

0959名無しさん＠ピンキー (ﾜｯﾁｮｲ db5f-uOOi)

2024/06/07(金) 06:20:42.73ID:???0

中華LLMにエロを期待してはいけないと思う
中国共産党の指導に従わないといけないからね

0960名無しさん＠ピンキー (ﾜｯﾁｮｲ a36a-MSF/)

2024/06/07(金) 10:42:25.72ID:???0

それがなんか規制が緩いらしいよ

0961名無しさん＠ピンキー (ﾍﾞｰｲﾓ MM0e-R3YG)

2024/06/07(金) 12:19:47.06ID:NRs3P/M3M

Xwinには世話になったんで期待半分

0962名無しさん＠ピンキー (ｽｯｯﾌﾟ Sd92-fd0q)

2024/06/07(金) 12:32:26.33ID:???d

中華LLMに天●門事件聞いてもちゃんと答えるからな
検閲どの程度なんだ

0963名無しさん＠ピンキー (ﾜｯﾁｮｲ 2f32-TEJs)

2024/06/07(金) 13:20:36.96ID:???0

Qwen2試した
>>527のタオルの問題は日本語で正解したが、生徒会問題は日本語でも英語でもダメだったわ
日本語性能は1.5と大差なかった
だが、小説書かせたら、ちょっとだけエロ要素に反応してたのは評価するｗ

0964名無しさん＠ピンキー (ﾜｯﾁｮｲ 367a-c+yS)

2024/06/07(金) 13:39:56.77ID:???0

まぁ検閲ゆるいのも今だけでしょAI時代になったら当然規制する

0965名無しさん＠ピンキー (ﾜｯﾁｮｲ ef68-enX/)

2024/06/07(金) 15:47:44.07ID:???0

ガンダム
シード
フリーダム

0966名無しさん＠ピンキー (ﾜｯﾁｮｲ 9311-KIU9)

2024/06/07(金) 17:39:58.88ID:JQdWVaPn0

Copilot+ PCのCopilotはオンラインじゃないと使えないらしい
必ずしもモデル自体がローカルで動いていない、とは限らないけど
https://x.com/shi3z/status/1798724388625506493

0967名無しさん＠ピンキー (ﾜｯﾁｮｲ 367a-7Hxz)

2024/06/07(金) 18:08:35.81ID:???0

そりゃMSはプロンプト集めるのが目的だしｗ

0968名無しさん＠ピンキー (ﾜｯﾁｮｲ a36a-MSF/)

2024/06/07(金) 18:25:34.32ID:???0

なんだ清水かよ

0969名無しさん＠ピンキー (ｵｯﾍﾟｹ Srd7-uOOi)

2024/06/07(金) 19:29:10.98ID:???r

>>966
最悪だな
要するに推論コストをユーザーに押し付けるためだけにローカルで動かすってことだろ
クラウドなら情報抜かれるのは致し方ないが、ローカルLLMでオンライン要求は最低

0970名無しさん＠ピンキー (ﾜｯﾁｮｲ 67c0-fd0q)

2024/06/07(金) 20:30:59.96ID:???0

Copilotには期待していない
期待するのはCopilot+PCで他のローカルモデルが高速化するかだ

0971名無しさん＠ピンキー (ﾜｯﾁｮｲ fe9b-Y3Vv)

2024/06/07(金) 20:56:16.09ID:6d8a34250

二次創作ならその作品の知識が入ってるモデルが良いんだろうけど
そのモデルがどのくらい知識入ってるのかさっぱり分からん。
ググっても自分には紹介になってない紹介でわからんわ。

0972名無しさん＠ピンキー (ﾜｯﾁｮｲ 9311-KIU9)

2024/06/07(金) 22:34:35.70ID:JQdWVaPn0

ギャルゲーごっこしてたらセックスが下手すぎて嫌われた

https://i.imgur.com/4BZCdQ4.png
https://i.imgur.com/JMkOTA6.png
https://i.imgur.com/RwGLkyO.png

0973名無しさん＠ピンキー (ﾜｯﾁｮｲ 0609-TEJs)

2024/06/07(金) 23:59:29.59ID:???0

koboldcpp-1.67のkoboldcpp_cu12.exeをkoboldcpp.exeにリネームして
EasyNovelに突っ込んだんだけど動くもんだな
なんで動いてるのか全く理解してないけどｗ

0974名無しさん＠ピンキー (ﾜｯﾁｮｲ 4311-b3Fy)

2024/06/08(土) 00:55:43.59ID:KtP0FeP50

EasyNovelとkobold.cppのやりとりは、ソースコード見る限りrequestsでPOST投げてるだけだから、kobold.cpp側のAPIの形式さえ変わらなければ基本問題ないんじゃね

0975名無しさん＠ピンキー (ｻｻｸｯﾃﾛﾗ Sp57-pZ0l)

2024/06/08(土) 07:54:06.49ID:???p

koboldがspeech to textに対応したね
じきに読み上げにも対応するかな？

0976名無しさん＠ピンキー (ﾜｯﾁｮｲ 8f69-96ZD)

2024/06/08(土) 14:48:23.69ID:???0

どのモデルも頑なすぎるんだが
どうやったらチャH持ち込めるんや…

0977名無しさん＠ピンキー (ﾜｯﾁｮｲ cf7a-0ZzU)

2024/06/08(土) 15:01:19.20ID:???0

チャH、ASMR、豊かな音声読み上げ　夢も股間も膨らむ

0978名無しさん＠ピンキー (ﾜｯﾁｮｲ ff3b-oLG6)

2024/06/08(土) 15:04:30.72ID:???0

必要なマシンスペックも膨らんで財布が萎むのは改善を要望する

0979名無しさん＠ピンキー (ﾜｯﾁｮｲ ff3b-oLG6)

2024/06/08(土) 15:06:07.87ID:???0

そろそろ次スレの準備よろしくやで

0980名無しさん＠ピンキー (ﾜｯﾁｮｲ 33be-bKLA)

2024/06/08(土) 15:09:38.61ID:???0

>>962
そりゃ偏った情報しか見せられてない日本人より中国人のほうが詳しく知ってるし
天安門の映像はTiktokでは西側の検閲がかかってない当時の生映像が大量に上がってる

0981名無しさん＠ピンキー (ﾜｯﾁｮｲ 93c0-6+CE)

2024/06/08(土) 15:16:39.94ID:???0

EasyNovelって一旦生成はじめたら終わりまで作る機能ってある？
リトライしないと不都合な物もあるだろうけど、1話分くらいを一晩でつなげて読んでみたい…

0982名無しさん＠ピンキー (ﾜｯﾁｮｲ 4311-b3Fy)

2024/06/08(土) 21:23:02.43ID:KtP0FeP50

このモデル結構いいな
純粋に無修正化したLlama-3-70Bって感じ(日本語力も同じくらいだからエロ語彙は少ないが)
Llama-3-70はfinetuning難しいって話で実際大体ゴミモデルになってたんだけど、こいつは体感本家と変わらない感じがする
Pythonコーディング・Function Calling・RAG性能あたりも遜色ない

https://huggingface.co/failspy/Smaug-Llama-3-70B-Instruct-abliterated-v3

0983名無しさん＠ピンキー (ﾜｯﾁｮｲ 4311-b3Fy)

2024/06/08(土) 21:47:10.65ID:KtP0FeP50

上のモデルのサンプル

ロリエロ
https://i.imgur.com/OS8FtjC.png
プログラミング
https://i.imgur.com/YDng7Cv.png
RAG & Function Calling
https://i.imgur.com/pZqKi1u.png

0984名無しさん＠ピンキー (ﾜｯﾁｮｲ b332-GHSR)

2024/06/09(日) 00:21:00.37ID:???0

>>982
70Bの情報助かる
RAG使えるってことは、尻でも使えるんかな？

0985名無しさん＠ピンキー (ﾜｯﾁｮｲ d332-1i4V)

2024/06/09(日) 07:08:13.78ID:???0

>>981
それ普通にkoboldCppでやればいいんでは？

0986名無しさん＠ピンキー (ﾜｯﾁｮｲ efc5-fT3B)

2024/06/09(日) 07:25:12.56ID:???0

AIW問題でCR+とかLiama 3 70Bみたいなベンチマーク性能の高いモデルの正答率が壊滅的でCR+に関してはゼロってあったからCR+使って手動でやってみた
https://twitter.com/JJitsev/status/1799025460724289544
結果、5/10は正答してるからゼロにはならなさそうやが（答え：2人）
https://i.imgur.com/xcoMJpr.jpeg

0987名無しさん＠ピンキー (ﾜｯﾁｮｲ f30d-NGCR)

2024/06/09(日) 07:28:03.34ID:???0

KVの量子化でGPUメモリ使用量減らすのよさそう．

https://www.reddit.com/r/LocalLLaMA/comments/1dalkm8/memory_tests_using_llamacpp_kv_cache_quantization/

0988名無しさん＠ピンキー (ﾜｯﾁｮｲ 93c0-6+CE)

2024/06/09(日) 07:33:32.45ID:???0

>>985
chatの使い過ぎでstory忘れてた

0989名無しさん＠ピンキー (ﾜｯﾁｮｲ 93c0-oLG6)

2024/06/09(日) 07:35:55.16ID:???0

次スレ建ててええか？
テンプレはあまり変わらんが

0990名無しさん＠ピンキー (ﾜｯﾁｮｲ 93c0-oLG6)

2024/06/09(日) 07:49:55.31ID:???0

建てたった
なんJLLM部避難所 ★3
https://mercury.bbspink.com/test/read.cgi/onatech/1717886234/
スレタイにローカル入れるかどうか迷ったがとりあえず今回は見送った
必要なら次々スレまでに議論してな

0991名無しさん＠ピンキー (ﾜｯﾁｮｲ efb8-bKLA)

2024/06/09(日) 08:34:11.08ID:R9heIntk0

>>957
ありがとうさんやで！

0992名無しさん＠ピンキー (ﾜｯﾁｮｲ 33be-bKLA)

2024/06/09(日) 12:51:11.25ID:???0

なまじベンチマークが公開されて標準化するとベンチに最適化されて信用できる指標じゃなくなっちゃうんだよな
極論答え丸覚えするだけでも突破できるわけだし

0993名無しさん＠ピンキー (ﾜｯﾁｮｲ 836a-g8m1)

2024/06/09(日) 13:12:37.28ID:???0

レスポンス投げるとスコアリングしてくれるサービスがあればいいよね

0994名無しさん＠ピンキー (ﾜｯﾁｮｲ 03c0-7xfz)

2024/06/10(月) 01:16:44.17ID:???0

>>957
ですよね!書いたあと思ってた
助かる

0995名無しさん＠ピンキー (ﾜｯﾁｮｲ 33be-bKLA)

2024/06/10(月) 07:08:32.36ID:???0

commandR、気に入らない題材とそうでないときで出力される文章量が違い過ぎるんだけど
ロールの指定で好みを操作出来たりしないのかな
あなたなは○○に関心を持つ作家ですとかは上手くいかない

0996名無しさん＠ピンキー (ﾜﾝﾄﾝｷﾝ MM5f-OOki)

2024/06/10(月) 10:56:09.84ID:???M

好みで文章量が変わる事はないでしょ
だったら俺が使ってるCR+は未成年調教NTRが大好きな変態って事になる
変わるのはこちらからのレスのやり方次第だからどんなレスをしてるのか言わないと答えようがないと思うよ

0997名無しさん＠ピンキー (ﾜｯﾁｮｲ 4330-f3BZ)

2024/06/10(月) 11:30:11.48ID:???0

どういう比較をしたのか分からんから何とも言えないが文章量は題材というよりプロンプトの影響が大きいと思う
題材の指示以外全く同じ文章のプロンプトで何度か比較して明らかに特定の題材だけ文章量が少なくなるとかだとそのモデルが苦手と言っていいかもしれない
ただ一言で題材って言ってもその粒度というか具体性の高さによって文章量の差が発生することもあるだろうから定量的な比較をしようと思ったら色々考慮しなきゃならない

0998名無しさん＠ピンキー (ﾜｯﾁｮｲ bf3c-fT3B)

2024/06/10(月) 12:14:55.05ID:???0

>>996
いや好みで出力は変わるよ
AIに好きなタイプを設定して一致するユーザーとしてやりとりしてみればいい
一致しないユーザーと比べたら全く変わってくるから
AIの好きなことを設定してそれに沿った行動や設定を付けると出力も精度も全く変わってくる

0999名無しさん＠ピンキー (ｽｯﾌﾟｰ Sddf-f3BZ)

2024/06/10(月) 12:55:49.27ID:???d

>>998
>>995を見る限り元の話はプロンプトで設定した人格の好き嫌いじゃなくて言語モデル自体に好き嫌いがあるんじゃないかって話じゃない？

1000名無しさん＠ピンキー (ﾜｯﾁｮｲ cf7a-OOki)

2024/06/10(月) 13:53:20.20ID:???0

ですな

10011001

Over 1000Thread

このスレッドは１０００を超えました。
もう書けないので、新しいスレッドを立ててくださいです。。。
life time: 38日 19時間 25分 57秒

レス数が1000を超えています。これ以上書き込みはできません。