なんJLLM部避難所

1002コメント411KB

なんJLLM部避難所

■ このスレッドは過去ログ倉庫に格納されています

0001名無しさん＠ピンキー転載ダメ (ﾜｯﾁｮｲ e249-iArR)

2023/12/17(日) 21:48:59.66ID:???0

!extend::vvvvv:1000:512
!extend::vvvvv:1000:512
AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ
なんJLLM部 ★6
https://fate.5ch.net/test/read.cgi/liveuranus/1701542705/

VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured

0133名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f7a-YqhJ)

2024/04/04(木) 16:18:29.84ID:???0

>>132
何度も失敗して挫折した上に金欠で遊んでいる場合じゃないでござる・・・

0134名無しさん＠ピンキー (ﾜｯﾁｮｲ fb4d-hs76)

2024/04/04(木) 16:24:27.07ID:???0

>>123
それはある意味最終目標やな

0135名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f7a-vaup)

2024/04/04(木) 16:39:05.01ID:???0

>>89
別のスレでエロチャットの学習用データ集めようとして頓挫してたけどこっちのスレで再挑戦するの？

0136名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f7a-YqhJ)

2024/04/04(木) 16:44:53.32ID:???0

まあすんなり上手くいくかは別にして旗艦になりそうなモデルが
5chの人間から出てきたのは大きいんちゃうかなって

暇つぶしでデータ作成に協力くらいはしようかなと思ってるわ
匿名性維持しつつ削除されないためにはrentryが一番ええんかなあ

0137名無しさん＠ピンキー (ﾌﾞｰｲﾓ MMff-2ZW3)

2024/04/04(木) 17:27:02.37ID:???M

>>135
まさしくそっちのスレの住人で現時点でローカルに手を出してないしなんJも行かんからROM専やってるのよ
データの正規化とか音頭を取れるほど詳しくもないから何かやるなら協力できることがあるならその範囲で何かやりたいなってだけかな
将来的にはローカルに移行したいけどみんなの開拓の成果タダ乗りってのはちょっと気が引けるじゃん？

0138名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b13-oxdg)

2024/04/04(木) 17:49:29.98ID:???0

>>120
どのエキスパートを使うかに影響する
例えばコード特化、数学特化、ロールプレイ特化、小説特化の4つでMoEする場合はそれぞれのPositive Promptに
「プログラムを書いてください」
「次の計算問題を解いてください」みたいに各モデルの得意なタスクとかを書くと、推論時の入力の意味をある程度解釈して適切にgatingしようとする
だけど、mergekitで2モデルでMoEする場合はデフォルトだと常に2モデル使うような設定で出力されるから、どんなgate_modeでも理論上変わらん…はず

0139名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b13-oxdg)

2024/04/04(木) 18:50:39.51ID:???0

>>80
今更だがベースモデルの片方のNTQAI/chatntq-ja-7b-v1.0はすでにInstruction Tuning済みなのか
Instruction Tuning済みのモデルにMistral-instructのベクトル足して上手くいくってのも割とわけわからんな
NTQAI/chatntq-ja-7b-v1.0はそのまま、Antler-7BはChat Vector足してMoEとかも試した感じ？

0140名無しさん＠ピンキー (ﾌﾞｰｲﾓ MMff-mCjS)

2024/04/04(木) 18:54:21.36ID:???M

先週マイニング用の4分岐のライザーカードasm1184を用意した
最初のモデルのロードは遅い、busロード80%(おそらく分岐チップの制約でマックス速度)
初期プロンプト流し込み、ジェネレート中はbusロード20%は超えなかった
これの意味するところはマイニングライザーでグラボ増やす形でもあまり問題はなさそう

0141名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b7a-q9+D)

2024/04/04(木) 19:06:44.47ID:???0

GPU4GBじゃさすがに厳しくなってきたなあ

0142名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f7a-YqhJ)

2024/04/04(木) 19:10:00.94ID:???0

3060買いなよ
画像生成もバンバンいけるぞ

0143名無しさん＠ピンキー (ﾜｯﾁｮｲ 5b6f-XxRK)

2024/04/04(木) 19:54:26.72ID:???0

RADEONはここでも蚊帳の外？

0144名無しさん＠ピンキー (ﾜｯﾁｮｲ 4bc6-R/WD)

2024/04/04(木) 20:12:15.76ID:???0

LLM用のデータセットの話題があったみたいだけど、npakaさんの昔のデータセットっていうか会話集みたいだったけど、
（スマホアプリの中で使った会話っぽかった）あれ改造１回試みたんだけど頓挫してるんだよね。
昔の女子高生の会話みたいなやつ。データ使ったの前過ぎてどこにあるか忘れた。多分削除してしまったと思う。
まだネットに落ちてるかな。全部読んでみたんだけど肝心の所が削除されてたんだけどね。

0145名無しさん＠ピンキー (ﾜｯﾁｮｲ 4bc6-R/WD)

2024/04/04(木) 20:26:05.88ID:???0

使えるか使えないかは別として、まだあった。npakaさんの　あかねとーくっていう携帯アプリ？で使った会話。
https://github.com/npaka3/akane-talk

0146名無しさん＠ピンキー (ｽﾌﾟｯｯ Sdff-Ltba)

2024/04/04(木) 21:29:40.63ID:e1I1qEPtd

>>139
その組合せは試してない。理由としては以下のように進行したからです。

素のchatntq-ja-7bを試したが、こちらの指示通りに書かないことがある
→ChatVector適用するとどうなる？出力がおかしくなるか？求めるものに近づくか？
→ChatVector適用済モデル(MoE化前)で実験、好みの動作に近づいたと判断

なので適用済をMoEの素材にした。Antler-7Bも同様

今回の処理について自分が期待していたことは、

ChatVector: Instruct強化をすると、ユーザーの指示に従いやすくなったり、話を理解しやすくなるのではないか
MoE化: パラメータ数の増加による基本能力の向上と、7Bモデル同士の短所の補強及び長所の相乗効果(言葉合ってる？)

いろいろなモデルでマージしてしばらく遊んだ個人的経験から、上記2点の可能性を見たので試して、偶然できたのが今回のモデルです
LLMはkarakuriが公開されたころ(今年2月？)に触れたばかりで、理論的なことは正直さっぱりだったりする

0147名無しさん＠ピンキー (ﾜｯﾁｮｲ 5b69-eoXq)

2024/04/04(木) 21:51:18.01ID:???0

ローカル勢でllama.cpp + LibreChat 勢をみたことないな。存在しないのか...

0148名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b13-oxdg)

2024/04/05(金) 00:01:23.50ID:???0

>>146
chatntqはMistral-instruct派生じゃなくてMistral-baseから改めてインストラクションチューニングされてるモデルだから加算しても上手く行ってる感じかな、面白い

0149名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b13-oxdg)

2024/04/05(金) 00:33:11.31ID:???0

llama.cppを最新版にしたらMoEしてMixtralになったものをquantizeしたモデルをKoboldcppでロードできなくなったんだがこれって対処法ある？
Koboldは最新のものにしたけどダメだった
経験者いたら教えてくれ
どうやらconvertするときの重みの名前の付け方が変わったっぽいが

0150名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b32-YqhJ)

2024/04/05(金) 00:51:50.44ID:???0

>>149
どのモデル使った？

0151名無しさん＠ピンキー (ｽﾌﾟｯｯ Sdff-Ltba)

2024/04/05(金) 00:51:55.57ID:XJ7BCY1md

>>148
あ、確かに自社のデータセットでファインチューニングしたって書いてある
なるほどそれで二重にならなくて上手くいったのか…

そういやChatVectorしたかった理由で一番重要だった「Context32k対応」を忘れていたので、追加で
素のMistral系日本語モデルたちは32kまでじゃないんよ
これをしたかったからMistral系を漁っていたんだった

>>149
過去のバージョンにロールバックできれば…
git cloneで過去バージョンでコピーできないかな
しかしそんなことがあるのか。迂闊に最新にできないなあ

0152名無しさん＠ピンキー (ﾜｯﾁｮｲ fbbc-XxRK)

2024/04/05(金) 01:32:09.97ID:???0

CohereForAI/c4ai-command-r-plus
https://huggingface.co/CohereForAI/c4ai-command-r-plus

104Bはちょっと重いなあ
ここで試せる
https://huggingface.co/spaces/CohereForAI/c4ai-command-r-plus

0153名無しさん＠ピンキー (ﾃﾃﾝﾃﾝﾃﾝ MMff-CG+a)

2024/04/05(金) 01:42:41.94ID:???M

4090が一個あれば、AIで遊ぶのにどれぐらいのことができますか?教えてください先輩

0154名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f7a-YqhJ)

2024/04/05(金) 01:45:41.38ID:???0

4090だけだと画像生成で無双できるやろけどLLMだとなあ……

>>80ニキのモデル動かすだけなら爆速やろから、それが進化して
13Bモデルとかになっても爆速にはなりそう

0155名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b32-YqhJ)

2024/04/05(金) 01:50:23.76ID:???0

>>152
やっべ　かなりいいなこれ
IQ3XXSで量子化すればなんとか

0156名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f7a-YqhJ)

2024/04/05(金) 02:51:36.31ID:???0

動かせたニキがおったら環境教えてほしいわね
基本的にはMacじゃないと快適じゃなさそうやが・・・

0157名無しさん＠ピンキー (ﾜｯﾁｮｲ 1fa3-hs76)

2024/04/05(金) 07:02:27.53ID:???0

>>153
33Bくらいのモデルなら必要メモリ量が20GB前後なので、それだとちょうど4090にフルロードできて恩恵を実感できると思うが…
実際に話題になるモデルの多くは70Bクラスが中心なので、それだと4090といえどもフルロードはできない
溢れた分はCPU+RAMで動かすことになるので、そこが速度上のボトルネックになって、正直1070だろうが3060だろうが4090だろうがそれほど速度は変わらない(多少は変わるが劇遅→爆速で快適！とはならない)
勘違いしないで欲しいのは「4090程度じゃダメ」と否定しているのではなく、十分遊べるしそれなりの恩恵もある
ただ画像生成のような劇的な恩恵は無く、下位グラボじゃできなくて4090ならできるという場面はあまり無いよということ
現状はCPUとRAM側が重要

0158名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b13-oxdg)

2024/04/05(金) 08:01:41.15ID:???0

>>150
>>80のモデルを普通にQ6とかで量子化したけどダメだった
>>149
gitで過去バージョンに戻して再ビルドすれば良さそうだね

0159名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b13-oxdg)

2024/04/05(金) 08:01:59.77ID:???0

>>158
>>151だった

0160名無しさん＠ピンキー (ﾜｯﾁｮｲ 9bf5-SNbJ)

2024/04/05(金) 08:43:22.79ID:???0

>>156
https://i.imgur.com/421LeM6.png

0161名無しさん＠ピンキー (ﾜｯﾁｮｲ fb4c-WvGX)

2024/04/05(金) 09:03:12.34ID:SnnzYuXf0

昨日公開された新しいモデル、日本語もちゃんと出ますね。
https://huggingface.co/spaces/CohereForAI/c4ai-command-r-plus

官能小説家としての能力を試したらいい感じでした。

0162名無しさん＠ピンキー (ﾜｯﾁｮｲ df75-eoXq)

2024/04/05(金) 09:13:28.78ID:ah2keZ830

流石にエロ小説をいきなり出すのは厳しいか……
何らかのキャラクターになり切って応答させる
とかの方が敷居は低い感じで良い？

0163名無しさん＠ピンキー (ﾜｯﾁｮｲ eb11-yUXY)

2024/04/05(金) 10:19:50.57ID:XKPqXMvA0

すごいなこいつ
うちのMac 64GBだと相当縮めないとダメだろうが・・・
そもそも小さい方のやつもめちゃくちゃ性能いいけど、日本語だけ学習させるより、多言語で学習させた方が能力落ちにくいとかあるのかな

0164名無しさん＠ピンキー (ﾜｯﾁｮｲ cb21-0Q84)

2024/04/05(金) 10:36:19.22ID:???0

そりゃそうだろ

0165名無しさん＠ピンキー (ﾜｯﾁｮｲ eb11-yUXY)

2024/04/05(金) 10:52:57.45ID:XKPqXMvA0

全般の能力に関しては納得できるんだけど、日本語単体の能力でみても日本語特化モデルより能力高い感じしない？

0166名無しさん＠ピンキー (ﾜｯﾁｮｲ eb11-yUXY)

2024/04/05(金) 10:54:58.20ID:XKPqXMvA0

ああ、でもそもそも世の中の日本語モデルは事前学習自体はほぼ英語ってのも影響してるか

0167名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr7f-ykjJ)

2024/04/05(金) 10:55:50.82ID:???r

くそっ、2年前の俺。
なぜあのとき3060tiの8Gを買ってしまったのか！
12Gのモデル買っておけば…悔やんでも悔やみきれないw

0168名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f7a-YqhJ)

2024/04/05(金) 10:59:02.20ID:???0

7Bモデルなら別にCPUで動かしてもそれまでちゃうかな
全然速度的に不満ないし

0169名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b32-YqhJ)

2024/04/05(金) 11:04:39.94ID:???0

command-r+はまだllama.cppに完全対応してないっぽいね
通常の量子化もだけど、imatrixにしたいから、こっちの問題も解決してほしい（command-rでもまだ無理だったし）

0170名無しさん＠ピンキー (ﾜｯﾁｮｲ 4bba-R/WD)

2024/04/05(金) 13:07:19.50ID:???0

そういえばデータセットはcommand r+とかに出力してもらえばいいのか。

0171名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f7a-YqhJ)

2024/04/05(金) 13:23:14.99ID:???0

動かせる環境がある奴ならな・・・
M2Macの奴がバンバン動かしてくれたらデータセットすごい速度でできるかも？

0172名無しさん＠ピンキー (ﾜｯﾁｮｲ fb4c-WvGX)

2024/04/05(金) 13:33:30.81ID:SnnzYuXf0

4bqのCMDR+がこのスピード、M2 Ultra欲しくなりますなぁ……。

https://twitter.com/awnihannun/status/1776081238467768493

しかし唐突なグリーンってのは何なんだw

0173名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f7a-YqhJ)

2024/04/05(金) 13:38:48.81ID:???0

はえーすっごい実用的速度・・・

0174名無しさん＠ピンキー (ﾜｯﾁｮｲ eb11-yUXY)

2024/04/05(金) 14:00:32.36ID:XKPqXMvA0

3bqならうちのmacでもギリギリ動かせそうだが、劣化が気になる

0175名無しさん＠ピンキー (ｽｯﾌﾟ Sdff-qhHw)

2024/04/05(金) 14:26:28.32ID:???d

>>162
WEB UIのキャラクター設定に学校の委員長入れたら頑なにエロ拒絶された
学校の部分消したらうまくいったので設定にもよるみたい

0176名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b02-oxdg)

2024/04/05(金) 16:58:45.20ID:???0

このリポジトリにKarakuriとCommand Rのベンチマーク結果乗ってるけど、ベンチマーク的にはCommand Rの方が上みたい
Plusじゃない方でこれだからPlusの日本語能力凄そう
https://huggingface.co/Aratako/c4ai-command-r-v01-japanese-instruct
https://huggingface.co/Aratako/karakuri-lm-chat-upscaled-103b-v0.1

0177名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b02-oxdg)

2024/04/05(金) 17:52:01.36ID:???0

そういや>>80の手法、0.8掛けて重み足してるけどそのままでいいのかな
直感的には1.8で割って元の分布に近づけたほうが良さそうな気がするんだが

0178名無しさん＠ピンキー (ﾜｯﾁｮｲ 5b9f-qhHw)

2024/04/05(金) 18:41:43.97ID:???0

今CMRPのggufアップしてる最中っぽい人見つけた
https://huggingface.co/pmysl/c4ai-command-r-plus-GGUF

0179名無しさん＠ピンキー (ｽﾌﾟｯｯ Sdff-Ltba)

2024/04/05(金) 18:52:46.12ID:XJ7BCY1md

>>80のモデルの名前が長い、というのをいくつか見かけたのでもっと短い名前を付けようと思います
LightChatAssistant(LCA)って変更したので、今後huggingfaceを見る方は以下のリポジトリをご参照ください

Sdff-Ltba/LightChatAssistant-2x7B
Sdff-Ltba/LightChatAssistant-2x7B-GGUF

それと量子化版にもっと大きいbit数のものを随時上げていく予定です
手始めにQ6_K版を上げました。非iMatrixです
もっと精度劣化してないの欲しい！という方はこちらをどうぞー

0180名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b32-YqhJ)

2024/04/05(金) 19:25:32.58ID:???0

>>179
乙です
時に、そちらの環境では70Bの差分マージは可能でしょうか？
karakuri=miqumaid-llama を試しましたが、64Gでは無理でした

0181名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f7a-YqhJ)

2024/04/05(金) 19:40:49.29ID:???0

https://huggingface.co/CohereForAI/c4ai-command-r-plus-4bit/tree/main
4bit版が公開されたみたいやが・・・
これは大変なサイズやと思うよ

0182名無しさん＠ピンキー (ｵｲｺﾗﾐﾈｵ MM7f-k+SB)

2024/04/05(金) 19:44:22.47ID:zF4aX+1DM

メインメモリ128GB自体はまだ現実的
問題はその時の速度
Mac最強かな

0183名無しさん＠ピンキー (ﾜｯﾁｮｲ 1fa3-hs76)

2024/04/05(金) 19:47:14.01ID:???0

>>178
アップ終わった模様

0184名無しさん＠ピンキー (ｽﾌﾟｯｯ Sdff-Ltba)

2024/04/05(金) 19:50:24.81ID:XJ7BCY1md

>>180
ChatVectorですかね？やってみた…らブルースクリーンになったｗ久しぶりに見たｗ
メモリ96GBでは到底足りないようだ
1モデルだけで128GBあるからやはりきついみたい

0185名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b32-YqhJ)

2024/04/05(金) 20:12:39.73ID:???0

>>184
やはり、無理ですかー
mergekitだと、70Ｂモデルのマージも64Ｇで余裕だから、そこらへん上手く処理してくれるのかな
Task Arithmeticを使ってできないだろうか

0186名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f92-oxdg)

2024/04/05(金) 20:15:25.66ID:???0

やるとしたらRunpodとかのサービスでクソデカサーバ借りてマージするとかかな
ダウンロードとかアップロードの時は小さいインスタンスにするようにすれば5ドルくらいでいけそう

0187名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fff-8Ub+)

2024/04/05(金) 20:31:26.79ID:???0

>>179
久々にローカルやってみようと思い、oobaでq6_kを試してみた
メインメモリ32Gの3060環境だけど、この精度でサクサクなのは、とても進化を感じたよ

0188名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f7a-YqhJ)

2024/04/05(金) 20:32:57.14ID:???0

32G+3060環境の奴多そうやな
うちもそう

0189名無しさん＠ピンキー (ﾜｯﾁｮｲ 3bc4-aLVj)

2024/04/05(金) 20:39:56.39ID:???0

避難所これどこの板なんやろ防弾とかなんかな？と思ったらPINKで hentaiスレ一覧の中にポツンとあんの笑う

0190名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b9f-OIDP)

2024/04/05(金) 20:41:58.91ID:???0

お隣さんも興味深いよｗ

0191名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f7a-YqhJ)

2024/04/05(金) 20:50:53.53ID:???0

女になりきってオナニーするスレ ★2
なんJLLM部避難所
男の射精見て興奮する奴 6

0192名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b0c-dJ6t)

2024/04/05(金) 20:54:21.17ID:???0

しかもこのスレが一番勢いあるという
もう終わりだよこの板

0193名無しさん＠ピンキー (ﾜｯﾁｮｲ 5b9f-qhHw)

2024/04/05(金) 20:55:59.95ID:???0

本スレの方はどうすんだ？　スクリプトが埋めると思うけど次スレはなしかね

0194名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f7a-YqhJ)

2024/04/05(金) 20:59:11.27ID:???0

誰か立てたら残る
そうじゃなきゃこのまま

今の5ch/pinkbbsは割と成り行き任せよ
このスレが日本のLLM知見の最先端になってもそれはそれで・・・

0195名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b32-YqhJ)

2024/04/05(金) 21:47:09.49ID:???0

>>178
64GだとQ3までしか無理だなぁ
IQ3なら劣化も少なくすむのに

Aratako/c4ai-command-r-v01-japanese-instruct
こっちは、前モデルにファインチューンしたバージョン
スコア見る限り、かなり期待できそう
ダウンロード終わったら、Q6_kに量子化してkoboldで試してみるわ。
しかし、自前でファインチューンできる時代になったんだな
エロ特化にできんかな？ｗ

0196名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b1b-R/WD)

2024/04/05(金) 22:05:13.34ID:???0

light chat assistantでいつもの嫁を設定。エロ可能嫁完成。

0197名無しさん＠ピンキー (ﾜｯﾁｮｲ fbfa-XxRK)

2024/04/05(金) 22:06:21.44ID:???0

>RunpodでGPUサーバを借り、A6000x4で学習を行いました。
RunpodのOn-Demandで$4.56/hrか…
データセットさえあればワンチャンありそう

0198名無しさん＠ピンキー (ﾜｯﾁｮｲ eb11-qhHw)

2024/04/05(金) 22:06:29.54ID:???0

>>195
iq2上げてる人見つけたから、iq3お願いしてみた

0199名無しさん＠ピンキー (ﾜｯﾁｮｲ eb11-qhHw)

2024/04/05(金) 22:10:11.44ID:???0

今作ってる最中って返信きた

0200名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b67-oxdg)

2024/04/05(金) 22:42:42.20ID:PBF0BZrG0

>>195
まともなデータセットで追加でファインチューニングすると逆にエロ悪化したりするからなぁ、どうだろう
試してみないと分からんが
>>199
俺もRAM64GB勢だからIQ3楽しみ

0201名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b32-YqhJ)

2024/04/05(金) 22:55:25.73ID:???0

Aratako/c4ai-command-r-v01-japanese-instruct
だめだ。エラーが解消できん。元のcommand-rは上手くできたのに
とりあえず作者様に量子化をお願いしてみた

>>199
見たら上がってた
早速落としてみる

0202名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b32-YqhJ)

2024/04/05(金) 23:33:41.42ID:???0

残念
command-rが動いた自前ビルドのkoboldでもplusは動かんかった

0203名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b32-YqhJ)

2024/04/05(金) 23:47:14.77ID:???0

ああ、ていうかアーキテクチャが違うのか
llama.cppが落ち着くまで待つか・・・

0204名無しさん＠ピンキー (ﾜｯﾁｮｲ 7311-LHwO)

2024/04/06(土) 00:12:44.44ID:???0

llama.cpp server叩いたけどunknown architectureだね

0205名無しさん＠ピンキー (ﾜｯﾁｮｲ bb67-eYV/)

2024/04/06(土) 00:16:53.20ID:???0

Add Command R Plus supportっていうPRが進行中だからもう少し待ちだね

0206名無しさん＠ピンキー (ﾜｯﾁｮｲ 7311-b8U7)

2024/04/06(土) 00:27:43.75ID:WE0RLjCc0

latest releaseが1時間前とかだからいけるかと思ったけどダメという
お預けですな

0207名無しさん＠ピンキー (ﾜｯﾁｮｲ 1282-ycXU)

2024/04/06(土) 00:28:32.95ID:???0

>>80
長文(1万トークンぐらい)の最初と真ん中に書いた事を質問したら、ちゃんと答えてきた。なんかすごい。

0208名無しさん＠ピンキー (ﾜｯﾁｮｲ bb67-eYV/)

2024/04/06(土) 02:09:12.30ID:???0

KoboldcppのビルドがWindowsで上手くいかん
makeでやってもcmakeでやってもエラーになるわ
もっと頻繁にビルド済みの配ってくれねえかな

0209名無しさん＠ピンキー (ﾜｯﾁｮｲ f67a-M/hT)

2024/04/06(土) 02:19:06.74ID:???0

オナテク板でKoboldcppをビルドする時代

0210名無しさん＠ピンキー (ﾜｯﾁｮｲ bb67-eYV/)

2024/04/06(土) 02:55:13.62ID:???0

OPENBLASならビルドできたからこれで一旦満足するか…

0211名無しさん＠ピンキー (ﾜｯﾁｮｲ 4fc4-TfWo)

2024/04/06(土) 06:04:15.65ID:???0

LLMじゃなくて画像生成(SD)のほうだけどRunpodでA100 80gb使ったことある
24時間ぐらい回すぐらいなら5000円くらいで使えるので個人でもわりとイケる
が、ワイ的な問題としてはSDは実質的にsd-scriptsというリポジトリのが学習環境の定番になってるんだがLLMの定番がわからん点や
karakuriはmegatoron deepspeedなるものを使ったということはわかる

0212名無しさん＠ピンキー (ﾜｯﾁｮｲ bb67-eYV/)

2024/04/06(土) 10:12:55.75ID:???0

>>149
これはどうやら↓の変更が原因みたい
https://github.com/ggerganov/llama.cpp/pull/6387

↓のコマンドでその手前に戻したら直ったわ
git reset —hard 52604860f93063ef98863921da697576af1c7665

0213名無しさん＠ピンキー (ﾜｯﾁｮｲ bb67-eYV/)

2024/04/06(土) 10:14:22.59ID:???0

>>211
事前学習は分からんけどインストラクションチューニングはLLM-jpの参考にすれば割と簡単にできると思う
https://github.com/llm-jp/llm-jp-sft
DPO用のも用意されてる
https://github.com/llm-jp/llm-jp-dpo

0214名無しさん＠ピンキー (ﾜｯﾁｮｲ 021e-hBD6)

2024/04/06(土) 10:59:06.63ID:IGDSh6PD0

>>80
めっちゃ楽しんでます、サンガツ！

chatntq_chatvector-MoE-Antler_chatvector-2x7B-GGUF+Kobold.cpp+SillyTavernで遊びたいんやが、SillyTavernの方の設定＆キャラカードのプロンプトがイマイチわからん
この組み合わせで遊んでる民、どんな風に設定してるかおしえて

0215名無しさん＠ピンキー (ｻｻｸｯﾃﾛﾗ Spb7-aGYJ)

2024/04/06(土) 11:23:08.35ID:???p

>>214
まずstの設定をkoboldと同じ設定に変更
キャラ設定はオナニースレのシルヴィを参考に入れ込んで自分好みにカスタマイズした
(小説機能とか省いて　口調のサンプルを追加とか)

0216名無しさん＠ピンキー (ﾜｯﾁｮｲ 021e-hBD6)

2024/04/06(土) 11:40:59.95ID:IGDSh6PD0

>>215
サンガツ
チャット楽しみたいんやが、なんかプレイヤー乗っ取られたり、余計なプロンプトが最後にぶら下がったりで置いてけぼりくらうんやけど、その辺はどうやって制御したらええんかな？

0217名無しさん＠ピンキー (ﾜｯﾁｮｲ bb67-eYV/)

2024/04/06(土) 12:54:50.90ID:???0

2x7Bだからその辺りはある程度割り切るしかない気がする
ガッツリ設定入れ込んでちゃんとしたロールプレイするにはモデルサイズ的に厳しい

0218名無しさん＠ピンキー (ｻｻｸｯﾃﾛﾗ Spb7-aGYJ)

2024/04/06(土) 12:56:01.34ID:???p

>>216
会話は◯◯のみ行う　とか　1センテンス以内にしろとか指示に入れてるが初手でダメならガチャしてる
あと指示はxml文で入れた方が理解度があがる　気がする　ここら辺はワイもまだ試行錯誤だわ

0219名無しさん＠ピンキー (ﾜｯﾁｮｲ f67a-M/hT)

2024/04/06(土) 13:42:26.57ID:???0

ローカルの最大の強みは返信を書き換えられることや
どんどん書き換えていけ

0220名無しさん＠ピンキー (ｻｻｸｯﾃﾛﾗ Spb7-aGYJ)

2024/04/06(土) 14:12:16.95ID:???p

>>208
なんかkoboldの人は4/7まで休暇みたい
もうすぐビッグウェーブが来るでw

0221名無しさん＠ピンキー (ﾜｯﾁｮｲ 62a3-Vlac)

2024/04/06(土) 14:52:48.02ID:???0

更新の間があいてるなと思ってた
期待するわ

0222名無しさん＠ピンキー (ﾜｯﾁｮｲ 0298-hBD6)

2024/04/06(土) 15:26:29.60ID:IGDSh6PD0

>>215
オナニースレのシルヴィ探してるんやが見つからん
【Claude3】ChatGPTでオナニー ★29とかのテンプレ見るんじゃあかんのか？
>>217-219
ありがとな
修正出来るのは強みは活用せんとな
せっかく日本語で遊べるローカル出てきたからには尻タブ用の使い勝手のいい日本語テンプレプロンプト作らんとな

0223名無しさん＠ピンキー (ｻｻｸｯﾃﾛﾗ Spb7-aGYJ)

2024/04/06(土) 15:44:27.27ID:???p

>>222
シルヴィは伴奏ちゃんのキャラよ

0224名無しさん＠ピンキー (ﾜｯﾁｮｲ fe2b-Kxjx)

2024/04/06(土) 16:18:23.05ID:PYnkc8ci0

避難所に案内されたわけですが、軽量でいいのがあるとのことですがどれのことなんだろう…

0225名無しさん＠ピンキー (ｽｯｯﾌﾟ Sdd2-GiYb)

2024/04/06(土) 16:20:07.55ID:???d

>>80と>>179を見てもろて

0226名無しさん＠ピンキー (ﾜｯﾁｮｲ fe2b-Kxjx)

2024/04/06(土) 17:17:13.41ID:PYnkc8ci0

>>225
ありがとうございます
これいくつか種類がありますけど何が違うんでしょうか…？

0227名無しさん＠ピンキー (ﾜｯﾁｮｲ 93c6-19vc)

2024/04/06(土) 17:56:56.52ID:???0

GGUFのQ4KMで良いかと

0228名無しさん＠ピンキー (ﾜｯﾁｮｲ b613-TGoQ)

2024/04/06(土) 18:06:42.64ID:???0

ここのニキらには不要っぽくはあるんやが
LightChatAssistantをKoboldCppで簡単にお試しする環境と解説を用意してみたで

https://github.com/Zuntan03/EasyLightChatAssistant

0229名無しさん＠ピンキー (ｽｯｯﾌﾟ Sdd2-GiYb)

2024/04/06(土) 18:15:45.80ID:???d

>>228
ooba以外での動かし方も知りたかったので助かりますぜ…！

0230名無しさん＠ピンキー (ﾜｯﾁｮｲ fe2b-Kxjx)

2024/04/06(土) 18:18:33.28ID:PYnkc8ci0

最初q8のものを落として使ってみましたがVRAM15gb使ってたのでQ4kmってやつにしてみますね。
ただ日本語モデルということで日本語で入力してるんですが返答は英語で帰ってくるのはどうすればいいんでしょうか

0231名無しさん＠ピンキー (ﾜｯﾁｮｲ b613-TGoQ)

2024/04/06(土) 18:20:36.42ID:???0

>>230
まずは
>>228 を試してみるとええかもしらんで

0232名無しさん＠ピンキー (ﾜｯﾁｮｲ fe2b-Kxjx)

2024/04/06(土) 18:30:04.85ID:PYnkc8ci0

全部消して228のを入れようとしたらこういわれました
https://files.catbox.moe/vr2l4z.png
koboldcppだけ先に落としておいたら進んで、できたbatを実行したらまた証明書が～と出るのでこっちは起動までたどり着けないです…
comfyuiの時もこんなの出たことあったなぁ…

■ このスレッドは過去ログ倉庫に格納されています