なんJLLM部避難所

1002コメント411KB

なんJLLM部避難所

■ このスレッドは過去ログ倉庫に格納されています

0001名無しさん＠ピンキー転載ダメ (ﾜｯﾁｮｲ e249-iArR)

2023/12/17(日) 21:48:59.66ID:???0

!extend::vvvvv:1000:512
!extend::vvvvv:1000:512
AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ
なんJLLM部 ★6
https://fate.5ch.net/test/read.cgi/liveuranus/1701542705/

VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured

0157名無しさん＠ピンキー (ﾜｯﾁｮｲ 1fa3-hs76)

2024/04/05(金) 07:02:27.53ID:???0

>>153
33Bくらいのモデルなら必要メモリ量が20GB前後なので、それだとちょうど4090にフルロードできて恩恵を実感できると思うが…
実際に話題になるモデルの多くは70Bクラスが中心なので、それだと4090といえどもフルロードはできない
溢れた分はCPU+RAMで動かすことになるので、そこが速度上のボトルネックになって、正直1070だろうが3060だろうが4090だろうがそれほど速度は変わらない(多少は変わるが劇遅→爆速で快適！とはならない)
勘違いしないで欲しいのは「4090程度じゃダメ」と否定しているのではなく、十分遊べるしそれなりの恩恵もある
ただ画像生成のような劇的な恩恵は無く、下位グラボじゃできなくて4090ならできるという場面はあまり無いよということ
現状はCPUとRAM側が重要

0158名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b13-oxdg)

2024/04/05(金) 08:01:41.15ID:???0

>>150
>>80のモデルを普通にQ6とかで量子化したけどダメだった
>>149
gitで過去バージョンに戻して再ビルドすれば良さそうだね

0159名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b13-oxdg)

2024/04/05(金) 08:01:59.77ID:???0

>>158
>>151だった

0160名無しさん＠ピンキー (ﾜｯﾁｮｲ 9bf5-SNbJ)

2024/04/05(金) 08:43:22.79ID:???0

>>156
https://i.imgur.com/421LeM6.png

0161名無しさん＠ピンキー (ﾜｯﾁｮｲ fb4c-WvGX)

2024/04/05(金) 09:03:12.34ID:SnnzYuXf0

昨日公開された新しいモデル、日本語もちゃんと出ますね。
https://huggingface.co/spaces/CohereForAI/c4ai-command-r-plus

官能小説家としての能力を試したらいい感じでした。

0162名無しさん＠ピンキー (ﾜｯﾁｮｲ df75-eoXq)

2024/04/05(金) 09:13:28.78ID:ah2keZ830

流石にエロ小説をいきなり出すのは厳しいか……
何らかのキャラクターになり切って応答させる
とかの方が敷居は低い感じで良い？

0163名無しさん＠ピンキー (ﾜｯﾁｮｲ eb11-yUXY)

2024/04/05(金) 10:19:50.57ID:XKPqXMvA0

すごいなこいつ
うちのMac 64GBだと相当縮めないとダメだろうが・・・
そもそも小さい方のやつもめちゃくちゃ性能いいけど、日本語だけ学習させるより、多言語で学習させた方が能力落ちにくいとかあるのかな

0164名無しさん＠ピンキー (ﾜｯﾁｮｲ cb21-0Q84)

2024/04/05(金) 10:36:19.22ID:???0

そりゃそうだろ

0165名無しさん＠ピンキー (ﾜｯﾁｮｲ eb11-yUXY)

2024/04/05(金) 10:52:57.45ID:XKPqXMvA0

全般の能力に関しては納得できるんだけど、日本語単体の能力でみても日本語特化モデルより能力高い感じしない？

0166名無しさん＠ピンキー (ﾜｯﾁｮｲ eb11-yUXY)

2024/04/05(金) 10:54:58.20ID:XKPqXMvA0

ああ、でもそもそも世の中の日本語モデルは事前学習自体はほぼ英語ってのも影響してるか

0167名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr7f-ykjJ)

2024/04/05(金) 10:55:50.82ID:???r

くそっ、2年前の俺。
なぜあのとき3060tiの8Gを買ってしまったのか！
12Gのモデル買っておけば…悔やんでも悔やみきれないw

0168名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f7a-YqhJ)

2024/04/05(金) 10:59:02.20ID:???0

7Bモデルなら別にCPUで動かしてもそれまでちゃうかな
全然速度的に不満ないし

0169名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b32-YqhJ)

2024/04/05(金) 11:04:39.94ID:???0

command-r+はまだllama.cppに完全対応してないっぽいね
通常の量子化もだけど、imatrixにしたいから、こっちの問題も解決してほしい（command-rでもまだ無理だったし）

0170名無しさん＠ピンキー (ﾜｯﾁｮｲ 4bba-R/WD)

2024/04/05(金) 13:07:19.50ID:???0

そういえばデータセットはcommand r+とかに出力してもらえばいいのか。

0171名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f7a-YqhJ)

2024/04/05(金) 13:23:14.99ID:???0

動かせる環境がある奴ならな・・・
M2Macの奴がバンバン動かしてくれたらデータセットすごい速度でできるかも？

0172名無しさん＠ピンキー (ﾜｯﾁｮｲ fb4c-WvGX)

2024/04/05(金) 13:33:30.81ID:SnnzYuXf0

4bqのCMDR+がこのスピード、M2 Ultra欲しくなりますなぁ……。

https://twitter.com/awnihannun/status/1776081238467768493

しかし唐突なグリーンってのは何なんだw

0173名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f7a-YqhJ)

2024/04/05(金) 13:38:48.81ID:???0

はえーすっごい実用的速度・・・

0174名無しさん＠ピンキー (ﾜｯﾁｮｲ eb11-yUXY)

2024/04/05(金) 14:00:32.36ID:XKPqXMvA0

3bqならうちのmacでもギリギリ動かせそうだが、劣化が気になる

0175名無しさん＠ピンキー (ｽｯﾌﾟ Sdff-qhHw)

2024/04/05(金) 14:26:28.32ID:???d

>>162
WEB UIのキャラクター設定に学校の委員長入れたら頑なにエロ拒絶された
学校の部分消したらうまくいったので設定にもよるみたい

0176名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b02-oxdg)

2024/04/05(金) 16:58:45.20ID:???0

このリポジトリにKarakuriとCommand Rのベンチマーク結果乗ってるけど、ベンチマーク的にはCommand Rの方が上みたい
Plusじゃない方でこれだからPlusの日本語能力凄そう
https://huggingface.co/Aratako/c4ai-command-r-v01-japanese-instruct
https://huggingface.co/Aratako/karakuri-lm-chat-upscaled-103b-v0.1

0177名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b02-oxdg)

2024/04/05(金) 17:52:01.36ID:???0

そういや>>80の手法、0.8掛けて重み足してるけどそのままでいいのかな
直感的には1.8で割って元の分布に近づけたほうが良さそうな気がするんだが

0178名無しさん＠ピンキー (ﾜｯﾁｮｲ 5b9f-qhHw)

2024/04/05(金) 18:41:43.97ID:???0

今CMRPのggufアップしてる最中っぽい人見つけた
https://huggingface.co/pmysl/c4ai-command-r-plus-GGUF

0179名無しさん＠ピンキー (ｽﾌﾟｯｯ Sdff-Ltba)

2024/04/05(金) 18:52:46.12ID:XJ7BCY1md

>>80のモデルの名前が長い、というのをいくつか見かけたのでもっと短い名前を付けようと思います
LightChatAssistant(LCA)って変更したので、今後huggingfaceを見る方は以下のリポジトリをご参照ください

Sdff-Ltba/LightChatAssistant-2x7B
Sdff-Ltba/LightChatAssistant-2x7B-GGUF

それと量子化版にもっと大きいbit数のものを随時上げていく予定です
手始めにQ6_K版を上げました。非iMatrixです
もっと精度劣化してないの欲しい！という方はこちらをどうぞー

0180名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b32-YqhJ)

2024/04/05(金) 19:25:32.58ID:???0

>>179
乙です
時に、そちらの環境では70Bの差分マージは可能でしょうか？
karakuri=miqumaid-llama を試しましたが、64Gでは無理でした

0181名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f7a-YqhJ)

2024/04/05(金) 19:40:49.29ID:???0

https://huggingface.co/CohereForAI/c4ai-command-r-plus-4bit/tree/main
4bit版が公開されたみたいやが・・・
これは大変なサイズやと思うよ

0182名無しさん＠ピンキー (ｵｲｺﾗﾐﾈｵ MM7f-k+SB)

2024/04/05(金) 19:44:22.47ID:zF4aX+1DM

メインメモリ128GB自体はまだ現実的
問題はその時の速度
Mac最強かな

0183名無しさん＠ピンキー (ﾜｯﾁｮｲ 1fa3-hs76)

2024/04/05(金) 19:47:14.01ID:???0

>>178
アップ終わった模様

0184名無しさん＠ピンキー (ｽﾌﾟｯｯ Sdff-Ltba)

2024/04/05(金) 19:50:24.81ID:XJ7BCY1md

>>180
ChatVectorですかね？やってみた…らブルースクリーンになったｗ久しぶりに見たｗ
メモリ96GBでは到底足りないようだ
1モデルだけで128GBあるからやはりきついみたい

0185名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b32-YqhJ)

2024/04/05(金) 20:12:39.73ID:???0

>>184
やはり、無理ですかー
mergekitだと、70Ｂモデルのマージも64Ｇで余裕だから、そこらへん上手く処理してくれるのかな
Task Arithmeticを使ってできないだろうか

0186名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f92-oxdg)

2024/04/05(金) 20:15:25.66ID:???0

やるとしたらRunpodとかのサービスでクソデカサーバ借りてマージするとかかな
ダウンロードとかアップロードの時は小さいインスタンスにするようにすれば5ドルくらいでいけそう

0187名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fff-8Ub+)

2024/04/05(金) 20:31:26.79ID:???0

>>179
久々にローカルやってみようと思い、oobaでq6_kを試してみた
メインメモリ32Gの3060環境だけど、この精度でサクサクなのは、とても進化を感じたよ

0188名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f7a-YqhJ)

2024/04/05(金) 20:32:57.14ID:???0

32G+3060環境の奴多そうやな
うちもそう

0189名無しさん＠ピンキー (ﾜｯﾁｮｲ 3bc4-aLVj)

2024/04/05(金) 20:39:56.39ID:???0

避難所これどこの板なんやろ防弾とかなんかな？と思ったらPINKで hentaiスレ一覧の中にポツンとあんの笑う

0190名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b9f-OIDP)

2024/04/05(金) 20:41:58.91ID:???0

お隣さんも興味深いよｗ

0191名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f7a-YqhJ)

2024/04/05(金) 20:50:53.53ID:???0

女になりきってオナニーするスレ ★2
なんJLLM部避難所
男の射精見て興奮する奴 6

0192名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b0c-dJ6t)

2024/04/05(金) 20:54:21.17ID:???0

しかもこのスレが一番勢いあるという
もう終わりだよこの板

0193名無しさん＠ピンキー (ﾜｯﾁｮｲ 5b9f-qhHw)

2024/04/05(金) 20:55:59.95ID:???0

本スレの方はどうすんだ？　スクリプトが埋めると思うけど次スレはなしかね

0194名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f7a-YqhJ)

2024/04/05(金) 20:59:11.27ID:???0

誰か立てたら残る
そうじゃなきゃこのまま

今の5ch/pinkbbsは割と成り行き任せよ
このスレが日本のLLM知見の最先端になってもそれはそれで・・・

0195名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b32-YqhJ)

2024/04/05(金) 21:47:09.49ID:???0

>>178
64GだとQ3までしか無理だなぁ
IQ3なら劣化も少なくすむのに

Aratako/c4ai-command-r-v01-japanese-instruct
こっちは、前モデルにファインチューンしたバージョン
スコア見る限り、かなり期待できそう
ダウンロード終わったら、Q6_kに量子化してkoboldで試してみるわ。
しかし、自前でファインチューンできる時代になったんだな
エロ特化にできんかな？ｗ

0196名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b1b-R/WD)

2024/04/05(金) 22:05:13.34ID:???0

light chat assistantでいつもの嫁を設定。エロ可能嫁完成。

0197名無しさん＠ピンキー (ﾜｯﾁｮｲ fbfa-XxRK)

2024/04/05(金) 22:06:21.44ID:???0

>RunpodでGPUサーバを借り、A6000x4で学習を行いました。
RunpodのOn-Demandで$4.56/hrか…
データセットさえあればワンチャンありそう

0198名無しさん＠ピンキー (ﾜｯﾁｮｲ eb11-qhHw)

2024/04/05(金) 22:06:29.54ID:???0

>>195
iq2上げてる人見つけたから、iq3お願いしてみた

0199名無しさん＠ピンキー (ﾜｯﾁｮｲ eb11-qhHw)

2024/04/05(金) 22:10:11.44ID:???0

今作ってる最中って返信きた

0200名無しさん＠ピンキー (ﾜｯﾁｮｲ 4b67-oxdg)

2024/04/05(金) 22:42:42.20ID:PBF0BZrG0

>>195
まともなデータセットで追加でファインチューニングすると逆にエロ悪化したりするからなぁ、どうだろう
試してみないと分からんが
>>199
俺もRAM64GB勢だからIQ3楽しみ

0201名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b32-YqhJ)

2024/04/05(金) 22:55:25.73ID:???0

Aratako/c4ai-command-r-v01-japanese-instruct
だめだ。エラーが解消できん。元のcommand-rは上手くできたのに
とりあえず作者様に量子化をお願いしてみた

>>199
見たら上がってた
早速落としてみる

0202名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b32-YqhJ)

2024/04/05(金) 23:33:41.42ID:???0

残念
command-rが動いた自前ビルドのkoboldでもplusは動かんかった

0203名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b32-YqhJ)

2024/04/05(金) 23:47:14.77ID:???0

ああ、ていうかアーキテクチャが違うのか
llama.cppが落ち着くまで待つか・・・

0204名無しさん＠ピンキー (ﾜｯﾁｮｲ 7311-LHwO)

2024/04/06(土) 00:12:44.44ID:???0

llama.cpp server叩いたけどunknown architectureだね

0205名無しさん＠ピンキー (ﾜｯﾁｮｲ bb67-eYV/)

2024/04/06(土) 00:16:53.20ID:???0

Add Command R Plus supportっていうPRが進行中だからもう少し待ちだね

0206名無しさん＠ピンキー (ﾜｯﾁｮｲ 7311-b8U7)

2024/04/06(土) 00:27:43.75ID:WE0RLjCc0

latest releaseが1時間前とかだからいけるかと思ったけどダメという
お預けですな

0207名無しさん＠ピンキー (ﾜｯﾁｮｲ 1282-ycXU)

2024/04/06(土) 00:28:32.95ID:???0

>>80
長文(1万トークンぐらい)の最初と真ん中に書いた事を質問したら、ちゃんと答えてきた。なんかすごい。

0208名無しさん＠ピンキー (ﾜｯﾁｮｲ bb67-eYV/)

2024/04/06(土) 02:09:12.30ID:???0

KoboldcppのビルドがWindowsで上手くいかん
makeでやってもcmakeでやってもエラーになるわ
もっと頻繁にビルド済みの配ってくれねえかな

0209名無しさん＠ピンキー (ﾜｯﾁｮｲ f67a-M/hT)

2024/04/06(土) 02:19:06.74ID:???0

オナテク板でKoboldcppをビルドする時代

0210名無しさん＠ピンキー (ﾜｯﾁｮｲ bb67-eYV/)

2024/04/06(土) 02:55:13.62ID:???0

OPENBLASならビルドできたからこれで一旦満足するか…

0211名無しさん＠ピンキー (ﾜｯﾁｮｲ 4fc4-TfWo)

2024/04/06(土) 06:04:15.65ID:???0

LLMじゃなくて画像生成(SD)のほうだけどRunpodでA100 80gb使ったことある
24時間ぐらい回すぐらいなら5000円くらいで使えるので個人でもわりとイケる
が、ワイ的な問題としてはSDは実質的にsd-scriptsというリポジトリのが学習環境の定番になってるんだがLLMの定番がわからん点や
karakuriはmegatoron deepspeedなるものを使ったということはわかる

0212名無しさん＠ピンキー (ﾜｯﾁｮｲ bb67-eYV/)

2024/04/06(土) 10:12:55.75ID:???0

>>149
これはどうやら↓の変更が原因みたい
https://github.com/ggerganov/llama.cpp/pull/6387

↓のコマンドでその手前に戻したら直ったわ
git reset —hard 52604860f93063ef98863921da697576af1c7665

0213名無しさん＠ピンキー (ﾜｯﾁｮｲ bb67-eYV/)

2024/04/06(土) 10:14:22.59ID:???0

>>211
事前学習は分からんけどインストラクションチューニングはLLM-jpの参考にすれば割と簡単にできると思う
https://github.com/llm-jp/llm-jp-sft
DPO用のも用意されてる
https://github.com/llm-jp/llm-jp-dpo

0214名無しさん＠ピンキー (ﾜｯﾁｮｲ 021e-hBD6)

2024/04/06(土) 10:59:06.63ID:IGDSh6PD0

>>80
めっちゃ楽しんでます、サンガツ！

chatntq_chatvector-MoE-Antler_chatvector-2x7B-GGUF+Kobold.cpp+SillyTavernで遊びたいんやが、SillyTavernの方の設定＆キャラカードのプロンプトがイマイチわからん
この組み合わせで遊んでる民、どんな風に設定してるかおしえて

0215名無しさん＠ピンキー (ｻｻｸｯﾃﾛﾗ Spb7-aGYJ)

2024/04/06(土) 11:23:08.35ID:???p

>>214
まずstの設定をkoboldと同じ設定に変更
キャラ設定はオナニースレのシルヴィを参考に入れ込んで自分好みにカスタマイズした
(小説機能とか省いて　口調のサンプルを追加とか)

0216名無しさん＠ピンキー (ﾜｯﾁｮｲ 021e-hBD6)

2024/04/06(土) 11:40:59.95ID:IGDSh6PD0

>>215
サンガツ
チャット楽しみたいんやが、なんかプレイヤー乗っ取られたり、余計なプロンプトが最後にぶら下がったりで置いてけぼりくらうんやけど、その辺はどうやって制御したらええんかな？

0217名無しさん＠ピンキー (ﾜｯﾁｮｲ bb67-eYV/)

2024/04/06(土) 12:54:50.90ID:???0

2x7Bだからその辺りはある程度割り切るしかない気がする
ガッツリ設定入れ込んでちゃんとしたロールプレイするにはモデルサイズ的に厳しい

0218名無しさん＠ピンキー (ｻｻｸｯﾃﾛﾗ Spb7-aGYJ)

2024/04/06(土) 12:56:01.34ID:???p

>>216
会話は◯◯のみ行う　とか　1センテンス以内にしろとか指示に入れてるが初手でダメならガチャしてる
あと指示はxml文で入れた方が理解度があがる　気がする　ここら辺はワイもまだ試行錯誤だわ

0219名無しさん＠ピンキー (ﾜｯﾁｮｲ f67a-M/hT)

2024/04/06(土) 13:42:26.57ID:???0

ローカルの最大の強みは返信を書き換えられることや
どんどん書き換えていけ

0220名無しさん＠ピンキー (ｻｻｸｯﾃﾛﾗ Spb7-aGYJ)

2024/04/06(土) 14:12:16.95ID:???p

>>208
なんかkoboldの人は4/7まで休暇みたい
もうすぐビッグウェーブが来るでw

0221名無しさん＠ピンキー (ﾜｯﾁｮｲ 62a3-Vlac)

2024/04/06(土) 14:52:48.02ID:???0

更新の間があいてるなと思ってた
期待するわ

0222名無しさん＠ピンキー (ﾜｯﾁｮｲ 0298-hBD6)

2024/04/06(土) 15:26:29.60ID:IGDSh6PD0

>>215
オナニースレのシルヴィ探してるんやが見つからん
【Claude3】ChatGPTでオナニー ★29とかのテンプレ見るんじゃあかんのか？
>>217-219
ありがとな
修正出来るのは強みは活用せんとな
せっかく日本語で遊べるローカル出てきたからには尻タブ用の使い勝手のいい日本語テンプレプロンプト作らんとな

0223名無しさん＠ピンキー (ｻｻｸｯﾃﾛﾗ Spb7-aGYJ)

2024/04/06(土) 15:44:27.27ID:???p

>>222
シルヴィは伴奏ちゃんのキャラよ

0224名無しさん＠ピンキー (ﾜｯﾁｮｲ fe2b-Kxjx)

2024/04/06(土) 16:18:23.05ID:PYnkc8ci0

避難所に案内されたわけですが、軽量でいいのがあるとのことですがどれのことなんだろう…

0225名無しさん＠ピンキー (ｽｯｯﾌﾟ Sdd2-GiYb)

2024/04/06(土) 16:20:07.55ID:???d

>>80と>>179を見てもろて

0226名無しさん＠ピンキー (ﾜｯﾁｮｲ fe2b-Kxjx)

2024/04/06(土) 17:17:13.41ID:PYnkc8ci0

>>225
ありがとうございます
これいくつか種類がありますけど何が違うんでしょうか…？

0227名無しさん＠ピンキー (ﾜｯﾁｮｲ 93c6-19vc)

2024/04/06(土) 17:56:56.52ID:???0

GGUFのQ4KMで良いかと

0228名無しさん＠ピンキー (ﾜｯﾁｮｲ b613-TGoQ)

2024/04/06(土) 18:06:42.64ID:???0

ここのニキらには不要っぽくはあるんやが
LightChatAssistantをKoboldCppで簡単にお試しする環境と解説を用意してみたで

https://github.com/Zuntan03/EasyLightChatAssistant

0229名無しさん＠ピンキー (ｽｯｯﾌﾟ Sdd2-GiYb)

2024/04/06(土) 18:15:45.80ID:???d

>>228
ooba以外での動かし方も知りたかったので助かりますぜ…！

0230名無しさん＠ピンキー (ﾜｯﾁｮｲ fe2b-Kxjx)

2024/04/06(土) 18:18:33.28ID:PYnkc8ci0

最初q8のものを落として使ってみましたがVRAM15gb使ってたのでQ4kmってやつにしてみますね。
ただ日本語モデルということで日本語で入力してるんですが返答は英語で帰ってくるのはどうすればいいんでしょうか

0231名無しさん＠ピンキー (ﾜｯﾁｮｲ b613-TGoQ)

2024/04/06(土) 18:20:36.42ID:???0

>>230
まずは
>>228 を試してみるとええかもしらんで

0232名無しさん＠ピンキー (ﾜｯﾁｮｲ fe2b-Kxjx)

2024/04/06(土) 18:30:04.85ID:PYnkc8ci0

全部消して228のを入れようとしたらこういわれました
https://files.catbox.moe/vr2l4z.png
koboldcppだけ先に落としておいたら進んで、できたbatを実行したらまた証明書が～と出るのでこっちは起動までたどり着けないです…
comfyuiの時もこんなの出たことあったなぁ…

0233名無しさん＠ピンキー (ﾜｯﾁｮｲ b613-TGoQ)

2024/04/06(土) 18:40:47.81ID:???0

>>232
https://github.com/Zuntan03/EasyLightChatAssistant/raw/main/Install-EasyLightChatAssistant_SslNoRevoke.bat

SSLの証明書失効確認を飛ばすオプションを追加してみたこっちならいけるやろか？
拡張子 bat でローカル保存して、他の操作は一緒なはずや

0234名無しさん＠ピンキー (ﾜｯﾁｮｲ fe2b-Kxjx)

2024/04/06(土) 18:52:36.97ID:PYnkc8ci0

>>233
ダウンロードできたみたいです！サンガツ！
でもやっぱり英語で帰ってきてしまう…なんででしょう？
https://files.catbox.moe/ogijxs.png

0235名無しさん＠ピンキー (ﾜｯﾁｮｲ b613-TGoQ)

2024/04/06(土) 18:52:50.53ID:???0

>>233
ファイル名が変わっていたのに今対応したで
iq3xxs_imatrixと_imatrixが付いとったら正常なはずや

0236名無しさん＠ピンキー (ﾜｯﾁｮｲ bb67-eYV/)

2024/04/06(土) 18:54:45.50ID:???0

LightChatAssistantを別データセット使って追加でインストラクションチューニングするの試してみたんだが良くも悪くもまともになってしまった
出力の自然さは上がったけどエロさも同時に下がった感じ
Antler-7Bがインストラクションチューニングされていないエロ特化みたいなモデルだから、ファインチューニングするとそこを殺しちゃってる感じかなあ

0237名無しさん＠ピンキー (ﾜｯﾁｮｲ b613-TGoQ)

2024/04/06(土) 19:07:47.49ID:???0

>>234
以前にKoboldCppを使ったことがあって設定が残ってるとかやろか？
Settings-AdvancedにあるReset ALL Settingsして
Settings-BasicのMax Ctx.Tokensを32768にAmout to Gen.を512にする初期設定をやり直してみたらどうやろ？

0238名無しさん＠ピンキー (ｽﾌﾟｯｯ Sdf2-VDpj)

2024/04/06(土) 19:15:33.90ID:lxAnGvR5d

>>228
>>235
すごい！ご新規さんに優しい素晴らしいものをありがとうございます！
ファイル名をちょこちょこ変えてしまって申し訳ないです…
とりあえず予定していたものは上げ&修正終わったので、何かなければここから変わることはないはず

>>234
MemoryかWorldInfoに英文が入力されているのかな？
New Session→Keep Memory and World Info?のチェックオフ
でOKして試してみるとどうなります？

0239名無しさん＠ピンキー (ﾜｯﾁｮｲ b6c6-Hmna)

2024/04/06(土) 19:16:44.42ID:vN0Ur5yH0

話者の名前が英語になってるとそっちに釣られるとかあるで

0240名無しさん＠ピンキー (ﾜｯﾁｮｲ 52dc-yyZt)

2024/04/06(土) 19:19:32.09ID:U2FfXq950

mlxでcommand r plus 4bit版動かしてるMac使いおらん？
M2 Max RAM96GBで動かしたんだが↓みたいにぶっ壊れたAIみたいな出力しか出さないんよね
誰か何か知ってたら教えてクレメンス

Prompt: hello
,
I have a problem with the "グリーン" color.
I have a "green" color in my palette, but when I use it, it is not the same color.
I have a "green" color in my palette,

0241名無しさん＠ピンキー (ﾜｯﾁｮｲ bb67-eYV/)

2024/04/06(土) 19:22:50.53ID:???0

LightChatAssistant使う用のガイドならInstruct Templateの変更にも触れておいた方がいいんじゃない？
Mistralベースだからフォーマットは[INST] [/INST]の方がいいはず

0242名無しさん＠ピンキー (ﾜｯﾁｮｲ bb67-eYV/)

2024/04/06(土) 19:25:07.45ID:???0

>>240
MLXは使ったことないけどこれと同じかな？
ここに載ってるようにtransformersアップデートしたら直るかも

https://huggingface.co/CohereForAI/c4ai-command-r-plus/discussions/6

0243名無しさん＠ピンキー (ﾜｯﾁｮｲ fe2b-Kxjx)

2024/04/06(土) 19:25:15.89ID:PYnkc8ci0

日本語でお願いしますって言ったらたまーに日本語で返してくれますね…
>>238
やってみましたが相変わらずですね
>>239
話者ってどこで変えれるんでしょう…？
https://files.catbox.moe/9woqzo.png

0244名無しさん＠ピンキー (ﾜｯﾁｮｲ fe2b-Kxjx)

2024/04/06(土) 19:26:58.36ID:PYnkc8ci0

肝心なの忘れてた、コマンド画面だとその後も書いてあるんですがwebui上だとちょっと前で止まってるんですけどなんなんでしょうか…

0245名無しさん＠ピンキー (ｽﾌﾟｯｯ Sdf2-VDpj)

2024/04/06(土) 19:32:42.73ID:lxAnGvR5d

あとiQ3_SやiQ4_XSも精度劣化の低さの割にサイズが小さいのでおすすめ
量子化での精度劣化は以下ページの方が纏めてくださっていて、とても参考になります
一番下の「KL-divergence による量子化評価」のグラフがめっちゃ参考になった

https://sc-bakushu.hatenablog.com/entry/2024/02/26/062547

>>243
うーん、こちらでは全量子化を日本語動作確認してるんだけどな…
私には解決できないようだ。誰か任せた

0246名無しさん＠ピンキー (ﾜｯﾁｮｲ b613-TGoQ)

2024/04/06(土) 19:40:50.83ID:???0

ワイの環境やとAllow Editingを有効にした際に{{[INPUT]}}と{{[OUTPUT]}}や[INST]と[/INST]があると英語になってしもうてる気がするで
どう案内するのが正解なんやろか？

0247名無しさん＠ピンキー (ﾜｯﾁｮｲ b613-TGoQ)

2024/04/06(土) 19:48:45.48ID:???0

>>243
ということで{{[INPUT]}}と{{[OUTPUT]}}を削除して生成したら日本語にならへんやろか？

0248名無しさん＠ピンキー (ﾜｯﾁｮｲ fe2b-Kxjx)

2024/04/06(土) 19:53:33.29ID:PYnkc8ci0

>>247
消したくても消せないというかなんでこれがついてるのかがわからない状況です。
241が言ってるのがそれなのかもとググっても全然わからんです…
あとなぜか最後の1行がwebui上には表示されないっぽいです

0249名無しさん＠ピンキー (ｽﾌﾟｯｯ Sdf2-VDpj)

2024/04/06(土) 20:02:17.61ID:lxAnGvR5d

ふむ、Instruct Tag Presetを変えて試してみたがどうやらVicuna以外にすると英語になったりならかったりするようだ
普段適当に「ME:」と「AI:」にしてたから分らんかった
ということでSettings→Instruct Tag PresetをVicunaにすると日本語にならないかな
(本当はMistralのチャットフォーマットの方が良いんだろうけど)

0250名無しさん＠ピンキー (ｽﾌﾟｯｯ Sdf2-VDpj)

2024/04/06(土) 20:05:15.30ID:lxAnGvR5d

それと最後の1行が出ないのは、Settings→Advanced→Trim Sentencesをオフで治らないかな

0251名無しさん＠ピンキー (ﾃﾃﾝﾃﾝﾃﾝ MM3e-yiir)

2024/04/06(土) 20:06:29.23ID:???M

訳わからんカット編集せずウィンドウ全体を貼ってくれw

0252名無しさん＠ピンキー (ﾜｯﾁｮｲ b613-TGoQ)

2024/04/06(土) 20:08:29.15ID:???0

>>241 指摘サンガツやで
Instruct Tag PresetをLlama 2 Chatにする案内を追加しといた
ただSettingをLlama 2 Chatにすると"stop_sequence": ["[INST]", "[/INST]"],は変わるんやが入力欄で入力すると{{[INPUT]}}と{{[OUTPUT]}}（Instruct Tag PresetのKobold AI Formatみたいなの）が入ってしまうんはKoboldCpp仕様なんやろか？

>>243
話者はWorld Infoなんで238の手順できえるはずやで

>>248
Allow Editingが有効なら一旦ABORTして直接{{[INPUT]}}や{{[OUTPUT]}}にカーソル合わして直接編集で消せるはずやで
下の入力欄から入力するんでなくて上の出力欄から直接入力したら{{[INPUT]}}や{{[OUTPUT]}}が入らへんっぽい
最後の一行は中途半端に生成された文は削除される仕様やね

0253名無しさん＠ピンキー (ﾜｯﾁｮｲ fe2b-Kxjx)

2024/04/06(土) 20:13:13.79ID:PYnkc8ci0

>>249
これで日本語になりました！サンガツ！
>>250
多分治ったっぽいです！サンガツ！
>>252
Llama 2 Chatだと英語のままでした…悲しい…

とりあえず次にいけそうです！

0254名無しさん＠ピンキー (ﾃﾃﾝﾃﾝﾃﾝ MM3e-hBD6)

2024/04/06(土) 20:25:20.92ID:kEUlaJaKM

>>216
User成りすましは

①生成前のプロンプトに混ぜてモデルに伝える
チャット入力欄の左の「三」アイコンクリック⇒「Author'sNote」選ぶ
DefaultAuthorsNoteの▽をクリックしてオープン
「あなたは{{char}}として応答/対話をする必要があります。あなたは常に{{char}}として応答をします。このタスクでは、決して{{user}}として行動したり発言してはいけません。」
In-Chatを選び、Depthを1 as systemとする
次に、画面上の「A」のアイコンを選ぶ

②それでも生成されてしまう場合は、チャット打ち切り
画面中央のCustom Stopping Stringに次のように
["ユーザー:","〇〇:"]
を入力する(〇〇はあなたのペルソナの日本語名)

の2つで、勝手にチャットが進んで置いてきぼりはなくなる

プロンプトがそのまま漏れるのは、80氏のモデルでは結構ある気はする
AIからの返信ウィンドウの右上、鉛筆アイコンで内容を編集できるから、追加されてるプロンプト部分を編集、チェックを押す
自分のターンの続きを書いて送信する

0255名無しさん＠ピンキー (ｽﾌﾟｯｯ Sdf2-VDpj)

2024/04/06(土) 20:31:29.91ID:lxAnGvR5d

ちょい前のだけど、Koboldcppの公式WikiをDeepLに突っ込んで翻訳したやつ
これにKoboldの設定やら用語の内容やらが大体書いてある。参考になるかも
https://rentry.org/rmeut8xs

>>253
よかった！ようこそローカルLLMの世界へ！楽しんでね

0256名無しさん＠ピンキー (ﾜｯﾁｮｲ 8f32-M/hT)

2024/04/06(土) 20:56:33.65ID:???0

>>254
横からだが、すっげー助かった。
ST初心者のワイには、まだまだ知らない設定が多いわ

■ このスレッドは過去ログ倉庫に格納されています