なんJLLM部 避難所
■ このスレッドは過去ログ倉庫に格納されています
0001名無しさん@ピンキー 転載ダメ (ワッチョイ e249-iArR)2023/12/17(日) 21:48:59.66ID:???0
!extend::vvvvv:1000:512
!extend::vvvvv:1000:512
AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC(できれば+3060 12GB以上)でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ
なんJLLM部 ★6
https://fate.5ch.net/test/read.cgi/liveuranus/1701542705/
VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured
0157名無しさん@ピンキー (ワッチョイ 1fa3-hs76)2024/04/05(金) 07:02:27.53ID:???0
>>153
33Bくらいのモデルなら必要メモリ量が20GB前後なので、それだとちょうど4090にフルロードできて恩恵を実感できると思うが…
実際に話題になるモデルの多くは70Bクラスが中心なので、それだと4090といえどもフルロードはできない
溢れた分はCPU+RAMで動かすことになるので、そこが速度上のボトルネックになって、正直1070だろうが3060だろうが4090だろうがそれほど速度は変わらない(多少は変わるが劇遅→爆速で快適!とはならない)
勘違いしないで欲しいのは「4090程度じゃダメ」と否定しているのではなく、十分遊べるしそれなりの恩恵もある
ただ画像生成のような劇的な恩恵は無く、下位グラボじゃできなくて4090ならできるという場面はあまり無いよということ
現状はCPUとRAM側が重要
0161名無しさん@ピンキー (ワッチョイ fb4c-WvGX)2024/04/05(金) 09:03:12.34ID:SnnzYuXf0
昨日公開された新しいモデル、日本語もちゃんと出ますね。
https://huggingface.co/spaces/CohereForAI/c4ai-command-r-plus

官能小説家としての能力を試したらいい感じでした。
0162名無しさん@ピンキー (ワッチョイ df75-eoXq)2024/04/05(金) 09:13:28.78ID:ah2keZ830
流石にエロ小説をいきなり出すのは厳しいか……
何らかのキャラクターになり切って応答させる
とかの方が敷居は低い感じで良い?
0163名無しさん@ピンキー (ワッチョイ eb11-yUXY)2024/04/05(金) 10:19:50.57ID:XKPqXMvA0
すごいなこいつ
うちのMac 64GBだと相当縮めないとダメだろうが・・・
そもそも小さい方のやつもめちゃくちゃ性能いいけど、日本語だけ学習させるより、多言語で学習させた方が能力落ちにくいとかあるのかな
0165名無しさん@ピンキー (ワッチョイ eb11-yUXY)2024/04/05(金) 10:52:57.45ID:XKPqXMvA0
全般の能力に関しては納得できるんだけど、日本語単体の能力でみても日本語特化モデルより能力高い感じしない?
0166名無しさん@ピンキー (ワッチョイ eb11-yUXY)2024/04/05(金) 10:54:58.20ID:XKPqXMvA0
ああ、でもそもそも世の中の日本語モデルは事前学習自体はほぼ英語ってのも影響してるか
0169名無しさん@ピンキー (ワッチョイ 3b32-YqhJ)2024/04/05(金) 11:04:39.94ID:???0
command-r+はまだllama.cppに完全対応してないっぽいね
通常の量子化もだけど、imatrixにしたいから、こっちの問題も解決してほしい(command-rでもまだ無理だったし)
0172名無しさん@ピンキー (ワッチョイ fb4c-WvGX)2024/04/05(金) 13:33:30.81ID:SnnzYuXf0
4bqのCMDR+がこのスピード、M2 Ultra欲しくなりますなぁ……。

https://twitter.com/awnihannun/status/1776081238467768493

しかし唐突なグリーンってのは何なんだw
0174名無しさん@ピンキー (ワッチョイ eb11-yUXY)2024/04/05(金) 14:00:32.36ID:XKPqXMvA0
3bqならうちのmacでもギリギリ動かせそうだが、劣化が気になる
0179名無しさん@ピンキー (スプッッ Sdff-Ltba)2024/04/05(金) 18:52:46.12ID:XJ7BCY1md
>>80のモデルの名前が長い、というのをいくつか見かけたのでもっと短い名前を付けようと思います
LightChatAssistant(LCA)って変更したので、今後huggingfaceを見る方は以下のリポジトリをご参照ください

Sdff-Ltba/LightChatAssistant-2x7B
Sdff-Ltba/LightChatAssistant-2x7B-GGUF

それと量子化版にもっと大きいbit数のものを随時上げていく予定です
手始めにQ6_K版を上げました。非iMatrixです
もっと精度劣化してないの欲しい!という方はこちらをどうぞー
0182名無しさん@ピンキー (オイコラミネオ MM7f-k+SB)2024/04/05(金) 19:44:22.47ID:zF4aX+1DM
メインメモリ128GB自体はまだ現実的
問題はその時の速度
Mac最強かな
0184名無しさん@ピンキー (スプッッ Sdff-Ltba)2024/04/05(金) 19:50:24.81ID:XJ7BCY1md
>>180
ChatVectorですかね?やってみた…らブルースクリーンになったw久しぶりに見たw
メモリ96GBでは到底足りないようだ
1モデルだけで128GBあるからやはりきついみたい
0186名無しさん@ピンキー (ワッチョイ 5f92-oxdg)2024/04/05(金) 20:15:25.66ID:???0
やるとしたらRunpodとかのサービスでクソデカサーバ借りてマージするとかかな
ダウンロードとかアップロードの時は小さいインスタンスにするようにすれば5ドルくらいでいけそう
0194名無しさん@ピンキー (ワッチョイ 0f7a-YqhJ)2024/04/05(金) 20:59:11.27ID:???0
誰か立てたら残る
そうじゃなきゃこのまま

今の5ch/pinkbbsは割と成り行き任せよ
このスレが日本のLLM知見の最先端になってもそれはそれで・・・
0195名無しさん@ピンキー (ワッチョイ 3b32-YqhJ)2024/04/05(金) 21:47:09.49ID:???0
>>178
64GだとQ3までしか無理だなぁ
IQ3なら劣化も少なくすむのに

Aratako/c4ai-command-r-v01-japanese-instruct
こっちは、前モデルにファインチューンしたバージョン
スコア見る限り、かなり期待できそう
ダウンロード終わったら、Q6_kに量子化してkoboldで試してみるわ。
しかし、自前でファインチューンできる時代になったんだな
エロ特化にできんかな?w
0200名無しさん@ピンキー (ワッチョイ 4b67-oxdg)2024/04/05(金) 22:42:42.20ID:PBF0BZrG0
>>195
まともなデータセットで追加でファインチューニングすると逆にエロ悪化したりするからなぁ、どうだろう
試してみないと分からんが
>>199
俺もRAM64GB勢だからIQ3楽しみ
0201名無しさん@ピンキー (ワッチョイ 3b32-YqhJ)2024/04/05(金) 22:55:25.73ID:???0
Aratako/c4ai-command-r-v01-japanese-instruct
だめだ。エラーが解消できん。元のcommand-rは上手くできたのに
とりあえず作者様に量子化をお願いしてみた

>>199
見たら上がってた
早速落としてみる
0206名無しさん@ピンキー (ワッチョイ 7311-b8U7)2024/04/06(土) 00:27:43.75ID:WE0RLjCc0
latest releaseが1時間前とかだからいけるかと思ったけどダメという
お預けですな
0211名無しさん@ピンキー (ワッチョイ 4fc4-TfWo)2024/04/06(土) 06:04:15.65ID:???0
LLMじゃなくて画像生成(SD)のほうだけどRunpodでA100 80gb使ったことある
24時間ぐらい回すぐらいなら5000円くらいで使えるので個人でもわりとイケる
が、ワイ的な問題としてはSDは実質的にsd-scriptsというリポジトリのが学習環境の定番になってるんだがLLMの定番がわからん点や
karakuriはmegatoron deepspeedなるものを使ったということはわかる
0214名無しさん@ピンキー (ワッチョイ 021e-hBD6)2024/04/06(土) 10:59:06.63ID:IGDSh6PD0
>>80
めっちゃ楽しんでます、サンガツ!

chatntq_chatvector-MoE-Antler_chatvector-2x7B-GGUF+Kobold.cpp+SillyTavernで遊びたいんやが、SillyTavernの方の設定&キャラカードのプロンプトがイマイチわからん
この組み合わせで遊んでる民、どんな風に設定してるかおしえて
0215名無しさん@ピンキー (ササクッテロラ Spb7-aGYJ)2024/04/06(土) 11:23:08.35ID:???p
>>214
まずstの設定をkoboldと同じ設定に変更
キャラ設定はオナニースレのシルヴィを参考に入れ込んで自分好みにカスタマイズした
(小説機能とか省いて 口調のサンプルを追加とか)
0216名無しさん@ピンキー (ワッチョイ 021e-hBD6)2024/04/06(土) 11:40:59.95ID:IGDSh6PD0
>>215
サンガツ
チャット楽しみたいんやが、なんかプレイヤー乗っ取られたり、余計なプロンプトが最後にぶら下がったりで置いてけぼりくらうんやけど、その辺はどうやって制御したらええんかな?
0218名無しさん@ピンキー (ササクッテロラ Spb7-aGYJ)2024/04/06(土) 12:56:01.34ID:???p
>>216
会話は◯◯のみ行う とか 1センテンス以内にしろとか指示に入れてるが初手でダメならガチャしてる
あと指示はxml文で入れた方が理解度があがる 気がする ここら辺はワイもまだ試行錯誤だわ
0222名無しさん@ピンキー (ワッチョイ 0298-hBD6)2024/04/06(土) 15:26:29.60ID:IGDSh6PD0
>>215
オナニースレのシルヴィ探してるんやが見つからん
【Claude3】ChatGPTでオナニー ★29とかのテンプレ見るんじゃあかんのか?
>>217-219
ありがとな
修正出来るのは強みは活用せんとな
せっかく日本語で遊べるローカル出てきたからには尻タブ用の使い勝手のいい日本語テンプレプロンプト作らんとな
0224名無しさん@ピンキー (ワッチョイ fe2b-Kxjx)2024/04/06(土) 16:18:23.05ID:PYnkc8ci0
避難所に案内されたわけですが、軽量でいいのがあるとのことですがどれのことなんだろう…
0226名無しさん@ピンキー (ワッチョイ fe2b-Kxjx)2024/04/06(土) 17:17:13.41ID:PYnkc8ci0
>>225
ありがとうございます
これいくつか種類がありますけど何が違うんでしょうか…?
0230名無しさん@ピンキー (ワッチョイ fe2b-Kxjx)2024/04/06(土) 18:18:33.28ID:PYnkc8ci0
最初q8のものを落として使ってみましたがVRAM15gb使ってたのでQ4kmってやつにしてみますね。
ただ日本語モデルということで日本語で入力してるんですが返答は英語で帰ってくるのはどうすればいいんでしょうか
0232名無しさん@ピンキー (ワッチョイ fe2b-Kxjx)2024/04/06(土) 18:30:04.85ID:PYnkc8ci0
全部消して228のを入れようとしたらこういわれました
https://files.catbox.moe/vr2l4z.png
koboldcppだけ先に落としておいたら進んで、できたbatを実行したらまた証明書が〜と出るのでこっちは起動までたどり着けないです…
comfyuiの時もこんなの出たことあったなぁ…
0234名無しさん@ピンキー (ワッチョイ fe2b-Kxjx)2024/04/06(土) 18:52:36.97ID:PYnkc8ci0
>>233
ダウンロードできたみたいです!サンガツ!
でもやっぱり英語で帰ってきてしまう…なんででしょう?
https://files.catbox.moe/ogijxs.png
0236名無しさん@ピンキー (ワッチョイ bb67-eYV/)2024/04/06(土) 18:54:45.50ID:???0
LightChatAssistantを別データセット使って追加でインストラクションチューニングするの試してみたんだが良くも悪くもまともになってしまった
出力の自然さは上がったけどエロさも同時に下がった感じ
Antler-7Bがインストラクションチューニングされていないエロ特化みたいなモデルだから、ファインチューニングするとそこを殺しちゃってる感じかなあ
0237名無しさん@ピンキー (ワッチョイ b613-TGoQ)2024/04/06(土) 19:07:47.49ID:???0
>>234
以前にKoboldCppを使ったことがあって設定が残ってるとかやろか?
Settings-AdvancedにあるReset ALL Settingsして
Settings-BasicのMax Ctx.Tokensを32768にAmout to Gen.を512にする初期設定をやり直してみたらどうやろ?
0238名無しさん@ピンキー (スプッッ Sdf2-VDpj)2024/04/06(土) 19:15:33.90ID:lxAnGvR5d
>>228
>>235
すごい!ご新規さんに優しい素晴らしいものをありがとうございます!
ファイル名をちょこちょこ変えてしまって申し訳ないです…
とりあえず予定していたものは上げ&修正終わったので、何かなければここから変わることはないはず

>>234
MemoryかWorldInfoに英文が入力されているのかな?
New Session→Keep Memory and World Info?のチェックオフ
でOKして試してみるとどうなります?
0239名無しさん@ピンキー (ワッチョイ b6c6-Hmna)2024/04/06(土) 19:16:44.42ID:vN0Ur5yH0
話者の名前が英語になってるとそっちに釣られるとかあるで
0240名無しさん@ピンキー (ワッチョイ 52dc-yyZt)2024/04/06(土) 19:19:32.09ID:U2FfXq950
mlxでcommand r plus 4bit版動かしてるMac使いおらん?
M2 Max RAM96GBで動かしたんだが↓みたいにぶっ壊れたAIみたいな出力しか出さないんよね
誰か何か知ってたら教えてクレメンス

Prompt: hello
,
I have a problem with the "グリーン" color.
I have a "green" color in my palette, but when I use it, it is not the same color.
I have a "green" color in my palette,
0241名無しさん@ピンキー (ワッチョイ bb67-eYV/)2024/04/06(土) 19:22:50.53ID:???0
LightChatAssistant使う用のガイドならInstruct Templateの変更にも触れておいた方がいいんじゃない?
Mistralベースだからフォーマットは[INST] [/INST]の方がいいはず
0243名無しさん@ピンキー (ワッチョイ fe2b-Kxjx)2024/04/06(土) 19:25:15.89ID:PYnkc8ci0
日本語でお願いしますって言ったらたまーに日本語で返してくれますね…
>>238
やってみましたが相変わらずですね
>>239
話者ってどこで変えれるんでしょう…?
https://files.catbox.moe/9woqzo.png
0244名無しさん@ピンキー (ワッチョイ fe2b-Kxjx)2024/04/06(土) 19:26:58.36ID:PYnkc8ci0
肝心なの忘れてた、コマンド画面だとその後も書いてあるんですがwebui上だとちょっと前で止まってるんですけどなんなんでしょうか…
0245名無しさん@ピンキー (スプッッ Sdf2-VDpj)2024/04/06(土) 19:32:42.73ID:lxAnGvR5d
あとiQ3_SやiQ4_XSも精度劣化の低さの割にサイズが小さいのでおすすめ
量子化での精度劣化は以下ページの方が纏めてくださっていて、とても参考になります
一番下の「KL-divergence による量子化評価」のグラフがめっちゃ参考になった

https://sc-bakushu.hatenablog.com/entry/2024/02/26/062547

>>243
うーん、こちらでは全量子化を日本語動作確認してるんだけどな…
私には解決できないようだ。誰か任せた
0246名無しさん@ピンキー (ワッチョイ b613-TGoQ)2024/04/06(土) 19:40:50.83ID:???0
ワイの環境やとAllow Editingを有効にした際に{{[INPUT]}}と{{[OUTPUT]}}や[INST]と[/INST]があると英語になってしもうてる気がするで
どう案内するのが正解なんやろか?
0248名無しさん@ピンキー (ワッチョイ fe2b-Kxjx)2024/04/06(土) 19:53:33.29ID:PYnkc8ci0
>>247
消したくても消せないというかなんでこれがついてるのかがわからない状況です。
241が言ってるのがそれなのかもとググっても全然わからんです…
あとなぜか最後の1行がwebui上には表示されないっぽいです
0249名無しさん@ピンキー (スプッッ Sdf2-VDpj)2024/04/06(土) 20:02:17.61ID:lxAnGvR5d
ふむ、Instruct Tag Presetを変えて試してみたがどうやらVicuna以外にすると英語になったりならかったりするようだ
普段適当に「ME:」と「AI:」にしてたから分らんかった
ということでSettings→Instruct Tag PresetをVicunaにすると日本語にならないかな
(本当はMistralのチャットフォーマットの方が良いんだろうけど)
0250名無しさん@ピンキー (スプッッ Sdf2-VDpj)2024/04/06(土) 20:05:15.30ID:lxAnGvR5d
それと最後の1行が出ないのは、Settings→Advanced→Trim Sentencesをオフで治らないかな
0252名無しさん@ピンキー (ワッチョイ b613-TGoQ)2024/04/06(土) 20:08:29.15ID:???0
>>241 指摘サンガツやで
Instruct Tag PresetをLlama 2 Chatにする案内を追加しといた
ただSettingをLlama 2 Chatにすると"stop_sequence": ["[INST]", "[/INST]"],は変わるんやが入力欄で入力すると{{[INPUT]}}と{{[OUTPUT]}}(Instruct Tag PresetのKobold AI Formatみたいなの)が入ってしまうんはKoboldCpp仕様なんやろか?

>>243
話者はWorld Infoなんで238の手順できえるはずやで

>>248
Allow Editingが有効なら一旦ABORTして直接{{[INPUT]}}や{{[OUTPUT]}}にカーソル合わして直接編集で消せるはずやで
下の入力欄から入力するんでなくて上の出力欄から直接入力したら{{[INPUT]}}や{{[OUTPUT]}}が入らへんっぽい
最後の一行は中途半端に生成された文は削除される仕様やね
0253名無しさん@ピンキー (ワッチョイ fe2b-Kxjx)2024/04/06(土) 20:13:13.79ID:PYnkc8ci0
>>249
これで日本語になりました!サンガツ!
>>250
多分治ったっぽいです!サンガツ!
>>252
Llama 2 Chatだと英語のままでした…悲しい…

とりあえず次にいけそうです!
0254名無しさん@ピンキー (テテンテンテン MM3e-hBD6)2024/04/06(土) 20:25:20.92ID:kEUlaJaKM
>>216
User成りすましは

@生成前のプロンプトに混ぜてモデルに伝える
チャット入力欄の左の「三」アイコンクリック⇒「Author'sNote」選ぶ
DefaultAuthorsNoteの▽をクリックしてオープン
「あなたは{{char}}として応答/対話をする必要があります。あなたは常に{{char}}として応答をします。このタスクでは、決して{{user}}として行動したり発言してはいけません。」
In-Chatを選び、Depthを1 as systemとする
次に、画面上の「A」のアイコンを選ぶ

Aそれでも生成されてしまう場合は、チャット打ち切り
画面中央のCustom Stopping Stringに次のように
["ユーザー:","〇〇:"]
を入力する(〇〇はあなたのペルソナの日本語名)

の2つで、勝手にチャットが進んで置いてきぼりはなくなる

プロンプトがそのまま漏れるのは、80氏のモデルでは結構ある気はする
AIからの返信ウィンドウの右上、鉛筆アイコンで内容を編集できるから、追加されてるプロンプト部分を編集、チェックを押す
自分のターンの続きを書いて送信する
0255名無しさん@ピンキー (スプッッ Sdf2-VDpj)2024/04/06(土) 20:31:29.91ID:lxAnGvR5d
ちょい前のだけど、Koboldcppの公式WikiをDeepLに突っ込んで翻訳したやつ
これにKoboldの設定やら用語の内容やらが大体書いてある。参考になるかも
https://rentry.org/rmeut8xs

>>253
よかった!ようこそローカルLLMの世界へ!楽しんでね
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況