なんJLLM部避難所 ★2

1002コメント390KB

なんJLLM部避難所 ★2

■ このスレッドは過去ログ倉庫に格納されています

0001名無しさん＠ピンキー転載ダメ (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:27:25.10ID:???0

!extend::vvvvv:1000:512
!extend::vvvvv:1000:512
AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(スクリプト攻撃継続中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所
https://mercury.bbspink.com/test/read.cgi/onatech/1702817339/

-
VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured

VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured

0002名無しさん＠ピンキー (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:27:51.22ID:???0

初心者は導入しやすいKoboldcppから始めるのをお勧め
(1)ここで最新版のKoboldcpp.exeをダウンロード
https://github.com/LostRuins/koboldcpp/releases
(2)ここで良さげなggufモデルをダウンロード
https://huggingface.co/models?sort=modified&search=gguf
この2つのファイルだけで動く

0003名無しさん＠ピンキー (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:28:15.41ID:???0

Koboldの設定や使い方は英語だけどここが詳しい
https://github.com/LostRuins/koboldcpp/wiki

0004名無しさん＠ピンキー (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:28:40.35ID:???0

oobabooga/text-generation-webui
これもKoboldAIに並んで有用な実行環境やで
https://github.com/oobabooga/text-generation-webui

0005名無しさん＠ピンキー (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:29:02.25ID:???0

●Zuntan03ニキ謹製のツールEasyNovelAssistant
や
ローカルLLM導入のハードルをぐっと下げてくれたで
初めてのお人はここから始めるのもいいで
https://github.com/Zuntan03/EasyNovelAssistant

0006名無しさん＠ピンキー (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:29:20.85ID:???0

●ここ最近話題になった日本語ローカルモデル達やで

LightChatAssistant(通称LCA)
このスレのニキが3月にリリースして激震が走った軽量高性能モデルや
>>5のツールもこのモデルの使用がデフォルトやで
非力なPCでも走るしまずはこの辺りから試すのを薦めるで
https://huggingface.co/Sdff-Ltba

Ninja/Vecteus
オープンソースの強力な日本語小説生成AIを開発しとるLocalNovelLLM-projectの皆さんによるモデル群や
リリースされたばかりやがこちらも軽量高性能やで
開発も続いとるようやから今後の動きにも要注目や
https://huggingface.co/Local-Novel-LLM-project

0007名無しさん＠ピンキー (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:29:41.26ID:???0

●その他の最近話題になったモデルも挙げとくで
動きの速い界隈やから日々チェックやで

Mistral-7B系:
LightChatAssistant
Antler-7B-RP
Japanese-Starling-ChatV
Antler-7B-Novel-Writing
SniffyOtter-7B-Novel-Writing-NSFW
Ninja-v1
Vecteus-v1

Llama2-70B系:
karakuri-lm-70b-chat-v0.1
karakuri-MS-01

Cohere系:
c4ai-command-r-v01 (35B)
c4ai-command-r-plus (104B)

0008名無しさん＠ピンキー (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:30:01.35ID:???0

●多くのモデルには「base」と「instruct」の2種類があるで
baseはチューニングされていない、与えられた文書の続きを垂れ流すモデルやで
instructはchatGPTのように対話して質問に答えるようチューニングされたAIやで

0009名無しさん＠ピンキー (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:30:23.52ID:???0

⚫︎LLMを動かすにはGPUを使う方法とCPUを使う方法があるで
GPUを使う場合は比較的速く動くけど、VRAM容量の大きなグラボが必要になるで
CPUを使う場合はグラボが不要でメインメモリのRAMを増やすだけで大きなモデルが動かせるというメリットがあるけど、動作速度はGPUよりは落ちるで

0010名無しさん＠ピンキー (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:30:43.04ID:???0

⚫︎LLMモデルには量子化されてないsafetensorsファイルと、8bitや4bitなどに量子化されて容量が小さくなったものがあるで
量子化モデルにはGGUFやGPTQなどの種類があるで
基本的にはCPU (llama.cpp)で動かす場合はGGUF、GPUで動かす場合はGPTQを選べばええで

0011名無しさん＠ピンキー (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:31:03.25ID:???0

⚫︎LLMモデルは既存のbaseモデルを元に自分で学習(ファインチューニング)させることもできるで
画像AIのようにLoRAファイルとして学習結果を保存したりLoRAを読み込むこともできるで

0012名無しさん＠ピンキー (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:31:24.71ID:???0

●高性能なPCがないけどLLMを試したい人や大きなモデルを速く動かしたい人はpaperspaceなどのクラウド環境を使うのも手やで

0013名無しさん＠ピンキー (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:31:45.33ID:???0

●モデルのサイズ(パラメータ数)は◯B (B=billion=10億)という単位で表記されるで
例えば7Bのモデルを読み込むなら量子化しない場合は約14GB、8ビット量子化の場合は7GB、4ビット量子化の場合は3.5GBのメモリまたはVRAMが必要になるで
基本的にはBが大きいほど性能が高いで

0014名無しさん＠ピンキー (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:32:02.67ID:???0

●70Bの大型モデルはLlama 2というMeta社が開発したモデルが元になってるものが多いで
メモリが48GB以上あれば動くけど、速度はかなり遅いで

0015名無しさん＠ピンキー (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:33:07.93ID:???0

ひとまずテンプレはここまでや
何か追加した方がいいものがあったらよろしゅうな

0016名無しさん＠ピンキー (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:39:48.52ID:???0

個人的にはSillyTavernの紹介もあっていい気もしてるけどな

0017名無しさん＠ピンキー (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:41:01.63ID:???0

あと最近盛り上がってるモデルのマージや音声合成なんかもいずれはテンプレに入るのかもしれんな

0018名無しさん＠ピンキー (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:44:19.56ID:???0

この一月で日本語ローカル導入のハードルは大きく下がって性能は大きく上がった感があるから今後がますます楽しみや

0019名無しさん＠ピンキー (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:47:22.00ID:???0

なんやろな、夜明けが来たという感じや

0020名無しさん＠ピンキー (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:47:59.33ID:???0

というわけで20や
このスレもよろしゅうな

0021名無しさん＠ピンキー (ﾜｯﾁｮｲ 83be-7iwU)

2024/05/02(木) 19:37:19.90ID:???0

7Bモデルの性能向上は凄いな
おかげでVRAM16GBあれば音声合成と音声認識をギリギリ同時に動かせるようになった

0022名無しさん＠ピンキー (ｽﾌﾟｯｯ Sd9f-1dje)

2024/05/02(木) 19:45:47.17ID:Ig09010md

>>1乙
この板は即死ないから20まで保守する必要はないと思う

0023名無しさん＠ピンキー (ﾜｯﾁｮｲ bf77-joKd)

2024/05/02(木) 20:51:31.02ID:???0

>>22
乙あり
保守不要か確信なかったから念のためしたった

0024名無しさん＠ピンキー (ﾜｯﾁｮｲ ffb7-+RyI)

2024/05/02(木) 22:33:30.19ID:???0

SillyTavernでStableDiffusionと連携すると捗るな
思った絵が出てこないのがほとんどだけど、ズバリの絵が出てきたらムクムクする

0025マジカル (ﾜｯﾁｮｲ 03bb-4Xr2)

2024/05/03(金) 11:43:52.70ID:6BfWfX3i0

この中に、大葉でChatタブからnotebookタブなど他タブに切り替えてもモデルが前のタスクや設定を覚えてて
それを引きずった応答をしたという経験した方はいらっしゃいますか？

0026名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fc8-3YXh)

2024/05/03(金) 12:58:20.95ID:???0

EasyNovelAssistantでゴールシークテンプレをちょっと改変しつつ、指示出して洗脳系のシチュを提案するようにした
ttps://i.imgur.com/ediKctI.png
これはこれで面白いんだけど、こういうのうまく出させるにはどういうプロンプト渡したら打率高くなるだろ？
あと方向性限定させたり、もっと突飛にしたり。
整合性が取れてない内容が出力されることがあったり、変に短かったりすることが結構あるんだけど

それと、ちょっと試してみた感じLCAtypeBよりggml-model-Q4Kの方が良さげな回答くれてる気がするんだけど
どのモデルが良いかは総当たりしかない感じかな？

LLM系しっかり触ったことなかったから全部手探りで何もわからん…

0027名無しさん＠ピンキー (ﾜﾝﾄﾝｷﾝ MM1f-jMJY)

2024/05/03(金) 13:42:57.97ID:???M

ggml-model-Q4KってVecteusのことかな
VecteusはLCAより後発なこともあって、より思考能力が高い傾向がある(恐らく最新のWizard2を組み込んでいるため)
とは言え日本語能力と一括りに言っても文章の傾向も異なってくるし、好みもあるから一概には言えん感じやけどね
こればっかりは試してみないと分からんと思う
Vecteusはサイズ小さくてより軽いのに高性能だから、人に勧め安いのは確か

0028名無しさん＠ピンキー (ﾜﾝﾄﾝｷﾝ MM1f-jMJY)

2024/05/03(金) 13:48:42.55ID:???M

LCAがお役御免になったわけではないよ。念のため言っとく
少なくとも今でもワイはLCAの出してくる文章好きやで

0029名無しさん＠ピンキー (ﾜｯﾁｮｲ 93c0-Ub2H)

2024/05/03(金) 14:00:38.83ID:???0

一応放置されているLLM部のWIKI：https://w.atwiki.jp/localmlhub
よくよく調べてみたらatwikiってえっちなコンテンツあかんらしい
NVA部とおそろいでseesaa wikiで作ったほうが編集もしやすくていいかもしれないな?

0030名無しさん＠ピンキー (ﾜｯﾁｮｲ 83be-7iwU)

2024/05/03(金) 14:04:36.67ID:???0

音声でローカルLLMと双方向会話+画像生成までやろうとするとどんなに工夫してもVRAM24GBは必要な感じだな

0031名無しさん＠ピンキー (ﾜｯﾁｮｲ 4330-8G2g)

2024/05/03(金) 14:08:45.57ID:???0

次スレのために板表示してそういやここオナテク板やったなって草生えるわ

0032名無しさん＠ピンキー (ﾜﾝﾐﾝｸﾞｸ MM1f-jMJY)

2024/05/03(金) 14:15:46.92ID:???M

スマン忘れてたわ
>>1スレ立て乙

0033名無しさん＠ピンキー (ﾜｯﾁｮｲ 73f4-5fNx)

2024/05/03(金) 14:17:35.77ID:???0

自慰のためのテクノロジーの話題だから何も間違っていない

0034名無しさん＠ピンキー (ﾜｯﾁｮｲ fff2-TaPL)

2024/05/03(金) 15:51:23.28ID:???0

Ninjaオリジナルのq8 ggufはkoboldcppの起動時にコンテキスト長上げても2kっぽい動き(web画面のsettingで最大が2kのまま、処理速度も速すぎる)だったけど、前スレのこれだと普通に上げられた。
https://huggingface.co/mmnga/Ninja-v1-NSFW-128k-gguf

0035名無しさん＠ピンキー (ﾜｯﾁｮｲ bf77-joKd)

2024/05/03(金) 15:57:26.46ID:???0

モモンガ先輩やるな
以前は彼が量子化したモデルは挙動がおかしいことが多々あったが最近は安定してる

0036名無しさん＠ピンキー (ﾜｯﾁｮｲ d311-h5/x)

2024/05/03(金) 16:38:29.33ID:Gj7rcMwg0

MikuMaidのLlama-3 70Bバージョン、LumiMaid 70Bがアップロードされたみたい
割とそのまま倫理規制が解除されてたLlama-3 70Bっていう感じだから、日本語のロールプレイは語彙的に厳しいけど、英語エロチャはいける

■ このスレッドは過去ログ倉庫に格納されています