なんJLLM部避難所 ★2

1002コメント390KB

なんJLLM部避難所 ★2

■ このスレッドは過去ログ倉庫に格納されています

0001名無しさん＠ピンキー転載ダメ (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:27:25.10ID:???0

!extend::vvvvv:1000:512
!extend::vvvvv:1000:512
AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(スクリプト攻撃継続中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所
https://mercury.bbspink.com/test/read.cgi/onatech/1702817339/

-
VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured

VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured

0002名無しさん＠ピンキー (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:27:51.22ID:???0

初心者は導入しやすいKoboldcppから始めるのをお勧め
(1)ここで最新版のKoboldcpp.exeをダウンロード
https://github.com/LostRuins/koboldcpp/releases
(2)ここで良さげなggufモデルをダウンロード
https://huggingface.co/models?sort=modified&search=gguf
この2つのファイルだけで動く

0003名無しさん＠ピンキー (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:28:15.41ID:???0

Koboldの設定や使い方は英語だけどここが詳しい
https://github.com/LostRuins/koboldcpp/wiki

0004名無しさん＠ピンキー (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:28:40.35ID:???0

oobabooga/text-generation-webui
これもKoboldAIに並んで有用な実行環境やで
https://github.com/oobabooga/text-generation-webui

0005名無しさん＠ピンキー (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:29:02.25ID:???0

●Zuntan03ニキ謹製のツールEasyNovelAssistant
や
ローカルLLM導入のハードルをぐっと下げてくれたで
初めてのお人はここから始めるのもいいで
https://github.com/Zuntan03/EasyNovelAssistant

0006名無しさん＠ピンキー (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:29:20.85ID:???0

●ここ最近話題になった日本語ローカルモデル達やで

LightChatAssistant(通称LCA)
このスレのニキが3月にリリースして激震が走った軽量高性能モデルや
>>5のツールもこのモデルの使用がデフォルトやで
非力なPCでも走るしまずはこの辺りから試すのを薦めるで
https://huggingface.co/Sdff-Ltba

Ninja/Vecteus
オープンソースの強力な日本語小説生成AIを開発しとるLocalNovelLLM-projectの皆さんによるモデル群や
リリースされたばかりやがこちらも軽量高性能やで
開発も続いとるようやから今後の動きにも要注目や
https://huggingface.co/Local-Novel-LLM-project

0007名無しさん＠ピンキー (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:29:41.26ID:???0

●その他の最近話題になったモデルも挙げとくで
動きの速い界隈やから日々チェックやで

Mistral-7B系:
LightChatAssistant
Antler-7B-RP
Japanese-Starling-ChatV
Antler-7B-Novel-Writing
SniffyOtter-7B-Novel-Writing-NSFW
Ninja-v1
Vecteus-v1

Llama2-70B系:
karakuri-lm-70b-chat-v0.1
karakuri-MS-01

Cohere系:
c4ai-command-r-v01 (35B)
c4ai-command-r-plus (104B)

0008名無しさん＠ピンキー (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:30:01.35ID:???0

●多くのモデルには「base」と「instruct」の2種類があるで
baseはチューニングされていない、与えられた文書の続きを垂れ流すモデルやで
instructはchatGPTのように対話して質問に答えるようチューニングされたAIやで

0009名無しさん＠ピンキー (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:30:23.52ID:???0

⚫︎LLMを動かすにはGPUを使う方法とCPUを使う方法があるで
GPUを使う場合は比較的速く動くけど、VRAM容量の大きなグラボが必要になるで
CPUを使う場合はグラボが不要でメインメモリのRAMを増やすだけで大きなモデルが動かせるというメリットがあるけど、動作速度はGPUよりは落ちるで

0010名無しさん＠ピンキー (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:30:43.04ID:???0

⚫︎LLMモデルには量子化されてないsafetensorsファイルと、8bitや4bitなどに量子化されて容量が小さくなったものがあるで
量子化モデルにはGGUFやGPTQなどの種類があるで
基本的にはCPU (llama.cpp)で動かす場合はGGUF、GPUで動かす場合はGPTQを選べばええで

0011名無しさん＠ピンキー (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:31:03.25ID:???0

⚫︎LLMモデルは既存のbaseモデルを元に自分で学習(ファインチューニング)させることもできるで
画像AIのようにLoRAファイルとして学習結果を保存したりLoRAを読み込むこともできるで

0012名無しさん＠ピンキー (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:31:24.71ID:???0

●高性能なPCがないけどLLMを試したい人や大きなモデルを速く動かしたい人はpaperspaceなどのクラウド環境を使うのも手やで

0013名無しさん＠ピンキー (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:31:45.33ID:???0

●モデルのサイズ(パラメータ数)は◯B (B=billion=10億)という単位で表記されるで
例えば7Bのモデルを読み込むなら量子化しない場合は約14GB、8ビット量子化の場合は7GB、4ビット量子化の場合は3.5GBのメモリまたはVRAMが必要になるで
基本的にはBが大きいほど性能が高いで

0014名無しさん＠ピンキー (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:32:02.67ID:???0

●70Bの大型モデルはLlama 2というMeta社が開発したモデルが元になってるものが多いで
メモリが48GB以上あれば動くけど、速度はかなり遅いで

0015名無しさん＠ピンキー (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:33:07.93ID:???0

ひとまずテンプレはここまでや
何か追加した方がいいものがあったらよろしゅうな

0016名無しさん＠ピンキー (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:39:48.52ID:???0

個人的にはSillyTavernの紹介もあっていい気もしてるけどな

0017名無しさん＠ピンキー (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:41:01.63ID:???0

あと最近盛り上がってるモデルのマージや音声合成なんかもいずれはテンプレに入るのかもしれんな

0018名無しさん＠ピンキー (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:44:19.56ID:???0

この一月で日本語ローカル導入のハードルは大きく下がって性能は大きく上がった感があるから今後がますます楽しみや

0019名無しさん＠ピンキー (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:47:22.00ID:???0

なんやろな、夜明けが来たという感じや

0020名無しさん＠ピンキー (ﾜｯﾁｮｲ 63c0-joKd)

2024/05/02(木) 18:47:59.33ID:???0

というわけで20や
このスレもよろしゅうな

0021名無しさん＠ピンキー (ﾜｯﾁｮｲ 83be-7iwU)

2024/05/02(木) 19:37:19.90ID:???0

7Bモデルの性能向上は凄いな
おかげでVRAM16GBあれば音声合成と音声認識をギリギリ同時に動かせるようになった

0022名無しさん＠ピンキー (ｽﾌﾟｯｯ Sd9f-1dje)

2024/05/02(木) 19:45:47.17ID:Ig09010md

>>1乙
この板は即死ないから20まで保守する必要はないと思う

0023名無しさん＠ピンキー (ﾜｯﾁｮｲ bf77-joKd)

2024/05/02(木) 20:51:31.02ID:???0

>>22
乙あり
保守不要か確信なかったから念のためしたった

■ このスレッドは過去ログ倉庫に格納されています