なんJLLM部避難所 ★5

1002コメント315KB

なんJLLM部避難所 ★5

■ このスレッドは過去ログ倉庫に格納されています

0001名無しさん＠ピンキー

2024/12/26(木) 13:13:11.15ID:Vhp+tTX0

AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所 ★4
https://mercury.bbspink.com/test/read.cgi/onatech/1725931151/

0002名無しさん＠ピンキー

2024/12/26(木) 13:15:23.84ID:Vhp+tTX0

初心者は導入しやすいKoboldcppから始めるのをお勧め
(1)ここで最新版のKoboldcpp.exeをダウンロード
https://github.com/LostRuins/koboldcpp/releases
(2)ここで良さげなggufモデルをダウンロード
https://huggingface.co/models?sort=modified&search=gguf
この2つのファイルだけで動く

0003名無しさん＠ピンキー

2024/12/26(木) 13:15:38.23ID:Vhp+tTX0

Koboldの設定や使い方は英語だけどここが詳しい
https://github.com/LostRuins/koboldcpp/wiki

0004名無しさん＠ピンキー

2024/12/26(木) 13:15:53.48ID:Vhp+tTX0

oobabooga/text-generation-webui
通称大葉
これもKoboldAIに並んで有用な実行環境やで
https://github.com/oobabooga/text-generation-webui

0005名無しさん＠ピンキー

2024/12/26(木) 13:16:04.96ID:Vhp+tTX0

●Zuntanニキ謹製のツールEasyNovelAssistant
や
ローカルLLM導入のハードルをぐっと下げてくれたで
初めてのお人はここから始めるのもいいで
https://github.com/Zuntan03/EasyNovelAssistant

0006名無しさん＠ピンキー

2024/12/26(木) 13:17:27.11ID:Vhp+tTX0

https://github.com/SillyTavern/SillyTavern
AIチャットに特化したUI、SillyTavernや
キャラをbot的に管理したりグラ登録したり複数選んでグループチャットしたり大量の設定を外部記憶的に管理したり色々できるで
画像出力や音声出力とも連携可能で夢が広がるで
機能が豊富すぎて最初取っ付きにくいのと日本語の解説がほとんど無いのが難点やがRPチャット派は使うと幸せになれるやで
あくまでUI(フロントエンド)やからこれ自体にはAIは内蔵されてないから注意してな
好きなAPIやローカルモデルと接続して使うんやで

0007名無しさん＠ピンキー

2024/12/26(木) 13:17:39.70ID:Vhp+tTX0

例としてKoboldで起動したローカルモデルとSillyTavernを接続する設定や
先にいつもどおりKoboldを起動してな

SillyTavernのプラグのアイコンをクリック
APIに Text Completion を選択
API Typeは KoboldCpp
API keyは不要
API URLに http://localhost:5001/
これでいける

0008名無しさん＠ピンキー

2024/12/26(木) 13:17:57.73ID:Vhp+tTX0

●多くのモデルには「base」と「instruct」の2種類があるで
baseはチューニングされていない、与えられた文書の続きを垂れ流すモデルやで
instructはchatGPTのように対話して質問に答えるようチューニングされたAIやで

0009名無しさん＠ピンキー

2024/12/26(木) 13:18:04.01ID:Vhp+tTX0

⚫︎LLMを動かすにはGPUを使う方法とCPUを使う方法があるで
GPUを使う場合は比較的速く動くけど、VRAM容量の大きなグラボが必要になるで
CPUを使う場合はグラボが不要でメインメモリのRAMを増やすだけで大きなモデルが動かせるというメリットがあるけど、動作速度はGPUよりは落ちるで

0010名無しさん＠ピンキー

2024/12/26(木) 13:18:12.93ID:Vhp+tTX0

⚫︎LLMモデルには量子化されてないsafetensorsファイルと、8bitや4bitなどに量子化されて容量が小さくなったものがあるで
量子化モデルにはGGUFやGPTQなどの種類があるで
基本的にはCPU (llama.cpp)で動かす場合はGGUF、GPUで動かす場合はGPTQを選べばええで

0011名無しさん＠ピンキー

2024/12/26(木) 13:18:20.52ID:Vhp+tTX0

⚫︎LLMモデルは既存のbaseモデルを元に自分で学習(ファインチューニング)させることもできるで
画像AIのようにLoRAファイルとして学習結果を保存したりLoRAを読み込むこともできるで

0012名無しさん＠ピンキー

2024/12/26(木) 13:18:28.79ID:Vhp+tTX0

●高性能なPCがないけどLLMを試したい人や大きなモデルを速く動かしたい人はpaperspaceなどのクラウド環境を使うのも手やで

0013名無しさん＠ピンキー

2024/12/26(木) 13:18:35.28ID:Vhp+tTX0

●モデルのサイズ(パラメータ数)は◯B (B=billion=10億)という単位で表記されるで
例えば7Bのモデルを読み込むなら量子化しない場合は約14GB、8ビット量子化の場合は7GB、4ビット量子化の場合は3.5GBのメモリまたはVRAMが必要になるで
基本的にはBが大きいほど性能が高いで

0014名無しさん＠ピンキー

2024/12/26(木) 13:21:20.99ID:Vhp+tTX0

●ここ最近話題になった日本語ローカルモデル達やで

LightChatAssistant(通称LCA)
このスレのニキが3月にリリースして激震が走った軽量高性能モデルや
>>5のツールもこのモデルの使用がデフォルトやで
非力なPCでも走るしまずはこの辺りから試すのを薦めるで
https://huggingface.co/Sdff-Ltba

Ninja/Vecteus
オープンソースの強力な日本語小説生成AIを開発しとるLocalNovelLLM-projectの皆さんによるモデル群や
リリースされたばかりやがこちらも軽量高性能やで
開発も続いとるようやから今後の動きにも要注目や
https://huggingface.co/Local-Novel-LLM-project

0015名無しさん＠ピンキー

2024/12/26(木) 13:21:36.48ID:Vhp+tTX0

●その他の最近話題になったモデルも挙げとくで
動きの速い界隈やから日々チェックやで

Mistral-7B系:
LightChatAssistant
Antler-7B-RP
Japanese-Starling-ChatV
Antler-7B-Novel-Writing
SniffyOtter-7B-Novel-Writing-NSFW
Ninja-v1
Vecteus-v1
Berghof-NSFW-7B-i1-GGUF

Llama2-70B系:
karakuri-lm-70b-chat-v0.1
karakuri-MS-01

Llama3-70B系:
Smaug-Llama-3-70B-Instruct-abliterated-v3

Cohere系:
c4ai-command-r-v01 (35B)
c4ai-command-r-plus (104B)

0016名無しさん＠ピンキー

2024/12/26(木) 13:27:46.54ID:Vhp+tTX0

こんな感じかな
モデル一覧は若干古くなりつつありそう
anthracite-orgのmagnumシリーズとかは追記しておくべきかな？
[anthracite-org (Anthracite)](https://huggingface.co/anthracite-org)

0017名無しさん＠ピンキー

2024/12/26(木) 13:40:16.43ID:???

>>16
いちおつ

0018名無しさん＠ピンキー

2024/12/26(木) 13:44:46.69ID:???

乙乙
magnum v4 123bが今の所最強かな
メモリ64Bで動かせるギリ最良量子化サイズがiQ3k_m

0019名無しさん＠ピンキー

2024/12/26(木) 13:46:05.88ID:???

ミス
iQ3_Mだわスマン

0020名無しさん＠ピンキー

2024/12/26(木) 18:28:41.46ID:???

おつおつ

0021名無しさん＠ピンキー

2024/12/26(木) 18:51:50.64ID:jsaRaPor

いちおつ
はよgemma3とかの新モデル出んかねぇ

0022名無しさん＠ピンキー

2024/12/26(木) 18:51:54.20ID:???

マグナムって日本語ではないよな？
123bだとVRAMに全然収まらんし70Bクラスでいい感じの日本語モデル来て欲しいわ
Llama-3.3-SuperSwallow-70B-Instruct-v0.1 っての出てるから試すぜ

0023名無しさん＠ピンキー

2024/12/26(木) 19:12:40.61ID:???

(70Bも全然収まら)ないです😡

0024名無しさん＠ピンキー

2024/12/26(木) 19:18:00.86ID:???

>>22
日本語(エロ)で最強やで
英語最強クラスなら他にいっぱいある

0025名無しさん＠ピンキー

2024/12/26(木) 20:03:54.09ID:???

https://gigazine.net/news/20241226-nvidia-geforce-rtx-5090-pcb/
次期NVIDIAのRTX 5090はVRAMが32GBらしいよ
64GBぐらいの出してくれないかなー

0026名無しさん＠ピンキー

2024/12/26(木) 20:40:00.50ID:???

5090×2でmagnum123BのiQ3Mがギリ乗るわけか…
帯域も1.8TB/secなんでしょ
4090の1.8倍速かあ
夢が広がりんぐ…

0027名無しさん＠ピンキー

2024/12/26(木) 20:40:38.68ID:???

ネット記事に
llm-jp-3-172b-instruct3
ってのが流れてきた

日本製なら日本語強いんじゃね？って期待は結構してるんだよなぁ

0028名無しさん＠ピンキー

2024/12/26(木) 21:34:24.08ID:???

>>27
ここのはいままでパッとしなかったからなぁ・・・

0029名無しさん＠ピンキー

2024/12/26(木) 21:38:11.38ID:jsaRaPor

さすがに172bあるからベンチでは最高クラスだよ
学習トークン少ないからモデルサイズで考えるともっといいの出て来るけど

0030名無しさん＠ピンキー

2024/12/26(木) 21:44:10.35ID:Y9WnaplU

ベンチでは最高クラスに今までどれだけ騙されてきたか、特に日本産は酷い

0031名無しさん＠ピンキー

2024/12/26(木) 21:47:16.63ID:???

日本産でいままで満足できたのは初代karakuri-70bだけだった

でも興味あるから、どっかでデモできないかな

0032名無しさん＠ピンキー

2024/12/26(木) 23:23:20.09ID:???

いちおつ

公開してくれるのはとても嬉しいんだけど172bでGPT3級なのね
試してみたいけどいままでの日本語モデルはMetaが片手間に作ってくれたLLMのほうが性能よかったしな...
Metaの新しい言語に(あまり)依存しない研究に期待。来年くらいにでそうだし。

0033名無しさん＠ピンキー

2024/12/26(木) 23:55:49.78ID:???

立て乙だ

>>26
消費電力600W×2とか、GPUだけで結構な電気代になるぜ・・・？

■ このスレッドは過去ログ倉庫に格納されています