なんJLLM部避難所 ★9

1002コメント342KB

なんJLLM部避難所 ★9

■ このスレッドは過去ログ倉庫に格納されています

0001名無しさん＠ピンキー転載ダメ (ﾜｯﾁｮｲ fec0-xVEZ)

2025/08/23(土) 13:52:18.71ID:5lw7ZcNF0

!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512

AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所 ★8
https://mercury.bbspink.com/test/read.cgi/onatech/1746883112/

VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured

0002名無しさん＠ピンキー (ﾜｯﾁｮｲ fec0-xVEZ)

2025/08/23(土) 13:52:48.95ID:5lw7ZcNF0

初心者は導入しやすいKoboldcppから始めるのをお勧め
(1)NVIDIA、CPUユーザーはここで最新版のKoboldcpp.exeをダウンロード
https://github.com/LostRuins/koboldcpp/releases
AMDユーザーはこっち
https://github.com/YellowRoseCx/koboldcpp-rocm
(2)ここで良さげなggufモデルをダウンロード
https://huggingface.co/models?sort=modified&search=gguf
この2つのファイルだけで動く

Koboldの設定や使い方は英語だけどここが詳しい
https://github.com/LostRuins/koboldcpp/wiki

0003名無しさん＠ピンキー (ﾜｯﾁｮｲ fec0-xVEZ)

2025/08/23(土) 13:53:01.31ID:5lw7ZcNF0

oobabooga/text-generation-webui
通称大葉
これもKoboldAIに並んで有用な実行環境やで
https://github.com/oobabooga/text-generation-webui

0004名無しさん＠ピンキー (ﾜｯﾁｮｲ fec0-xVEZ)

2025/08/23(土) 13:53:13.44ID:5lw7ZcNF0

●Zuntanニキ謹製のツールEasyNovelAssistant
主に小説用で使われとるで
ローカルLLM導入のハードルをぐっと下げてくれたで
初めてのお人はここから始めるのもいいで
https://github.com/Zuntan03/EasyNovelAssistant

0005名無しさん＠ピンキー (ﾜｯﾁｮｲ fec0-xVEZ)

2025/08/23(土) 13:53:40.81ID:5lw7ZcNF0

https://github.com/SillyTavern/SillyTavern
AIチャットに特化したUI、SillyTavernや
キャラをbot的に管理したりグラ登録したり複数選んでグループチャットしたり大量の設定を外部記憶的に管理したり色々できるで
画像出力や音声出力とも連携可能で夢が広がるで
機能が豊富すぎて最初取っ付きにくいのと日本語の解説がほとんど無いのが難点やがRPチャット派は使うと幸せになれるやで
あくまでUI(フロントエンド)やからこれ自体にはAIは内蔵されてないから注意してな
好きなAPIやローカルモデルと接続して使うんやで

0006名無しさん＠ピンキー (ﾜｯﾁｮｲ fec0-xVEZ)

2025/08/23(土) 13:53:57.63ID:5lw7ZcNF0

例としてKoboldで起動したローカルモデルとSillyTavernを接続する設定や
先にいつもどおりKoboldを起動してな

SillyTavernのプラグのアイコンをクリック
APIに Text Completion を選択
API Typeは KoboldCpp
API keyは不要
API URLに http://localhost:5001/
これでいける

0007名無しさん＠ピンキー (ﾜｯﾁｮｲ fec0-xVEZ)

2025/08/23(土) 13:54:14.74ID:5lw7ZcNF0

●多くのモデルには「base」と「instruct」の2種類があるで
baseはチューニングされていない、与えられた文書の続きを垂れ流すモデルやで
instructはchatGPTのように対話して質問に答えるようチューニングされたAIやで

⚫︎LLMを動かすにはGPUを使う方法とCPUを使う方法があるで
GPUを使う場合は比較的速く動くけど、VRAM容量の大きなグラボが必要になるで
CPUを使う場合はグラボが不要でメインメモリのRAMを増やすだけで大きなモデルが動かせるというメリットがあるけど、動作速度はGPUよりは落ちるで

⚫︎LLMモデルには量子化されてないsafetensorsファイルと、8bitや4bitなどに量子化されて容量が小さくなったものがあるで
量子化モデルにはGGUFやGPTQなどの種類があるで
基本的にはCPU (llama.cpp)で動かす場合はGGUF、GPUで動かす場合はGPTQを選べばええで
量子化は4bitまでならほとんど精度が落ちないのでよくわからない場合はIQ4_XSやQ4_k_mなどにしとけばええで

⚫︎LLMモデルは既存のbaseモデルを元に自分で学習(ファインチューニング)させることもできるで
画像AIのようにLoRAファイルとして学習結果を保存したりLoRAを読み込むこともできるで

●モデルのサイズ(パラメータ数)は◯B (B=billion=10億)という単位で表記されるで
例えば7Bのモデルを読み込むなら量子化しない場合は約14GB、8ビット量子化の場合は7GB、4ビット量子化の場合は3.5GBのメモリまたはVRAMが必要になるで
基本的にはBが大きいほど性能が高いで

0008名無しさん＠ピンキー (ﾜｯﾁｮｲ fec0-xVEZ)

2025/08/23(土) 14:06:17.76ID:5lw7ZcNF0

●その他の最近話題になったモデルも挙げとくで
動きの速い界隈やから日々チェックやで

Mistral系
LightChatAssistant
Antler-7B-RP
Japanese-Starling-ChatV
Antler-7B-Novel-Writing
SniffyOtter-7B-Novel-Writing-NSFW
Ninja-v1
Vecteus-v1
Berghof-NSFW-7B-i1-GGUF
Mistral-Small-3.2-24B-Instruct-2506
Cydonia 24B v4
Cydonia-R1-24B-v4

Llama3-70B系:
Smaug-Llama-3-70B-Instruct-abliterated-v3

Cohere系:
c4ai-command-r-08-2024 (35B)
c4ai-command-r-plus-08-2024 (104B)

magnumシリーズ(エロ特化):
https://huggingface.co/collections/anthracite-org/v4-671450072656036945a21348

Lumimaid-Magnum:
Lumimaid-Magnum-v4-12B

magnumの日本語版:
Mistral-nemo-ja-rp-v0.2

0009名無しさん＠ピンキー (ﾜｯﾁｮｲ fec0-xVEZ)

2025/08/23(土) 14:06:34.21ID:5lw7ZcNF0

●高性能なPCがないけどLLMを試したい人や大きなモデルを速く動かしたい人はpaperspaceなどのクラウド環境を使うのも手やで
若干規制はあるもののGoogle AI studioから無料でAPI keyを入手して高性能なAIを使うこともできるのでそれを使うのええで
API keyの入手はhttps://aistudio.google.com/apikeyここからできるで

0010名無しさん＠ピンキー (ﾜｯﾁｮｲ fec0-xVEZ)

2025/08/23(土) 14:06:46.46ID:5lw7ZcNF0

テンプレここまで、しばらく更新されてないから過去ログも参考にしてな

0011名無しさん＠ピンキー (ﾜｯﾁｮｲ f651-Nkl/)

2025/08/23(土) 14:11:17.26ID:x3P4s8SO0

なんUってそろそろ帰っても良さそうやけどまだグロ爆撃あるんやっけ

0012名無しさん＠ピンキー (ﾜｯﾁｮｲ be27-slH+)

2025/08/23(土) 14:41:19.47ID:DqRDqYzm0

もう爆撃は無い
でもこの板に文章生成AIスレがあるから移動する必要性を感じない
こっちはローカルメイン、あっちはWEBサービスで住み分け出来てるし
そもそもなんU戻っても過疎すぎて人増えんやろ

0013名無しさん＠ピンキー (ﾜｯﾁｮｲ f385-6Hg8)

2025/08/23(土) 23:35:58.73ID:nllRM+eP0

スレ立てありがとう

0014名無しさん＠ピンキー (ﾜｯﾁｮｲ dba3-BdKp)

2025/08/23(土) 23:37:21.11ID:Z2L/fI+E0

新しいモデル来ないと盛り上がらんなあ

0015名無しさん＠ピンキー (ﾜｯﾁｮｲ c716-BBaN)

2025/08/24(日) 00:29:39.09ID:Pbn0WOox0

GPTかGeminiかClaude並の知能あって何も拒否しなくてローカルで動くやつ、出して

0016名無しさん＠ピンキー (ﾜｯﾁｮｲ dba3-BdKp)

2025/08/24(日) 00:36:12.45ID:4Xx0/wYJ0

わ
わかんないっピ…

0017名無しさん＠ピンキー (ﾜｯﾁｮｲ 729f-uDW3)

2025/08/24(日) 07:45:44.58ID:1KQNreGg0

Grok 2きとるわね
https://huggingface.co/xai-org/grok-2

0018名無しさん＠ピンキー (ｼｬﾁｰｸ 0C53-c+Mf)

2025/08/24(日) 07:55:42.30ID:Xzxqe1AhC

>>15
magnum123b

0019名無しさん＠ピンキー (ｼｬﾁｰｸ 0C53-c+Mf)

2025/08/24(日) 10:11:18.38ID:Xzxqe1AhC

CohereLabs/command-a-reasoning-08-2025
なんか出てた

0020名無しさん＠ピンキー (ﾜｯﾁｮｲ f3c2-DcZR)

2025/08/24(日) 10:46:14.18ID:OJuYvR2Q0

grok2なんて今更どうするんだ
性能ではもう価値ないだろう

0021名無しさん＠ピンキー (ﾜｯﾁｮｲ d203-TnY8)

2025/08/24(日) 10:49:30.41ID:20pTTCWQ0

command rってちょっと前にあったよ、なんだったかもう忘れたッピけど…

0022名無しさん＠ピンキー (ﾜｯﾁｮｲ b6a9-slH+)

2025/08/24(日) 10:55:13.30ID:5IWKqrSs0

>>19
MoEだとちょうどいいサイズなんだけどMoEじゃないから動かすのしんどいやね

Cohereは最初からなんでも出力してくれるから好きなんだけど

0023名無しさん＠ピンキー (ﾜｯﾁｮｲ f3c2-TcND)

2025/08/24(日) 11:39:43.59ID:h1oo6yxg0

MacでもRyzenAIでもいいからVRAM126GB
50万以下で載せられる時代来ないかね

0024名無しさん＠ピンキー (ﾜｯﾁｮｲ a36a-Bq+j)

2025/08/24(日) 12:03:09.69ID:K9fb1xWi0

毒舌なんじゃなかったっけ？grok2
あとエロに寛容？

0025名無しさん＠ピンキー (ﾜｯﾁｮｲ f3a6-Nkl/)

2025/08/24(日) 12:50:40.01ID:UGJ9tbE40

Grok2は研究用に使ってねって感じだからローカル民が使う用途にはなって無さそう

0026名無しさん＠ピンキー (ﾜｯﾁｮｲ f29c-JKMc)

2025/08/24(日) 14:31:33.78ID:/ky+OZzI0

今時の高効率なLLMと比べるとgrok2なんて研究用でも使い道あるんかな。llama4もそんな感じのレベル

0027名無しさん＠ピンキー (ﾜｯﾁｮｲ b6a9-slH+)

2025/08/24(日) 14:47:20.24ID:5IWKqrSs0

今のLM Arena日本語ランキングの上位勢でオープンなLLMのサイズ調べてみた
qwen3-30b-a3bがなんか異常にいいのとqwen3-235b-a22b、gpt-oss-120b、gemma-3n-e4bあたりがコスパいいね
コスパじゃなくてパラメータに対するパフォーマンスだからパラパと言うのかわからんけど
https://i.imgur.com/3351cnd.png

このリストでは一番下にいるllama3.1-405bって出た当初はクローズLLMも含めた中でtop5くらいに食い込んでた記憶があるけど
今や4bのgemma-3n-e4bに抜かれてるのとかLLMの進化は恐ろしいな

0028名無しさん＠ピンキー (ﾜｯﾁｮｲ f66f-/T2E)

2025/08/24(日) 16:18:42.39ID:mZXf77670

llamaってもう過去のものみたいな感じするからな

0029名無しさん＠ピンキー (ﾜｯﾁｮｲ fb8c-GMkG)

2025/08/24(日) 16:24:33.63ID:j7Yf8Kt20

>>28
gpt-oss 出ちゃったからなぁ

0030名無しさん＠ピンキー (ﾜｯﾁｮｲ 2249-DcZR)

2025/08/24(日) 16:56:34.90ID:3I/Vxdms0

MetaはFacebookとかInstagramのビックデータ資産があるのにどうしてこんなにAIショボいのだろうか
Grokはその部分で成功しているのに

0031名無しさん＠ピンキー (ﾜｯﾁｮｲ fb8c-GMkG)

2025/08/24(日) 18:01:11.62ID:j7Yf8Kt20

grok はつまみ食いしてるだけだから
というか何も成功はしてないだろ

0032名無しさん＠ピンキー (ﾜｯﾁｮｲ f3b0-TnY8)

2025/08/24(日) 20:54:18.60ID:KAk5/6Ny0

えっcalude sonnet4とgtp ossとdeepseek r1よりqwen3-30b-a3bの方がいいの？まじ

0033名無しさん＠ピンキー (ﾜｯﾁｮｲ b6a9-slH+)

2025/08/24(日) 21:53:36.27ID:5IWKqrSs0

確かに信じがたいけど一応今の順位はこうなってる
ただGemma3-27bも結構なうえにいるし、それよりも後発＆MoE＆Qwenシリーズが全体的に高性能
であることを考えるとありえなくはないかなとも思ってる

0034名無しさん＠ピンキー (ﾜｯﾁｮｲ bfec-TnY8)

2025/08/24(日) 22:17:19.22ID:1z/0yi150

Claude 4 Sonnetより上ならかなり頂点に近いところにいるよねQwen3 30B

IQ Test | Tracking AI https://www.trackingai.org/home

0035名無しさん＠ピンキー (ﾜｯﾁｮｲ bfec-TnY8)

2025/08/24(日) 22:20:19.57ID:1z/0yi150

違ったこの表>>34は偏差値だから、gemini pro 2.5の次くらいかな？

0036名無しさん＠ピンキー (ﾜｯﾁｮｲ bfec-TnY8)

2025/08/24(日) 22:21:43.42ID:1z/0yi150

>>27
ごめんここに書いてたｗ　2.5flashにも及ばずだけどローカルにしてはやっぱ強いな…

■ このスレッドは過去ログ倉庫に格納されています