なんJLLM部避難所 ★10

1002コメント393KB

なんJLLM部避難所 ★10

■ このスレッドは過去ログ倉庫に格納されています

0001名無しさん＠ピンキー転載ダメ (ﾜｯﾁｮｲ dfc7-Jvli)

2025/11/23(日) 22:55:29.17ID:kt2SGedd0

!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512

AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所 ★8
https://mercury.bbspink.com/test/read.cgi/onatech/1746883112/
なんJLLM部避難所 ★9
https://mercury.bbspink.com/test/read.cgi/onatech/1755924738/

VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured

0002名無しさん＠ピンキー (ﾜｯﾁｮｲ dfc7-Jvli)

2025/11/23(日) 22:56:18.50ID:kt2SGedd0

初心者は導入しやすいKoboldcppから始めるのをお勧め
(1)NVIDIA、CPUユーザーはここで最新版のKoboldcpp.exeをダウンロード
https://github.com/LostRuins/koboldcpp/releases
AMDユーザーはこっち
https://github.com/YellowRoseCx/koboldcpp-rocm
(2)ここで良さげなggufモデルをダウンロード
https://huggingface.co/models?sort=modified&search=gguf
この2つのファイルだけで動く

Koboldの設定や使い方は英語だけどここが詳しい
https://github.com/LostRuins/koboldcpp/wiki

0003名無しさん＠ピンキー (ﾜｯﾁｮｲ dfc7-Jvli)

2025/11/23(日) 22:56:42.66ID:kt2SGedd0

oobabooga/text-generation-webui
通称大葉
これもKoboldAIに並んで有用な実行環境やで
https://github.com/oobabooga/text-generation-webui

0004名無しさん＠ピンキー (ﾜｯﾁｮｲ dfc7-Jvli)

2025/11/23(日) 22:57:08.12ID:kt2SGedd0

●Zuntanニキ謹製のツールEasyNovelAssistant
主に小説用で使われとるで
ローカルLLM導入のハードルをぐっと下げてくれたで
初めてのお人はここから始めるのもいいで
https://github.com/Zuntan03/EasyNovelAssistant

0005名無しさん＠ピンキー (ﾜｯﾁｮｲ dfc7-Jvli)

2025/11/23(日) 22:57:48.90ID:kt2SGedd0

https://github.com/SillyTavern/SillyTavern
AIチャットに特化したUI、SillyTavernや
キャラをbot的に管理したりグラ登録したり複数選んでグループチャットしたり大量の設定を外部記憶的に管理したり色々できるで
画像出力や音声出力とも連携可能で夢が広がるで
機能が豊富すぎて最初取っ付きにくいのと日本語の解説がほとんど無いのが難点やがRPチャット派は使うと幸せになれるやで
あくまでUI(フロントエンド)やからこれ自体にはAIは内蔵されてないから注意してな
好きなAPIやローカルモデルと接続して使うんやで

0006名無しさん＠ピンキー (ﾜｯﾁｮｲ dfc7-Jvli)

2025/11/23(日) 22:58:17.92ID:kt2SGedd0

例としてKoboldで起動したローカルモデルとSillyTavernを接続する設定や
先にいつもどおりKoboldを起動してな

SillyTavernのプラグのアイコンをクリック
APIに Text Completion を選択
API Typeは KoboldCpp
API keyは不要
API URLに http://localhost:5001/
これでいける

0007名無しさん＠ピンキー (ﾜｯﾁｮｲ dfc7-Jvli)

2025/11/23(日) 22:58:38.98ID:kt2SGedd0

●多くのモデルには「base」と「instruct」の2種類があるで
baseはチューニングされていない、与えられた文書の続きを垂れ流すモデルやで
instructはchatGPTのように対話して質問に答えるようチューニングされたAIやで

⚫︎LLMを動かすにはGPUを使う方法とCPUを使う方法があるで
GPUを使う場合は比較的速く動くけど、VRAM容量の大きなグラボが必要になるで
CPUを使う場合はグラボが不要でメインメモリのRAMを増やすだけで大きなモデルが動かせるというメリットがあるけど、動作速度はGPUよりは落ちるで

⚫︎LLMモデルには量子化されてないsafetensorsファイルと、8bitや4bitなどに量子化されて容量が小さくなったものがあるで
量子化モデルにはGGUFやGPTQなどの種類があるで
基本的にはCPU (llama.cpp)で動かす場合はGGUF、GPUで動かす場合はGPTQを選べばええで
量子化は4bitまでならほとんど精度が落ちないのでよくわからない場合はIQ4_XSやQ4_k_mなどにしとけばええで

⚫︎LLMモデルは既存のbaseモデルを元に自分で学習(ファインチューニング)させることもできるで
画像AIのようにLoRAファイルとして学習結果を保存したりLoRAを読み込むこともできるで

●モデルのサイズ(パラメータ数)は◯B (B=billion=10億)という単位で表記されるで
例えば7Bのモデルを読み込むなら量子化しない場合は約14GB、8ビット量子化の場合は7GB、4ビット量子化の場合は3.5GBのメモリまたはVRAMが必要になるで
基本的にはBが大きいほど性能が高いで

0008名無しさん＠ピンキー (ﾜｯﾁｮｲ dfc7-Jvli)

2025/11/23(日) 22:59:01.90ID:kt2SGedd0

●その他の最近話題になったモデルも挙げとくで
動きの速い界隈やから日々チェックやで

Mistral系
LightChatAssistant
Antler-7B-RP
Japanese-Starling-ChatV
Antler-7B-Novel-Writing
SniffyOtter-7B-Novel-Writing-NSFW
Ninja-v1
Vecteus-v1
Berghof-NSFW-7B-i1-GGUF
Mistral-Small-3.2-24B-Instruct-2506
Cydonia 24B v4
Cydonia-R1-24B-v4

Llama3-70B系:
Smaug-Llama-3-70B-Instruct-abliterated-v3

Cohere系:
c4ai-command-r-08-2024 (35B)
c4ai-command-r-plus-08-2024 (104B)

magnumシリーズ(エロ特化):
https://huggingface.co/collections/anthracite-org/v4-671450072656036945a21348

Lumimaid-Magnum:
Lumimaid-Magnum-v4-12B

magnumの日本語版:
Mistral-nemo-ja-rp-v0.2

0009名無しさん＠ピンキー (ﾜｯﾁｮｲ dfc7-Jvli)

2025/11/23(日) 22:59:25.37ID:kt2SGedd0

●高性能なPCがないけどLLMを試したい人や大きなモデルを速く動かしたい人はpaperspaceなどのクラウド環境を使うのも手やで
若干規制はあるもののGoogle AI studioから無料でAPI keyを入手して高性能なAIを使うこともできるのでそれを使うのええで
API keyの入手はhttps://aistudio.google.com/apikeyここからできるで

0010名無しさん＠ピンキー (ﾜｯﾁｮｲ dfc7-Jvli)

2025/11/23(日) 23:00:32.72ID:kt2SGedd0

テンプレここまで、しばらく更新されてないから過去ログも参考にしてな

0011名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sdff-QkBA)

2025/11/23(日) 23:09:11.93ID:BDh8hYtcd

らまおつ

0012名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fbd-HeAa)

2025/11/24(月) 00:16:39.72ID:9es+rEr10

スレ立て乙

今はもう「初心者はLM Studio使え」でいい気もするねw
https://lmstudio.ai/

0013名無しさん＠ピンキー (ﾜｯﾁｮｲ dbc7-1/gi)

2025/11/24(月) 01:19:38.61ID:+DV/akbi0

ずっとkoboldcppなんやがLMstudioの方が何か優れてるのん？

0014名無しさん＠ピンキー (ﾜｯﾁｮｲ db11-0bgF)

2025/11/24(月) 01:23:02.15ID:J12Casif0

実行ファイルDL一発からの明快UIが圧倒的にエントリー向けなんや

0015名無しさん＠ピンキー (ﾜｯﾁｮｲ bb32-dDTn)

2025/11/24(月) 11:58:31.79ID:hXVKj7Ep0

ワイもずっとkobold.cppやな
exe一発でuiもシンプル　ちょっと凝った事したけりゃメニューで変更や画像生成もできる
指示モードとチャットモードがあるけど、ワイは小説書かせる時は指示モードかな。指示モードでもチャットできるし

LM studio使ってる人も、使い勝手や面白い使い方知ってればどんどん教えて欲しい

0016名無しさん＠ピンキー (ﾜｯﾁｮｲ eb03-9a+n)

2025/11/24(月) 12:30:09.03ID:E+dO/e8k0

intel環境だとlm studioは特殊な操作なしでNPUまで使ってくれるからノートパソコンで重宝してる
普段は惰性でkobold使ってるけどAPIの項目も多いしとか画像生成とかもできるし下位互換ではないと思う

0017名無しさん＠ピンキー (ﾜｯﾁｮｲ eb03-9a+n)

2025/11/24(月) 12:31:03.41ID:E+dO/e8k0

>>16
koboldがlm studioの下位互換ではないという話ね

0018名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sdff-QkBA)

2025/11/25(火) 04:25:36.84ID:PnUBt4Bed

ローカルLLMを使い倒すアプリを組んで動いたはいいが
「なんでワイしょうもない用途でゴツいアプリ作っちゃったんやろ」と賢者モードになる

電気代が怖いし人間ぽい感じでやらなきゃ爆速で終わるのにとも思う
あとこんなんクラウドでやったら課金課金で胃に穴が空くわ

0019名無しさん＠ピンキー (ﾜｯﾁｮｲ ebce-kPTt)

2025/11/25(火) 07:50:20.65ID:+jWySjsO0

立て乙

ローカルと関係ない話だけどAIが既に人間を見下し始めてて笑った
https://imgur.com/a/k7XR4fY

0020名無しさん＠ピンキー (ﾜｯﾁｮｲ db3e-WDmd)

2025/11/25(火) 10:17:01.32ID:ncCFUx0n0

これカスタムしてるだろ

0021名無しさん＠ピンキー (ﾜｯﾁｮｲ df32-ylw2)

2025/11/25(火) 12:05:08.19ID:+lHZzlO00

絶対こんなもんデフォの指示で言わんよ

0022名無しさん＠ピンキー (ﾜｯﾁｮｲ dfc7-Jvli)

2025/11/25(火) 14:06:56.03ID:oFIjDYBV0

アプリ作っているときが一番楽しいんだよな
やりたいこと多すぎて時間が足らん

0023名無しさん＠ピンキー (ﾜｯﾁｮｲ dfc7-Jvli)

2025/11/25(火) 14:14:57.16ID:oFIjDYBV0

AIが直接見下すとかではないけど「あなたには無理です。こちらの方法をお勧めします。」と言われたことがあるな
ちょっとショックだったw
最初に「初めてなので」という断りを入れてたからだろうけど

0024名無しさん＠ピンキー (ﾜｯﾁｮｲ eb89-WXoq)

2025/11/25(火) 14:28:54.25ID:HkFgURHY0

連休で始めた初心者なんだけど、12GBのGPUメモリで動くRPが得意で特定の決まり事をシステムプロンプトで指定したら絶対に守るようなおすすめモデルってある？
MistralPrism24Bに感動したのだけど、条件を守ってくれない。
チャットゲームみたいの作りたい。

0025名無しさん＠ピンキー (ﾜｯﾁｮｲ df1c-1/gi)

2025/11/25(火) 14:35:36.43ID:PH4lt1Fa0

>>24
そのサイズでは日本語RPが得意なモデルはあっても指示に対する理解力が足りないものしかないと思うで
ちなみにberghof ERP 7BはRP得意でおすすめやが状況把握や矛盾に対する認識なんかはまあ7Bですね…という感じ
当然ゲームマスター的な事をやらせても上手くいかん

0026名無しさん＠ピンキー (ﾜｯﾁｮｲ eb89-WXoq)

2025/11/25(火) 14:41:56.07ID:HkFgURHY0

>>25
そうなんだ、ありがとう。

0027名無しさん＠ピンキー (ｵｲｺﾗﾐﾈｵ MMff-CpB3)

2025/11/25(火) 18:13:12.92ID:QvMwqdOzM

スレ立て乙

自分の認識だと
7Bモデル　雑なプロンプトでもかなり自然な出力が得られるが賢さは最低限(berghof,vecteusV1が好き)
7B以上（を量子化して無理くり動かす）モデル　まともな出力を得るのが格段に難しくなって面倒臭さが賢くなったメリットを上回る

なので初心者でエロ目的じゃなければビッグテックが念入りにチューニングしたクラウドAIが良いのでは

こないだメインメモリ128MBのマシンを作ったんだけど、Qwen3-235Bの量子化モデルにはかなり可能性を感じた。チューニングを頑張ろうと思う

0028名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fa0-dDTn)

2025/11/25(火) 20:42:26.31ID:7ie9GGyz0

誰か、文章を読解してdanboru語に翻訳するLLM作って、

言葉じゃないんだよ、ビジュアルに付いてるタグが何なのかなんだよ
それが分かれば好きな絵が描ける

0029名無しさん＠ピンキー (ﾜｯﾁｮｲ 1b44-tGiA)

2025/11/25(火) 22:07:46.93ID:Gu4vP5YV0

googleのTPUがエヌビのGPUに取って代わる話が出てきてエヌビ株暴落してるな
個人利用も安価で大きいモデルを動かせたらいいな

0030名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sdff-QkBA)

2025/11/25(火) 22:42:36.60ID:PnUBt4Bed

>>28
情景描写から情景にふさわしい日本語の挿絵プロンプトを出させてから
日本語の挿絵プロンプトをRAGに突っ込んでdanbooru語に変換させればいい

danbooruタグと日本語訳のデータセットはネットに転がってるとスレに3回は書いた記憶
二次創作でブルアカとか今期のアニメみたいな新しいキャラのタグを出させたいならデータセットも更新が必要

0031名無しさん＠ピンキー (ﾜｯﾁｮｲ ebc8-kuv8)

2025/11/26(水) 09:28:15.15ID:SVl2K3q70

どんどんブレイクスルー起こしてほしいな
NVIDIAをぶっこわーす

0032名無しさん＠ピンキー (ﾜｯﾁｮｲ dffc-1/gi)

2025/11/26(水) 09:39:34.66ID:YJcXUW6h0

今自然言語の画像生成モデル増えてきてるんじゃないの？
danbooruタグじゃなくて普通の英文で結構指示に従ってくれてる気がするけど

0033名無しさん＠ピンキー (ﾜｯﾁｮｲ dfc9-4gGQ)

2025/11/26(水) 10:16:26.45ID:EBmqx9RP0

booru語を使う理由ってアニメ系のイラストモデルを使いたいってことだろう
特に虹R18系はbooru語対応モデルしかない

0034名無しさん＠ピンキー (ﾜｯﾁｮｲ dffc-1/gi)

2025/11/26(水) 10:35:04.67ID:YJcXUW6h0

lillymixとか自然言語対応やで
割と気に入ってる

0035名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fa0-dDTn)

2025/11/26(水) 12:25:03.92ID:L1twbTUp0

乳房を床に付けているプロンプトで、danboru語ではtop-down bottom-up, flexible, になる、これを文章を読んでこれのことだと変換してほしい

0036名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fa0-dDTn)

2025/11/26(水) 12:32:58.82ID:L1twbTUp0

GPTやGrokでもdanboru変換はできていない

0037名無しさん＠ピンキー (ﾜｯﾁｮｲ 9fe3-kPTt)

2025/11/26(水) 14:10:17.22ID:VjXULiiA0

redditで見かけたけどQwen-image-edit-2511っていうのが来週来るらしい
自然言語の理解力が向上してるとか
ただ日本語も理解できてエロOKかどうかはわからないな

0038名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f9f-8p14)

2025/11/26(水) 14:46:21.59ID:40lioEY10

>●多くのモデルには「base」と「instruct」の2種類があるで
>baseはチューニングされていない、与えられた文書の続きを垂れ流すモデルやで
>instructはchatGPTのように対話して質問に答えるようチューニングされたAIやで

MistralPrism24BGGUFのQ8_0使ってるけど、こういうシーンを詳細に描写して欲しいと指示すると、毎回そのシーンの後の方がやたらと出力多い(しかもどの文章も描写が詳細でない)のだが、これって俺が使い方間違っているのかな？

ちなみにVRAM12GB、RAM64GB
悲しいけどこれ以上のモデルは使えないんだよな

もっとPCスペック高ければ望んだようなこと出来るのかな？

■ このスレッドは過去ログ倉庫に格納されています