なんJLLM部避難所 ★7

1002コメント348KB

なんJLLM部避難所 ★7

■ このスレッドは過去ログ倉庫に格納されています

0001名無しさん＠ピンキー

2025/03/23(日) 14:58:05.71ID:bsaTSAD8

AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所 ★6
https://mercury.bbspink.com/test/read.cgi/onatech/1739448962/

0792名無しさん＠ピンキー

2025/05/02(金) 01:02:52.98ID:???

mistral small 3.1は推奨tempが0.15の罠あるんだよな

0793名無しさん＠ピンキー

2025/05/02(金) 01:40:15.71ID:hOcc+2CW

>>756
LM studioだとQwen3-30B-A3B-abliterated-Q6_K-GGUF
ってのしか無かったけどこれとは別なの？

0794名無しさん＠ピンキー

2025/05/02(金) 03:59:47.94ID:???

>>757
今更だけど一応あるよ
忘れられて久しいけど

29 名無しさん＠ピンキー (ﾜｯﾁｮｲ 93c0-Ub2H) sage 2024/05/03(金) 14:00:38.83 ID:???0
一応放置されているLLM部のWIKI：https://w.atwiki.jp/localmlhub
よくよく調べてみたらatwikiってえっちなコンテンツあかんらしい
NVA部とおそろいでseesaa wikiで作ったほうが編集もしやすくていいかもしれないな?

0795名無しさん＠ピンキー

2025/05/02(金) 04:25:37.65ID:???

個人がやってるwikiだけど日本語ローカルLLM関連のメモってwikiがだいたいスレの内容と同じで更新続いてるからなあ

0796名無しさん＠ピンキー

2025/05/02(金) 04:28:13.07ID:nnyzTfvM

>>765
戦いはVRAMの数だよ、兄貴
最新のGPUよりVRAM沢山搭載してるGPU複数枚の方がコスパがいい
マルチGPUに対応してないAIは一枚の性能に頼るしかないけど

0797名無しさん＠ピンキー

2025/05/02(金) 10:27:39.55ID:???

前にLLMと組み合わせたデスクトップアクセサリ秘書つくりたいと言っとった者やけど
Chill With You : Lo-Fi Story
ていう今度出るsteamアプリが近いかもしれん
なんか別ウィンドウに常時表示させておきたくなるンゴねこういうの

0798名無しさん＠ピンキー

2025/05/02(金) 10:58:43.16ID:???

日尼でGMKtecのX2 AI(Ryzen AI Max+ 395, 128GB)予約した
メモリの帯域幅的に現環境のP40*3よりたぶん少し劣るぐらいの速度だけろうけどP40は消費電力がね...

0799名無しさん＠ピンキー

2025/05/02(金) 11:01:46.63ID:???

おめ！いい色買ったな！

0800名無しさん＠ピンキー

2025/05/02(金) 11:35:52.63ID:???

Ryzen 9950XとRTX4090でKTransformersを使ってQwen3-235B-A22Bを動かしてみた
50token/sでるからすごい
DeepSeek R2が来るまでもうずっとこれでいいな

0801名無しさん＠ピンキー

2025/05/02(金) 11:44:51.44ID:???

>>800
はええな
導入したいけどどうすればいいか分からん
lm studioで動くんやろか

0802名無しさん＠ピンキー

2025/05/02(金) 11:49:15.93ID:B8zW0mtE

さすがにGMKtecのX2 AIは95000円クーポンと3割引クーポンは排他か

0803名無しさん＠ピンキー

2025/05/02(金) 13:24:11.71ID:???

>>798
vramに回せるの最大96Gやっけか
command-aが動くのええなあ
レポ楽しみにしとるやで

5090買う予算はないから今後AIまわりはRyzenAIになりそうや
メデューサ楽しみやで

0804名無しさん＠ピンキー

2025/05/02(金) 14:08:26.10ID:???

Qwen3-235B-A22Bは128GBのメインメモリと24GBのVRAMがあれば快適に動くね

0805名無しさん＠ピンキー

2025/05/02(金) 14:20:42.18ID:???

>>804
量子化はどの程度の？

0806名無しさん＠ピンキー

2025/05/02(金) 14:44:20.63ID:???

https://huggingface.co/ubergarm/Qwen3-235B-A22B-GGUF/tree/main
Vram24+DDR128やとQ3かしらん？
これってcmdからファイル結合でよかったやろか

0807名無しさん＠ピンキー

2025/05/02(金) 14:53:40.44ID:???

>>805
Q6_K

0808名無しさん＠ピンキー

2025/05/02(金) 14:56:23.03ID:???

>>777
あれからもう少し使ってみたがやっぱ小説の続きを書かせるAIのべりすと的な使い方ならベースモデルの方が優秀やな
nemoや3.1のbaseははっきり言ってNSFW目的のFTモデルより遥かにR18関連の語彙力高くてエロい
そっち系の学習を考えている人はmistralがおすすめやで　ベースモデルの時点で知識があるから軽くチューニングするだけで目的達成できるはずや

0809名無しさん＠ピンキー

2025/05/02(金) 15:10:12.91ID:???

俺もmistral系が好き

0810名無しさん＠ピンキー

2025/05/02(金) 17:25:13.46ID:???

Qwen3-235B-A22Bの動かし方どっかに載ってないかな？

0811名無しさん＠ピンキー

2025/05/02(金) 18:20:09.89ID:???

KTransformers知名度低いから記事はかなり少ない
YouTubeで検索したらいくつか見つけたけど

0812名無しさん＠ピンキー

2025/05/02(金) 18:50:23.19ID:???

ktransformers、0.2から0.3でなんかいろいろ変わってる？
公式のドキュメント通りにインストールしてもなんかうまくいかんな…

0813名無しさん＠ピンキー

2025/05/02(金) 20:44:00.89ID:???

ktransformersのインストールに挫折しました……

0814名無しさん＠ピンキー

2025/05/02(金) 20:46:31.20ID:???

Ubuntuなら簡単だけどな

0815名無しさん＠ピンキー

2025/05/02(金) 23:47:32.49ID:???

koboldの最大出力が512tから1024tに正式対応してるね。
これで放置作成がやりやすくなった

0816名無しさん＠ピンキー

2025/05/03(土) 12:20:30.56ID:DbQKJoUC

>>629
temp0.95/topK40でいい感じに動いたで
システムプロンプトも入力できるようになると助かる。応援してるで。

0817名無しさん＠ピンキー

2025/05/03(土) 12:41:17.49ID:GtjOGb0N

Qwen3 32BをAIエージェント的に使おうと思ったけどやっぱ使い物にならんかった…

0818名無しさん＠ピンキー

2025/05/03(土) 13:44:38.41ID:???

>>798
メインメモリを最大96G gpuに割り当てれるらしいけど本来のgpuメモリとは合算して使えるんだっけ？
例えば4090積んでたら120G使えるとか

0819名無しさん＠ピンキー

2025/05/03(土) 16:05:50.66ID:???

>>817
30の方が向いてるのでは？

0820名無しさん＠ピンキー

2025/05/03(土) 17:49:32.31ID:???

X2 AIは外部GPUも視野にいれるとOculinkが無いのがちょっとひっかかるな
多分拡張M.2スロットあるからそこに変換基板刺して繋ぐか
USB4で繋ぐという手はあるかもだが

0821名無しさん＠ピンキー

2025/05/03(土) 17:50:43.13ID:???

Qwen3-32BはQwQ-32Bより日本語性能が低い気がする
単純な上位版ではないっぽい

0822mp4

2025/05/03(土) 18:07:18.45ID:kt26AEII

https://do7go.com/f/bcqgxls6zk
https://ouo.io/6Jurbbu
https://ouo.io/D4pdQ4
https://ouo.io/hMj2HAn
https://ouo.io/1oDPQZ
https://ouo.io/GeXo1Qc
https://ouo.io/0Zek61

0823名無しさん＠ピンキー

2025/05/03(土) 18:24:53.26ID:???

qwen3-30B-A3Bのあんまり使われてない部分を排除した16Bバージョンらしい
14Bと比べたらどうなんだろうね
235Bを150Bに減らすこともできるらしく、そっちはまだっぽい
https://huggingface.co/kalomaze/Qwen3-16B-A3B

0824名無しさん＠ピンキー

2025/05/03(土) 19:27:51.75ID:???

>>823
bartowskiのIQ4_XS試してみたけど普通にダメそう
出力が欠けてたり文字化けしたりで使い物にならん

0825名無しさん＠ピンキー

2025/05/03(土) 19:35:47.47ID:???

あんまり使われてないから削ってみましたってロボトミーやんけ

0826名無しさん＠ピンキー

2025/05/03(土) 20:03:00.13ID:???

小説用の新しいモデルを公開してProject Wannabeを更新したやで　

https://github.com/kawaii-justice/Project-Wannabe/tree/main
https://huggingface.co/kawaimasa/wanabi_24b_v1_GGUF

主な変更点は次の展開を明示的に指定できるオーサーズノート機能に対応したことと、小説の続きを書かせるタスク時に冒頭部分が本文と重複して話が進まない問題を解消した点やね　詳しくはreadmeを見てほしい
データセットも2倍以上に増やして、あらすじや設定等の詳細情報を複数のフォーマットに対応させたから指示性も柔軟性もpreview版より大幅に上がってると思うで
チュートリアルも充実させたから合わせて見ると理解が深まると思うで

プレビュー版に意見くれたニキ達にはほんま感謝や

0827名無しさん＠ピンキー

2025/05/03(土) 20:27:19.40ID:gGU5VyRI

ktransformersって、プロンプトごとに学習データ使用範囲を予測してVRAM、DRAMに振り分けるんでしょ？
そうすると、プロンプト入力が増えるほど、参照が必要な学習データが増えて処理が遅くなるのではと思う。

単発でなく繰り返しプロンプト入力のでの処理時間と結果がどうなのか知りたいところ。

まあ通常使用だと精々5回位しか同系列のプロンプトしか入力しないから問題なさそうだけど。

0828名無しさん＠ピンキー

2025/05/03(土) 22:06:17.92ID:GtjOGb0N

>>819
今外部のLLM（Claude)でコーディングサポートに使ってて、Qwen3 ならローカルでコーディングサポート出来るかな？と使ってみたけどやっぱり知識的にというか分析的にイマイチおっちょこちょいな感じがするんよね…

0829名無しさん＠ピンキー

2025/05/03(土) 22:26:47.26ID:???

Qwen3ってやっぱりベンチ番長だった感じか

0830名無しさん＠ピンキー

2025/05/04(日) 05:09:31.45ID:???

>>826
更新サンガツやで
まずdev-04-28verのDynamic prompt やけど
{うきうきと|楽しそうに|悲しそうに}などで機能したで！
プロットで試したんやが、本文にもその雰囲気が多少反映された感じで面白いンゴ
ただ初期設定500トークンを超える長さのものだとプロット冒頭に書いたのは影響薄くなるね

ちょっと疑問やけども
設定
キャラA＝{黒髪|赤毛|茶髪}｛内気|悪戯っ子|負けず嫌い｝
てしたとき、ランダムで決めた「黒髪」「内気」は以後ずっと引用される（ように内部で指示されとる）んやろか？

0831名無しさん＠ピンキー

2025/05/04(日) 05:26:36.09ID:???

>>826
今回のmain-05-03
オーサーズノートの使い方がようやく解ったで
実際に指定してみたらそのとおり字数かけてくれた
地の文をじっくり書いて欲しいワイからするとメチャ嬉しい機能や！
こんなんが可能ならワイも好きな作家を学習させてみたいと思ってしまったで

ワイは今んトコ好みなんはc4ai-command-a なんやけど
地の文をちゃんと書いてくれるんや、クソ重いけども代え難い魅力や
今回の機能でwanabi_24b_v01_q4km の24Bでもかなりええ感じに思えたんで
いずれRyzenAImaxが普及した暁には c4ai-command-a でのアレンジもお願いしたいで！

0832名無しさん＠ピンキー

2025/05/04(日) 05:46:28.29ID:???

>>826
あとまた勝手な希望やけども
恐らく皆、設定にキャラ表を書いとるよね？
キャラ表を別textなりで用意して、別個で読ませたら
「キャラA」「キャラB」とタグができる（消すのはいつものX）のはどうやろか
設定もjsonに書かれとるけども、さすがにスクロールせんと見えんから
「この設定て誰が出てくるんやっけ」となるし、保存したjsonのによっては継ぎ足した差分で混乱するから
ひとつにまとめたいんや
別ファイルにすることで生成する直前にいちいち読みにいかなあかんくなるとは思うけども……

更に発展させると要素カードを作ってマインドマップ的なものを組み立てて、それをストーリー化とか
（NotebookLMがそうなのかもしれんがまだいじっとらん）
三幕構成のフォーマットに穴を埋めていくとそれっぽい物が完成するとかもできそうや
とにかく楽しみやからワイでよかったらなんぼでもデバッガーになるで

0833名無しさん＠ピンキー

2025/05/04(日) 06:17:04.92ID:???

>>826
GUIっぽくプロットをいじれるようになってワイルドカード使えたら
誰でもアサイラムに就職できるかもしれん

Z級サメ映画フォーマット
├─ １幕目
│ └─ サメの不穏な影（資料映像wild）
│ └─港町（場所wild）では海辺で（祭wild）の準備中
│ └─ エサ枠のチャラ男チャラ女たち（キャラwild）
│ └─1人が「この海には（伝説wild）があって……と言い出す
│ └─1人行方不明（キャラwild）になる
│ └─ チャラ男が（有力者wild）に危険を訴えるが（理由wild）により断られる
│ └─相手にされないチャラ男たち、お互いの（悪口wild）で罵り合う
├─2幕目
│ └─祭が開始される。突然（空間wild）の中から（突然変異wild）した（サメ外見wild）が群衆に襲いかかる
│ └─（反撃wild）にもかかわらずサメは人間たちを（面白死亡wild）で食べていく
├─3幕目
└─（ひょんなことwild）で、サメは姿を消す
└─（人間は愚かwild）というテーマっぽいことを語る

書いてて思ったけど別に港町じゃなくてもええんよな、雪山とか砂漠にもサメ出るし

0834名無しさん＠ピンキー

2025/05/04(日) 07:31:48.47ID:???

>>828
公式がQwen3-30B-A3Bの方を勧めてる（openhandsと組んで検証したみたい）
ただまだcloudeやgemini2.5proが圧倒的だね
swe benchに圧倒的な差がある

0835名無しさん＠ピンキー

2025/05/04(日) 13:20:19.89ID:???

text-generaton-webuiを2.6から3.2に上げたら
ST経由の出力がとんでもなく長くて繰り返しが多くなってしまったんですが
解決法知ってる方いますか？

0836名無しさん＠ピンキー

2025/05/04(日) 16:10:16.08ID:HT/coSqq

>>826
更新サンガツ。アイデア出しの時に詳細情報の各項目を出力に含める含めないを指定することは難しいんかな？
設定が長いとプロットだけ書いてほしいときに時間かかるんや。

0837名無しさん＠ピンキー

2025/05/04(日) 16:45:59.90ID:???

>>835
大葉とST共にキャラカードとかチャット履歴をバックアップ取ってからクリーン再インストール

0838名無しさん＠ピンキー

2025/05/04(日) 21:06:19.27ID:???

>>835
アプリの更新で出力の雰囲気が変わるのは俺もあったな
画像生成でもそういうことはあるしある程度は諦めて調整し直すしかないと思う

0839名無しさん＠ピンキー

2025/05/04(日) 23:25:15.33ID:???

>>830
>>836
使ってくれてありがとやで
dynamic promptは生成されるたびにランダムに選択やね面白そうな展開やアイデアが出たら、手動で調節する形やね
>>ランダムで決めた「黒髪」「内気」は以後ずっと引用される（ように内部で指示されとる）んやろか？

GUI側で非表示にするだけなら簡単に出来るけど出力時間は同じだから時短にはならんね　特定の項目のみを出力はデータセットから変えないといけないから厳しい
>>更新サンガツ。アイデア出しの時に詳細情報の各項目を出力に含める含めないを指定することは難しいんかな？

データセット変えるのは簡単なんだけど次のモデルに入れようと画策してるアイデア出し時にアイデアの補間（既存の詳細情報を膨らませる）する機能とも相性悪そうなんよね　良い方法が無いか考えてみるわ
機能要望は出来るだけありがたいからどんどん送ってや

0840名無しさん＠ピンキー

2025/05/05(月) 02:15:25.73ID:???

unsloth/Qwen3-235B-A22B Q3_K-XL がMacBookで動いたから試してみたけど
個人的にはイマイチだった

0841名無しさん＠ピンキー

2025/05/05(月) 03:29:36.91ID:I34Rq591

昨日初めてローカルLLMやったんだが、Gemmaとあと名前すら忘れたけどバカな上にキチガイレベルで検閲ひどくてドン引きしたモデルがあった
そのあとMistral 7B入れたら日本語みたいな言語喋る何者かって感じで会話7割くらいができなかったな

0842名無しさん＠ピンキー

2025/05/05(月) 05:15:20.76ID:???

mistralは欧州しぐさ強いからアジア対応なんて期待できない

0843名無しさん＠ピンキー

2025/05/05(月) 05:21:35.05ID:???

Largeは動かせてないけどMistral Smallはあのモデルサイズにしては日本語できる方だけどな

0844名無しさん＠ピンキー

2025/05/05(月) 08:15:58.67ID:???

rtx4070からrtx5070tiに変えたら少しは生成早くなるかと思いきや、koboldcppでエラー吐いて止まるようになってしまった
AIで調べたらコンテキストシフトが悪さしてるとか言われたけど、GUI上で切っても効果無し
画像生成の方でもz-tipoがエラー吐くしaviutlもエラー吐くし散々だよ

0845名無しさん＠ピンキー

2025/05/05(月) 09:27:18.19ID:???

mistralにキレてる意味がわからん
mistralに論破でもされたんか？

0846名無しさん＠ピンキー

2025/05/05(月) 09:35:02.75ID:???

mistralとllama間違えてる説

0847名無しさん＠ピンキー

2025/05/05(月) 09:57:10.27ID:???

>>844
グラボじゃなくてドライバ変えたからアカンとか？
最近の緑ドライバ評判悪いし

0848名無しさん＠ピンキー

2025/05/05(月) 09:57:49.02ID:???

mistralは内部に日本好きがいると思われる
トークナイザーからTekkenとか命名してるし

0849名無しさん＠ピンキー

2025/05/05(月) 10:06:32.04ID:???

Mistral Largeは123Bだっけ
あの辺気軽に動かせるようになればまた変わるんだろうな

0850名無しさん＠ピンキー

2025/05/05(月) 11:06:49.98ID:???

mistral large 系のmagnum v4は日本語最強やで

0851名無しさん＠ピンキー

2025/05/05(月) 11:08:40.89ID:???

どっかにエロ小説用のLoRAないの？

0852名無しさん＠ピンキー

2025/05/05(月) 11:45:10.09ID:???

>>851
LLMだとLoRAだけ公開ってほとんどみないな
NSFW系小説だと上のwanabi 24bも対応してるしaratako氏の
https://huggingface.co/Aratako/SniffyOtter-7B-Novel-Writing-NSFW-GGUF?not-for-all-audiences=true
これとかも有名や　このモデル時代は1年前のモデルやけどXでqwen3 8bバージョンも出すって言ってたから期待してる

0853名無しさん＠ピンキー

2025/05/05(月) 12:05:11.49ID:???

汎用的に使えるようにLoRAにする一歩前段階のものがあるといいのだけど

0854名無しさん＠ピンキー

2025/05/05(月) 12:51:11.27ID:???

画像生成みたいなLoRA作成環境ってLLMにもあるん？

0855名無しさん＠ピンキー

2025/05/05(月) 13:32:37.10ID:???

LLMのLoRA作成ツールはあったはず
前に調べた時にはあった

0856名無しさん＠ピンキー

2025/05/05(月) 13:48:26.96ID:???

koboldcppに続いてsilly tavernの設定項目の解説をchatGPT先生にお願いしてるんやが面白いな
使ってるberghof-ERP向けの動体温度を採用したおすすめパラメータで組んでみたら挙動が理想に近づいた
ちなみにberghofのコンテキストテンプレート、なぜか俺はずっとmistralV1だと勘違いしてたんだけど多分ChatMLもしくはAlpacaが正解やわ
それにしてInstructモードをオンでやると変な挙動が出なくなった

0857名無しさん＠ピンキー

2025/05/05(月) 16:08:37.93ID:???

>>847
そうかもやけど乗せ替えたときに最新版ドライバ入れんと動作せんかったんや…
単にグラボ変えただけやのにこんな事になるとは

0858名無しさん＠ピンキー

2025/05/05(月) 16:30:42.80ID:???

>>836
アイデア出しタスクで条件付きやが精度を維持したまま高速で特定の項目だけ出力できるようにしたやで
Project Wannabeを更新すれば使えるはずや
複数の項目の出力は良い方法が思いつかなったので無理やった

0859名無しさん＠ピンキー

2025/05/05(月) 16:52:12.67ID:jjYWJ4/9

Twitterで回ってきたけどQwenにエロデータ学習させてる人がいるらしいからそれ使ってみるか

0860名無しさん＠ピンキー

2025/05/05(月) 17:01:44.12ID:???

wannabeに触発されて、今更、初めて自分でllmの微調整して量子化までやった
プログラミング分からん俺でもgeminiに聞きながらやったら4日でここまで来れたから、そんなに難しいことではないと思う
データセットとハイパーパラメータとかいうやつは、これからゆっくり学んでいく
データセットの自作はAPI経由で集めるか、AIに作らせるしかないんかな
自分好みにしようと思うとめっちゃ大変だね

0861名無しさん＠ピンキー

2025/05/05(月) 17:05:55.00ID:???

お疲れ様
いいの出来たらうｐしてくれ頼むで

0862名無しさん＠ピンキー

2025/05/05(月) 17:21:41.16ID:???

学習はデータセット作成に全体の9割の労力を使えと言われるくらいにはデータセットの品質が結果に直結するから頑張るんやで
LLMで合成データを作るなら無料枠をかき集めると安上がりなんでおすすめや
openrouterなら10$チャージすれば無料モデルなら1日1000リクエストまで使えるようになる
googleもGemini 2.0 flashや2.5 flashなら結構無料枠あるしgrokならデータ共有すれば毎月150$のクレジット貰える

0863名無しさん＠ピンキー

2025/05/05(月) 17:33:53.99ID:???

ｻﾝｶﾞﾂ　参考にする

0864名無しさん＠ピンキー

2025/05/05(月) 17:45:20.16ID:???

ピンとこんのやがデータセットって要は大量のドスケベ日本語サンプルってこと？
どういう雰囲気で～とか指示して書きまくってもらう感じ？

0865名無しさん＠ピンキー

2025/05/05(月) 18:06:30.92ID:???

>>862
それっていわゆる蒸留って手法？

0866名無しさん＠ピンキー

2025/05/05(月) 18:39:21.11ID:???

データセットの形式もLLMで作ってもらう内容もモデルの目的次第やね
小説を書かせたいならLLMに書かせるよりスクレイピングなりOCRなりで取得して→LLMには目的に応じて単なるプログラム処理では得られない情報を作ってもらう形やね（例えばあらすじから小説を書かせたいならLLMであらすじを作らせるとか）
チャット用途なら会話履歴自体をほぼ0からLLMに作らせることになるはずや　
この場合なら最終的なデータセットの形式も指示文と出力文を用意する形（所謂SFT用データ）になる
特定の知識を与えたい場合は事前学習の方が適してると言われているから特に変形させずひたすらプレーンテキストを与える形式(>>488みたいな)を作ることになる

0867名無しさん＠ピンキー

2025/05/05(月) 19:39:25.94ID:D+dlVy8I

今って2つのAIに会話させて小説を2人のLLMsで作っていくって出来る？昔Rinnaで2人会話させる昨日作ってたニキがここにいて使わせて貰ったけど、アタオカ2人が会話してて面白かった（使い物にはならんかった

0868名無しさん＠ピンキー

2025/05/05(月) 19:40:51.32ID:???

登場人物一人一人にslmを割り当てて監督llmに指示させるのはどう？

0869名無しさん＠ピンキー

2025/05/05(月) 19:42:30.97ID:???

昔のリンナは酷かったよな
STのグループチャット機能使えば行けるんじゃね？

0870名無しさん＠ピンキー

2025/05/05(月) 22:51:03.56ID:???

>>851
そもそもQwQ-32Bとかの人気モデルは大抵エロも学習してる
それで満足できるかは人によるだろうけど

0871名無しさん＠ピンキー

2025/05/05(月) 23:10:53.75ID:???

賢さはあっても喋り口調がぎこちなかったりしがち

0872名無しさん＠ピンキー

2025/05/06(火) 02:09:51.20ID:bOSySj8N

32Bってかなりマシなんじゃね？
7Bだと日本語モドキ喋る何者かだぞ

0873名無しさん＠ピンキー

2025/05/06(火) 02:45:12.21ID:???

STのグループチャットはLLMの性能向上もあってかなり使えるようになったけどまともな会話を続けさせるならユーザーがプロンプトで逐次介入しないと無理だと思う

0874名無しさん＠ピンキー

2025/05/06(火) 03:44:24.12ID:???

>>872
それ多分設定がうまく出来てない
7Bは複雑な関係や状況は把握しきれないけど普通に流暢に会話出来るよ
むしろ下手な20～30Bモデルより会話が自然だったりする

0875名無しさん＠ピンキー

2025/05/06(火) 10:08:12.79ID:UztmOgSB

こことか色々なところの反応見るとchat templateの概念を理解出来てない人が意外と多いのかもなって感じがする
ローカルLLMでまともに会話できないって言ってる人はここで躓いてることが多いイメージ、最近のモデルは7Bとかでも普通に会話はできるよ

0876名無しさん＠ピンキー

2025/05/06(火) 10:40:02.25ID:???

>>870
基本的な語彙力とかはモデルに頼るとして
エロい表現とかはLoRAで補強したいですね

0877名無しさん＠ピンキー

2025/05/06(火) 11:06:32.05ID:G7Ze4Tdj

>>872
ほんそれ
最新のナウいやつは知らんけど
大抵の小型モデルは言語をあやつる怪異レベルなんよな

0878名無しさん＠ピンキー

2025/05/06(火) 11:23:56.31ID:???

>>875
まず長い設定を覚えてくれないから正確なキャラの維持やTRPGゲームマスターみたいなことができないよね
例えばお嬢様でも敬語で落ち着いて喋るお淑やかにしたいのに「〇〇ですわ～！」連発するとかね
そんでセリフの例を少し渡すと「アレンジしろ」と注釈をつけても同じ言葉を繰り返すし
たくさん例を渡すと今度は扱いきれなくなってセリフとルールと注釈を取り違えて指示文とか喋りだす

って認識なんやけど違うん？
クソデカモデルで長時間待っても大差なかったんやけどワイの使い方が悪い？

0879名無しさん＠ピンキー

2025/05/06(火) 11:50:54.47ID:???

キャラの維持はサイズよりRP用にチューンされたモデルかどうかが重要だと思う
例えば俺のお気に入りの7Bのberghof-ERPの方はsilly tavernで使うとキャラ追従性がとても良くて口調や性格も崩れない
mistral3.1も使って比較したところ、こっちは同じキャラカード使っても口調がどこか教科書チックというか、お硬い感じになるね
ただし7BはTRPGの進行みたいな複雑なルール把握はまず無理だからそういう用途では大サイズモデルを使うべきだろうね

0880名無しさん＠ピンキー

2025/05/06(火) 11:58:02.16ID:bOSySj8N

>>875
俺なんかお前が言うところの「初心者」なんだろうけど、7Bと14Bじゃ全然違うぞ

0881名無しさん＠ピンキー

2025/05/06(火) 11:58:22.25ID:???

ローカルLLM動かしたこと無いけど
巨大モデル使えば性能良くなるんでは？って思って
ThunderComputeでVRAM80GBのNVIDIA A100XL借りて
初めてOllama動かしてみた
VCPUs: 4, Memory: 32GB, Cost/Hour: $0.82
20ドルまでは無料らしいので偶に実験する程度なら安く使えそう

これのQ5_0量子化のやつ
無規制っぽくて、文章の整合性はともかく脱獄のような事をしなくても申し訳してこないのは良いな
https://huggingface.co/mmnga/c4ai-command-r-plus-gguf

https://www.thundercompute.com/about
Every account also receives $20 in free credit each month, so many users run small experiments at zero cost.

0882名無しさん＠ピンキー

2025/05/06(火) 12:22:19.28ID:???

知識を付与するのがLoRAが一番苦手な学習やから　
賢いモデルにエロさを付与するよりそこそこの賢さの無検閲モデル（出来ればベースモデル）を軽くチューニングしたほうが結果として賢さとエロさを両立できる
　

0883名無しさん＠ピンキー

2025/05/06(火) 12:39:50.85ID:???

りんなのQwen3日本語チューニング出すのを待っています

0884名無しさん＠ピンキー

2025/05/06(火) 12:44:09.03ID:???

3060にPhi4はいくら4bitにされてるとは言え重いなぁ

0885名無しさん＠ピンキー

2025/05/06(火) 14:34:39.89ID:1ejB0bC0

>>858
サンガツ。かなりいい感じに動いてるわ。応援してるで。

0886名無しさん＠ピンキー

2025/05/06(火) 15:10:46.18ID:???

データセットのロードうまくいかんと思ったら、windowsのパスの最大長制限ってのが原因だった
デフォだと260文字までしか対応してないんだってね。無効化したらいけた
geminiにエラーコード放り込んで、最後に「もしかしたら…」って言われたのがこれなんだけど、geminiなかったら一生躓いてたと思う
技術畑の人にとっては割とありがちだから常識らしい

0887名無しさん＠ピンキー

2025/05/06(火) 16:25:00.23ID:???

今まで難しそうと思って後回しにしてたsilly tavernとcomfyUIを繋げて画像生成、やってみたら意外と簡単だった！
生成指示文を改良していけばさらに色々出来そう
ちなみにLLMはberghof-ERP-7B-Q8
画像モデルはcottonnoob-V3

https://i.imgur.com/DDVCcmL.jpeg

0888名無しさん＠ピンキー

2025/05/06(火) 17:49:51.83ID:???

qwen3ってstable diffusionのエロプロンプトとかエロ小説書ける？
自分で調べてqwen3ダウンロードしてるんやが
今ダウンロード中75%
1秒に0.07%くらい

0889名無しさん＠ピンキー

2025/05/06(火) 17:59:03.81ID:???

>>888
非常にフィルタきつい

0890名無しさん＠ピンキー

2025/05/06(火) 18:05:59.30ID:???

>>889
試したら無理やったわ

0891名無しさん＠ピンキー

2025/05/06(火) 18:31:58.09ID:???

まあいいや
qwen3は別な目的に使う
今magnumシリーズの適当なのをダウンロード中

0892名無しさん＠ピンキー

2025/05/06(火) 18:51:22.22ID:???

magnumダウンロードしたが、彼女は「幼女レイプは犯罪です」と取り合ってくれなかった
486見て別なバージョンダウンロード中

■ このスレッドは過去ログ倉庫に格納されています