なんJLLM部避難所 ★8

1002コメント348KB

なんJLLM部避難所 ★8

■ このスレッドは過去ログ倉庫に格納されています

0001名無しさん＠ピンキー転載ダメ (ﾜｯﾁｮｲ f3c0-9L8h)

2025/05/10(土) 22:18:32.02ID:0Ak3eO5y0

!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512

AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所 ★7
https://mercury.bbspink.com/test/read.cgi/onatech/1742709485/

VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured

0170名無しさん＠ピンキー (ﾜｯﾁｮｲ c0a9-dAft)

2025/05/20(火) 16:40:26.06ID:OE1T9HoO0

なんかこの感じだと来年にはさらにVRAMがたくさん載った製品がどこからか出てきそうではある
でもまぁ来年以降までのつなぎとしてさっさとDGX Spark買って128GBのようなVRAMを使ったLLMに慣れとくって感じかなぁ・・・

0171名無しさん＠ピンキー (ﾜｯﾁｮｲ ecb6-fjSQ)

2025/05/20(火) 17:13:42.07ID:EpOCsUcx0

ktranformersのARC対応来てるな

0172名無しさん＠ピンキー (ﾜｯﾁｮｲ 9629-WIAZ)

2025/05/20(火) 19:31:26.49ID:Cwf3ds990

エロ用途じゃなくて仕事でも実用的に使えるローカル動かしたいわ

0173名無しさん＠ピンキー (ﾜｯﾁｮｲ c46f-UUM3)

2025/05/21(水) 12:06:56.77ID:VMhmUO1u0

128GB構成だとRyzen AI Max+ 395のノートpcと MacBook proどっちがええんや？

0174名無しさん＠ピンキー (ﾜｯﾁｮｲ eaec-iXKU)

2025/05/21(水) 12:50:58.36ID:Q21vvImu0

>>173
LLMだけならMacBook proかな
帯域幅(m4 max)がryzenの倍だからLLM推論も倍になる
ネイティブwindows やlinuxに魅力を感じるならryzenもあり

0175名無しさん＠ピンキー (ﾜｯﾁｮｲ c0a9-tAUQ)

2025/05/21(水) 12:51:53.16ID:JjJtS8ls0

M4 Max縺ｮMBP縺ｪ繧峨Γ繝｢繝ｪ蟶ｯ蝓溷ｹ�′Ryzen縺ｮ蛟阪□縺九ｉLLM縺ｯMac縺ｮ譁ｹ縺梧掠縺繧薙§繧�↑縺

0176名無しさん＠ピンキー (ﾜﾝﾐﾝｸﾞｸ MM64-RrWD)

2025/05/21(水) 13:56:17.00ID:RWUalE/6M

懐かしい文字化けだなあ😅

0177名無しさん＠ピンキー (ｵｲｺﾗﾐﾈｵ MM51-XgzA)

2025/05/21(水) 15:23:27.18ID:yfhKEiWpM

Macなんか買っちゃった末路

0178名無しさん＠ピンキー (ﾜｯﾁｮｲ 5a27-dAft)

2025/05/21(水) 20:12:18.26ID:p/PiZriE0

SJISでおk

0179名無しさん＠ピンキー (ﾜﾝﾐﾝｸﾞｸ MM2e-/5ow)

2025/05/22(木) 10:22:36.52ID:T0sTcZ3bM

gemma3-12b-itの調整してみようとcolabでロードしたらgpuメモリバカ食いして
A100でもほぼまともに動かないんだけどgemma3の仕様？
他のモデルの同規模モデルならこんなメモリ使わないんだけどな

0180名無しさん＠ピンキー (ﾜｯﾁｮｲ fcfb-Bvsn)

2025/05/22(木) 16:01:50.83ID:MqaDOyYa0

Berghof-NSFW-7Bでエロエロ小説を生成してるんだけど、このモデルはどんな要求でもこなしてくれるんだけど、コンテキスト長が4096なのだけが唯一の不満点。
こういうほぼなんでもOKのモデルで最大コンテキスト長がもっと大きいモデルってあるんかな

0181名無しさん＠ピンキー (ﾜｯﾁｮｲ e281-fjSQ)

2025/05/22(木) 19:05:01.15ID:rh/uH6OR0

ローカルだとqwq 32Bがロングコンテキストのベンチが良かった気がするからqwq系かね

0182名無しさん＠ピンキー (ﾜｯﾁｮｲ 056b-Y0zr)

2025/05/22(木) 21:05:39.26ID:PK2p9HAo0

掲示板の書き込みでshift-jisとutf8の変換で文字化けしているようです。
以下のメッセージを、意訳せず論理的に元の日本語に戻して。
前後の話題としては、M4 MaxのMacBookPro(MBP)とRyzenでLLMを動作させる話題があったのでその関係かも。
>>175 を渡す

Qwen3-32b
M4 MaxのMBPではLLMがMacで実行できるが、Ryzen搭載機でもLLMをMac上で動作させる。

c4ai-command-a-03-2025
M4 MaxのMBPはまだ高嶺の花ですが、Ryzenの方がLLMはMacの壁が厚そうですね。

一応 GPT4.1
M4 MaxのMBPで動かすのとRyzenの自作機でLLMを動かすのは、Macの方が有利だったりする？

ちなみに文字化け変換サイトで正解がでるよ。暗号解読が得意なLLMってあるんかな？

0183名無しさん＠ピンキー (ﾜｯﾁｮｲ 007a-jzjh)

2025/05/23(金) 00:50:32.06ID:I8MvikNQ0

llmを解読の補助に使うなら復号までは機械的にやって意味の通る物が吐き出されたかどうかの判定に使うのが良さそう

0184名無しさん＠ピンキー (ﾜｯﾁｮｲ 4684-fjSQ)

2025/05/23(金) 21:51:58.91ID:ywJOzA5e0

いつの間にかrpcがまともに動くようになってたんで24b級のモデル探してるんだけどRP用途で皆のおすすめのモデルある？

0185名無しさん＠ピンキー (ﾜｯﾁｮｲ ef64-oPLX)

2025/05/24(土) 00:07:54.07ID:bdaqM82G0

Project Wannabeでロリエロ小説生成に向いたモデルってどのあたりでしょう？
VRAMは16GBx2です。

0186名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fec-oPLX)

2025/05/24(土) 14:53:57.04ID:j2cdjv2K0

mistral nemo 12bベースのwanabi mini 12bを公開したぞ　 12GBもあれば快適に動くとようになったはずや　24B版も前の宣伝から更新しているので合わせて見てほしいで　量子化の種類も増やしたで
https://huggingface.co/kawaimasa/wanabi_mini_12b_GGUF
特定の形式に特化したFTモデルだからkobold経由の以下のGUI以外では多分まともに動かないので注意や
https://github.com/kawaii-justice/Project-Wannabe
学習時のコンテキスト長は32Kである程度長い文章でも扱える+チャット形式の生成ではないためマルチターンによる性能低下も発生しないから小説生成にはこの方式が最適やと思ってるで
とりあえず試したい人はベンチマーク代わりにお気に入りの小説を本文欄にコピーしてレーティングだけを設定して続きを書かせてみてほしいで結構良い線いってるはずや　自分の所感やが12B版は24B版よりも低い温度にするとちょうど良いで

0187名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f02-oPLX)

2025/05/24(土) 20:37:11.62ID:e3a5IQWJ0

>>186
いただきます

0188名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fec-oPLX)

2025/05/24(土) 23:00:47.49ID:j2cdjv2K0

>>185
wanabi 24B v03から初めてみることをおすすめするやで
試してはいないけどデータソースが年齢関係の表現に無頓着だから学習はしているはずや

0189名無しさん＠ピンキー (ﾜｯﾁｮｲ e3c6-nh/d)

2025/05/25(日) 02:03:12.82ID:YaNnPRND0

SillyTavernでGoogle APIの時は日本語で会話できるんだけど、LM Studioサーバーに繋いでポート経由でQwen3 30B A3B使ったら全部英語になった…なぜ？

0190名無しさん＠ピンキー (ﾜｯﾁｮｲ ef9f-57jE)

2025/05/25(日) 09:14:45.79ID:aUtjZJc30

>>189
SillyTavernのSystem Promptに、「日本語でチャットして」みたいなのを入れてもダメなのかい？
Qwen3は、知らんけど

0191名無しさん＠ピンキー (ﾜｯﾁｮｲ cf6f-DdzT)

2025/05/26(月) 04:17:31.46ID:sdeMGLlg0

Ryzen AI MAX、画像生成だけど3060より遅いみたいね
https://zenn.dev/robustonian/articles/flux1_ryzen_ai_guide

0192名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f7a-1Air)

2025/05/26(月) 08:34:05.37ID:C31LJLrt0

確か帯域が3060以下なんだっけ？

0193名無しさん＠ピンキー (ﾜｯﾁｮｲ e39e-GcMG)

2025/05/26(月) 12:14:43.03ID:mXH4e4ZZ0

Ryzen AI MAXはMACのM1 MAXみたいな性能でもしょうがないけど
Radeon AI PRO R9700は2枚挿したら画像生成能力もRTX 5090に近いものになって欲しいな
今のところは無理そうだけど

0194名無しさん＠ピンキー (ﾜｯﾁｮｲ ef27-St5P)

2025/05/26(月) 12:46:03.66ID:qFnDw5XZ0

そもそもAMDのGPGPU環境が糞なのに
今更AI特化ですとか言われてもってなる

0195名無しさん＠ピンキー (ﾜｯﾁｮｲ a3c7-Ar1F)

2025/05/26(月) 12:50:07.96ID:zJFAZMFs0

自然言語に強いモデルってある？

0196名無しさん＠ピンキー (ﾜｯﾁｮｲ 7fc5-8Cc+)

2025/05/26(月) 14:31:57.63ID:ClwMpXqp0

えっなにそれこわい

0197名無しさん＠ピンキー (ﾜｯﾁｮｲ efb5-zApV)

2025/05/26(月) 14:40:59.95ID:z4MgSvrt0

デカいモデルは自然言語に強いし小さいモデルはアホ
以上

0198名無しさん＠ピンキー (ﾜｯﾁｮｲ e39e-GcMG)

2025/05/26(月) 16:27:03.87ID:mXH4e4ZZ0

ここで今RDNA4対応のROCm 6.4.1の速度検証中みたいなんで
良い結果が出ればRadeon AI PRO R9700の購入を検討したいところ
https://github.com/ROCm/ROCm/issues/4443

0199名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fec-oPLX)

2025/05/26(月) 16:48:27.12ID:2M9wNHPd0

AMDの技術力を信じられないので後数年は待ちたい
長い間WSLでなら動くからwindows対応した！とか言ってた連中やし

0200名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fa1-zApV)

2025/05/26(月) 16:49:54.34ID:67TuyZ5z0

今年後半にはWindowsネイティブ対応します(できるとは言ってない)ってgithubのissueのどれかで言ってたような

0201名無しさん＠ピンキー (ﾜｯﾁｮｲ cfc6-ZxZL)

2025/05/27(火) 00:44:36.36ID:2K8oApBJ0

mistralnemoとmistralsmallのロールプレイの指示プロンプトってどういうのが良いんだろ？
ちょっと進めるだけでセリフとか行動が繰り返しの展開になるよね

0202名無しさん＠ピンキー (ﾜｯﾁｮｲ 5306-zApV)

2025/05/27(火) 00:47:21.17ID:16NlTkql0

同じ表現繰り返しがちなのはMistral系の宿命や
Mistral Largeは違うかも知れんけど動かせてないから分からん

0203名無しさん＠ピンキー (ﾜｯﾁｮｲ 5306-zApV)

2025/05/27(火) 00:52:23.76ID:16NlTkql0

一応言っとくと温度を推奨よりちょっと上げてそのままだと支離滅裂になるから代わりにmin_pもちょい上げるとマシにはなる

0204名無しさん＠ピンキー (ﾜｯﾁｮｲ cfd9-Qnse)

2025/05/27(火) 01:57:18.96ID:Z0ZSM0u/0

DGX Sparkは80万らしいな

0205名無しさん＠ピンキー (ﾌﾞｰｲﾓ MMff-3IWN)

2025/05/27(火) 08:15:58.74ID:dwqDJGhLM

strix halo機（EVO-X2）入手したんでちょっといじってみた
lm studioでrocmランタイム有効化してmagnum-v4-123bのq3klがだいたい2.5tok/s前後でした

0206名無しさん＠ピンキー (ﾜｯﾁｮｲ 83c6-ZTJL)

2025/05/27(火) 11:47:56.13ID:B3ICfmX+0

乙
こっちは発送が6/6に延びた...はよ触りたいわ

0207名無しさん＠ピンキー (ﾜｯﾁｮｲ ef50-57jE)

2025/05/27(火) 13:41:00.85ID:iOAPqrxk0

>>205

乙やで羨ましい
ワイも再来年にはそっち側にいきたいで

録画サーバーとひとまとめにしたいから
ITXでも出してくれんかなあ

0208名無しさん＠ピンキー (ﾜｯﾁｮｲ e377-ElKC)

2025/05/27(火) 13:50:47.62ID:j/rkKysz0

lmスタジオ触り始めたワイに最近ホットなエチエチモデルこっそり教えて

0209名無しさん＠ピンキー (ﾜｯﾁｮｲ ffc7-D55G)

2025/05/27(火) 15:03:43.39ID:FBxT1TC10

>>208
magnum-v4-123b

0210名無しさん＠ピンキー (ﾜｯﾁｮｲ e377-ElKC)

2025/05/27(火) 17:21:24.36ID:j/rkKysz0

>>209
ホットやけど個人で使えるレベル超えてないか？ワイの3090tiでも無理そうなんやが

0211名無しさん＠ピンキー (ﾜｯﾁｮｲ 5367-ElKC)

2025/05/27(火) 20:44:47.86ID:Khy5JY5E0

magnum-v4-27bとか色々使ってみたけどエロ会話どころか日本語も安定しないな画像生成AIみたいに日本語強いモデルとエロモデルでマージみたいな事は簡単には出来ん感じ?

0212名無しさん＠ピンキー (ﾜｯﾁｮｲ 5332-St5P)

2025/05/27(火) 21:19:51.95ID:oat/RohR0

>>210
メモリ積めば動くで
日本語でエチエチ目的なら、今のところこれを超えるモデルはない

0213名無しさん＠ピンキー (ﾜｯﾁｮｲ cffb-oPLX)

2025/05/27(火) 22:52:07.26ID:bc4+kV0z0

>>211
gemmaみたいな規制強いモデルにエロファインチューンすると使ってるデータの言語に過剰適合しちゃう感じ
mistral系ならちゃんとした日本語返してくれるよ

0214名無しさん＠ピンキー (ﾜｯﾁｮｲ 0383-ElKC)

2025/05/28(水) 19:58:00.90ID:ijGRRwkN0

色々試してberghof-erp-7bが今ん所エチエチの解像度高く正確にレスポンスしてくれるんやがコレより更にいいモデルってなるとある？

0215名無しさん＠ピンキー (ﾜｯﾁｮｲ cfd9-Qnse)

2025/05/29(木) 01:11:59.57ID:LI3y/jIC0

サイズにこだわらなければMistral系列のもうちょい大きめなやつベースのモデルが良いんじゃない？
BerghofもMistralベースだしmagnum-v4-123bもそうだしMistral系列は俺たちみたいな用途の人間にとっては最強なイメージ

日本産モデルでどっかがエロテキストとかフィルタせず食わせまくってるとかあればポテンシャルは高そうだけどないのかな

0216名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f21-ElKC)

2025/05/29(木) 06:51:05.05ID:fTvJ5RgK0

スプレッドシートとか使ってスレ民で寄り合ってチマチマデータセット作るとかも考えたことあるが

0217名無しさん＠ピンキー (ﾜｯﾁｮｲ 93e1-hAZc)

2025/05/29(木) 07:06:03.45ID:76ON7lxO0

>>216
やばいの書き込まれてGoogleアカウントBANされそうやなw

0218名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f21-ElKC)

2025/05/29(木) 07:18:11.62ID:fTvJ5RgK0

>>217
それがあるから代替案模索しとるんやけどなかなか
正直文章程度でbanとかふざけんなよって思うけどそもそものLLMのエロ規制も含め世知辛い

0219名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f21-ElKC)

2025/05/29(木) 08:08:35.97ID:fTvJ5RgK0

うーん……
3枚目笑かしに来てるだろこれデータ量は多いはずだが
ちなみに画面外の方の会話で一度ご褒美としてキメてる
https://i.imgur.com/SHIyNM0.png
https://i.imgur.com/Dc3hWdI.png
https://i.imgur.com/80W6FFw.png

0220名無しさん＠ピンキー (ﾜｯﾁｮｲ ff49-N1DS)

2025/05/29(木) 09:31:28.45ID:DDX3Te/+0

DeepSeek R1のアップデート来たぞ

0221名無しさん＠ピンキー (ﾜｯﾁｮｲ ffc7-D55G)

2025/05/29(木) 10:03:42.90ID:i/FsIwC00

DeepSeek R1ってまともにローカルで動かせるんけ？

0222名無しさん＠ピンキー (ﾜｯﾁｮｲ b38a-8Cc+)

2025/05/29(木) 10:20:27.67ID:WS1eLZJ/0

蒸留したやつなら

0223名無しさん＠ピンキー (ﾜｯﾁｮｲ ff49-N1DS)

2025/05/29(木) 10:39:03.92ID:DDX3Te/+0

蒸留してなくてもKTransformersを使うとそこまで難易度高くない
800GBくらいのDRAMとRTX4090が1つあれば動く

0224名無しさん＠ピンキー (ﾜｯﾁｮｲ b3ba-oPLX)

2025/05/29(木) 12:42:28.93ID:rhm4SzzZ0

R2かと思ったら違った
しかしファイルサイズでかいな……

0225名無しさん＠ピンキー (ﾜｯﾁｮｲ b3ba-oPLX)

2025/05/29(木) 14:57:58.57ID:rhm4SzzZ0

plamo-2-8bをローカルで動作させられた人いますか？

0226名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-St5P)

2025/05/29(木) 19:37:59.08ID:n8QeM8Rt0

ＧＧＵＦ版も作ってるニキがいるな
がんばってくれ

0227名無しさん＠ピンキー (ﾜｯﾁｮｲ efc8-I9TV)

2025/05/29(木) 20:00:36.79ID:OQIYzoML0

>>205
すいません
購入を考えているのですが
AI最適化済みのWIN11って普通のものと何か違ってましたか

用途によるんでしょうが、radeonで困ることってありますか

0228名無しさん＠ピンキー (ﾌﾞｰｲﾓ MM5f-3IWN)

2025/05/29(木) 21:07:57.72ID:De9VSIVPM

>>227
きちんと検証した訳じゃないけど多分普通のwin11じゃないかな
radeonで困ることはおそらくあると思う
lm studioでrocmランタイム有効にするのも一手間かかったし
ユーザー増えて対応進むといいなと思ってる（他力本願）

0229名無しさん＠ピンキー (ｽﾌﾟｯｯ Sd5f-J0oL)

2025/05/29(木) 21:13:18.31ID:HZQgz9qxd

Ai(LLM)で人物とかの設定と細かいストーリーラインを指示して小説風に仕上げることを繰り返して物語を作りたいのですが、おすすめありますか？

0230名無しさん＠ピンキー (ﾜｯﾁｮｲ ff49-N1DS)

2025/05/29(木) 23:08:40.17ID:DDX3Te/+0

DeepSeek-R1-0528-Qwen3-8Bがあるらしいけどまだ公開されてないな

0231名無しさん＠ピンキー (ﾜｯﾁｮｲ 5332-St5P)

2025/05/30(金) 00:21:51.78ID:IwaM7x+Y0

>>220
デモ試してるが、日本語でthinkするようになってるね

0232名無しさん＠ピンキー (ﾜｯﾁｮｲ efc8-I9TV)

2025/05/30(金) 00:40:58.24ID:0vYqElAy0

>>228
返信ありがとうございます
cudaがないとやはり一手間かかるんだと思いますが
それも楽しそうですね

0233名無しさん＠ピンキー (ﾜｯﾁｮｲ ff49-N1DS)

2025/05/30(金) 01:50:28.95ID:EkRUpVgW0

>>231
日本語性能がかなり上がったように見える

0234名無しさん＠ピンキー (ﾜｯﾁｮｲ 8fc8-O274)

2025/05/30(金) 05:53:08.32ID:mY97NSrc0

RADEONてローカルLLMで使えるんでしょうか？
メモリ容量だけ見るとＮＶより有利に見えるけど...

0235名無しさん＠ピンキー (ﾜｯﾁｮｲ ef9f-oPLX)

2025/05/30(金) 06:54:16.05ID:aWuKrBSk0

>>234
RADEONだとローカルLLMはVulkanを利用する事になるだろうけど、
画像生成までしたいのならZLUDAでCUDA互換環境を作るとか苦労するだろうね

0236名無しさん＠ピンキー (ﾜｯﾁｮｲ ff49-tlT5)

2025/05/30(金) 08:52:29.99ID:EkRUpVgW0

RadeonはLinuxかWindowsかでも結構変わってくる
Linuxのほうが開発が進んでいる
Linuxが扱えない人には難易度高い

0237名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f5f-oPLX)

2025/05/30(金) 10:59:05.41ID:8eS3E81o0

Ryzen AI MAX ならミニPCやろうし
LinuxでLLM動かして
普段はWinのメインPCからリモートで扱う感じになるんかねえ

0238名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f9f-FD3H)

2025/05/30(金) 22:16:13.57ID:WWTGK6G80

これ誰か量子化してくれないかなぁ？
pfnet/plamo-2-translate ・ Hugging Face
https://huggingface.co/pfnet/plamo-2-translate

0239名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fcc-pzE/)

2025/05/30(金) 22:18:54.96ID:SgTWU+a40

>>238
そもそもmac以外で動作するの？という話

0240名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f9f-FD3H)

2025/05/30(金) 22:23:41.50ID:WWTGK6G80

>>239
Mac関係あるの？ああ、サイズ大きいんじゃないかって？
Model size 9.53B params, Tensor type BF16 でも大きい？

0241名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fcc-pzE/)

2025/05/30(金) 22:29:16.23ID:SgTWU+a40

>>240
mamba-ssm問題が解決してなかったと思う

0242名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f9f-FD3H)

2025/05/30(金) 22:37:17.37ID:WWTGK6G80

>>241
ああ、それがあったね
https://huggingface.co/pfnet/plamo-2-8b
ベースモデルも試用した記憶がなかったのはそのせいか……

0243名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f9f-FD3H)

2025/05/30(金) 23:27:36.72ID:WWTGK6G80

>>238
ていうかSambaモデルがMacというかMLXで動くのか
実はApple Silicon Mac持ちなのでMLXで動くなら動かせるんよ
で、中の人がtranslateの方もMLX用の量子化モデルを作ってくれていたので動かせた
(Model treeのリンクが間違っているので量子化モデルの存在に気付けなかった)
https://x.com/mitmul/status/1927960884103762302
https://huggingface.co/mlx-community/plamo-2-translate

0244名無しさん＠ピンキー (ﾜｯﾁｮｲ a249-xQVN)

2025/05/31(土) 00:52:42.00ID:rzj64tZq0

翻訳はgemma3でよくないか

0245名無しさん＠ピンキー (ﾜｯﾁｮｲ 636a-SsOf)

2025/05/31(土) 07:05:02.38ID:eUluHB070

>>238
これ精度低いよ
bleuも公開できないほど

0246名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr97-PO4I)

2025/05/31(土) 22:50:30.63ID:NoEL71Wjr

>>236
Linuxってwslでもいいの？

0247名無しさん＠ピンキー (ﾜｯﾁｮｲ 520f-cgR3)

2025/06/01(日) 04:15:43.13ID:6i8+Zqz50

AmazonでRyzen AI Maxの128GBのが22万円のセールやってるな

0248名無しさん＠ピンキー (ﾜｯﾁｮｲ 520f-cgR3)

2025/06/01(日) 04:17:19.06ID:6i8+Zqz50

ごめん、64GBのだったわ

0249名無しさん＠ピンキー (ﾜｯﾁｮｲ a2c7-8HDr)

2025/06/01(日) 16:39:51.03ID:41bXt3zO0

deepseek-R1-0528のIQ2_XXS動かしてるんだけど日本語は自然になってるね

でも小説書かせてみたらmagnum-v4-123bほどではないんだけどそんなもんかな？

0250名無しさん＠ピンキー (ﾜｯﾁｮｲ ef32-kszJ)

2025/06/01(日) 19:44:36.69ID:OACok6Q00

>>249
てゆうかエロ小説でこれを超えるモデルそろそろ出て欲しいんだわ

0251名無しさん＠ピンキー (ﾜｯﾁｮｲ b2ec-SiyO)

2025/06/01(日) 22:46:27.41ID:mIad1fRF0

小説性能ってベースモデルの事前学習時点で決まる感じやから当分は来ないやろね
qwenやgemmaは明らかに学習データをフィルタリングしてるしmistralも最近はSTEM重視の姿勢でクリエイティブ性能落ちてる
deepseekはかなり緩めだけどそれで越えれないなら厳しい　

0252名無しさん＠ピンキー (ﾜｯﾁｮｲ 724a-rQsc)

2025/06/02(月) 00:41:51.92ID:Z/D3ETlA0

magnum-v4-123b使うときGPUとRAM何GB消費してる？
RTX3060 12GBと32GBしか積んでなくて、どれくらい増せばよいのか知りたい

0253名無しさん＠ピンキー (ﾜｯﾁｮｲ ef32-kszJ)

2025/06/02(月) 01:01:34.86ID:PL5oy1lz0

>>252
メモリは最低でも64Gないと動かん
64GでもIQ3_Mの量子化が限界
96GあればQ5_K_Mが動くが、メモリで動かすと絶望的に遅いからお勧めしない
ワイは64Gで動かしてるが、プロンプト打ち込んだら、別の事して30～40分掛かって512トークン終わる感じだわｗ
3080tiの12GのVRAMは一応使ってるが、あっても無くても変わらんレベル
しかもmagnum123Bは日本語トークン対応してないみたいで、１文字２トークン使うから、対応してる70Ｂの体感３倍遅いｗｗｗ

RTX6000proQ-Maxが欲しいいいいいいい
このグラボでフルスペックの512G mac買えるけど画像ＡＩにも使えるしマジ悩むｗ

0254名無しさん＠ピンキー (ﾜｯﾁｮｲ 36a9-kszJ)

2025/06/02(月) 01:56:26.38ID:mYVBCutS0

magnumは最近のモデルで作ってほしいよね
123bってMistral Largeだしちょっともう古いよね

今ならCommand-Aが元からゆるゆるだしよさそうやが

0255名無しさん＠ピンキー (ﾜｯﾁｮｲ 724a-rQsc)

2025/06/02(月) 01:57:42.37ID:Z/D3ETlA0

>>252
ありがﾄﾝ
じゃあとりあえず32GBx2買うかあ
最低64GB、相性運よけりゃ4枚刺しで96GBで。現代もメモリの相性問題があるのかは知らんけど・・・

0256名無しさん＠ピンキー (ﾜｯﾁｮｲ 72c1-ulTm)

2025/06/02(月) 07:19:27.78ID:HMsOLYMX0

1応答30分超はキツすぎるな

0257名無しさん＠ピンキー (ﾜｯﾁｮｲ 3ee0-1F/z)

2025/06/02(月) 17:24:43.28ID:yAniuXgO0

Ryzen AI Max期待してたんだけど微妙なの？

0258名無しさん＠ピンキー (ﾜｯﾁｮｲ b72d-SiyO)

2025/06/02(月) 17:37:37.38ID:fdRm+/fO0

数値あげてくれとるニキおるからそれ参考にしてもろて

0259名無しさん＠ピンキー (ﾜｯﾁｮｲ 1bc6-BVpK)

2025/06/02(月) 17:42:08.90ID:defDcJlJ0

>>257
70B以上のモデルでも普通のPCのメインメモリに載せて動かすよりは速いのと省電力性が良いって感じかな

0260名無しさん＠ピンキー (ﾜｯﾁｮｲ a249-xQVN)

2025/06/02(月) 18:00:47.70ID:nvxNZBIi0

Ryzen AI Maxは128GBメモリを使えるPCでは一番安いのが強みではある
そこに良さを感じないなら微妙かもね

0261名無しさん＠ピンキー (ﾜｯﾁｮｲ 66de-HBKV)

2025/06/02(月) 18:05:42.44ID:VrKdnv2l0

結局マシンスペックに帰結するんだよな
もっと手軽に高品質な官能小説出したいだけなのに

0262名無しさん＠ピンキー (ﾜｯﾁｮｲ bb0a-rkY2)

2025/06/02(月) 19:39:50.13ID:Pz4Lw+jF0

楽しみながらデータセット無限生成編始まった一粒で6度美味しい
こういうのみんなで出し合ったらデータセット簡単に作れそうやけど情報偏りそう
https://i.imgur.com/AYt6MwY.png

0263名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sd32-21AQ)

2025/06/02(月) 19:56:09.86ID:ncNQp2bZd

>>262
キャラチャット用のFT手順一式が欲しいわ
今はUnslothとかいうのを使うのか？

0264名無しさん＠ピンキー (ﾜｯﾁｮｲ 52d4-SiyO)

2025/06/02(月) 22:26:51.97ID:L4/XXPNV0

最近ローカルでLLM使えるの知って今日始めてSilly Tavernでオリキャラと会話して遊んでるけど
なんか緊張して関係性進展しなくて草
でも昔恋愛シュミレーションゲームやってて選択肢をどっちにするかとか考えて楽しかったけど
こっちは無限にいろんな分岐があるゲームをやってるみたいで更に楽しいね

0265名無しさん＠ピンキー (ﾜｯﾁｮｲ fec8-npAY)

2025/06/02(月) 22:48:20.98ID:I2aTIrKa0

Project-Wannabeの作者様へ
いつも使わせていただいております
ありがとうございます

要望なのですが
・出力されたものは全てパラメータjsonやkcppsと共に
logとして残しておくことはできないでしょうか
・デフォルトの生成パラメータ数値ヘ簡単に戻すことはできないでしょうか
・出力時に1行ずつ空白行を挿入（改行）されてしまうことが多いのですが、
それをさせないようにすることはできないでしょうか

0266名無しさん＠ピンキー (ﾜｯﾁｮｲ 5253-SiyO)

2025/06/02(月) 23:27:22.02ID:GzXIK7ru0

>>263
unslothのcolabノートブック使ってみるといいよ
わかりやすいし何より無料

0267名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sd32-21AQ)

2025/06/02(月) 23:40:28.32ID:ncNQp2bZd

>>266
ありがとう試してみるで

0268名無しさん＠ピンキー (ﾜｯﾁｮｲ b6bc-lbRc)

2025/06/03(火) 19:48:55.49ID:Uf3qAznp0

学習データって>>262のように同じテーマで口調を変えただけのものを用意するのと
バラバラなテーマで口調を変えたものを用意するのとどっちが適してるのかな
もちろんトータルのデータセット数は同じだと仮定した場合ね
前者でいいなら楽にデータセット用意できるけど後者だと内容考えるだけでも大変なんだけど

0269名無しさん＠ピンキー (ﾜｯﾁｮｲ b6d9-KDLv)

2025/06/04(水) 09:20:46.17ID:+oV0wOD20

後者のほうが良いよ
基本多様であれば多様なほど良いと思って良い
テーマのリストとか口調のリストとかをGeminiとかで大量に書かせてリスト化してランダムに組み合わせてLLMに合成させる感じとかでそれなりに多様にはできると思う

0270名無しさん＠ピンキー (ﾜｯﾁｮｲ ef32-kszJ)

2025/06/04(水) 11:20:24.86ID:4a8LWwHM0

shisa-ai/shisa-v2-llama3.1-405b-GGUF

だれか試せる人おらんかな？
moeじゃない405Gの日本語finetune

■ このスレッドは過去ログ倉庫に格納されています