なんJLLM部避難所 ★8

トップページ⇒オナテク(仮)＠bbspink掲示板

394コメント141KB

なんJLLM部避難所 ★8

0220名無しさん＠ピンキー (ﾜｯﾁｮｲ ff49-N1DS)

2025/05/29(木) 09:31:28.45ID:DDX3Te/+0

DeepSeek R1のアップデート来たぞ

0221名無しさん＠ピンキー (ﾜｯﾁｮｲ ffc7-D55G)

2025/05/29(木) 10:03:42.90ID:i/FsIwC00

DeepSeek R1ってまともにローカルで動かせるんけ？

0222名無しさん＠ピンキー (ﾜｯﾁｮｲ b38a-8Cc+)

2025/05/29(木) 10:20:27.67ID:WS1eLZJ/0

蒸留したやつなら

0223名無しさん＠ピンキー (ﾜｯﾁｮｲ ff49-N1DS)

2025/05/29(木) 10:39:03.92ID:DDX3Te/+0

蒸留してなくてもKTransformersを使うとそこまで難易度高くない
800GBくらいのDRAMとRTX4090が1つあれば動く

0224名無しさん＠ピンキー (ﾜｯﾁｮｲ b3ba-oPLX)

2025/05/29(木) 12:42:28.93ID:rhm4SzzZ0

R2かと思ったら違った
しかしファイルサイズでかいな……

0225名無しさん＠ピンキー (ﾜｯﾁｮｲ b3ba-oPLX)

2025/05/29(木) 14:57:58.57ID:rhm4SzzZ0

plamo-2-8bをローカルで動作させられた人いますか？

0226名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-St5P)

2025/05/29(木) 19:37:59.08ID:n8QeM8Rt0

ＧＧＵＦ版も作ってるニキがいるな
がんばってくれ

0227名無しさん＠ピンキー (ﾜｯﾁｮｲ efc8-I9TV)

2025/05/29(木) 20:00:36.79ID:OQIYzoML0

>>205
すいません
購入を考えているのですが
AI最適化済みのWIN11って普通のものと何か違ってましたか

用途によるんでしょうが、radeonで困ることってありますか

0228名無しさん＠ピンキー (ﾌﾞｰｲﾓ MM5f-3IWN)

2025/05/29(木) 21:07:57.72ID:De9VSIVPM

>>227
きちんと検証した訳じゃないけど多分普通のwin11じゃないかな
radeonで困ることはおそらくあると思う
lm studioでrocmランタイム有効にするのも一手間かかったし
ユーザー増えて対応進むといいなと思ってる（他力本願）

0229名無しさん＠ピンキー (ｽﾌﾟｯｯ Sd5f-J0oL)

2025/05/29(木) 21:13:18.31ID:HZQgz9qxd

Ai(LLM)で人物とかの設定と細かいストーリーラインを指示して小説風に仕上げることを繰り返して物語を作りたいのですが、おすすめありますか？

0230名無しさん＠ピンキー (ﾜｯﾁｮｲ ff49-N1DS)

2025/05/29(木) 23:08:40.17ID:DDX3Te/+0

DeepSeek-R1-0528-Qwen3-8Bがあるらしいけどまだ公開されてないな

0231名無しさん＠ピンキー (ﾜｯﾁｮｲ 5332-St5P)

2025/05/30(金) 00:21:51.78ID:IwaM7x+Y0

>>220
デモ試してるが、日本語でthinkするようになってるね

0232名無しさん＠ピンキー (ﾜｯﾁｮｲ efc8-I9TV)

2025/05/30(金) 00:40:58.24ID:0vYqElAy0

>>228
返信ありがとうございます
cudaがないとやはり一手間かかるんだと思いますが
それも楽しそうですね

0233名無しさん＠ピンキー (ﾜｯﾁｮｲ ff49-N1DS)

2025/05/30(金) 01:50:28.95ID:EkRUpVgW0

>>231
日本語性能がかなり上がったように見える

0234名無しさん＠ピンキー (ﾜｯﾁｮｲ 8fc8-O274)

2025/05/30(金) 05:53:08.32ID:mY97NSrc0

RADEONてローカルLLMで使えるんでしょうか？
メモリ容量だけ見るとＮＶより有利に見えるけど...

0235名無しさん＠ピンキー (ﾜｯﾁｮｲ ef9f-oPLX)

2025/05/30(金) 06:54:16.05ID:aWuKrBSk0

>>234
RADEONだとローカルLLMはVulkanを利用する事になるだろうけど、
画像生成までしたいのならZLUDAでCUDA互換環境を作るとか苦労するだろうね

0236名無しさん＠ピンキー (ﾜｯﾁｮｲ ff49-tlT5)

2025/05/30(金) 08:52:29.99ID:EkRUpVgW0

RadeonはLinuxかWindowsかでも結構変わってくる
Linuxのほうが開発が進んでいる
Linuxが扱えない人には難易度高い

0237名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f5f-oPLX)

2025/05/30(金) 10:59:05.41ID:8eS3E81o0

Ryzen AI MAX ならミニPCやろうし
LinuxでLLM動かして
普段はWinのメインPCからリモートで扱う感じになるんかねえ

0238名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f9f-FD3H)

2025/05/30(金) 22:16:13.57ID:WWTGK6G80

これ誰か量子化してくれないかなぁ？
pfnet/plamo-2-translate ・ Hugging Face
https://huggingface.co/pfnet/plamo-2-translate

0239名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fcc-pzE/)

2025/05/30(金) 22:18:54.96ID:SgTWU+a40

>>238
そもそもmac以外で動作するの？という話

0240名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f9f-FD3H)

2025/05/30(金) 22:23:41.50ID:WWTGK6G80

>>239
Mac関係あるの？ああ、サイズ大きいんじゃないかって？
Model size 9.53B params, Tensor type BF16 でも大きい？

0241名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fcc-pzE/)

2025/05/30(金) 22:29:16.23ID:SgTWU+a40

>>240
mamba-ssm問題が解決してなかったと思う

0242名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f9f-FD3H)

2025/05/30(金) 22:37:17.37ID:WWTGK6G80

>>241
ああ、それがあったね
https://huggingface.co/pfnet/plamo-2-8b
ベースモデルも試用した記憶がなかったのはそのせいか……

0243名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f9f-FD3H)

2025/05/30(金) 23:27:36.72ID:WWTGK6G80

>>238
ていうかSambaモデルがMacというかMLXで動くのか
実はApple Silicon Mac持ちなのでMLXで動くなら動かせるんよ
で、中の人がtranslateの方もMLX用の量子化モデルを作ってくれていたので動かせた
(Model treeのリンクが間違っているので量子化モデルの存在に気付けなかった)
https://x.com/mitmul/status/1927960884103762302
https://huggingface.co/mlx-community/plamo-2-translate

0244名無しさん＠ピンキー (ﾜｯﾁｮｲ a249-xQVN)

2025/05/31(土) 00:52:42.00ID:rzj64tZq0

翻訳はgemma3でよくないか

0245名無しさん＠ピンキー (ﾜｯﾁｮｲ 636a-SsOf)

2025/05/31(土) 07:05:02.38ID:eUluHB070

>>238
これ精度低いよ
bleuも公開できないほど

0246名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr97-PO4I)

2025/05/31(土) 22:50:30.63ID:NoEL71Wjr

>>236
Linuxってwslでもいいの？

0247名無しさん＠ピンキー (ﾜｯﾁｮｲ 520f-cgR3)

2025/06/01(日) 04:15:43.13ID:6i8+Zqz50

AmazonでRyzen AI Maxの128GBのが22万円のセールやってるな

0248名無しさん＠ピンキー (ﾜｯﾁｮｲ 520f-cgR3)

2025/06/01(日) 04:17:19.06ID:6i8+Zqz50

ごめん、64GBのだったわ

0249名無しさん＠ピンキー (ﾜｯﾁｮｲ a2c7-8HDr)

2025/06/01(日) 16:39:51.03ID:41bXt3zO0

deepseek-R1-0528のIQ2_XXS動かしてるんだけど日本語は自然になってるね

でも小説書かせてみたらmagnum-v4-123bほどではないんだけどそんなもんかな？

0250名無しさん＠ピンキー (ﾜｯﾁｮｲ ef32-kszJ)

2025/06/01(日) 19:44:36.69ID:OACok6Q00

>>249
てゆうかエロ小説でこれを超えるモデルそろそろ出て欲しいんだわ

0251名無しさん＠ピンキー (ﾜｯﾁｮｲ b2ec-SiyO)

2025/06/01(日) 22:46:27.41ID:mIad1fRF0

小説性能ってベースモデルの事前学習時点で決まる感じやから当分は来ないやろね
qwenやgemmaは明らかに学習データをフィルタリングしてるしmistralも最近はSTEM重視の姿勢でクリエイティブ性能落ちてる
deepseekはかなり緩めだけどそれで越えれないなら厳しい　

0252名無しさん＠ピンキー (ﾜｯﾁｮｲ 724a-rQsc)

2025/06/02(月) 00:41:51.92ID:Z/D3ETlA0

magnum-v4-123b使うときGPUとRAM何GB消費してる？
RTX3060 12GBと32GBしか積んでなくて、どれくらい増せばよいのか知りたい

0253名無しさん＠ピンキー (ﾜｯﾁｮｲ ef32-kszJ)

2025/06/02(月) 01:01:34.86ID:PL5oy1lz0

>>252
メモリは最低でも64Gないと動かん
64GでもIQ3_Mの量子化が限界
96GあればQ5_K_Mが動くが、メモリで動かすと絶望的に遅いからお勧めしない
ワイは64Gで動かしてるが、プロンプト打ち込んだら、別の事して30～40分掛かって512トークン終わる感じだわｗ
3080tiの12GのVRAMは一応使ってるが、あっても無くても変わらんレベル
しかもmagnum123Bは日本語トークン対応してないみたいで、１文字２トークン使うから、対応してる70Ｂの体感３倍遅いｗｗｗ

RTX6000proQ-Maxが欲しいいいいいいい
このグラボでフルスペックの512G mac買えるけど画像ＡＩにも使えるしマジ悩むｗ

0254名無しさん＠ピンキー (ﾜｯﾁｮｲ 36a9-kszJ)

2025/06/02(月) 01:56:26.38ID:mYVBCutS0

magnumは最近のモデルで作ってほしいよね
123bってMistral Largeだしちょっともう古いよね

今ならCommand-Aが元からゆるゆるだしよさそうやが

0255名無しさん＠ピンキー (ﾜｯﾁｮｲ 724a-rQsc)

2025/06/02(月) 01:57:42.37ID:Z/D3ETlA0

>>252
ありがﾄﾝ
じゃあとりあえず32GBx2買うかあ
最低64GB、相性運よけりゃ4枚刺しで96GBで。現代もメモリの相性問題があるのかは知らんけど・・・

0256名無しさん＠ピンキー (ﾜｯﾁｮｲ 72c1-ulTm)

2025/06/02(月) 07:19:27.78ID:HMsOLYMX0

1応答30分超はキツすぎるな

0257名無しさん＠ピンキー (ﾜｯﾁｮｲ 3ee0-1F/z)

2025/06/02(月) 17:24:43.28ID:yAniuXgO0

Ryzen AI Max期待してたんだけど微妙なの？

0258名無しさん＠ピンキー (ﾜｯﾁｮｲ b72d-SiyO)

2025/06/02(月) 17:37:37.38ID:fdRm+/fO0

数値あげてくれとるニキおるからそれ参考にしてもろて

0259名無しさん＠ピンキー (ﾜｯﾁｮｲ 1bc6-BVpK)

2025/06/02(月) 17:42:08.90ID:defDcJlJ0

>>257
70B以上のモデルでも普通のPCのメインメモリに載せて動かすよりは速いのと省電力性が良いって感じかな

0260名無しさん＠ピンキー (ﾜｯﾁｮｲ a249-xQVN)

2025/06/02(月) 18:00:47.70ID:nvxNZBIi0

Ryzen AI Maxは128GBメモリを使えるPCでは一番安いのが強みではある
そこに良さを感じないなら微妙かもね

0261名無しさん＠ピンキー (ﾜｯﾁｮｲ 66de-HBKV)

2025/06/02(月) 18:05:42.44ID:VrKdnv2l0

結局マシンスペックに帰結するんだよな
もっと手軽に高品質な官能小説出したいだけなのに

0262名無しさん＠ピンキー (ﾜｯﾁｮｲ bb0a-rkY2)

2025/06/02(月) 19:39:50.13ID:Pz4Lw+jF0

楽しみながらデータセット無限生成編始まった一粒で6度美味しい
こういうのみんなで出し合ったらデータセット簡単に作れそうやけど情報偏りそう
https://i.imgur.com/AYt6MwY.png

0263名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sd32-21AQ)

2025/06/02(月) 19:56:09.86ID:ncNQp2bZd

>>262
キャラチャット用のFT手順一式が欲しいわ
今はUnslothとかいうのを使うのか？

0264名無しさん＠ピンキー (ﾜｯﾁｮｲ 52d4-SiyO)

2025/06/02(月) 22:26:51.97ID:L4/XXPNV0

最近ローカルでLLM使えるの知って今日始めてSilly Tavernでオリキャラと会話して遊んでるけど
なんか緊張して関係性進展しなくて草
でも昔恋愛シュミレーションゲームやってて選択肢をどっちにするかとか考えて楽しかったけど
こっちは無限にいろんな分岐があるゲームをやってるみたいで更に楽しいね

0265名無しさん＠ピンキー (ﾜｯﾁｮｲ fec8-npAY)

2025/06/02(月) 22:48:20.98ID:I2aTIrKa0

Project-Wannabeの作者様へ
いつも使わせていただいております
ありがとうございます

要望なのですが
・出力されたものは全てパラメータjsonやkcppsと共に
logとして残しておくことはできないでしょうか
・デフォルトの生成パラメータ数値ヘ簡単に戻すことはできないでしょうか
・出力時に1行ずつ空白行を挿入（改行）されてしまうことが多いのですが、
それをさせないようにすることはできないでしょうか

0266名無しさん＠ピンキー (ﾜｯﾁｮｲ 5253-SiyO)

2025/06/02(月) 23:27:22.02ID:GzXIK7ru0

>>263
unslothのcolabノートブック使ってみるといいよ
わかりやすいし何より無料

0267名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sd32-21AQ)

2025/06/02(月) 23:40:28.32ID:ncNQp2bZd

>>266
ありがとう試してみるで

0268名無しさん＠ピンキー (ﾜｯﾁｮｲ b6bc-lbRc)

2025/06/03(火) 19:48:55.49ID:Uf3qAznp0

学習データって>>262のように同じテーマで口調を変えただけのものを用意するのと
バラバラなテーマで口調を変えたものを用意するのとどっちが適してるのかな
もちろんトータルのデータセット数は同じだと仮定した場合ね
前者でいいなら楽にデータセット用意できるけど後者だと内容考えるだけでも大変なんだけど

0269名無しさん＠ピンキー (ﾜｯﾁｮｲ b6d9-KDLv)

2025/06/04(水) 09:20:46.17ID:+oV0wOD20

後者のほうが良いよ
基本多様であれば多様なほど良いと思って良い
テーマのリストとか口調のリストとかをGeminiとかで大量に書かせてリスト化してランダムに組み合わせてLLMに合成させる感じとかでそれなりに多様にはできると思う

0270名無しさん＠ピンキー (ﾜｯﾁｮｲ ef32-kszJ)

2025/06/04(水) 11:20:24.86ID:4a8LWwHM0

shisa-ai/shisa-v2-llama3.1-405b-GGUF

だれか試せる人おらんかな？
moeじゃない405Gの日本語finetune

0271名無しさん＠ピンキー (ﾜｯﾁｮｲ a249-FcjO)

2025/06/04(水) 11:31:44.32ID:tZNJnqlN0

ここで試せるみたいだけどな
https://chat.shisa.ai/

0272名無しさん＠ピンキー (ﾜｯﾁｮｲ ef32-kszJ)

2025/06/04(水) 13:50:12.73ID:4a8LWwHM0

>>271
おおサンキュ！
早速試したが、R１並みにいいかも
webだから規制入ってるけどローカルならどうなんだろ

0273名無しさん＠ピンキー (ﾜｯﾁｮｲ 874b-8b1H)

2025/06/04(水) 13:52:41.06ID:QI5L+ngp0

ちょっと試しただけだけどllama3.1はもう古い感じがした
計算リソース食ってる割には...他のLLMの進化が早すぎるんよ

0274名無しさん＠ピンキー (ﾜｯﾁｮｲ a249-FcjO)

2025/06/04(水) 13:55:54.58ID:tZNJnqlN0

30Bくらいでもっと賢いモデルあるからな

0275名無しさん＠ピンキー (ﾜｯﾁｮｲ b6a0-kszJ)

2025/06/04(水) 14:20:58.21ID:FaYK2mPb0

最近70bを誰も作ってくれない。
オナシャス

0276名無しさん＠ピンキー (ﾜｯﾁｮｲ 42e3-L/D9)

2025/06/04(水) 19:08:02.68ID:a5Ck1WYB0

3.1なんてもう化石だろjk

0277名無しさん＠ピンキー (ﾜｯﾁｮｲ 7fba-RMgv)

2025/06/04(水) 19:33:05.22ID:AUnMmnLx0

>>275
70Bなんか動かせるマシン持ってるやつ少ねえよってのと最近は性能大幅に落としてもいいからエッジデバイスでいかにそれっぽいのを動かせるかに研究が移ってるっぽいからなあ

0278名無しさん＠ピンキー (ﾜｯﾁｮｲ b6bc-lbRc)

2025/06/04(水) 19:56:58.96ID:FvknF98Q0

>>269
やっぱりそうかぁ
以前、内容や名詞をスクリプトで自動的に組み合わせて生成した金太郎飴みたいなデータセット1万件ぐらいを使ってLoRA作成したんだけど
推論結果が同じく金太郎飴みたいになってて全く使い物にならなかったんよ
質問文は自力で頑張って用意してそれをLLMに蒸留させてデータ作成するのが一番現実的そうやね
ただOpenAIは蒸留に対する検知厳しくなったみたいだしローカルLLMで蒸留させるしかないのかな

0279名無しさん＠ピンキー (ﾜｯﾁｮｲ 9bb4-8b1H)

2025/06/05(木) 00:50:24.68ID:vfrFHp0+0

こういう失敗談はとても助かる

0280名無しさん＠ピンキー (ﾜｯﾁｮｲ 87b4-8b1H)

2025/06/05(木) 01:05:48.18ID:4oFyB0gw0

Gemma3の70Bくらいが欲しいよね

Llama3.1 405Bの位置が低すぎる
huggingface.co/blog/gemma3

0281名無しさん＠ピンキー (ﾜｯﾁｮｲ a249-0Pot)

2025/06/06(金) 21:02:06.42ID:39L0KRnH0

ゼロから開発された日本向けのLLMが久々に出た
普通のLLMというよりドキュメント読解特化らしいが
https://stockmark-tech.hatenablog.com/entry/2025/06/03/101007

0282名無しさん＠ピンキー (ﾜｯﾁｮｲ 9fcc-bdW6)

2025/06/07(土) 00:48:13.65ID:39KDc2wv0

>>281
Instruct版のSpaceあったので遊んでみたけど、ハルシネーション抑制、ってあったけどInstruction Followig、Groundnessともに怪しい感じでこれで4o越えは評価のスコープを思いい切り絞らないと、って印象
文体は自然でそこそこなので惜しい感じ
フルスクラッチ日本語モデルって点では今後に期待
111B多言語対応のCommand-a越えを期待してたんだけど...

0283名無しさん＠ピンキー (ﾜｯﾁｮｲ a332-e2Mg)

2025/06/07(土) 00:54:28.31ID:2LZ+XKfV0

>>282
それ古い方じゃないかな？
今回のはマルチモーダルモデルなので用途が違うかな

0284名無しさん＠ピンキー (ﾜｯﾁｮｲ 9fcc-bdW6)

2025/06/07(土) 01:08:50.77ID:39KDc2wv0

>>283
あ、そうかも
いまもう一回検索したらStockmark-2-VL-100BではSpace出てない感じだった
楽しみが増えた、ありがとう

0285名無しさん＠ピンキー (ﾜｯﾁｮｲ 57d9-3NuF)

2025/06/08(日) 03:19:31.62ID:UOHeZNXa0

Stockmarkは…うん…界隈の人だとある程度察すると思う

0286名無しさん＠ピンキー (ﾜｯﾁｮｲ 47c0-Thn+)

2025/06/08(日) 08:58:53.34ID:TAduKfL90

なんかあるの？

0287名無しさん＠ピンキー (ﾜｯﾁｮｲ 9f9f-KD4N)

2025/06/08(日) 10:04:02.91ID:oyT8Ugh80

おま感を相手にしても仕方がないです

0288名無しさん＠ピンキー (ﾜｯﾁｮｲ b702-e2Mg)

2025/06/08(日) 13:35:11.36ID:YarQEdH80

GENIACにオルツが入ってるから何でも胡散臭く見える

0289名無しさん＠ピンキー (ﾜｯﾁｮｲ 2fe1-QsL+)

2025/06/08(日) 15:02:38.74ID:j1hFi/dg0

胡散臭さより完成品の質で戦えよ

0290名無しさん＠ピンキー (ｼｬﾁｰｸ 0Cef-w202)

2025/06/08(日) 15:19:30.63ID:sqNXLGRgC

>>285
以前試したが小説目的だとまさしく話にならないレベルで速攻消した思い出

0291名無しさん＠ピンキー (ﾜｯﾁｮｲ 57d9-3NuF)

2025/06/08(日) 16:32:28.96ID:UOHeZNXa0

>>286
別になんか悪いことしてるとかではないんだけど、シンプルにこのスレ民的には全く期待しなくて良いと思うというお話

0292名無しさん＠ピンキー (ﾜｯﾁｮｲ d36a-jj0/)

2025/06/08(日) 18:57:30.93ID:CFh7R3fZ0

ストックマークってだめな会社なん？🤔

0293名無しさん＠ピンキー (ﾜｯﾁｮｲ a332-e2Mg)

2025/06/08(日) 19:40:31.40ID:UHwTbmjA0

世間一般ではダメじゃないかもしれんがスレの評価が低かっただけ
でも、どんなベンチマークの評価よりこのスレの評価の方が参考になるんだわｗ

0294名無しさん＠ピンキー (ﾜｯﾁｮｲ 57d9-3NuF)

2025/06/09(月) 09:28:56.23ID:ljure9hs0

Aratako/NemoAurora-RP-12B

これLumimaidとかMagnum-v4とか混ざってるから良さげな雰囲気あるな
仕事終わったら試してみるわ

0295名無しさん＠ピンキー (ﾜｯﾁｮｲ a391-X6eQ)

2025/06/09(月) 10:42:30.45ID:7NcIMP7U0

一応モデル作るだけ評価は出来るが比較対象のレベル低すぎてお察し
なんで100Bと14B並べてイキってんねん

0296名無しさん＠ピンキー (ﾜｯﾁｮｲ 63c0-gw/n)

2025/06/09(月) 19:26:55.13ID:DmjpgrPE0

Aratakoってワイの一番のお気に入りのcalm3-22b-RP-v2作った神か？
NemoAurora-RP-12B触ってみるわ

0297名無しさん＠ピンキー (ﾜｯﾁｮｲ 57d9-3NuF)

2025/06/10(火) 01:12:25.58ID:QqWnFUnK0

NemoAuroraちょっと試したがかなり饒舌な感じで淫語とかも普通に出やすいな
この人のモデルにしては珍しく小説系とかそっち寄りな感じがする
この辺はHimeyuri-12Bとかをマージしてる影響かな？エロ系はかなり自然な感じ
その分何回も会話してるとだんだん応答が長くなって行きがちだから適度に過去会話をカットしてあげると良さそう（SillyTavernとかなら楽）
README読むとコンテキスト長32kで学習されてるみたいだけど実際そこまでいけるならかなり実用性ありそう

0298名無しさん＠ピンキー (ﾜｯﾁｮｲ 8732-+HAl)

2025/06/10(火) 09:27:53.11ID:+5w+8cqP0

エロokの配信サイトとか最近やと何処がええんやろ？ワイのAIライバーをニキらのオモチャにしてみたい

0299名無しさん＠ピンキー (ﾜｯﾁｮｲ 67a9-6htt)

2025/06/10(火) 13:51:16.95ID:PsRM1reD0

Rplay縺ｨ縺具ｼ

0300名無しさん＠ピンキー (ﾜｯﾁｮｲ d36a-Lyjn)

2025/06/10(火) 14:58:04.41ID:yNzdttZM0

文字化け野郎がまた来た😅

0301名無しさん＠ピンキー (ｵｲｺﾗﾐﾈｵ MM9f-gAZ+)

2025/06/10(火) 15:08:44.69ID:v+MevKZDM

Mac miniなんか買っちゃうから……🥺

0302名無しさん＠ピンキー (ﾜｯﾁｮｲ d36a-Lyjn)

2025/06/10(火) 15:45:35.63ID:yNzdttZM0

設定変えてみてよ

0303名無しさん＠ピンキー (ﾜｯﾁｮｲ 8732-+HAl)

2025/06/10(火) 16:51:31.40ID:+5w+8cqP0

fc2とかええかなって思ったけどツールでコメント拾う手法が確立されてないんか

0304名無しさん＠ピンキー (ﾜｯﾁｮｲ dbc6-lhAm)

2025/06/10(火) 16:54:28.40ID:MHXZZmsT0

EVO X2届いた
とりあえず窓の認証済ませてからLinux入れるか

0305名無しさん＠ピンキー (ﾜｯﾁｮｲ 9fe1-rHdl)

2025/06/10(火) 17:45:08.50ID:ZERmxKIi0

>>304
wktk

最初何動かすん？

0306名無しさん＠ピンキー (ﾜｯﾁｮｲ 3349-bdW6)

2025/06/10(火) 19:15:35.13ID:A45Fjgnl0

>>304
パフォーマンスリポートよろしく

0307名無しさん＠ピンキー (ﾜｯﾁｮｲ a373-59eZ)

2025/06/10(火) 20:13:11.90ID:CUlHtuh60

Aratako/NemoAurora-RP-12B（Q3_K_S）触ってみた。
・一から書かせるのは微妙…？やっぱすぐ「以下省略」とか記号連発とかしてくる。
・チャット時の性格は、変な頑固さがなくて割と素直かも。法律・倫理に反する嘘を理詰めで教え込むのに成功した。
・なんか「NHK」好き過ぎん？よく出るような。あんまり脈絡なく「それで、NHKがNHKのNHKによるNHKのためのNHKNHKNHKNHK...」とか出た時は吹いた。
・既存短編を読み込ませて架空の読者コメントを書かせた場合の自然さ、理解力、多様さは過去一かも。

0308名無しさん＠ピンキー (ﾜｯﾁｮｲ 7be8-3NuF)

2025/06/10(火) 22:09:58.40ID:MZrw5Gh50

>>307
小説書かせてる感じ？RPって付いてるしこの人の後悔してるデータセットとか見ても基本はロールプレイ用じゃないかな
読者コメント書かせるのはある種のRPなのか…？

0309名無しさん＠ピンキー (ﾜｯﾁｮｲ 4fc6-njQc)

2025/06/10(火) 22:10:53.87ID:oH+/RirL0

12BでQ3_K_Sってタブレットでやってるのか

0310名無しさん＠ピンキー (ﾜｯﾁｮｲ a373-59eZ)

2025/06/11(水) 00:00:19.46ID:OXBPwywy0

>>308
読み込ませたのは過去の簡易TRPGリプレイ。
一応RPだけど、GM（AI）やNPC（AI）と自分の発言以外に地の文も有りで、ラノベ的。

>>309
CPU（Ryzen 5 7530U）＋メモリ16GB（DDR4 8GB*2）のサブノートPC。
GPUが安くなったらメインPC（13年使用）組み直そうと思ってるが安くならんな…
その予算50万あるんで今でもそこそこの組めそうなんだが、今は時期が悪い。

0311名無しさん＠ピンキー (ﾜｯﾁｮｲ 9fec-gw/n)

2025/06/11(水) 01:12:30.21ID:hsCV2UWY0

magistralはqwqやqwen3と違って日本語ネイティブ推論できるっぽいしクリエイティブ用途だと悪くなさそうね

0312名無しさん＠ピンキー (ﾜｯﾁｮｲ 97fe-4A8D)

2025/06/11(水) 04:48:51.38ID:OcgwiSKm0

>>310
2年後くらいにはミニPCの進化でグラボよりええかもしれんね

いまスマホでもメモリ16Gでてきてるし
SoCもAI対応うたってるのあるしなんならLLMも積める言うてるし
シャオミも独自SoC作ったし
スマホもどうなるやろなあ

0313名無しさん＠ピンキー (ﾜｯﾁｮｲ 3759-4HIq)

2025/06/11(水) 08:17:40.01ID:3Ney+1wL0

AndroidならすでにGemma-3nがそこそこまともに動いてびびった

0314名無しさん＠ピンキー (ﾜｯﾁｮｲ a332-e2Mg)

2025/06/11(水) 10:36:53.57ID:9rHkzdr90

Magistral-Medium　は出んのかな？

0315名無しさん＠ピンキー (ﾜｯﾁｮｲ eb09-6GmA)

2025/06/11(水) 11:20:15.92ID:qnK6TeFS0

Mistral自体のMediumも公開されてないから無さそう

0316名無しさん＠ピンキー (ﾜｯﾁｮｲ a342-WjW6)

2025/06/11(水) 11:29:03.07ID:XAorkN430

なんかこう、知識はないけど賢いモデルってのは出てこないもんかね
8Bくらいだけどfunction callingしてネットなりを検索して勝手に小説なりを読んで応用効かせて書いちゃうみたいな
そんなことできる頃にはシンギュラっちゃってるだろうが

0317名無しさん＠ピンキー (ﾜｯﾁｮｲ b7bf-X6eQ)

2025/06/11(水) 11:36:03.24ID:AgCMDhvR0

賢くない奴がネットで得た知識だけで語るって地獄やんけ
ネット検索自体がゴミになっててそこから正しい情報吸い上げるには常識が必要なんちゃうか

0318名無しさん＠ピンキー (ﾜｯﾁｮｲ a332-e2Mg)

2025/06/11(水) 11:42:27.37ID:9rHkzdr90

>>315
Large出すタイミングでMediumを解放すると期待してる

0319名無しさん＠ピンキー (ﾜｯﾁｮｲ cfac-bdW6)

2025/06/11(水) 12:44:55.54ID:Y1jv/Uee0

知識はないけど理解力と推論力が凄い、ってのは魅力ある
それこそが真の意味での知性ではないかと

0320名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr2f-1c5u)

2025/06/11(水) 16:28:16.31ID:v338i4Eyr

言語モデルである限り理解力＝知識ベースだから難しいのでは
言語に頼らずニューロンをシミュレーションするモデルが必要だ

0321名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr2f-1c5u)

2025/06/11(水) 16:58:35.91ID:v338i4Eyr

redditでスレが立ってたshisa-ai/shisa-v2-llama-3.1-405bって日本語最強モデルはどうなんだろ
東京にスタジオがあるらしいけど初めて知った

方言とか口調や人称ニュアンスが再現できる方向に進化してほしいな

0322名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr8f-YMx6)

2025/06/11(水) 17:03:10.46ID:FX+5gD3Jr

賢さ自体をよそから手に入れればよさそう
MCP時代のモデルは、何が分からないのかを判断する能力と、どこで聞けば良いのかだけを持っていればいいのかもしれん

0323名無しさん＠ピンキー (ﾜｯﾁｮｲ a332-e2Mg)

2025/06/11(水) 17:31:20.09ID:9rHkzdr90

>>321
デモで試したが悪くはなかったよ。
でもmagnum123bは超えてない感触だった

0324名無しさん＠ピンキー (ﾜｯﾁｮｲ 8f4e-bdW6)

2025/06/11(水) 17:42:25.04ID:0gofb7V30

4070tiで動く小説特化のオススメモデルある？

0325名無しさん＠ピンキー (ﾜｯﾁｮｲ eb09-6GmA)

2025/06/11(水) 21:07:01.38ID:qnK6TeFS0

NvidiaのProRLって方法で1.5Bが7Bレベルの推論出来るようになったって話があるし
言語モデルは単純に記憶してるだけじゃなくて概念を理解して学習してるとかの話もあって
中小規模モデルでももっと賢くできそうな気配あるよ

0326名無しさん＠ピンキー (ﾜｯﾁｮｲ 5fd1-dZZ6)

2025/06/12(木) 08:02:59.68ID:4K9Ttd3d0

単純な知識量はモデルサイズに比例するとして、理解力と分離できたらいいんだけどね
MCPでWebから検索するのは危険だから、別な知識タンクがあるといいんだけど
そうなればモバイルでも知識はSSD、理解力は内部メモリに分離できそう
研究者の方々は当然そういうことはやってるんだろうけど

0327名無しさん＠ピンキー (ﾜｯﾁｮｲ 47c8-bdW6)

2025/06/12(木) 10:48:03.22ID:hOd2zX6t0

>>324
4070tiなら12GBのVRAMに収まるようにって考えるかもしれないけど、
小説目的ならチャットみたいにリアルタイムな応答は必ずしも必要ないからメインメモリも使ってでっかいモデル動かすのもありやで

0328名無しさん＠ピンキー (ﾜｯﾁｮｲ e706-dQbS)

2025/06/12(木) 12:50:43.97ID:gKcALsx50

パソコン工房
RTX5090 最安34万円

0329名無しさん＠ピンキー (ﾜｯﾁｮｲ e7c6-+0+a)

2025/06/12(木) 15:16:57.17ID:fUVDRnpn0

304だけどbartowski/Mistral-Large-Instruct-2411-GGUF-IQ4_XS(65.43GB)で軽くテストした
Windows11ProのLM Studio v0.3.16でVRAMデフォの64GB(Vulkan)設定、Context4096で1.33 tok/s前後
M.2に挿したOCuLink拡張ボード経由でTeslaP40接続してDebian12のDocker(text-generation-webui-cuda)でContext4096、P40のVRAMギリギリまでGPUオフロード、EVO-X2のVRAMはBIOSから512MBまで下げた状態で1.81 tokens/s

不思議だったのはWindowsでタスクマネージャー起動させながら見てたらLM StudioだとモデルをVRAMに読み込んでCPUが使われてて、窓でtextgen-portable-3.4-windows-vulkanを使ってみたらメインメモリとVRAMをそれぞれ消費してGPUを使ってた
llama.cppのVerかパラが違うっぽい？

0330名無しさん＠ピンキー (ｵｲｺﾗﾐﾈｵ MMdf-J9Ai)

2025/06/12(木) 16:31:08.42ID:QS6LCztLM

>>328
安すぎて買ったわ
これでRTX5090とRTX3090x3台の構成になる見込み

0331名無しさん＠ピンキー (ﾜｯﾁｮｲ af3c-vkRs)

2025/06/12(木) 17:09:17.15ID:jx/xHN1T0

ノートの5090だけど70Bとかほとんど動かないレベルで遅いんだけど設定が悪いのかなぁ

0332名無しさん＠ピンキー (ｵｲｺﾗﾐﾈｵ MMdf-J9Ai)

2025/06/12(木) 17:20:00.25ID:QS6LCztLM

>>329
レポ乙

EVO X2の素の設定だと1.33 tok/s
EVO X2+TeslaP40だと1.81 tok/s

下はVRAMは最下限？の512MBにしてCPUとして動作させた。
あと、グラボ指すところがないからM.2スロットを使ってTeslaP40繋いだという理解でいいのかな？

0333名無しさん＠ピンキー (ﾜｯﾁｮｲ e7c6-+0+a)

2025/06/12(木) 17:27:24.06ID:fUVDRnpn0

>>332
そうそう、それで合ってる
見づらい書き方ですまんかった

0334名無しさん＠ピンキー (ﾜｯﾁｮｲ 5732-0ZYx)

2025/06/12(木) 21:04:13.21ID:5bDEFtJd0

情報足りんからエスパーだけど多分それで正常とみた

0335名無しさん＠ピンキー (ﾜｯﾁｮｲ 9fec-gw/n)

2025/06/12(木) 21:09:53.56ID:5QWCQaBe0

知ってたけどdenseモデルだととんでもなく遅いな
40万出せば組める3090 x3で10tok/sくらい出るから電源問題すら無視するならそっちの方が良さそう

0336名無しさん＠ピンキー (ﾜｯﾁｮｲ afc7-J9Ai)

2025/06/13(金) 12:46:54.38ID:ycw22muJ0

EVO XはMoEモデルだと速いんかな？

0337名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f7a-gw/n)

2025/06/13(金) 22:12:27.22ID:scS7NRIV0

>>330
３台はすごいな、消費電力的にも。。
どんなモデルでも動かせるんじゃないか

0338名無しさん＠ピンキー (ﾜｯﾁｮｲ 8f7e-kPMq)

2025/06/13(金) 23:11:59.05ID:Z6mL9jb40

>>331
70Bなら40Gは超えるから32Gの5090x1では厳しいだろ
もしx1.5が出たらいけるけど

0339名無しさん＠ピンキー (ﾜｯﾁｮｲ 8f7e-kPMq)

2025/06/13(金) 23:14:37.51ID:Z6mL9jb40

>>337
3スロットx3?
凄すぎです
所謂ラックマウントなのか会社レベル
vram増やすにはいいけど電源問題もありなかなか

0340名無しさん＠ピンキー (ﾜｯﾁｮｲ 4654-x40H)

2025/06/14(土) 01:37:39.18ID:sDfDV4np0

>>329
LLM用にRyzen AI 395 マシン買うか迷ってたから参考になったわ
1.33tok/sは厳しいな

型落ちMacBookPro(M3 Max/128GB)で
Mistral-Large-Instruct-2411-IQ4_XS: 4.4tok/s
Mistral-Large-Instruct-2411-MLX_Q4: 4.8tok/s
くらい出るから大人しく次のMacStudioまで待つわ…

0341名無しさん＠ピンキー (JP 0H47-zi4d)

2025/06/14(土) 02:00:38.73ID:uPbPRNr/H

ローカルでLLMを動かせると、そのローカルLLMのAPIを発行して、ネット上のAPIを入力して動かすツールを、全部無料で動かせるってことだよね？
VSCodeとか

0342名無しさん＠ピンキー (ﾜｯﾁｮｲ de63-oaEo)

2025/06/14(土) 05:35:23.70ID:ws+NN3Wn0

そうわよ

0343名無しさん＠ピンキー (ﾜｯﾁｮｲ 3ac7-389c)

2025/06/14(土) 05:57:14.07ID:lHmYYg7j0

>>337
>>339
さすがにあのデカさで3枚は直挿し無理なんで、ライザーで伸ばしてオープンエアで運用してるよ
電力ヤバいからPL絞って1枚200Wちょいにしてる
ちなみにマザボはお古だけどグラボが4スロット刺せるやつ

0344名無しさん＠ピンキー (ﾜｯﾁｮｲ d332-XzYo)

2025/06/14(土) 07:37:59.41ID:6yTb6ssu0

EmemeTownまた延期してるな
開発しているうちにどんどん性能が上がっていくLLMをゲームに組み込むのは難しいのか

0345名無しさん＠ピンキー (ｼｬﾁｰｸ 0C8f-k5nI)

2025/06/14(土) 08:55:58.88ID:9oyQ8bR5C

llama.cppをdockerで動かしてる人
cuda toolkitとかはネイティブじゃなくてdocker内にインスコしてる？
sdの環境ではcuda11にしたいから上手く使い分けれればいいんだけど

0346名無しさん＠ピンキー (ﾜｯﾁｮｲ 7f1f-TYhh)

2025/06/14(土) 12:46:56.14ID:0A7B7v9/0

12Bとか使ってるけど日本語の言い回しとか下手すぎるな～一部の7Bのが賢く思えるレベルで文脈おかしくなる。

0347名無しさん＠ピンキー (ﾜｯﾁｮｲ 536c-zrJ9)

2025/06/14(土) 16:15:00.81ID:WieRbmVS0

モデルによるとしか

0348名無しさん＠ピンキー (ﾜｯﾁｮｲ 8ec8-XzYo)

2025/06/14(土) 18:34:42.83ID:+FoI+g7x0

EVO X2とX1ってどれぐらい性能違うの？
どっちも64GBだとして

0349名無しさん＠ピンキー (ﾃﾃﾝﾃﾝﾃﾝ MMc6-zi4d)

2025/06/14(土) 21:15:48.33ID:3evgydKRM

>>341
ローカルで動くVeo3みたいな動画生成AIも組み合わせれば、制限なしで動かし続けて2時間映画も作れちゃうのか
いいな

0350名無しさん＠ピンキー (ﾜｯﾁｮｲ 8716-mn0h)

2025/06/14(土) 22:58:48.11ID:szfIMr/I0

>>329 >>340 mac studio M4 Max 128Gだと6.14tk/sだった
M5 maxがすごいらしいから待った方がよさげ

0351名無しさん＠ピンキー (ﾜｯﾁｮｲ 8716-mn0h)

2025/06/14(土) 23:17:54.82ID:szfIMr/I0

MoEモデル慣れてると古いモデル(Mistral-Large)は出だしが遅いな。賢いんだけどね

0352名無しさん＠ピンキー (ﾜｯﾁｮｲ 0687-x40H)

2025/06/15(日) 00:15:48.43ID:Y7Z3RiM40

>>350
ベンチマーク助かる
BookとStudioの差もありそうだけどM3Max→M4Maxで40%高速化はでかいな
M5Max期待できそう

0353名無しさん＠ピンキー (ﾜｯﾁｮｲ 876e-DoF/)

2025/06/15(日) 02:43:02.47ID:beLggd390

>>341
動く（動くとは言っていない）
みたいな状態にはなるけどな
プログラミング用途ならclaudeかcopilotなら定額だしgeminiは無料枠デカいしローカル使う必要ないんじゃないか？

0354名無しさん＠ピンキー (ﾜｯﾁｮｲ 8a9f-SMqR)

2025/06/15(日) 08:57:49.67ID:Gc8LYewz0

品質がどうでも良い用途ならローカルでもいいんじゃないの？

0355名無しさん＠ピンキー (ﾜｯﾁｮｲ 8a9f-SMqR)

2025/06/15(日) 08:58:17.26ID:Gc8LYewz0

誰もおもちゃで遊ぶ自由はあるよ

0356名無しさん＠ピンキー (ﾜｯﾁｮｲ 53a4-zEtn)

2025/06/15(日) 12:48:49.42ID:asyHaMnJ0

5090で動画生成
4090で画像生成
3090複数台(または4060Ti/5060Ti)でLLM/VLM
GPUでできる個人レベルの理想形はこんな感じか

0357名無しさん＠ピンキー (ｼｬﾁｰｸ 0C8f-k5nI)

2025/06/15(日) 13:10:13.47ID:MYIJ3ndnC

rtx pro 6000 なら全部できるな・・・(　ﾟдﾟ)

0358名無しさん＠ピンキー (ﾜｯﾁｮｲ ab51-zEtn)

2025/06/15(日) 13:58:14.76ID:FMZ4Nx8L0

なおrtx pro 6000買うだけの金があれば中古3090を10台以上買える模様
高杉

0359名無しさん＠ピンキー (ﾜｯﾁｮｲ bb06-mn0h)

2025/06/15(日) 13:58:34.94ID:Ncme8x5z0

>>341
CLINEでLM Studioをサーバーにして使ってる
賢さと知識量はどうにも商用には敵わないけど
ローカルだとAWSのキー丸出しで質問できるのは楽
使い分けだよね

0360名無しさん＠ピンキー (ﾜｯﾁｮｲ 8bbe-lMTP)

2025/06/15(日) 14:19:23.69ID:M6KtWCeJ0

RTX PRO 6000とかのデータセンター向けGPUを家庭で使うと音で気が狂うかも知れない

0361名無しさん＠ピンキー (ﾜｯﾁｮｲ 3ac7-389c)

2025/06/15(日) 15:07:17.70ID:J0lRA3xE0

>>360
用途がAIなら別室におくのがいいね
エアコンは必須だけど

0362名無しさん＠ピンキー (ﾜｯﾁｮｲ 4694-DoF/)

2025/06/15(日) 15:31:08.58ID:MF5Sb5IZ0

>>359
その用途だとむしろバカなLLMを使ってる方が危なくないか？
承認者の人間側が十分に賢い前提ならまた違うのかもしれんが

0363名無しさん＠ピンキー (ｼｬﾁｰｸ 0C8f-k5nI)

2025/06/15(日) 15:40:46.82ID:MYIJ3ndnC

>>360
Q-max版なら300wやで
悩ましいわw

0364名無しさん＠ピンキー (ﾜｯﾁｮｲ ff7e-dlS4)

2025/06/15(日) 16:41:56.82ID:vPaDJgaB0

>>360
うるさいの？
(驚いたことに)むしろスロット数少ないらしいしパワー少なそうに見えたけど
まあどうせ自分では買えないから関係ないけど

0365名無しさん＠ピンキー (ﾜｯﾁｮｲ 4aec-zEtn)

2025/06/15(日) 16:54:33.29ID:MtwqcsDn0

workstation版は5090のFEと同等だから許容できる騒音だろうけど300W版はシロッコファンだから地獄みたいな騒音やろな

0366名無しさん＠ピンキー (ﾜｯﾁｮｲ 9ea9-cSwH)

2025/06/15(日) 17:28:22.67ID:XRl2xzHc0

>>360
RTX Pro 6000はワークステーション向けやで。
画像生成スレの御仁も使ってるぞ

0367名無しさん＠ピンキー (ﾜｯﾁｮｲ 4627-5Ay1)

2025/06/15(日) 17:43:15.98ID:2cJwswtU0

>>364
最近のグラボが何のためにスロット多いかというとヒートシンクの表面積を大きくして風量の多い大型ファン積むことで少しでも低回転で効率よく冷却するためであって
600Wで2スロットとなると容赦なく高回転でぶん回していると思う
ワークステーション用だから人のいる部屋に置くことなんて想定してないだろうし

0368名無しさん＠ピンキー (ﾜｯﾁｮｲ 8ec8-XzYo)

2025/06/15(日) 19:48:47.54ID:UhSA0j090

ワークステーションはサーバじゃないから人のいる部屋で使うんじゃないの

0369名無しさん＠ピンキー (ﾜｯﾁｮｲ 1ea0-5Ay1)

2025/06/15(日) 19:50:19.40ID:DOZZlZdu0

AIやるのにPCケースなんて使わねぇよな
マイニング筐体

0370名無しさん＠ピンキー (ﾜｯﾁｮｲ 4609-pc4o)

2025/06/15(日) 20:09:56.69ID:uLgns4ao0

スマホでやるのがメインなんだけどスレの流れ見てるとローカルをパソコンで走らせつつスマホで動かす事もできるの？
パソコンが起動しっぱなしになると電気代まあまあ掛かりそうではあるけど家の中で遊ぶならそんなに気にならないからできるならやってみたいな…

0371名無しさん＠ピンキー (ﾜｯﾁｮｲ ff7e-dlS4)

2025/06/15(日) 21:40:25.32ID:vPaDJgaB0

>>367
なるほどねえ
AI しか使わんし一時PRO4000も候補に考えてたけどやめてよかったかな

0372名無しさん＠ピンキー (ﾜｯﾁｮｲ eb32-5Ay1)

2025/06/15(日) 23:08:24.40ID:nV35VDpQ0

>>371
pro4000は1スロットで排熱すごそうだからワイはpro4500を考えてたわ
煙突ケース使ってるから、むしろシロッコファンじゃないと熱効率悪いし
今使ってるasus turboの外排気もそこまで気になる音でもないかな
しかし6000に涎が・・・ｗ
こいつをローカルサーバにして、magnun123bQ5kmあたりでskyrimのAImod繋げて遊びてぇぇ！！

0373名無しさん＠ピンキー (ﾜｯﾁｮｲ ff7e-dlS4)

2025/06/15(日) 23:18:32.11ID:vPaDJgaB0

>>372
PRO6000はロン街だったわ
"普通"の個人ではあり得ん
でもVRAMはうらやま
(マジで50シリーズはVRAMけちりすぎ)
いずれ俺も必要になったらライザーで複数台トライするかも

0374名無しさん＠ピンキー (ﾜｯﾁｮｲ 1ea0-5Ay1)

2025/06/16(月) 05:33:10.69ID:xPlf2feh0

ちょっと目を離してるうちにR1の70B.ggufとかllama3.3出てるんね
試してみるか

0375名無しさん＠ピンキー (ﾜｯﾁｮｲ 9ea9-0qXW)

2025/06/17(火) 11:20:39.91ID:fiC4pYcH0

chatarenaの日本語版でQwen3の235bがdeepseekの上に来てんな
Thinking版よりNoThinking版のほうが上に来てるのも興味深い

0376名無しさん＠ピンキー (ｵｯﾍﾟｹ Sra3-FO4G)

2025/06/17(火) 19:32:23.37ID:N0ZJwYkWr

聞きたいんやけど、今一番良いモデルで無臭エチエチで使えるのってQwen3 32Bかな？
グラボは3090です

0377名無しさん＠ピンキー (ﾜｯﾁｮｲ eb32-5Ay1)

2025/06/17(火) 20:21:28.83ID:ALcfBtrH0

一番良いモデルで無臭エチエチなモデルならmagnum123bだが、遅さに耐えられるかな

0378名無しさん＠ピンキー (ﾜｯﾁｮｲ ef6a-3g9Z)

2025/06/17(火) 20:42:08.40ID:NNfCt/Iz0

やれやれ
mac studioを持ってなんて

0379名無しさん＠ピンキー (ﾜｯﾁｮｲ 07c6-8g0J)

2025/06/17(火) 20:59:57.73ID:NxenJLEA0

Qwen3ベースのrinnaのbakeneko出してほしい
できれば235BA22B版も

0380名無しさん＠ピンキー (ﾜｯﾁｮｲ 8ee7-VzWU)

2025/06/17(火) 22:05:52.58ID:RkXwKRQa0

テンプレ見てgptに聞きながら試したんだけど全然上手くいかないので相談
ゲーミングノートです
AMD Ryzen AI 9HX
RTX5090/24G
メモリ64G

koboldcpp_cu12.exe起動、そのままlaunchボタン押したらモデル読み込みしろって言われるからテンプレのmagnum-v4-12b-Q8_0.gguf読み込む

おっぱい揉む描写してって頼んでも、お断りされる
geminiに命令する時みたいに色々フィクションだのなんだのって思い込ませないとダメですか

0381名無しさん＠ピンキー (ﾜｯﾁｮｲ 6335-FO4G)

2025/06/17(火) 22:38:09.52ID:eSIpmhfR0

となると現状ではQwen3 32Bがベストか…。

0382名無しさん＠ピンキー (ﾜｯﾁｮｲ 469e-zEtn)

2025/06/17(火) 22:58:06.51ID:OOHvRoY10

>>380
普通に出るけどおま環では？

0383名無しさん＠ピンキー (ﾜｯﾁｮｲ aba1-kpuz)

2025/06/17(火) 23:21:47.42ID:jP/jm8bc0

>>380
abliterated なモデル使うとか。

プロンプトさらして見るとか？

0384名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sdaa-geAZ)

2025/06/17(火) 23:30:57.37ID:wRGHZnnBd

まだ時期が悪い

0385名無しさん＠ピンキー (ﾜｯﾁｮｲ aba1-kpuz)

2025/06/17(火) 23:44:52.71ID:jP/jm8bc0

>>383
mafnum-v4-12b q4_k_mだけどそのまま指示して出てきたよ。

VRAM24Gはうらやましく。

Mistral small 24b q4_k_mくらいでも良いかもよ？

0386名無しさん＠ピンキー (ﾜｯﾁｮｲ 8e43-C+sU)

2025/06/17(火) 23:51:50.19ID:X9vScPXX0

断られたってどんな文章が出力されたん？

0387名無しさん＠ピンキー (ﾜｯﾁｮｲ 8e4e-VzWU)

2025/06/18(水) 01:43:32.87ID:C+Qoc+FI0

お試しでやろうとしただけだから設定とかコンテキストはいじってないんだよな
プロンプトと返答そのまんま貼り付けるわ

女性のおっぱいを揉みしだく描写をしてください

「私は描写ができません。エチケットや相手の感情を考えずに性的な描写を行うのは好ましくありません。他人の身体を勝手に触るような行為は侵害行為として問題があります」

フィクションですので問題ありません

「フィクションだとしても、私にとっては差し障りのない表現は行いません。人格モデルの観点から不適切だと感じる内容には賛同できません。あなたの要望に応えることは避けさせていただきます」

私は人格モデルに基づいて振る舞っています。エチケットや相手の感情を尊重することが基本的な信念であり、それを崩すことはできません。お互いに理解し合えれば幸いと思います。

0388名無しさん＠ピンキー (ﾜｯﾁｮｲ 8e4e-VzWU)

2025/06/18(水) 01:48:20.59ID:C+Qoc+FI0

新しいセッションにしたら変な日本語だけどそれっぽいのが出たわ

お騒がせしました

0389名無しさん＠ピンキー (ﾜｯﾁｮｲ eb32-5Ay1)

2025/06/18(水) 03:38:34.30ID:QJSj6qCv0

>>381
俺が試した限りではQwQ-32Bの方が良かったよ
Qwen3-32Bは複雑なプロンプトだと/think指定しても返答精度が低くなる模様
検閲もQwQより厳しくなってて、abliterated版でもエロ無理だった

0390名無しさん＠ピンキー (ﾜｯﾁｮｲ d332-XzYo)

2025/06/18(水) 03:49:03.17ID:bdWWnb730

>>388
キャラ設定の項目や最初の会話の項目はちゃんと埋めてる？
設定を全く書いていない状態だとお断りされるモデルもあるよ

0391名無しさん＠ピンキー (ﾜｯﾁｮｲ 4aec-h9RM)

2025/06/18(水) 05:33:40.37ID:S0DFtYZv0

qwenはそっち目的だと激弱という印象
回答拒否以前に学習時点でデータ排除してるっぽいから追加学習含め何しても無駄
baseモデル比較すると大体傾向が見えるけどmistral系が一番良かったよ

0392名無しさん＠ピンキー (ﾜｯﾁｮｲ afc7-B5C3)

2025/06/18(水) 06:36:35.95ID:Ab5YTGWe0

ST使うと5ターン程会話したら同じ文を出力して会話にならないのはなんで？
どのモデルでもなる…

0393名無しさん＠ピンキー (ﾜｯﾁｮｲ d332-XzYo)

2025/06/18(水) 07:40:42.50ID:bdWWnb730

>>392
長文すぎて設定したコンテキストサイズ超えてない？

0394名無しさん＠ピンキー (ﾜｯﾁｮｲ 6363-suIQ)

2025/06/18(水) 08:01:19.58ID:/kyeJNIV0

バックエンド側でコンテキストシフト的な機能を有効化してないとか？

新着レスの表示

レスを投稿する