なんJLLM部避難所 ★8

1002コメント348KB

なんJLLM部避難所 ★8

■ このスレッドは過去ログ倉庫に格納されています

0001名無しさん＠ピンキー転載ダメ (ﾜｯﾁｮｲ f3c0-9L8h)

2025/05/10(土) 22:18:32.02ID:0Ak3eO5y0

!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512

AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所 ★7
https://mercury.bbspink.com/test/read.cgi/onatech/1742709485/

VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured

0205名無しさん＠ピンキー (ﾌﾞｰｲﾓ MMff-3IWN)

2025/05/27(火) 08:15:58.74ID:dwqDJGhLM

strix halo機（EVO-X2）入手したんでちょっといじってみた
lm studioでrocmランタイム有効化してmagnum-v4-123bのq3klがだいたい2.5tok/s前後でした

0206名無しさん＠ピンキー (ﾜｯﾁｮｲ 83c6-ZTJL)

2025/05/27(火) 11:47:56.13ID:B3ICfmX+0

乙
こっちは発送が6/6に延びた...はよ触りたいわ

0207名無しさん＠ピンキー (ﾜｯﾁｮｲ ef50-57jE)

2025/05/27(火) 13:41:00.85ID:iOAPqrxk0

>>205

乙やで羨ましい
ワイも再来年にはそっち側にいきたいで

録画サーバーとひとまとめにしたいから
ITXでも出してくれんかなあ

0208名無しさん＠ピンキー (ﾜｯﾁｮｲ e377-ElKC)

2025/05/27(火) 13:50:47.62ID:j/rkKysz0

lmスタジオ触り始めたワイに最近ホットなエチエチモデルこっそり教えて

0209名無しさん＠ピンキー (ﾜｯﾁｮｲ ffc7-D55G)

2025/05/27(火) 15:03:43.39ID:FBxT1TC10

>>208
magnum-v4-123b

0210名無しさん＠ピンキー (ﾜｯﾁｮｲ e377-ElKC)

2025/05/27(火) 17:21:24.36ID:j/rkKysz0

>>209
ホットやけど個人で使えるレベル超えてないか？ワイの3090tiでも無理そうなんやが

0211名無しさん＠ピンキー (ﾜｯﾁｮｲ 5367-ElKC)

2025/05/27(火) 20:44:47.86ID:Khy5JY5E0

magnum-v4-27bとか色々使ってみたけどエロ会話どころか日本語も安定しないな画像生成AIみたいに日本語強いモデルとエロモデルでマージみたいな事は簡単には出来ん感じ?

0212名無しさん＠ピンキー (ﾜｯﾁｮｲ 5332-St5P)

2025/05/27(火) 21:19:51.95ID:oat/RohR0

>>210
メモリ積めば動くで
日本語でエチエチ目的なら、今のところこれを超えるモデルはない

0213名無しさん＠ピンキー (ﾜｯﾁｮｲ cffb-oPLX)

2025/05/27(火) 22:52:07.26ID:bc4+kV0z0

>>211
gemmaみたいな規制強いモデルにエロファインチューンすると使ってるデータの言語に過剰適合しちゃう感じ
mistral系ならちゃんとした日本語返してくれるよ

0214名無しさん＠ピンキー (ﾜｯﾁｮｲ 0383-ElKC)

2025/05/28(水) 19:58:00.90ID:ijGRRwkN0

色々試してberghof-erp-7bが今ん所エチエチの解像度高く正確にレスポンスしてくれるんやがコレより更にいいモデルってなるとある？

0215名無しさん＠ピンキー (ﾜｯﾁｮｲ cfd9-Qnse)

2025/05/29(木) 01:11:59.57ID:LI3y/jIC0

サイズにこだわらなければMistral系列のもうちょい大きめなやつベースのモデルが良いんじゃない？
BerghofもMistralベースだしmagnum-v4-123bもそうだしMistral系列は俺たちみたいな用途の人間にとっては最強なイメージ

日本産モデルでどっかがエロテキストとかフィルタせず食わせまくってるとかあればポテンシャルは高そうだけどないのかな

0216名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f21-ElKC)

2025/05/29(木) 06:51:05.05ID:fTvJ5RgK0

スプレッドシートとか使ってスレ民で寄り合ってチマチマデータセット作るとかも考えたことあるが

0217名無しさん＠ピンキー (ﾜｯﾁｮｲ 93e1-hAZc)

2025/05/29(木) 07:06:03.45ID:76ON7lxO0

>>216
やばいの書き込まれてGoogleアカウントBANされそうやなw

0218名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f21-ElKC)

2025/05/29(木) 07:18:11.62ID:fTvJ5RgK0

>>217
それがあるから代替案模索しとるんやけどなかなか
正直文章程度でbanとかふざけんなよって思うけどそもそものLLMのエロ規制も含め世知辛い

0219名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f21-ElKC)

2025/05/29(木) 08:08:35.97ID:fTvJ5RgK0

うーん……
3枚目笑かしに来てるだろこれデータ量は多いはずだが
ちなみに画面外の方の会話で一度ご褒美としてキメてる
https://i.imgur.com/SHIyNM0.png
https://i.imgur.com/Dc3hWdI.png
https://i.imgur.com/80W6FFw.png

0220名無しさん＠ピンキー (ﾜｯﾁｮｲ ff49-N1DS)

2025/05/29(木) 09:31:28.45ID:DDX3Te/+0

DeepSeek R1のアップデート来たぞ

0221名無しさん＠ピンキー (ﾜｯﾁｮｲ ffc7-D55G)

2025/05/29(木) 10:03:42.90ID:i/FsIwC00

DeepSeek R1ってまともにローカルで動かせるんけ？

0222名無しさん＠ピンキー (ﾜｯﾁｮｲ b38a-8Cc+)

2025/05/29(木) 10:20:27.67ID:WS1eLZJ/0

蒸留したやつなら

0223名無しさん＠ピンキー (ﾜｯﾁｮｲ ff49-N1DS)

2025/05/29(木) 10:39:03.92ID:DDX3Te/+0

蒸留してなくてもKTransformersを使うとそこまで難易度高くない
800GBくらいのDRAMとRTX4090が1つあれば動く

0224名無しさん＠ピンキー (ﾜｯﾁｮｲ b3ba-oPLX)

2025/05/29(木) 12:42:28.93ID:rhm4SzzZ0

R2かと思ったら違った
しかしファイルサイズでかいな……

0225名無しさん＠ピンキー (ﾜｯﾁｮｲ b3ba-oPLX)

2025/05/29(木) 14:57:58.57ID:rhm4SzzZ0

plamo-2-8bをローカルで動作させられた人いますか？

0226名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-St5P)

2025/05/29(木) 19:37:59.08ID:n8QeM8Rt0

ＧＧＵＦ版も作ってるニキがいるな
がんばってくれ

0227名無しさん＠ピンキー (ﾜｯﾁｮｲ efc8-I9TV)

2025/05/29(木) 20:00:36.79ID:OQIYzoML0

>>205
すいません
購入を考えているのですが
AI最適化済みのWIN11って普通のものと何か違ってましたか

用途によるんでしょうが、radeonで困ることってありますか

0228名無しさん＠ピンキー (ﾌﾞｰｲﾓ MM5f-3IWN)

2025/05/29(木) 21:07:57.72ID:De9VSIVPM

>>227
きちんと検証した訳じゃないけど多分普通のwin11じゃないかな
radeonで困ることはおそらくあると思う
lm studioでrocmランタイム有効にするのも一手間かかったし
ユーザー増えて対応進むといいなと思ってる（他力本願）

0229名無しさん＠ピンキー (ｽﾌﾟｯｯ Sd5f-J0oL)

2025/05/29(木) 21:13:18.31ID:HZQgz9qxd

Ai(LLM)で人物とかの設定と細かいストーリーラインを指示して小説風に仕上げることを繰り返して物語を作りたいのですが、おすすめありますか？

0230名無しさん＠ピンキー (ﾜｯﾁｮｲ ff49-N1DS)

2025/05/29(木) 23:08:40.17ID:DDX3Te/+0

DeepSeek-R1-0528-Qwen3-8Bがあるらしいけどまだ公開されてないな

0231名無しさん＠ピンキー (ﾜｯﾁｮｲ 5332-St5P)

2025/05/30(金) 00:21:51.78ID:IwaM7x+Y0

>>220
デモ試してるが、日本語でthinkするようになってるね

0232名無しさん＠ピンキー (ﾜｯﾁｮｲ efc8-I9TV)

2025/05/30(金) 00:40:58.24ID:0vYqElAy0

>>228
返信ありがとうございます
cudaがないとやはり一手間かかるんだと思いますが
それも楽しそうですね

0233名無しさん＠ピンキー (ﾜｯﾁｮｲ ff49-N1DS)

2025/05/30(金) 01:50:28.95ID:EkRUpVgW0

>>231
日本語性能がかなり上がったように見える

0234名無しさん＠ピンキー (ﾜｯﾁｮｲ 8fc8-O274)

2025/05/30(金) 05:53:08.32ID:mY97NSrc0

RADEONてローカルLLMで使えるんでしょうか？
メモリ容量だけ見るとＮＶより有利に見えるけど...

0235名無しさん＠ピンキー (ﾜｯﾁｮｲ ef9f-oPLX)

2025/05/30(金) 06:54:16.05ID:aWuKrBSk0

>>234
RADEONだとローカルLLMはVulkanを利用する事になるだろうけど、
画像生成までしたいのならZLUDAでCUDA互換環境を作るとか苦労するだろうね

0236名無しさん＠ピンキー (ﾜｯﾁｮｲ ff49-tlT5)

2025/05/30(金) 08:52:29.99ID:EkRUpVgW0

RadeonはLinuxかWindowsかでも結構変わってくる
Linuxのほうが開発が進んでいる
Linuxが扱えない人には難易度高い

0237名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f5f-oPLX)

2025/05/30(金) 10:59:05.41ID:8eS3E81o0

Ryzen AI MAX ならミニPCやろうし
LinuxでLLM動かして
普段はWinのメインPCからリモートで扱う感じになるんかねえ

0238名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f9f-FD3H)

2025/05/30(金) 22:16:13.57ID:WWTGK6G80

これ誰か量子化してくれないかなぁ？
pfnet/plamo-2-translate ・ Hugging Face
https://huggingface.co/pfnet/plamo-2-translate

0239名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fcc-pzE/)

2025/05/30(金) 22:18:54.96ID:SgTWU+a40

>>238
そもそもmac以外で動作するの？という話

0240名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f9f-FD3H)

2025/05/30(金) 22:23:41.50ID:WWTGK6G80

>>239
Mac関係あるの？ああ、サイズ大きいんじゃないかって？
Model size 9.53B params, Tensor type BF16 でも大きい？

0241名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fcc-pzE/)

2025/05/30(金) 22:29:16.23ID:SgTWU+a40

>>240
mamba-ssm問題が解決してなかったと思う

0242名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f9f-FD3H)

2025/05/30(金) 22:37:17.37ID:WWTGK6G80

>>241
ああ、それがあったね
https://huggingface.co/pfnet/plamo-2-8b
ベースモデルも試用した記憶がなかったのはそのせいか……

0243名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f9f-FD3H)

2025/05/30(金) 23:27:36.72ID:WWTGK6G80

>>238
ていうかSambaモデルがMacというかMLXで動くのか
実はApple Silicon Mac持ちなのでMLXで動くなら動かせるんよ
で、中の人がtranslateの方もMLX用の量子化モデルを作ってくれていたので動かせた
(Model treeのリンクが間違っているので量子化モデルの存在に気付けなかった)
https://x.com/mitmul/status/1927960884103762302
https://huggingface.co/mlx-community/plamo-2-translate

0244名無しさん＠ピンキー (ﾜｯﾁｮｲ a249-xQVN)

2025/05/31(土) 00:52:42.00ID:rzj64tZq0

翻訳はgemma3でよくないか

0245名無しさん＠ピンキー (ﾜｯﾁｮｲ 636a-SsOf)

2025/05/31(土) 07:05:02.38ID:eUluHB070

>>238
これ精度低いよ
bleuも公開できないほど

0246名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr97-PO4I)

2025/05/31(土) 22:50:30.63ID:NoEL71Wjr

>>236
Linuxってwslでもいいの？

0247名無しさん＠ピンキー (ﾜｯﾁｮｲ 520f-cgR3)

2025/06/01(日) 04:15:43.13ID:6i8+Zqz50

AmazonでRyzen AI Maxの128GBのが22万円のセールやってるな

0248名無しさん＠ピンキー (ﾜｯﾁｮｲ 520f-cgR3)

2025/06/01(日) 04:17:19.06ID:6i8+Zqz50

ごめん、64GBのだったわ

0249名無しさん＠ピンキー (ﾜｯﾁｮｲ a2c7-8HDr)

2025/06/01(日) 16:39:51.03ID:41bXt3zO0

deepseek-R1-0528のIQ2_XXS動かしてるんだけど日本語は自然になってるね

でも小説書かせてみたらmagnum-v4-123bほどではないんだけどそんなもんかな？

0250名無しさん＠ピンキー (ﾜｯﾁｮｲ ef32-kszJ)

2025/06/01(日) 19:44:36.69ID:OACok6Q00

>>249
てゆうかエロ小説でこれを超えるモデルそろそろ出て欲しいんだわ

0251名無しさん＠ピンキー (ﾜｯﾁｮｲ b2ec-SiyO)

2025/06/01(日) 22:46:27.41ID:mIad1fRF0

小説性能ってベースモデルの事前学習時点で決まる感じやから当分は来ないやろね
qwenやgemmaは明らかに学習データをフィルタリングしてるしmistralも最近はSTEM重視の姿勢でクリエイティブ性能落ちてる
deepseekはかなり緩めだけどそれで越えれないなら厳しい　

0252名無しさん＠ピンキー (ﾜｯﾁｮｲ 724a-rQsc)

2025/06/02(月) 00:41:51.92ID:Z/D3ETlA0

magnum-v4-123b使うときGPUとRAM何GB消費してる？
RTX3060 12GBと32GBしか積んでなくて、どれくらい増せばよいのか知りたい

0253名無しさん＠ピンキー (ﾜｯﾁｮｲ ef32-kszJ)

2025/06/02(月) 01:01:34.86ID:PL5oy1lz0

>>252
メモリは最低でも64Gないと動かん
64GでもIQ3_Mの量子化が限界
96GあればQ5_K_Mが動くが、メモリで動かすと絶望的に遅いからお勧めしない
ワイは64Gで動かしてるが、プロンプト打ち込んだら、別の事して30～40分掛かって512トークン終わる感じだわｗ
3080tiの12GのVRAMは一応使ってるが、あっても無くても変わらんレベル
しかもmagnum123Bは日本語トークン対応してないみたいで、１文字２トークン使うから、対応してる70Ｂの体感３倍遅いｗｗｗ

RTX6000proQ-Maxが欲しいいいいいいい
このグラボでフルスペックの512G mac買えるけど画像ＡＩにも使えるしマジ悩むｗ

0254名無しさん＠ピンキー (ﾜｯﾁｮｲ 36a9-kszJ)

2025/06/02(月) 01:56:26.38ID:mYVBCutS0

magnumは最近のモデルで作ってほしいよね
123bってMistral Largeだしちょっともう古いよね

今ならCommand-Aが元からゆるゆるだしよさそうやが

0255名無しさん＠ピンキー (ﾜｯﾁｮｲ 724a-rQsc)

2025/06/02(月) 01:57:42.37ID:Z/D3ETlA0

>>252
ありがﾄﾝ
じゃあとりあえず32GBx2買うかあ
最低64GB、相性運よけりゃ4枚刺しで96GBで。現代もメモリの相性問題があるのかは知らんけど・・・

0256名無しさん＠ピンキー (ﾜｯﾁｮｲ 72c1-ulTm)

2025/06/02(月) 07:19:27.78ID:HMsOLYMX0

1応答30分超はキツすぎるな

0257名無しさん＠ピンキー (ﾜｯﾁｮｲ 3ee0-1F/z)

2025/06/02(月) 17:24:43.28ID:yAniuXgO0

Ryzen AI Max期待してたんだけど微妙なの？

0258名無しさん＠ピンキー (ﾜｯﾁｮｲ b72d-SiyO)

2025/06/02(月) 17:37:37.38ID:fdRm+/fO0

数値あげてくれとるニキおるからそれ参考にしてもろて

0259名無しさん＠ピンキー (ﾜｯﾁｮｲ 1bc6-BVpK)

2025/06/02(月) 17:42:08.90ID:defDcJlJ0

>>257
70B以上のモデルでも普通のPCのメインメモリに載せて動かすよりは速いのと省電力性が良いって感じかな

0260名無しさん＠ピンキー (ﾜｯﾁｮｲ a249-xQVN)

2025/06/02(月) 18:00:47.70ID:nvxNZBIi0

Ryzen AI Maxは128GBメモリを使えるPCでは一番安いのが強みではある
そこに良さを感じないなら微妙かもね

0261名無しさん＠ピンキー (ﾜｯﾁｮｲ 66de-HBKV)

2025/06/02(月) 18:05:42.44ID:VrKdnv2l0

結局マシンスペックに帰結するんだよな
もっと手軽に高品質な官能小説出したいだけなのに

0262名無しさん＠ピンキー (ﾜｯﾁｮｲ bb0a-rkY2)

2025/06/02(月) 19:39:50.13ID:Pz4Lw+jF0

楽しみながらデータセット無限生成編始まった一粒で6度美味しい
こういうのみんなで出し合ったらデータセット簡単に作れそうやけど情報偏りそう
https://i.imgur.com/AYt6MwY.png

0263名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sd32-21AQ)

2025/06/02(月) 19:56:09.86ID:ncNQp2bZd

>>262
キャラチャット用のFT手順一式が欲しいわ
今はUnslothとかいうのを使うのか？

0264名無しさん＠ピンキー (ﾜｯﾁｮｲ 52d4-SiyO)

2025/06/02(月) 22:26:51.97ID:L4/XXPNV0

最近ローカルでLLM使えるの知って今日始めてSilly Tavernでオリキャラと会話して遊んでるけど
なんか緊張して関係性進展しなくて草
でも昔恋愛シュミレーションゲームやってて選択肢をどっちにするかとか考えて楽しかったけど
こっちは無限にいろんな分岐があるゲームをやってるみたいで更に楽しいね

0265名無しさん＠ピンキー (ﾜｯﾁｮｲ fec8-npAY)

2025/06/02(月) 22:48:20.98ID:I2aTIrKa0

Project-Wannabeの作者様へ
いつも使わせていただいております
ありがとうございます

要望なのですが
・出力されたものは全てパラメータjsonやkcppsと共に
logとして残しておくことはできないでしょうか
・デフォルトの生成パラメータ数値ヘ簡単に戻すことはできないでしょうか
・出力時に1行ずつ空白行を挿入（改行）されてしまうことが多いのですが、
それをさせないようにすることはできないでしょうか

0266名無しさん＠ピンキー (ﾜｯﾁｮｲ 5253-SiyO)

2025/06/02(月) 23:27:22.02ID:GzXIK7ru0

>>263
unslothのcolabノートブック使ってみるといいよ
わかりやすいし何より無料

0267名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sd32-21AQ)

2025/06/02(月) 23:40:28.32ID:ncNQp2bZd

>>266
ありがとう試してみるで

0268名無しさん＠ピンキー (ﾜｯﾁｮｲ b6bc-lbRc)

2025/06/03(火) 19:48:55.49ID:Uf3qAznp0

学習データって>>262のように同じテーマで口調を変えただけのものを用意するのと
バラバラなテーマで口調を変えたものを用意するのとどっちが適してるのかな
もちろんトータルのデータセット数は同じだと仮定した場合ね
前者でいいなら楽にデータセット用意できるけど後者だと内容考えるだけでも大変なんだけど

0269名無しさん＠ピンキー (ﾜｯﾁｮｲ b6d9-KDLv)

2025/06/04(水) 09:20:46.17ID:+oV0wOD20

後者のほうが良いよ
基本多様であれば多様なほど良いと思って良い
テーマのリストとか口調のリストとかをGeminiとかで大量に書かせてリスト化してランダムに組み合わせてLLMに合成させる感じとかでそれなりに多様にはできると思う

0270名無しさん＠ピンキー (ﾜｯﾁｮｲ ef32-kszJ)

2025/06/04(水) 11:20:24.86ID:4a8LWwHM0

shisa-ai/shisa-v2-llama3.1-405b-GGUF

だれか試せる人おらんかな？
moeじゃない405Gの日本語finetune

0271名無しさん＠ピンキー (ﾜｯﾁｮｲ a249-FcjO)

2025/06/04(水) 11:31:44.32ID:tZNJnqlN0

ここで試せるみたいだけどな
https://chat.shisa.ai/

0272名無しさん＠ピンキー (ﾜｯﾁｮｲ ef32-kszJ)

2025/06/04(水) 13:50:12.73ID:4a8LWwHM0

>>271
おおサンキュ！
早速試したが、R１並みにいいかも
webだから規制入ってるけどローカルならどうなんだろ

0273名無しさん＠ピンキー (ﾜｯﾁｮｲ 874b-8b1H)

2025/06/04(水) 13:52:41.06ID:QI5L+ngp0

ちょっと試しただけだけどllama3.1はもう古い感じがした
計算リソース食ってる割には...他のLLMの進化が早すぎるんよ

0274名無しさん＠ピンキー (ﾜｯﾁｮｲ a249-FcjO)

2025/06/04(水) 13:55:54.58ID:tZNJnqlN0

30Bくらいでもっと賢いモデルあるからな

0275名無しさん＠ピンキー (ﾜｯﾁｮｲ b6a0-kszJ)

2025/06/04(水) 14:20:58.21ID:FaYK2mPb0

最近70bを誰も作ってくれない。
オナシャス

0276名無しさん＠ピンキー (ﾜｯﾁｮｲ 42e3-L/D9)

2025/06/04(水) 19:08:02.68ID:a5Ck1WYB0

3.1なんてもう化石だろjk

0277名無しさん＠ピンキー (ﾜｯﾁｮｲ 7fba-RMgv)

2025/06/04(水) 19:33:05.22ID:AUnMmnLx0

>>275
70Bなんか動かせるマシン持ってるやつ少ねえよってのと最近は性能大幅に落としてもいいからエッジデバイスでいかにそれっぽいのを動かせるかに研究が移ってるっぽいからなあ

0278名無しさん＠ピンキー (ﾜｯﾁｮｲ b6bc-lbRc)

2025/06/04(水) 19:56:58.96ID:FvknF98Q0

>>269
やっぱりそうかぁ
以前、内容や名詞をスクリプトで自動的に組み合わせて生成した金太郎飴みたいなデータセット1万件ぐらいを使ってLoRA作成したんだけど
推論結果が同じく金太郎飴みたいになってて全く使い物にならなかったんよ
質問文は自力で頑張って用意してそれをLLMに蒸留させてデータ作成するのが一番現実的そうやね
ただOpenAIは蒸留に対する検知厳しくなったみたいだしローカルLLMで蒸留させるしかないのかな

0279名無しさん＠ピンキー (ﾜｯﾁｮｲ 9bb4-8b1H)

2025/06/05(木) 00:50:24.68ID:vfrFHp0+0

こういう失敗談はとても助かる

0280名無しさん＠ピンキー (ﾜｯﾁｮｲ 87b4-8b1H)

2025/06/05(木) 01:05:48.18ID:4oFyB0gw0

Gemma3の70Bくらいが欲しいよね

Llama3.1 405Bの位置が低すぎる
huggingface.co/blog/gemma3

0281名無しさん＠ピンキー (ﾜｯﾁｮｲ a249-0Pot)

2025/06/06(金) 21:02:06.42ID:39L0KRnH0

ゼロから開発された日本向けのLLMが久々に出た
普通のLLMというよりドキュメント読解特化らしいが
https://stockmark-tech.hatenablog.com/entry/2025/06/03/101007

0282名無しさん＠ピンキー (ﾜｯﾁｮｲ 9fcc-bdW6)

2025/06/07(土) 00:48:13.65ID:39KDc2wv0

>>281
Instruct版のSpaceあったので遊んでみたけど、ハルシネーション抑制、ってあったけどInstruction Followig、Groundnessともに怪しい感じでこれで4o越えは評価のスコープを思いい切り絞らないと、って印象
文体は自然でそこそこなので惜しい感じ
フルスクラッチ日本語モデルって点では今後に期待
111B多言語対応のCommand-a越えを期待してたんだけど...

0283名無しさん＠ピンキー (ﾜｯﾁｮｲ a332-e2Mg)

2025/06/07(土) 00:54:28.31ID:2LZ+XKfV0

>>282
それ古い方じゃないかな？
今回のはマルチモーダルモデルなので用途が違うかな

0284名無しさん＠ピンキー (ﾜｯﾁｮｲ 9fcc-bdW6)

2025/06/07(土) 01:08:50.77ID:39KDc2wv0

>>283
あ、そうかも
いまもう一回検索したらStockmark-2-VL-100BではSpace出てない感じだった
楽しみが増えた、ありがとう

0285名無しさん＠ピンキー (ﾜｯﾁｮｲ 57d9-3NuF)

2025/06/08(日) 03:19:31.62ID:UOHeZNXa0

Stockmarkは…うん…界隈の人だとある程度察すると思う

0286名無しさん＠ピンキー (ﾜｯﾁｮｲ 47c0-Thn+)

2025/06/08(日) 08:58:53.34ID:TAduKfL90

なんかあるの？

0287名無しさん＠ピンキー (ﾜｯﾁｮｲ 9f9f-KD4N)

2025/06/08(日) 10:04:02.91ID:oyT8Ugh80

おま感を相手にしても仕方がないです

0288名無しさん＠ピンキー (ﾜｯﾁｮｲ b702-e2Mg)

2025/06/08(日) 13:35:11.36ID:YarQEdH80

GENIACにオルツが入ってるから何でも胡散臭く見える

0289名無しさん＠ピンキー (ﾜｯﾁｮｲ 2fe1-QsL+)

2025/06/08(日) 15:02:38.74ID:j1hFi/dg0

胡散臭さより完成品の質で戦えよ

0290名無しさん＠ピンキー (ｼｬﾁｰｸ 0Cef-w202)

2025/06/08(日) 15:19:30.63ID:sqNXLGRgC

>>285
以前試したが小説目的だとまさしく話にならないレベルで速攻消した思い出

0291名無しさん＠ピンキー (ﾜｯﾁｮｲ 57d9-3NuF)

2025/06/08(日) 16:32:28.96ID:UOHeZNXa0

>>286
別になんか悪いことしてるとかではないんだけど、シンプルにこのスレ民的には全く期待しなくて良いと思うというお話

0292名無しさん＠ピンキー (ﾜｯﾁｮｲ d36a-jj0/)

2025/06/08(日) 18:57:30.93ID:CFh7R3fZ0

ストックマークってだめな会社なん？🤔

0293名無しさん＠ピンキー (ﾜｯﾁｮｲ a332-e2Mg)

2025/06/08(日) 19:40:31.40ID:UHwTbmjA0

世間一般ではダメじゃないかもしれんがスレの評価が低かっただけ
でも、どんなベンチマークの評価よりこのスレの評価の方が参考になるんだわｗ

0294名無しさん＠ピンキー (ﾜｯﾁｮｲ 57d9-3NuF)

2025/06/09(月) 09:28:56.23ID:ljure9hs0

Aratako/NemoAurora-RP-12B

これLumimaidとかMagnum-v4とか混ざってるから良さげな雰囲気あるな
仕事終わったら試してみるわ

0295名無しさん＠ピンキー (ﾜｯﾁｮｲ a391-X6eQ)

2025/06/09(月) 10:42:30.45ID:7NcIMP7U0

一応モデル作るだけ評価は出来るが比較対象のレベル低すぎてお察し
なんで100Bと14B並べてイキってんねん

0296名無しさん＠ピンキー (ﾜｯﾁｮｲ 63c0-gw/n)

2025/06/09(月) 19:26:55.13ID:DmjpgrPE0

Aratakoってワイの一番のお気に入りのcalm3-22b-RP-v2作った神か？
NemoAurora-RP-12B触ってみるわ

0297名無しさん＠ピンキー (ﾜｯﾁｮｲ 57d9-3NuF)

2025/06/10(火) 01:12:25.58ID:QqWnFUnK0

NemoAuroraちょっと試したがかなり饒舌な感じで淫語とかも普通に出やすいな
この人のモデルにしては珍しく小説系とかそっち寄りな感じがする
この辺はHimeyuri-12Bとかをマージしてる影響かな？エロ系はかなり自然な感じ
その分何回も会話してるとだんだん応答が長くなって行きがちだから適度に過去会話をカットしてあげると良さそう（SillyTavernとかなら楽）
README読むとコンテキスト長32kで学習されてるみたいだけど実際そこまでいけるならかなり実用性ありそう

0298名無しさん＠ピンキー (ﾜｯﾁｮｲ 8732-+HAl)

2025/06/10(火) 09:27:53.11ID:+5w+8cqP0

エロokの配信サイトとか最近やと何処がええんやろ？ワイのAIライバーをニキらのオモチャにしてみたい

0299名無しさん＠ピンキー (ﾜｯﾁｮｲ 67a9-6htt)

2025/06/10(火) 13:51:16.95ID:PsRM1reD0

Rplay縺ｨ縺具ｼ

0300名無しさん＠ピンキー (ﾜｯﾁｮｲ d36a-Lyjn)

2025/06/10(火) 14:58:04.41ID:yNzdttZM0

文字化け野郎がまた来た😅

0301名無しさん＠ピンキー (ｵｲｺﾗﾐﾈｵ MM9f-gAZ+)

2025/06/10(火) 15:08:44.69ID:v+MevKZDM

Mac miniなんか買っちゃうから……🥺

0302名無しさん＠ピンキー (ﾜｯﾁｮｲ d36a-Lyjn)

2025/06/10(火) 15:45:35.63ID:yNzdttZM0

設定変えてみてよ

0303名無しさん＠ピンキー (ﾜｯﾁｮｲ 8732-+HAl)

2025/06/10(火) 16:51:31.40ID:+5w+8cqP0

fc2とかええかなって思ったけどツールでコメント拾う手法が確立されてないんか

0304名無しさん＠ピンキー (ﾜｯﾁｮｲ dbc6-lhAm)

2025/06/10(火) 16:54:28.40ID:MHXZZmsT0

EVO X2届いた
とりあえず窓の認証済ませてからLinux入れるか

0305名無しさん＠ピンキー (ﾜｯﾁｮｲ 9fe1-rHdl)

2025/06/10(火) 17:45:08.50ID:ZERmxKIi0

>>304
wktk

最初何動かすん？

■ このスレッドは過去ログ倉庫に格納されています