なんJLLM部避難所 ★8

284コメント105KB

なんJLLM部避難所 ★8

2025/05/24(土) 14:53:57.04ID:j2cdjv2K0

mistral nemo 12bベースのwanabi mini 12bを公開したぞ　 12GBもあれば快適に動くとようになったはずや　24B版も前の宣伝から更新しているので合わせて見てほしいで　量子化の種類も増やしたで
https://huggingface.co/kawaimasa/wanabi_mini_12b_GGUF
特定の形式に特化したFTモデルだからkobold経由の以下のGUI以外では多分まともに動かないので注意や
https://github.com/kawaii-justice/Project-Wannabe
学習時のコンテキスト長は32Kである程度長い文章でも扱える+チャット形式の生成ではないためマルチターンによる性能低下も発生しないから小説生成にはこの方式が最適やと思ってるで
とりあえず試したい人はベンチマーク代わりにお気に入りの小説を本文欄にコピーしてレーティングだけを設定して続きを書かせてみてほしいで結構良い線いってるはずや　自分の所感やが12B版は24B版よりも低い温度にするとちょうど良いで

0187名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f02-oPLX)

2025/05/24(土) 20:37:11.62ID:e3a5IQWJ0

>>186
いただきます

0188名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fec-oPLX)

2025/05/24(土) 23:00:47.49ID:j2cdjv2K0

>>185
wanabi 24B v03から初めてみることをおすすめするやで
試してはいないけどデータソースが年齢関係の表現に無頓着だから学習はしているはずや

0189名無しさん＠ピンキー (ﾜｯﾁｮｲ e3c6-nh/d)

2025/05/25(日) 02:03:12.82ID:YaNnPRND0

SillyTavernでGoogle APIの時は日本語で会話できるんだけど、LM Studioサーバーに繋いでポート経由でQwen3 30B A3B使ったら全部英語になった…なぜ？

0190名無しさん＠ピンキー (ﾜｯﾁｮｲ ef9f-57jE)

2025/05/25(日) 09:14:45.79ID:aUtjZJc30

>>189
SillyTavernのSystem Promptに、「日本語でチャットして」みたいなのを入れてもダメなのかい？
Qwen3は、知らんけど

0191名無しさん＠ピンキー (ﾜｯﾁｮｲ cf6f-DdzT)

2025/05/26(月) 04:17:31.46ID:sdeMGLlg0

Ryzen AI MAX、画像生成だけど3060より遅いみたいね
https://zenn.dev/robustonian/articles/flux1_ryzen_ai_guide

0192名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f7a-1Air)

2025/05/26(月) 08:34:05.37ID:C31LJLrt0

確か帯域が3060以下なんだっけ？

0193名無しさん＠ピンキー (ﾜｯﾁｮｲ e39e-GcMG)

2025/05/26(月) 12:14:43.03ID:mXH4e4ZZ0

Ryzen AI MAXはMACのM1 MAXみたいな性能でもしょうがないけど
Radeon AI PRO R9700は2枚挿したら画像生成能力もRTX 5090に近いものになって欲しいな
今のところは無理そうだけど

0194名無しさん＠ピンキー (ﾜｯﾁｮｲ ef27-St5P)

2025/05/26(月) 12:46:03.66ID:qFnDw5XZ0

そもそもAMDのGPGPU環境が糞なのに
今更AI特化ですとか言われてもってなる

0195名無しさん＠ピンキー (ﾜｯﾁｮｲ a3c7-Ar1F)

2025/05/26(月) 12:50:07.96ID:zJFAZMFs0

自然言語に強いモデルってある？

0196名無しさん＠ピンキー (ﾜｯﾁｮｲ 7fc5-8Cc+)

2025/05/26(月) 14:31:57.63ID:ClwMpXqp0

えっなにそれこわい

0197名無しさん＠ピンキー (ﾜｯﾁｮｲ efb5-zApV)

2025/05/26(月) 14:40:59.95ID:z4MgSvrt0

デカいモデルは自然言語に強いし小さいモデルはアホ
以上

0198名無しさん＠ピンキー (ﾜｯﾁｮｲ e39e-GcMG)

2025/05/26(月) 16:27:03.87ID:mXH4e4ZZ0

ここで今RDNA4対応のROCm 6.4.1の速度検証中みたいなんで
良い結果が出ればRadeon AI PRO R9700の購入を検討したいところ
https://github.com/ROCm/ROCm/issues/4443

0199名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fec-oPLX)

2025/05/26(月) 16:48:27.12ID:2M9wNHPd0

AMDの技術力を信じられないので後数年は待ちたい
長い間WSLでなら動くからwindows対応した！とか言ってた連中やし

0200名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fa1-zApV)

2025/05/26(月) 16:49:54.34ID:67TuyZ5z0

今年後半にはWindowsネイティブ対応します(できるとは言ってない)ってgithubのissueのどれかで言ってたような

0201名無しさん＠ピンキー (ﾜｯﾁｮｲ cfc6-ZxZL)

2025/05/27(火) 00:44:36.36ID:2K8oApBJ0

mistralnemoとmistralsmallのロールプレイの指示プロンプトってどういうのが良いんだろ？
ちょっと進めるだけでセリフとか行動が繰り返しの展開になるよね

0202名無しさん＠ピンキー (ﾜｯﾁｮｲ 5306-zApV)

2025/05/27(火) 00:47:21.17ID:16NlTkql0

同じ表現繰り返しがちなのはMistral系の宿命や
Mistral Largeは違うかも知れんけど動かせてないから分からん

0203名無しさん＠ピンキー (ﾜｯﾁｮｲ 5306-zApV)

2025/05/27(火) 00:52:23.76ID:16NlTkql0

一応言っとくと温度を推奨よりちょっと上げてそのままだと支離滅裂になるから代わりにmin_pもちょい上げるとマシにはなる

0204名無しさん＠ピンキー (ﾜｯﾁｮｲ cfd9-Qnse)

2025/05/27(火) 01:57:18.96ID:Z0ZSM0u/0

DGX Sparkは80万らしいな

0205名無しさん＠ピンキー (ﾌﾞｰｲﾓ MMff-3IWN)

2025/05/27(火) 08:15:58.74ID:dwqDJGhLM

strix halo機（EVO-X2）入手したんでちょっといじってみた
lm studioでrocmランタイム有効化してmagnum-v4-123bのq3klがだいたい2.5tok/s前後でした

0206名無しさん＠ピンキー (ﾜｯﾁｮｲ 83c6-ZTJL)

2025/05/27(火) 11:47:56.13ID:B3ICfmX+0

乙
こっちは発送が6/6に延びた...はよ触りたいわ

0207名無しさん＠ピンキー (ﾜｯﾁｮｲ ef50-57jE)

2025/05/27(火) 13:41:00.85ID:iOAPqrxk0

>>205

乙やで羨ましい
ワイも再来年にはそっち側にいきたいで

録画サーバーとひとまとめにしたいから
ITXでも出してくれんかなあ

0208名無しさん＠ピンキー (ﾜｯﾁｮｲ e377-ElKC)

2025/05/27(火) 13:50:47.62ID:j/rkKysz0

lmスタジオ触り始めたワイに最近ホットなエチエチモデルこっそり教えて

0209名無しさん＠ピンキー (ﾜｯﾁｮｲ ffc7-D55G)

2025/05/27(火) 15:03:43.39ID:FBxT1TC10

>>208
magnum-v4-123b

0210名無しさん＠ピンキー (ﾜｯﾁｮｲ e377-ElKC)

2025/05/27(火) 17:21:24.36ID:j/rkKysz0

>>209
ホットやけど個人で使えるレベル超えてないか？ワイの3090tiでも無理そうなんやが

0211名無しさん＠ピンキー (ﾜｯﾁｮｲ 5367-ElKC)

2025/05/27(火) 20:44:47.86ID:Khy5JY5E0

magnum-v4-27bとか色々使ってみたけどエロ会話どころか日本語も安定しないな画像生成AIみたいに日本語強いモデルとエロモデルでマージみたいな事は簡単には出来ん感じ?

0212名無しさん＠ピンキー (ﾜｯﾁｮｲ 5332-St5P)

2025/05/27(火) 21:19:51.95ID:oat/RohR0

>>210
メモリ積めば動くで
日本語でエチエチ目的なら、今のところこれを超えるモデルはない

0213名無しさん＠ピンキー (ﾜｯﾁｮｲ cffb-oPLX)

2025/05/27(火) 22:52:07.26ID:bc4+kV0z0

>>211
gemmaみたいな規制強いモデルにエロファインチューンすると使ってるデータの言語に過剰適合しちゃう感じ
mistral系ならちゃんとした日本語返してくれるよ

0214名無しさん＠ピンキー (ﾜｯﾁｮｲ 0383-ElKC)

2025/05/28(水) 19:58:00.90ID:ijGRRwkN0

色々試してberghof-erp-7bが今ん所エチエチの解像度高く正確にレスポンスしてくれるんやがコレより更にいいモデルってなるとある？

0215名無しさん＠ピンキー (ﾜｯﾁｮｲ cfd9-Qnse)

2025/05/29(木) 01:11:59.57ID:LI3y/jIC0

サイズにこだわらなければMistral系列のもうちょい大きめなやつベースのモデルが良いんじゃない？
BerghofもMistralベースだしmagnum-v4-123bもそうだしMistral系列は俺たちみたいな用途の人間にとっては最強なイメージ

日本産モデルでどっかがエロテキストとかフィルタせず食わせまくってるとかあればポテンシャルは高そうだけどないのかな

0216名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f21-ElKC)

2025/05/29(木) 06:51:05.05ID:fTvJ5RgK0

スプレッドシートとか使ってスレ民で寄り合ってチマチマデータセット作るとかも考えたことあるが

0217名無しさん＠ピンキー (ﾜｯﾁｮｲ 93e1-hAZc)

2025/05/29(木) 07:06:03.45ID:76ON7lxO0

>>216
やばいの書き込まれてGoogleアカウントBANされそうやなw

0218名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f21-ElKC)

2025/05/29(木) 07:18:11.62ID:fTvJ5RgK0

>>217
それがあるから代替案模索しとるんやけどなかなか
正直文章程度でbanとかふざけんなよって思うけどそもそものLLMのエロ規制も含め世知辛い

0219名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f21-ElKC)

2025/05/29(木) 08:08:35.97ID:fTvJ5RgK0

うーん……
3枚目笑かしに来てるだろこれデータ量は多いはずだが
ちなみに画面外の方の会話で一度ご褒美としてキメてる
https://i.imgur.com/SHIyNM0.png
https://i.imgur.com/Dc3hWdI.png
https://i.imgur.com/80W6FFw.png

0220名無しさん＠ピンキー (ﾜｯﾁｮｲ ff49-N1DS)

2025/05/29(木) 09:31:28.45ID:DDX3Te/+0

DeepSeek R1のアップデート来たぞ

0221名無しさん＠ピンキー (ﾜｯﾁｮｲ ffc7-D55G)

2025/05/29(木) 10:03:42.90ID:i/FsIwC00

DeepSeek R1ってまともにローカルで動かせるんけ？

0222名無しさん＠ピンキー (ﾜｯﾁｮｲ b38a-8Cc+)

2025/05/29(木) 10:20:27.67ID:WS1eLZJ/0

蒸留したやつなら

0223名無しさん＠ピンキー (ﾜｯﾁｮｲ ff49-N1DS)

2025/05/29(木) 10:39:03.92ID:DDX3Te/+0

蒸留してなくてもKTransformersを使うとそこまで難易度高くない
800GBくらいのDRAMとRTX4090が1つあれば動く

0224名無しさん＠ピンキー (ﾜｯﾁｮｲ b3ba-oPLX)

2025/05/29(木) 12:42:28.93ID:rhm4SzzZ0

R2かと思ったら違った
しかしファイルサイズでかいな……

0225名無しさん＠ピンキー (ﾜｯﾁｮｲ b3ba-oPLX)

2025/05/29(木) 14:57:58.57ID:rhm4SzzZ0

plamo-2-8bをローカルで動作させられた人いますか？

0226名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-St5P)

2025/05/29(木) 19:37:59.08ID:n8QeM8Rt0

ＧＧＵＦ版も作ってるニキがいるな
がんばってくれ

0227名無しさん＠ピンキー (ﾜｯﾁｮｲ efc8-I9TV)

2025/05/29(木) 20:00:36.79ID:OQIYzoML0

>>205
すいません
購入を考えているのですが
AI最適化済みのWIN11って普通のものと何か違ってましたか

用途によるんでしょうが、radeonで困ることってありますか

0228名無しさん＠ピンキー (ﾌﾞｰｲﾓ MM5f-3IWN)

2025/05/29(木) 21:07:57.72ID:De9VSIVPM

>>227
きちんと検証した訳じゃないけど多分普通のwin11じゃないかな
radeonで困ることはおそらくあると思う
lm studioでrocmランタイム有効にするのも一手間かかったし
ユーザー増えて対応進むといいなと思ってる（他力本願）

0229名無しさん＠ピンキー (ｽﾌﾟｯｯ Sd5f-J0oL)

2025/05/29(木) 21:13:18.31ID:HZQgz9qxd

Ai(LLM)で人物とかの設定と細かいストーリーラインを指示して小説風に仕上げることを繰り返して物語を作りたいのですが、おすすめありますか？

0230名無しさん＠ピンキー (ﾜｯﾁｮｲ ff49-N1DS)

2025/05/29(木) 23:08:40.17ID:DDX3Te/+0

DeepSeek-R1-0528-Qwen3-8Bがあるらしいけどまだ公開されてないな

0231名無しさん＠ピンキー (ﾜｯﾁｮｲ 5332-St5P)

2025/05/30(金) 00:21:51.78ID:IwaM7x+Y0

>>220
デモ試してるが、日本語でthinkするようになってるね

0232名無しさん＠ピンキー (ﾜｯﾁｮｲ efc8-I9TV)

2025/05/30(金) 00:40:58.24ID:0vYqElAy0

>>228
返信ありがとうございます
cudaがないとやはり一手間かかるんだと思いますが
それも楽しそうですね

0233名無しさん＠ピンキー (ﾜｯﾁｮｲ ff49-N1DS)

2025/05/30(金) 01:50:28.95ID:EkRUpVgW0

>>231
日本語性能がかなり上がったように見える

0234名無しさん＠ピンキー (ﾜｯﾁｮｲ 8fc8-O274)

2025/05/30(金) 05:53:08.32ID:mY97NSrc0

RADEONてローカルLLMで使えるんでしょうか？
メモリ容量だけ見るとＮＶより有利に見えるけど...

0235名無しさん＠ピンキー (ﾜｯﾁｮｲ ef9f-oPLX)

2025/05/30(金) 06:54:16.05ID:aWuKrBSk0

>>234
RADEONだとローカルLLMはVulkanを利用する事になるだろうけど、
画像生成までしたいのならZLUDAでCUDA互換環境を作るとか苦労するだろうね

0236名無しさん＠ピンキー (ﾜｯﾁｮｲ ff49-tlT5)

2025/05/30(金) 08:52:29.99ID:EkRUpVgW0

RadeonはLinuxかWindowsかでも結構変わってくる
Linuxのほうが開発が進んでいる
Linuxが扱えない人には難易度高い

0237名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f5f-oPLX)

2025/05/30(金) 10:59:05.41ID:8eS3E81o0

Ryzen AI MAX ならミニPCやろうし
LinuxでLLM動かして
普段はWinのメインPCからリモートで扱う感じになるんかねえ

0238名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f9f-FD3H)

2025/05/30(金) 22:16:13.57ID:WWTGK6G80

これ誰か量子化してくれないかなぁ？
pfnet/plamo-2-translate ・ Hugging Face
https://huggingface.co/pfnet/plamo-2-translate

0239名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fcc-pzE/)

2025/05/30(金) 22:18:54.96ID:SgTWU+a40

>>238
そもそもmac以外で動作するの？という話

0240名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f9f-FD3H)

2025/05/30(金) 22:23:41.50ID:WWTGK6G80

>>239
Mac関係あるの？ああ、サイズ大きいんじゃないかって？
Model size 9.53B params, Tensor type BF16 でも大きい？

0241名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fcc-pzE/)

2025/05/30(金) 22:29:16.23ID:SgTWU+a40

>>240
mamba-ssm問題が解決してなかったと思う

0242名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f9f-FD3H)

2025/05/30(金) 22:37:17.37ID:WWTGK6G80

>>241
ああ、それがあったね
https://huggingface.co/pfnet/plamo-2-8b
ベースモデルも試用した記憶がなかったのはそのせいか……

0243名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f9f-FD3H)

2025/05/30(金) 23:27:36.72ID:WWTGK6G80

>>238
ていうかSambaモデルがMacというかMLXで動くのか
実はApple Silicon Mac持ちなのでMLXで動くなら動かせるんよ
で、中の人がtranslateの方もMLX用の量子化モデルを作ってくれていたので動かせた
(Model treeのリンクが間違っているので量子化モデルの存在に気付けなかった)
https://x.com/mitmul/status/1927960884103762302
https://huggingface.co/mlx-community/plamo-2-translate

0244名無しさん＠ピンキー (ﾜｯﾁｮｲ a249-xQVN)

2025/05/31(土) 00:52:42.00ID:rzj64tZq0

翻訳はgemma3でよくないか

0245名無しさん＠ピンキー (ﾜｯﾁｮｲ 636a-SsOf)

2025/05/31(土) 07:05:02.38ID:eUluHB070

>>238
これ精度低いよ
bleuも公開できないほど

0246名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr97-PO4I)

2025/05/31(土) 22:50:30.63ID:NoEL71Wjr

>>236
Linuxってwslでもいいの？

0247名無しさん＠ピンキー (ﾜｯﾁｮｲ 520f-cgR3)

2025/06/01(日) 04:15:43.13ID:6i8+Zqz50

AmazonでRyzen AI Maxの128GBのが22万円のセールやってるな

0248名無しさん＠ピンキー (ﾜｯﾁｮｲ 520f-cgR3)

2025/06/01(日) 04:17:19.06ID:6i8+Zqz50

ごめん、64GBのだったわ

0249名無しさん＠ピンキー (ﾜｯﾁｮｲ a2c7-8HDr)

2025/06/01(日) 16:39:51.03ID:41bXt3zO0

deepseek-R1-0528のIQ2_XXS動かしてるんだけど日本語は自然になってるね

でも小説書かせてみたらmagnum-v4-123bほどではないんだけどそんなもんかな？

0250名無しさん＠ピンキー (ﾜｯﾁｮｲ ef32-kszJ)

2025/06/01(日) 19:44:36.69ID:OACok6Q00

>>249
てゆうかエロ小説でこれを超えるモデルそろそろ出て欲しいんだわ

0251名無しさん＠ピンキー (ﾜｯﾁｮｲ b2ec-SiyO)

2025/06/01(日) 22:46:27.41ID:mIad1fRF0

小説性能ってベースモデルの事前学習時点で決まる感じやから当分は来ないやろね
qwenやgemmaは明らかに学習データをフィルタリングしてるしmistralも最近はSTEM重視の姿勢でクリエイティブ性能落ちてる
deepseekはかなり緩めだけどそれで越えれないなら厳しい　

0252名無しさん＠ピンキー (ﾜｯﾁｮｲ 724a-rQsc)

2025/06/02(月) 00:41:51.92ID:Z/D3ETlA0

magnum-v4-123b使うときGPUとRAM何GB消費してる？
RTX3060 12GBと32GBしか積んでなくて、どれくらい増せばよいのか知りたい

0253名無しさん＠ピンキー (ﾜｯﾁｮｲ ef32-kszJ)

2025/06/02(月) 01:01:34.86ID:PL5oy1lz0

>>252
メモリは最低でも64Gないと動かん
64GでもIQ3_Mの量子化が限界
96GあればQ5_K_Mが動くが、メモリで動かすと絶望的に遅いからお勧めしない
ワイは64Gで動かしてるが、プロンプト打ち込んだら、別の事して30～40分掛かって512トークン終わる感じだわｗ
3080tiの12GのVRAMは一応使ってるが、あっても無くても変わらんレベル
しかもmagnum123Bは日本語トークン対応してないみたいで、１文字２トークン使うから、対応してる70Ｂの体感３倍遅いｗｗｗ

RTX6000proQ-Maxが欲しいいいいいいい
このグラボでフルスペックの512G mac買えるけど画像ＡＩにも使えるしマジ悩むｗ

0254名無しさん＠ピンキー (ﾜｯﾁｮｲ 36a9-kszJ)

2025/06/02(月) 01:56:26.38ID:mYVBCutS0

magnumは最近のモデルで作ってほしいよね
123bってMistral Largeだしちょっともう古いよね

今ならCommand-Aが元からゆるゆるだしよさそうやが

0255名無しさん＠ピンキー (ﾜｯﾁｮｲ 724a-rQsc)

2025/06/02(月) 01:57:42.37ID:Z/D3ETlA0

>>252
ありがﾄﾝ
じゃあとりあえず32GBx2買うかあ
最低64GB、相性運よけりゃ4枚刺しで96GBで。現代もメモリの相性問題があるのかは知らんけど・・・

0256名無しさん＠ピンキー (ﾜｯﾁｮｲ 72c1-ulTm)

2025/06/02(月) 07:19:27.78ID:HMsOLYMX0

1応答30分超はキツすぎるな

0257名無しさん＠ピンキー (ﾜｯﾁｮｲ 3ee0-1F/z)

2025/06/02(月) 17:24:43.28ID:yAniuXgO0

Ryzen AI Max期待してたんだけど微妙なの？

0258名無しさん＠ピンキー (ﾜｯﾁｮｲ b72d-SiyO)

2025/06/02(月) 17:37:37.38ID:fdRm+/fO0

数値あげてくれとるニキおるからそれ参考にしてもろて

0259名無しさん＠ピンキー (ﾜｯﾁｮｲ 1bc6-BVpK)

2025/06/02(月) 17:42:08.90ID:defDcJlJ0

>>257
70B以上のモデルでも普通のPCのメインメモリに載せて動かすよりは速いのと省電力性が良いって感じかな

0260名無しさん＠ピンキー (ﾜｯﾁｮｲ a249-xQVN)

2025/06/02(月) 18:00:47.70ID:nvxNZBIi0

Ryzen AI Maxは128GBメモリを使えるPCでは一番安いのが強みではある
そこに良さを感じないなら微妙かもね

0261名無しさん＠ピンキー (ﾜｯﾁｮｲ 66de-HBKV)

2025/06/02(月) 18:05:42.44ID:VrKdnv2l0

結局マシンスペックに帰結するんだよな
もっと手軽に高品質な官能小説出したいだけなのに

0262名無しさん＠ピンキー (ﾜｯﾁｮｲ bb0a-rkY2)

2025/06/02(月) 19:39:50.13ID:Pz4Lw+jF0

楽しみながらデータセット無限生成編始まった一粒で6度美味しい
こういうのみんなで出し合ったらデータセット簡単に作れそうやけど情報偏りそう
https://i.imgur.com/AYt6MwY.png

0263名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sd32-21AQ)

2025/06/02(月) 19:56:09.86ID:ncNQp2bZd

>>262
キャラチャット用のFT手順一式が欲しいわ
今はUnslothとかいうのを使うのか？

0264名無しさん＠ピンキー (ﾜｯﾁｮｲ 52d4-SiyO)

2025/06/02(月) 22:26:51.97ID:L4/XXPNV0

最近ローカルでLLM使えるの知って今日始めてSilly Tavernでオリキャラと会話して遊んでるけど
なんか緊張して関係性進展しなくて草
でも昔恋愛シュミレーションゲームやってて選択肢をどっちにするかとか考えて楽しかったけど
こっちは無限にいろんな分岐があるゲームをやってるみたいで更に楽しいね

0265名無しさん＠ピンキー (ﾜｯﾁｮｲ fec8-npAY)

2025/06/02(月) 22:48:20.98ID:I2aTIrKa0

Project-Wannabeの作者様へ
いつも使わせていただいております
ありがとうございます

要望なのですが
・出力されたものは全てパラメータjsonやkcppsと共に
logとして残しておくことはできないでしょうか
・デフォルトの生成パラメータ数値ヘ簡単に戻すことはできないでしょうか
・出力時に1行ずつ空白行を挿入（改行）されてしまうことが多いのですが、
それをさせないようにすることはできないでしょうか

0266名無しさん＠ピンキー (ﾜｯﾁｮｲ 5253-SiyO)

2025/06/02(月) 23:27:22.02ID:GzXIK7ru0

>>263
unslothのcolabノートブック使ってみるといいよ
わかりやすいし何より無料

0267名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sd32-21AQ)

2025/06/02(月) 23:40:28.32ID:ncNQp2bZd

>>266
ありがとう試してみるで

0268名無しさん＠ピンキー (ﾜｯﾁｮｲ b6bc-lbRc)

2025/06/03(火) 19:48:55.49ID:Uf3qAznp0

学習データって>>262のように同じテーマで口調を変えただけのものを用意するのと
バラバラなテーマで口調を変えたものを用意するのとどっちが適してるのかな
もちろんトータルのデータセット数は同じだと仮定した場合ね
前者でいいなら楽にデータセット用意できるけど後者だと内容考えるだけでも大変なんだけど

0269名無しさん＠ピンキー (ﾜｯﾁｮｲ b6d9-KDLv)

2025/06/04(水) 09:20:46.17ID:+oV0wOD20

後者のほうが良いよ
基本多様であれば多様なほど良いと思って良い
テーマのリストとか口調のリストとかをGeminiとかで大量に書かせてリスト化してランダムに組み合わせてLLMに合成させる感じとかでそれなりに多様にはできると思う

0270名無しさん＠ピンキー (ﾜｯﾁｮｲ ef32-kszJ)

2025/06/04(水) 11:20:24.86ID:4a8LWwHM0

shisa-ai/shisa-v2-llama3.1-405b-GGUF

だれか試せる人おらんかな？
moeじゃない405Gの日本語finetune

0271名無しさん＠ピンキー (ﾜｯﾁｮｲ a249-FcjO)

2025/06/04(水) 11:31:44.32ID:tZNJnqlN0

ここで試せるみたいだけどな
https://chat.shisa.ai/

0272名無しさん＠ピンキー (ﾜｯﾁｮｲ ef32-kszJ)

2025/06/04(水) 13:50:12.73ID:4a8LWwHM0

>>271
おおサンキュ！
早速試したが、R１並みにいいかも
webだから規制入ってるけどローカルならどうなんだろ

0273名無しさん＠ピンキー (ﾜｯﾁｮｲ 874b-8b1H)

2025/06/04(水) 13:52:41.06ID:QI5L+ngp0

ちょっと試しただけだけどllama3.1はもう古い感じがした
計算リソース食ってる割には...他のLLMの進化が早すぎるんよ

0274名無しさん＠ピンキー (ﾜｯﾁｮｲ a249-FcjO)

2025/06/04(水) 13:55:54.58ID:tZNJnqlN0

30Bくらいでもっと賢いモデルあるからな

0275名無しさん＠ピンキー (ﾜｯﾁｮｲ b6a0-kszJ)

2025/06/04(水) 14:20:58.21ID:FaYK2mPb0

最近70bを誰も作ってくれない。
オナシャス

0276名無しさん＠ピンキー (ﾜｯﾁｮｲ 42e3-L/D9)

2025/06/04(水) 19:08:02.68ID:a5Ck1WYB0

3.1なんてもう化石だろjk

0277名無しさん＠ピンキー (ﾜｯﾁｮｲ 7fba-RMgv)

2025/06/04(水) 19:33:05.22ID:AUnMmnLx0

>>275
70Bなんか動かせるマシン持ってるやつ少ねえよってのと最近は性能大幅に落としてもいいからエッジデバイスでいかにそれっぽいのを動かせるかに研究が移ってるっぽいからなあ

0278名無しさん＠ピンキー (ﾜｯﾁｮｲ b6bc-lbRc)

2025/06/04(水) 19:56:58.96ID:FvknF98Q0

>>269
やっぱりそうかぁ
以前、内容や名詞をスクリプトで自動的に組み合わせて生成した金太郎飴みたいなデータセット1万件ぐらいを使ってLoRA作成したんだけど
推論結果が同じく金太郎飴みたいになってて全く使い物にならなかったんよ
質問文は自力で頑張って用意してそれをLLMに蒸留させてデータ作成するのが一番現実的そうやね
ただOpenAIは蒸留に対する検知厳しくなったみたいだしローカルLLMで蒸留させるしかないのかな

0279名無しさん＠ピンキー (ﾜｯﾁｮｲ 9bb4-8b1H)

2025/06/05(木) 00:50:24.68ID:vfrFHp0+0

こういう失敗談はとても助かる

0280名無しさん＠ピンキー (ﾜｯﾁｮｲ 87b4-8b1H)

2025/06/05(木) 01:05:48.18ID:4oFyB0gw0

Gemma3の70Bくらいが欲しいよね

Llama3.1 405Bの位置が低すぎる
huggingface.co/blog/gemma3

0281名無しさん＠ピンキー (ﾜｯﾁｮｲ a249-0Pot)

2025/06/06(金) 21:02:06.42ID:39L0KRnH0

ゼロから開発された日本向けのLLMが久々に出た
普通のLLMというよりドキュメント読解特化らしいが
https://stockmark-tech.hatenablog.com/entry/2025/06/03/101007

0282名無しさん＠ピンキー (ﾜｯﾁｮｲ 9fcc-bdW6)

2025/06/07(土) 00:48:13.65ID:39KDc2wv0

>>281
Instruct版のSpaceあったので遊んでみたけど、ハルシネーション抑制、ってあったけどInstruction Followig、Groundnessともに怪しい感じでこれで4o越えは評価のスコープを思いい切り絞らないと、って印象
文体は自然でそこそこなので惜しい感じ
フルスクラッチ日本語モデルって点では今後に期待
111B多言語対応のCommand-a越えを期待してたんだけど...

0283名無しさん＠ピンキー (ﾜｯﾁｮｲ a332-e2Mg)

2025/06/07(土) 00:54:28.31ID:2LZ+XKfV0

>>282
それ古い方じゃないかな？
今回のはマルチモーダルモデルなので用途が違うかな

0284名無しさん＠ピンキー (ﾜｯﾁｮｲ 9fcc-bdW6)

2025/06/07(土) 01:08:50.77ID:39KDc2wv0

>>283
あ、そうかも
いまもう一回検索したらStockmark-2-VL-100BではSpace出てない感じだった
楽しみが増えた、ありがとう

新着レスの表示

レスを投稿する