なんJLLM部避難所 ★9

470コメント158KB

なんJLLM部避難所 ★9

0423名無しさん＠ピンキー (ﾜｯﾁｮｲ f70b-5nxf)

2025/09/20(土) 01:32:15.97ID:hrmH+Mjd0

GPT-ossみたいな単一言語ガチガチにしたMoEモデル+翻訳専用SLMで組めるようになるのがローカルの終着点だと思っとるから数百BパラメータのLLM動かせるような環境はやりすぎな気はするわね

2025/09/20(土) 08:00:26.50ID:p/li7AZa0

大手IT企業とか大学の研究機関ですらLLMの学習コストが高すぎるって言ってるからこれから量子化とかtransformersに代わる計算コストの低いアーキテクチャの研究が進むかもな
そもそも人間は絵描いたりするより文章書く方が簡単なはずなのにAIは画像生成の方が必要リソースが少なくて言語モデルは倍近くのリソースが必要なのはなんでや

0425名無しさん＠ピンキー (ﾜｯﾁｮｲ a36a-3wxO)

2025/09/20(土) 08:06:01.28ID:+jVh25Pi0

既に色々されてるが

0426名無しさん＠ピンキー (ﾜｯﾁｮｲ 7732-kQ/7)

2025/09/20(土) 08:48:50.70ID:xy79eLcb0

>>424
人間が絵より文章を書く方が得意なのは、文章が生きる上での必須技能でより多くの時間を費やすからだろ
人生で絵と文章どっちに多くの時間をかけてるのか考えてみるんだ

0427名無しさん＠ピンキー (ﾜｯﾁｮｲ dbb2-XlN9)

2025/09/20(土) 09:57:05.54ID:KQrWb2+N0

>>426
簡単/難しいと得意/不得意は別の論な気もするのだが
ワイは、絵は全てのピクセルに明確な意図を込める必要はなく、なんなら単なるノイズですら魅力的な絵の一部と見なされうるけど、文章において文字はそれが許容されるケースが極めて限定的ってあたりがよりリソースが必要になる原因の一つやないか、と思うんやで

0428名無しさん＠ピンキー (ﾜｯﾁｮｲ f390-gFLl)

2025/09/20(土) 09:59:40.83ID:qDJ0IAj30

>>421
普通に追加学習でファインチューンできると思うんだけど、上手くいかない感じ？
まぁVRAMが量子化前のモデルサイズ×4倍くらいは要るのが環境面では大変よね

0429名無しさん＠ピンキー (ﾜｯﾁｮｲ c720-GsOJ)

2025/09/20(土) 10:13:50.69ID:ExnGmMsF0

視覚は莫大な情報の中から必要な物だけを抜き出す作業をしている
見たい部分が正しければ他は間違っていても気にならない

文章は伝えたい情報を全て文章化して相手に渡しており原則として相手は全てに目を通す
最初から最後まで確認するから間違いがあれば気づきやすい

0430名無しさん＠ピンキー (ﾜｯﾁｮｲ 7732-kQ/7)

2025/09/20(土) 10:56:37.47ID:xy79eLcb0

>>429
もちろんそういう問題もあるけど知識や技術の差も大きいで

アホな小学生は文章の良し悪しや文法の間違いに気付くことが出来ない
絵も同じで画力が無い奴は絵のおかしな部分に気付くことが出来ないし、単に下手なのかわざと崩しているのかの区別もつかない
画力があると絵を見た瞬間に多くの情報を正しく拾っておかしな部分に気付いてしまう
んで人類のほとんどはアホな小学生の文章力と同レベルの稚拙な画力しか持っていないから間違いが気になるはずもない

英語苦手な奴が英文読んだときにその良し悪しに気付かないのも同じことやで

0431名無しさん＠ピンキー (ﾜｯﾁｮｲ be35-/zn3)

2025/09/20(土) 12:42:40.70ID:JqUlC67e0

OpenRouterにGrok 4 Fastが来た。
しかもフリー。なんだこれ最高かよ。

0432名無しさん＠ピンキー (ﾜﾝﾐﾝｸﾞｸ MMa2-tQaT)

2025/09/21(日) 10:00:43.82ID:TZGwxDCYM

CPU推論ってシングルスレッドが有効？
スリッパだとシングルが弱い上にメモリアクセスにワンクッション挟むからRyzen 8000シリーズより遅くなる印象

ThreadripperならGPU複数枚構成かなぁ

0433名無しさん＠ピンキー (ﾜｯﾁｮｲ e6c8-vRSx)

2025/09/21(日) 19:57:54.80ID:ewooSzNA0

CPUよりメモリ速度が問題なんじゃないの

0434名無しさん＠ピンキー (ﾜｯﾁｮｲ f2d3-OtDG)

2025/09/21(日) 20:42:01.00ID:UQ+WCB620

epycで良くないか?
SP5ソケットなら最大12ch動作やから500GB/sくらい出たはず
それにデュアルcpuにすれば理論帯域幅も倍になるから1000GB/s超えも狙える(ソフト側の問題で実際の速度向上は30%程度らしい)
まあCCDの数で実際の帯域幅は律速されるから12chフルで使えるCPUにすると数百万コースやけど

0435名無しさん＠ピンキー (ﾜｯﾁｮｲ f2d3-OtDG)

2025/09/21(日) 21:01:38.73ID:UQ+WCB620

調べたら9B45とか128core DDR5 12channel で50万くらいなので組み方次第で100万以下も狙えそう
MoEならGPUも載せて一部オフロードすればさらに高速化狙えるし

0436名無しさん＠ピンキー (ﾜｯﾁｮｲ 7232-QENU)

2025/09/21(日) 21:30:49.13ID:cNbiFHnF0

pcie4.0でいいやと思ってsp3マザーとzen2epyc狙い

0437名無しさん＠ピンキー (ﾜｯﾁｮｲ bffd-XlN9)

2025/09/22(月) 00:16:15.61ID:oEFIPp9o0

magistral 1.2推論ってやつ使ってないけど普通に楽しいや

0438名無しさん＠ピンキー (ﾜｯﾁｮｲ b6a9-HCKT)

2025/09/22(月) 00:26:54.28ID:b0NiJC3J0

epycはxeonのAMXより速いってベンチマーク出してきてるけどほんまなんかな
llmのcpu推論は第三者のベンチマークがほとんどないんよなぁ

0439名無しさん＠ピンキー (ﾜｯﾁｮｲ f2c7-yPTp)

2025/09/22(月) 05:29:51.21ID:acG4VmK/0

Threadripper Proやepyc買うなら24コア以上推奨
16コア以下だとCCD数の関係で、例えば8chのメモリ帯域をフルに活かせない
chが増えるほど必要なCCD数がいるはず

0440名無しさん＠ピンキー (ﾜｯﾁｮｲ 2f32-vRSx)

2025/09/22(月) 23:57:09.88ID:VRVV12LZ0

jukofyork/command-a-03-2025-uncut

command-aの規制解除版（lora統合かな？）
規制強かった３月版が、エロエロになったわｗ

0441名無しさん＠ピンキー (ﾜｯﾁｮｲ f2b0-gFLl)

2025/09/23(火) 04:37:00.70ID:zbNZTUaY0

qwen3 omniは純粋に面白そう
日本語での音声入出力が可能らしい

0442名無しさん＠ピンキー (ﾜｯﾁｮｲ 36a0-vRSx)

2025/09/23(火) 07:19:21.83ID:SJavagWE0

まもなく10月だが、Windows11とかCPUとかどうでもいい

TPMなんか無くても何ら問題ない

0443名無しさん＠ピンキー (ﾜｯﾁｮｲ fb07-XBLx)

2025/09/23(火) 07:46:08.73ID:Wf25WXgH0

Sandyおじさん「まだ・・・・・・戦える」

0444名無しさん＠ピンキー (ﾜｯﾁｮｲ f7fb-5nxf)

2025/09/23(火) 09:25:22.55ID:bSvVK3GU0

Qwen明日またモデル出るっぽいな
ミニサイズで性能良かったら嬉しいが、

0445名無しさん＠ピンキー (ﾜｯﾁｮｲ 2249-YdyK)

2025/09/23(火) 14:14:46.14ID:J/x1dQw60

Qwenのリリース速度はすごいな
さすがアリババ
クラウドサービス持ってるところは強い

0446名無しさん＠ピンキー (ﾜｯﾁｮｲ f3a4-KxXW)

2025/09/24(水) 06:28:25.56ID:Tg8zlyhV0

>>424
人類が意味と価値を見出せるパターンが文章より圧倒的に少ない
ローカルで動いてる画像生成なんて裸の女の子ドーン！みたいな似たような絵しか出ないやろ
それに自然言語で色々出せるモデルはそろそろローカルじゃキツくなってきてるころや

0447名無しさん＠ピンキー (ﾜｯﾁｮｲ db8e-fBkI)

2025/09/24(水) 12:35:38.81ID:PYQ60cU40

エロ小説をLMstudio君に生成させてみたいんだけどどのモデルがいいのかね？
さすがにgptモデルじゃ無理でした…

0448名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sdb2-0UjF)

2025/09/24(水) 12:42:07.18ID:l8hRk/lgd

>>447
https://huggingface.co/huihui-ai/models?sort=downloads#repos

0449名無しさん＠ピンキー (ﾜｯﾁｮｲ db8e-fBkI)

2025/09/24(水) 17:44:39.49ID:PYQ60cU40

>>448
おほーサンクス
家に帰ってみたら早速実装してみます

0450名無しさん＠ピンキー (ﾜｯﾁｮｲ 72ec-iuAP)

2025/09/24(水) 17:49:04.04ID:q/lnB44d0

オナテク板で真面目なLLM性能も議論してるから教えて欲しいんやが
コード添付して色々教えてもらうのってどのモデルがええんや？
GPTやと1つのphpコードであれこれ入門的な説明してもらってるときに
「添付があるからこれ以上続行すらさせへんで」になるからLLMでやりたいんや

0451名無しさん＠ピンキー (ﾜｯﾁｮｲ 7232-QENU)

2025/09/24(水) 17:54:58.36ID:gl5NAfdi0

codingとか名前付いてるやつかgpt-ossでいいんじゃない
でもクラウドモデルのが圧倒的にいいからgpt以外も試してみるべきかな

0452名無しさん＠ピンキー (ﾜｯﾁｮｲ f26b-YdyK)

2025/09/24(水) 18:06:27.43ID:EqE2QH2E0

codex使えば？

0453名無しさん＠ピンキー (ﾌﾞｰｲﾓ MM92-QGC9)

2025/09/24(水) 18:08:51.17ID:wQMvlyu2M

コーディングだとclaudeが強いって前に評判だったけど最新の情勢は違うのかもしれん
ローカルだとそもそもコンテキストサイズ的に満足行く回答が得られるか怪しいと思うで

0454名無しさん＠ピンキー (ﾜｯﾁｮｲ 7232-QENU)

2025/09/24(水) 18:11:18.89ID:gl5NAfdi0

claude安定なのはそうだけど添付で怒られるってので勝手に無料想定して外してたわ

0455名無しさん＠ピンキー (ﾜｯﾁｮｲ 72ec-iuAP)

2025/09/24(水) 18:17:46.93ID:q/lnB44d0

>>451-453
サンガツ
添付が無かったらワイのつたない質問でも永遠に相手してくれるんやが
100行のPHPコードだけでもすぐに「このスレッドには添付があるからこれ以上は質問すらさせへんで」になるのが無料やから仕方ないんよな

0456名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sdb2-0UjF)

2025/09/24(水) 18:22:03.89ID:l8hRk/lgd

コーディングはエロ小説と違って間違いが一つでもあると動かないからローカルLLMではまだ厳しい
Qwen3-Coder-480B-A35B-Instructでも微妙だった

0457名無しさん＠ピンキー (ﾜｯﾁｮｲ 1f81-gFLl)

2025/09/24(水) 18:55:55.40ID:ARkRWnqL0

どうしてもローカルがいいならgpt-oss 20B/120Bかqwen3 coder試してみて、ダメだったらcodexとかclaude codeにいくしかないと思うで
強めのグラボ積んでるならLM StudioでGPU offloadを最大にしてflash attensionを有効にすればワイの環境ならgpt-oss 120Bで140tok/sec出てるで
長めの文章読み込めるようにcontext lengthをそのモデルの最大(gpt-ossなら13万)にするか、遅くならない程度の値にしておくんやで

0458名無しさん＠ピンキー (ﾜｯﾁｮｲ bffd-pB+b)

2025/09/24(水) 18:56:33.04ID:gh85Ul4x0

コードを扱うならどこのAIでも良いので大人しく課金した方が良い
仕事でバリバリ使ってない限り20$の一番安いプランで、
チャットでもCLIでもまず制限には当たらない

0459名無しさん＠ピンキー (ﾜｯﾁｮｲ 1f81-gFLl)

2025/09/24(水) 18:56:50.60ID:ARkRWnqL0

↑gpt-oss 20Bで140tok/sec出てるでの間違いや
120Bで140tok/sec出るモンスターPCほしいわ

0460名無しさん＠ピンキー (ﾜｯﾁｮｲ d2bb-gFLl)

2025/09/24(水) 18:58:19.78ID:/Sudpaw60

ai studioでいいのでは？
あそこ制限ないぞ

0461名無しさん＠ピンキー (ﾜｯﾁｮｲ 72ec-iuAP)

2025/09/24(水) 19:03:54.92ID:q/lnB44d0

>>456-458
それでご飯食べてるわけではなくて初学者で
まれにファイル添付して全体的な質問をする時があるくらいやからその時はローカルでと思ったんやが
codeがついているモデルで添付OKなモデルでやってみるやで

0462名無しさん＠ピンキー (ﾜｯﾁｮｲ bf06-/zn3)

2025/09/24(水) 19:09:04.54ID:w2HZ4JhN0

動かなかったら直せばええ

0463名無しさん＠ピンキー (ﾜｯﾁｮｲ 9320-VUrW)

2025/09/24(水) 19:44:20.87ID:ZtGaaXzi0

試行錯誤の時間のほうがコスト高い
ノールックでChatGPT契約して

0464名無しさん＠ピンキー (ﾜｯﾁｮｲ 9320-VUrW)

2025/09/24(水) 19:47:13.41ID:ZtGaaXzi0

なんも考えずにChatGPT契約して使い倒してから続けるか止めるか考えればいい
ローカルLLMは日本語でやりとりすることによる性能ロスが大きすぎるから殆どの用途で使い物にならん
英語ネイティブですというなら違う可能性はあるけど

0465名無しさん＠ピンキー (ﾜｯﾁｮｲ 1f81-gFLl)

2025/09/24(水) 22:16:39.94ID:ARkRWnqL0

ChatGPTの契約はもう必須と捉えてるからコストとして考えてないわ

0466名無しさん＠ピンキー (ﾜｯﾁｮｲ c74a-QGC9)

2025/09/25(木) 00:14:40.76ID:s66GNXV70

確かにガソリン代みたいなとこはある

0467名無しさん＠ピンキー (ﾜｯﾁｮｲ f7b6-/zn3)

2025/09/25(木) 06:53:11.82ID:Z3kA1xHf0

ワイも必須になりつつある
毎日の食事カロリー計算から運動のリマインダー、
あとマイコンボードでのデバイス制作とめちゃ助かってる
（肝心な部分はredditの海外ニキらのコメントだが）

でもローカルLLMはロマンはあるンゴね

0468名無しさん＠ピンキー (ﾜｯﾁｮｲ be05-AIfB)

2025/09/25(木) 21:49:20.04ID:d920FlUw0

日本語が下手なので使いこなすのも何気にエネルギー要るのはワイだけか

0469名無しさん＠ピンキー (JP 0H6e-MM1T)

2025/09/25(木) 21:55:28.51ID:apj1zCrgH

カロリーは脳ミソでもかなり消費するはずだから
エネルギーが要るというのは間違ってはないと思う
お堅い文面でもLLMにぶち込むモノでも頭はけっこう使うし

0470名無しさん＠ピンキー (ﾜｯﾁｮｲ f3f5-h6sN)

2025/09/25(木) 21:55:47.21ID:XUPSdIh90

>>468
プロンプトの書き方も使いこなし方もAIに聞いてお勉強するんや

新着レスの表示

レスを投稿する