なんJLLM部避難所 ★10

1002コメント393KB

なんJLLM部避難所 ★10

■ このスレッドは過去ログ倉庫に格納されています

0001名無しさん＠ピンキー転載ダメ (ﾜｯﾁｮｲ dfc7-Jvli)

2025/11/23(日) 22:55:29.17ID:kt2SGedd0

!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512

AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所 ★8
https://mercury.bbspink.com/test/read.cgi/onatech/1746883112/
なんJLLM部避難所 ★9
https://mercury.bbspink.com/test/read.cgi/onatech/1755924738/

VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured

0343名無しさん＠ピンキー (ﾜｯﾁｮｲ 72c7-lorD)

2025/12/16(火) 12:37:58.89ID:6N5ldNhF0

Nemotron 3 Nanoはもう試せるの？
NVIDIA製のやつ？
というか知らんかったw

0344名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sd12-9DM+)

2025/12/16(火) 13:50:22.49ID:iC+YmZrid

>>342
実装完了したら教えてね

0345名無しさん＠ピンキー (ﾜｯﾁｮｲ 36a9-z5HT)

2025/12/16(火) 14:31:15.36ID:YLOPA8Ta0

動くまでの実装は完了しとるから上のPRのブランチでビルドすれば動かせるで

0346名無しさん＠ピンキー (ﾜｯﾁｮｲ 3732-9rD2)

2025/12/16(火) 14:48:29.52ID:1Zg1Wdsu0

Nemotron 3 NanoはOpenRouterでfreeで使えるぞ
でもものすごい長考するし出力も暴れるしでチャットするのには苦労しそうな感じだ

0347名無しさん＠ピンキー (ﾜｯﾁｮｲ 3732-9rD2)

2025/12/16(火) 14:57:03.34ID:1Zg1Wdsu0

ユーザー「AI、今週末に新しく出来たピザ屋さんに行かない？」
AI「新しいピザ屋さん！？わくわくするわね～！ユーザーは何を頼むのかな？今度、週末に行こうよ！ 🍕」

これだけのやりとりをするのに8000トークンも思考する
まあチャットやロールプレイング用のモデルじゃないから仕方ないんだろうけど

0348名無しさん＠ピンキー (ﾜｯﾁｮｲ 87e8-DAEx)

2025/12/16(火) 15:20:49.17ID:I8CXFDR50

>>344
コミットされたで（はやい）

0349名無しさん＠ピンキー (ﾜｯﾁｮｲ 5224-I8Ki)

2025/12/16(火) 15:55:55.06ID:hw7FBFqM0

ピザ屋へのお誘いで8000トークンは草
ローカルLLMやるようになってから人間がいちいち「ありがとう」とか言うせいで莫大な計算力が浪費されてるって話の重大さが理解できるようになったわ
理解できるようになっても辞めんけどな

0350名無しさん＠ピンキー (ﾜｯﾁｮｲ 8748-elKO)

2025/12/16(火) 15:56:50.50ID:i7w/eNA/0

トークン数≒コンテキスト長だっけ？
そのペースなら一応答で前の記憶どんどん消えてくな

0351名無しさん＠ピンキー (ﾜｯﾁｮｲ 36a9-z5HT)

2025/12/16(火) 17:03:42.93ID:YLOPA8Ta0

リーズニングの部分ってコンテキストには含めてないんとちゃうかな
アプリ側の実装によるとは思うねんけど

0352名無しさん＠ピンキー (ﾜｯﾁｮｲ 72c7-lorD)

2025/12/16(火) 17:47:15.86ID:6N5ldNhF0

LM Studioだとリーズニングも含めてたような
アプリによるんだろうね

0353名無しさん＠ピンキー (ﾜｯﾁｮｲ 72c7-lorD)

2025/12/16(火) 18:01:33.89ID:6N5ldNhF0

ビジョンモデルのGLM4.6V試してるんだけど4.5Vとそんなに違いは感じないような気がする
ただ、小さいモデルの9BFlashが意外とすごい
それなりにオブジェクトを認識しているし、日本語の表現も自然。英語で返してくることも多いけどね
OCRはちょっと弱いけど割と日本語も認識する
使う場面によっては実用的かも？

後は新たに追加されたツール呼び出しだな
vLLMは性能がいいので使ってるんだけどThinkingとツール呼び出しの併用が出来ないっぽい・・・
Thinking有り無しで結構、得られる情報量が違うから惜しいな
もうちょっと調べてみるけど

0354名無しさん＠ピンキー (ﾜｯﾁｮｲ 87b8-D2pJ)

2025/12/16(火) 20:12:41.28ID:+e/A/7mx0

nVidia から新しいモデル
nvidia/NVIDIA-Nemotron-3-Nano-30B-A3B-BF16

0355名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b49-r+g0)

2025/12/16(火) 22:23:31.58ID:quQmhDAk0

昨今はベンチ項目が軒並みコーディング小説エージェントだから小説向きモデルがあるのかすら分からんな

0356名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b49-r+g0)

2025/12/16(火) 22:33:26.03ID:quQmhDAk0

ミスった　コーディング・数学・エージェントね
小説向けのベンチはEQBenchぐらいだけどあんまりリーダーボードにモデル追加されないんよな

0357名無しさん＠ピンキー (ﾜｯﾁｮｲ 3e27-A5rm)

2025/12/16(火) 22:39:07.15ID:70w/DKgZ0

コーディングは与えられた問題を解決できるかで客観的に評価できるけど
小説の評価ってどうやるんだ

0358名無しさん＠ピンキー (ﾜｯﾁｮｲ 5224-I8Ki)

2025/12/16(火) 22:49:07.37ID:hw7FBFqM0

小説みたいないわゆるアートとか対人の受け答えは数値で評価できんから今の世の中ではAIに限らず軽視されがちやな

0359名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b49-r+g0)

2025/12/16(火) 22:50:11.17ID:quQmhDAk0

>>357 例えばこんな感じ
https://eqbench.com/about.html#creative-writing-v3
結局は外部のLLMに評価基準与えて採点させてるんだからコーディングもライティングも変わらんで

0360名無しさん＠ピンキー (ﾜｯﾁｮｲ b6a0-A5rm)

2025/12/17(水) 08:12:48.81ID:3Qb5xfU80

Stable DiffusionやってるとAIというより
モデルを作った人がどんな学習をさせたかを逆に想像しながら作っていく。
そしてそれが一致した時にほしい絵柄が得られる。
ほしい絵柄が生成された時が快感だ

0361名無しさん＠ピンキー (ﾜｯﾁｮｲ b6a0-A5rm)

2025/12/17(水) 08:14:53.57ID:3Qb5xfU80

Stable Diffusionのプロンプトを作るのにGrok先生とレスバをしながら思考を繰り返す日々

0362名無しさん＠ピンキー (ﾜｯﾁｮｲ 722d-zBTM)

2025/12/17(水) 08:38:09.06ID:/pkrHNq40

shisa2.1 14Bあれからも色々パラメータ調整しながら試してるんやが微妙に会話力弱いのかも？
これどんな匂い？って聞いても無視して話を進めようとしたり
なんなんやろなこれ
昔の7Bでもちゃんと答えるようなことが出来てなかったりするわ

0363名無しさん＠ピンキー (ﾜｯﾁｮｲ b6a0-A5rm)

2025/12/17(水) 09:41:01.54ID:3Qb5xfU80

さくらインターネットさぁ70Bとか個人でできるじゃん。300B以上でやってよ
AIスパコン「さくらONE」で挑むLLM・HPCベンチマーク (1) MLPerf Llama 2 70Bファインチューニング性能検証
https://knowledge.sakura.ad.jp/48233/

0364名無しさん＠ピンキー (ﾜｯﾁｮｲ 1bc6-r+g0)

2025/12/17(水) 09:55:29.35ID:w5cKB6em0

OpenRouterにMistral Small Creativeなるモデルが出たらしいけど試した人居る？
>Mistral Small Creative は、クリエイティブライティング、物語生成、ロールプレイ、キャラクター主導の対話、汎用的な指示の追跡、会話エージェント向けに設計された実験的な小型モデルです。
との事でちょっと期待している

0365名無しさん＠ピンキー (ﾜｯﾁｮｲ 32ac-DAEx)

2025/12/17(水) 11:27:24.59ID:SvtpxmAx0

4090で普通に動く
・エロ規制ありで優秀なモデル
・コーディングに強いモデル
・エロ規制なしの優秀なモデル
これらの用途におすすめモデルってどんなのがある
あと、初めて使うなら、どんな環境(Ollama？)も教えて貰えるとありがたい

0366名無しさん＠ピンキー (ﾜｯﾁｮｲ 1bc6-eccJ)

2025/12/17(水) 11:52:52.32ID:w5cKB6em0

>>365
環境はWindowsならLM Studio使うのが楽でオススメ
エロ用途ならMistral-Small-24Bかこいつをベースにしたモデルが個人的には好み
エロかつ画像認識対応ならQwen3-VLの30BA3Bのabliterated版が良いかと

でも最終的には自分の好みとかあるから片っ端からダウンロードして試すのが一番だよ

0367名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr97-QUL1)

2025/12/17(水) 12:31:07.33ID:dh3d3zpIr

同じモデルの同じsafetensorを使ってもollamaよりLM studioの方がエロにゆるい気がしないでもない…
実装が違うからなんだろうか

0368名無しさん＠ピンキー (ﾜｯﾁｮｲ 72bf-zBTM)

2025/12/17(水) 12:59:04.62ID:/pkrHNq40

前もそんな風なこと言ってる人いたね
同じ規制解除版使ってるのにollamaとLM studioだと申し訳食らってkoboldcppだとエロいけた、だったっけか？
どこで差が出来るんだろ
デフォのシステムプロンプトとか？

0369名無しさん＠ピンキー (ﾜｯﾁｮｲ 72bb-KIjk)

2025/12/17(水) 14:39:55.92ID:/jx/zd8d0

初心者で最近ローカルLLMを触り始めた
NeverSleep/Lumimaid-v0.2-12B (12B)GGUF版、ollamaでエロ小説を書かせたら動作は遅いのはともかく、セリフの整合性、語彙力、表現力が全然だわ
これってプロンプトが悪いのかPCスペックが悪いのか12Bっていう量子化されてるやつを使ってるから微妙なのか何が原因なんだろ
3060ti VRAM 8GB、メインメモリ32GBの弱小スペックにおすすめのモデルってある？
素直にGrok使っておけっていうのは最もなんだけどやっぱりGrokやGPTに近いような小説をローカルでやってみたいんよ

0370名無しさん＠ピンキー (ﾜｯﾁｮｲ 32c7-DAEx)

2025/12/17(水) 14:44:12.41ID:SvtpxmAx0

ありがとう！！！
はじめの取っ掛かりが掴めずに居たから助かる

0371名無しさん＠ピンキー (ﾜｯﾁｮｲ 3732-9rD2)

2025/12/17(水) 15:33:00.83ID:C1S990uQ0

>>369
初心者ならプロンプトの問題もかなりあるだろうけど、モデルの性能自体が低いからどうやってもGrokに近づくことはできない
GrokやGPTみたいなトップクラスのモデルと比べたらあかん
7B～12Bぐらいのモデルは変な日本語や整合性の悪さ、コンテキストウィンドウの小ささを受け入れた上で遊ぶんだよ

0372名無しさん＠ピンキー (ﾜｯﾁｮｲ ef32-A5rm)

2025/12/17(水) 21:14:26.31ID:xM+RNAtv0

>>369
ローカルでエロ小説やりたいなら、旧mistral-large系一択
日本語ならamaterasuとかmagnum
123Gあってmoeじゃないからクソ遅いけどビンビンにくるぞｗ

0373名無しさん＠ピンキー (ﾜｯﾁｮｲ 8760-7UIs)

2025/12/18(木) 02:03:41.26ID:2awyAXmF0

ローカルで何するにもPC高騰で冬の時代に
でもここは震源に近いから強く言えん所はある
PCゲーマーとしてはマイニングブームが終わったら次はAIブームでまたかよって文句言いたいけど

0374名無しさん＠ピンキー (ﾜｯﾁｮｲ 72c7-lorD)

2025/12/18(木) 02:38:49.00ID:d/GwtOZZ0

llama.cppがGLM4.6Vに対応したみたいだぞ
LM StudioでもVisionは有効ですと出てるから動かせそうだ

0375名無しさん＠ピンキー (ｼｬﾁｰｸ 0C13-Toi2)

2025/12/18(木) 07:53:52.78ID:afV40DvKC

マルチモーダル系のモデルの規制解除版の説明に規制解除はテキストのみで画像部分は解除されてないってよく書いてるけど
あれってどうゆう事？
画像生成するわけでもないし、出力のテキストが規制なかったらいいんじゃないの？

0376名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr97-HgNt)

2025/12/18(木) 10:36:43.02ID:Tn5rBGrSr

>>363
国内企業はドコモ国内のアホを騙せればいいと思っていい加減な商売してる

0377名無しさん＠ピンキー (ﾜｯﾁｮｲ 3e2e-c5sb)

2025/12/18(木) 11:09:02.03ID:wV9BfonF0

>>375
学習データからエロ関連を弾いてるからそもそもモデルが認識できないとか？
それか画像認識の中にエロ判定層みたいなのがあるけど回避する手段が見つかってないとかじゃない？

0378名無しさん＠ピンキー (ﾜｯﾁｮｲ 72b0-5Jjh)

2025/12/18(木) 11:31:24.56ID:9swORTeL0

VLMって通常のLLMにビジョン用機構を増設しているだけという事が多いから規制解除時にLLMの重みだけを対象に変更したってだけじゃない？
ビジョン用機構は画像入力を受け付けるから別の処理しないといけなくて、最適化ライブラリでも対象外なこと多いし

0379名無しさん＠ピンキー (ﾜｯﾁｮｲ b6a0-A5rm)

2025/12/19(金) 06:10:31.93ID:yIRDbP130

世の中おかしくなってきたな、メモリ高騰のせいで
原価が高騰してパソコン売れなくなってパソコン屋がピンチになっている。

0380名無しさん＠ピンキー (ﾜｯﾁｮｲ b6a0-A5rm)

2025/12/19(金) 06:34:24.28ID:yIRDbP130

この流れだと来年はDDR3の復権が流行るんじゃね

0381名無しさん＠ピンキー (ﾜｯﾁｮｲ 32ac-DAEx)

2025/12/19(金) 15:06:20.82ID:3xMkD4GE0

このまま価格が高騰したら、128MBで十分早く動いていたような軽量OSが開発されると信じてる
そして、これをエッジPCとしてクラウドのPCを使うイメージ

0382名無しさん＠ピンキー (ﾜｯﾁｮｲ b6a0-A5rm)

2025/12/19(金) 15:23:58.06ID:yIRDbP130

NVIDIAが4割減産って本末転倒すぎる。

0383名無しさん＠ピンキー (ﾜｯﾁｮｲ 32c7-DAEx)

2025/12/19(金) 15:30:49.78ID:3xMkD4GE0

しかし、パソコンが今の数倍になると
Jailbreakしたようなモデルの開発は恐ろしく停滞しそうだな
開発者も利用者も環境を用意できない
中国企業とかGPUチップを作ってると聞くし開発が気になってくる

0384名無しさん＠ピンキー (ｱｳｱｳｳｰ Sad3-A5rm)

2025/12/19(金) 16:20:36.38ID:D2OuqAG7a

早めにパソコン更新決断しといてよかったな
年末に画像生成にはまって部品揃えて５０７０ti買えたのが３月
今欲しくなってたら大変だったな

0385名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa9-s35p)

2025/12/20(土) 01:14:58.34ID:iiBBMiVS0

期待されてた新しいGemmaはGemma Scope 2なんか？

0386名無しさん＠ピンキー (ﾜｯﾁｮｲ 3ff8-xjV2)

2025/12/20(土) 04:24:34.54ID:lzs6gmi+0

GLM 4.7がもうすぐ来そう

0387名無しさん＠ピンキー (ｼｬﾁｰｸ 0C97-Fga2)

2025/12/20(土) 10:09:41.43ID:VwtsKzj/C

mistral large 123b を日本語エロファインチューンかけるにはメモリ256Gでも足りないかな？
aratakoさんはwebレンタルでやってるんだろか

0388名無しさん＠ピンキー (ﾜｯﾁｮｲ 7f64-ldFF)

2025/12/20(土) 13:28:36.94ID:AF+/v0mG0

DRAMでFTなんぞやってたら何週間かかるか分かったもんじゃないからVRAM一択
https://docs.unsloth.ai/get-started/fine-tuning-for-beginners/unsloth-requirements
もちろんローカルでやる奴はいないから鯖借りる

0389名無しさん＠ピンキー (ﾜｯﾁｮｲ e32d-xuds)

2025/12/21(日) 06:16:19.96ID:4QmB8GeU0

5090+96GB RAMだと今どのモデルがコーディングに良いでしょうか？

0390名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sd5f-iM94)

2025/12/21(日) 06:34:45.92ID:P3/dnoG4d

>>389
Opus

0391名無しさん＠ピンキー (ｵｲｺﾗﾐﾈｵ MM37-dPjQ)

2025/12/21(日) 11:26:48.79ID:uX1scsJsM

企業や学生さんが新しいパソコン買えずに困ってるのに、くだらん用途にたんまりリソース割り当ててる非国民のスレはここですか？

0392名無しさん＠ピンキー (ﾜｯﾁｮｲ 8f87-TclW)

2025/12/21(日) 12:43:52.89ID:adZUKwHi0

愛国者が国にパソコンを献上する制度があれば皆喜んで差し出しますよ

0393名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa9-s35p)

2025/12/21(日) 12:52:04.59ID:rMc6GAvW0

まだ完成品のPCは値上げしとらんからもう今が本当に最後のチャンスやぞ
1月から値上げ予告してるところある

0394名無しさん＠ピンキー (ﾜｯﾁｮｲ 5332-s35p)

2025/12/21(日) 17:22:29.61ID:CQfjHatX0

震災を経験した世代は「買えるときに買わない奴が悪い」という資本主義を嫌というほど理解してる
情弱ノロマは誰も助けてくれない

0395名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fc7-rc7o)

2025/12/21(日) 18:25:02.43ID:B6/89BpV0

>>394
詳しく
神戸や東北の報道を見る限り、みんな助け合ってた風景しか知らない

0396名無しさん＠ピンキー (ﾜｯﾁｮｲ 834a-rc7o)

2025/12/21(日) 18:27:26.47ID:EYenuooH0

震災直後の買い占めじゃない？
コンビニもスーパーも商品なんにもなくなったじゃない

0397名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa9-oKN0)

2025/12/22(月) 00:47:00.35ID:gWAF2loy0

nemotoron100bはよ出してくれんかな
休みに入る前に出して欲しいんやが

0398名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fc7-rc7o)

2025/12/22(月) 01:16:54.22ID:ZkZbvAII0

とりあえず、5090在庫ありだったからポチってしまった
納期未定ばかり見ていたから買ってしまった
今更だけど、LLMするにはどんなPC作ればLLMが5090の性能をしっかり引き出して動く？

最悪は今持ってるPC(4年型落ちだが128GB積んでる)とGPUと差し替えるつもりだけど
可能なら今風のPCを1台作ってやりたい、もしくはメモリや本体そのものをオクで買ってケチりたい

>>396
そういえば、混乱期は酷かったっぽいな

0399名無しさん＠ピンキー (ﾜｯﾁｮｲ 7f67-+S0n)

2025/12/22(月) 07:39:36.14ID:sURJg28A0

まずマイニング用のフレームと1200Wの電源を用意します。

0400名無しさん＠ピンキー (ﾜｯﾁｮｲ 7f67-+S0n)

2025/12/22(月) 07:44:01.39ID:sURJg28A0

ライザーカードに挿せる限りのGPUを付けます。

0401名無しさん＠ピンキー (ﾜｯﾁｮｲ 7f67-+S0n)

2025/12/22(月) 07:46:12.61ID:sURJg28A0

後は電力と騒音と排熱との戦い

0402名無しさん＠ピンキー (ﾜｯﾁｮｲ a36a-9NV1)

2025/12/22(月) 10:19:08.68ID:XF+zaIuH0

欲しい時が買い時
買える時に買うのが正解です

0403名無しさん＠ピンキー (ﾜｯﾁｮｲ 3ff2-ZCHH)

2025/12/22(月) 10:36:20.80ID:7WEznTFd0

グラボ複数でVRAMを盛りましょう
盛れないなら妥協でメインメモリ盛りましょう
こんだけだよね、LLM用のPCって

0404名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f32-sTpE)

2025/12/22(月) 10:38:12.14ID:3kTALSsa0

32gbカード一枚だと微妙に選択肢広がらないんだよな

0405名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-s35p)

2025/12/22(月) 10:49:32.48ID:v29qw+6w0

早いGPUは処理早いけど、LLMの場合、戦いはVRAM数だから
Stable Diffusionで早いGPUは意味が出てくる

0406名無しさん＠ピンキー (ﾜｯﾁｮｲ b323-Ky+w)

2025/12/22(月) 10:56:40.31ID:7F5UFXYj0

ソフト面が多様になるのが一番ありがたいんだけどまあ難しいわな

0407名無しさん＠ピンキー (ﾜｯﾁｮｲ 8f0f-0si7)

2025/12/22(月) 13:51:33.79ID:/SPL55EJ0

Blackwell凄いアピールの時に使われたfp4はどうなったんだよ

0408名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa9-s35p)

2025/12/22(月) 14:28:53.46ID:gWAF2loy0

vllmはもう対応しとるみたい
llama.cppは2週間前にようやっとPR立ったみたいやね
まだ未マージ
https://github.com/ggml-org/llama.cpp/pull/17906

0409名無しさん＠ピンキー (ﾜｯﾁｮｲ 5332-s35p)

2025/12/22(月) 15:32:02.81ID:KaFwJnb80

>>398
変換コネクタは使うなよ(;´Д｀)

５０万以下では来年買えそうにないから同じく買った

0410名無しさん＠ピンキー (ﾜｯﾁｮｲ 5332-s35p)

2025/12/22(月) 16:54:41.95ID:KaFwJnb80

>>301
Q5K_M以上も出してくれたんで試したが、たしかにQ4より出来はいいな
だが、なんというか意識高い系っていうか、エロなのになんか上品な小説に持っていこうとする傾向あるな
整合性についはもう一歩欲しい

0411名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sd5f-iM94)

2025/12/22(月) 18:48:04.06ID:3IAyEDiWd

>>410
他所でも書いたが下品なエロを学習してないから話がどんどん脇道に反れる
中華モデルで顕著に見られる傾向

特にQwen系はすぐSFやメカ展開に持っていきたがるからプロンプトで明示的に抑制する必要がある

下品なエロや隠語をGrokあたりから抜いてプロンプト、LoRA、FTで移植しないと俺らが望むエロモデルにはならない

0412名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fc7-rc7o)

2025/12/22(月) 19:56:53.84ID:ZkZbvAII0

>>409
PL80で使うから大丈夫だと思ってたけど、不安になったから
電源使い回し(コルセア9年目)でHDD沢山積んでるから、
Thermaltake PS-TPD-1200FNFAPJ-L
をポチってみた(AIに聞いたらこれすごく推してきた)
ただ4090ではGPU付属の変換コネクタ使ってるわ　4090も結構まずかったんだろうか

>>399-401
Define使ってるけどサイドを開けて空気清浄機の風当てようかと思ってる
ライザーカードに乗せるのかなり良さそうだね　もう1台買おうかと思ったけど5090の在庫がなくってよかった
とりあえず、冷静になって、まずはローカルLLMの性能を使ってみた考えようと思う

あと、ちょびっツじゃないけど、AIを自宅で育てるというかいい感じに改良できないんだろうか？
最近、国分寺稔くんをやたらと思い出す　あとKOTOも
ただレイアースの方が遥かに有名みたいでこのSFアニメしてる人が少ないっぽく残念

特に、最近Geminiの品質が向上しすぎてシステム無駄になりそうで不安ある
SDのエロLoRA素材(顔を赤らめてとか怒ってるとか作らせてる)作らせてるけどエロが無理だから素材だけどかなりいいものができてるわ
というかこれnswfで動かしたいがいつになったらローカルで使えるのやら
あとLLM、科学、経済など大学の教官並に詳しくて驚く、これいつになったらローカルで使えるのやら？

0413名無しさん＠ピンキー (ﾜｯﾁｮｲ 5332-s35p)

2025/12/22(月) 21:03:39.87ID:WaudJre70

追加学習は要求スペックと難易度が高いから海外勢も諦めムード
それに今はDenseモデルを弄るよりMoEモデルをそのまま使う方がいい結果になりやすい

0414名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fb6-zXIm)

2025/12/22(月) 21:49:07.62ID:OMjUm8Lu0

知識（語彙も含む）の追加は学習で最も面倒でLoRAでは無理って言われてるね　
だから海外のRPモデルは最初からそっちの知識が豊富なmistral smallとかnemoをベースにしてる

0415名無しさん＠ピンキー (ﾜｯﾁｮｲ ef7c-PVG4)

2025/12/23(火) 07:30:07.43ID:yRRcBOzn0

koboldcppにKVキャッシュやレイヤー枚数などを自動で調整して
メモリ割り当てしてくれる機能が追加されたんですね

0416名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f93-fMZT)

2025/12/23(火) 07:43:32.88ID:nDZDWBRS0

GLM4.7来たね
ベンチマークだとGPT5.1くらいのスコアしてる

0417名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa9-RgzM)

2025/12/23(火) 09:30:11.60ID:6o9rYbEn0

GLM4.7、倫理規制厳しくなっていて泣いた

0418名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa9-oKN0)

2025/12/23(火) 10:33:52.11ID:tnOvr0+U0

4.7はツールコーリングとかマルチモーダルとか、言語以外の部分の強化をしたみたいやな

0419名無しさん＠ピンキー (ｻｻｸｯﾃﾛﾗ Sp77-Fga2)

2025/12/23(火) 11:01:33.80ID:eLl8Z+b5p

>>417
ローカルでも？

0420名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f61-RgzM)

2025/12/23(火) 11:40:29.62ID:gx75EdUN0

>>419
ローカルじゃないがChutesていうOpenAI互換プロバイダのAPIから使ってみた
多分入力の検閲はやってないとこのはず

0421名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fc7-SDhK)

2025/12/23(火) 12:02:17.18ID:Gw5AHzAS0

GLM4.7がGPT5.1クラス...だと？

0422名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sd5f-iM94)

2025/12/23(火) 13:11:34.25ID:qK/zAGQ1d

ローカルLLMもエロ規制が厳しくなって
過去モデルがオーパーツになったりするんやろか

0423名無しさん＠ピンキー (ｻｻｸｯﾃﾛﾗ Sp77-Fga2)

2025/12/23(火) 13:16:27.48ID:nHAN9AQpp

GLM4.7 Q5k_m
メモリ256Gに乗るかな？
使ってるニキいない？

0424名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa9-oKN0)

2025/12/23(火) 13:39:22.81ID:tnOvr0+U0

>>408
これそろそろマージされそうやけど、これを機能させるには
mxfp4なgguf使う必要あるんやろか
2～3割高速化するようやがQ4よりは精度は落ちるんやろかね

0425名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f32-sTpE)

2025/12/23(火) 16:11:11.69ID:ZmvOXIE40

>>423
使ってはないけどQ5kmは254GBモデルなので256GB環境に乗せるのは無理だ

0426名無しさん＠ピンキー (ﾜｯﾁｮｲ 5332-s35p)

2025/12/23(火) 17:32:55.99ID:/088yPv10

>>422
すでにQwQ-32Bがオーパーツ化しつつあるわ
Qwen3-32Bは微妙に日本語性能が落ちてるし
他の32B以下モデルもQwQを超える日本語性能は出せてないように思う

0427名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fc7-SDhK)

2025/12/23(火) 17:43:35.73ID:Gw5AHzAS0

>>425
そりゃメモリだけなら無理だけど、GPUも動かすなら多分いけると思うで

0428名無しさん＠ピンキー (ﾜｯﾁｮｲ a36a-rh7x)

2025/12/23(火) 17:57:18.41ID:qshlcN+k0

>>416
ソース

0429名無しさん＠ピンキー (ﾜｯﾁｮｲ ef04-XkZH)

2025/12/23(火) 20:24:52.15ID:j8PFql5i0

このスレ民の評価ってどういう基準なの？
自分は動画生成用のプロンプト推論に使ってるので
ストーリー性は求めるがセリフは求めないって感じ
あとVRAM溢れさせるのがデフォな使い方しとるんか？
メインメモリで推論させてテキストで重厚なストーリー出力って感じ？

0430名無しさん＠ピンキー (ﾜｯﾁｮｲ 5332-s35p)

2025/12/23(火) 21:09:09.15ID:/088yPv10

>>429
俺は日本語で自然なやり取りができるとか、複雑なプロンプトの理解力を見てるな
小説はほとんど読まない書かないから良し悪しがよくわからない

0431名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fc7-SDhK)

2025/12/23(火) 21:42:25.92ID:Gw5AHzAS0

>>423
ダウンロードしたら254GBあったけど、メモリ256GBでも普通に載ったわ
スワップなしでいけてる
ちなGLM4.7 Q5_K_XL

0432名無しさん＠ピンキー (ﾜｯﾁｮｲ 939c-AnvC)

2025/12/23(火) 21:53:59.17ID:WT+0/B0C0

GLM-4.7のUD-IQ1_S試したけど流石に質の低下が厳しくて実用は無理だな
でも素の日本語能力は高そう

0433名無しさん＠ピンキー (ﾜｯﾁｮｲ cf36-rc7o)

2025/12/23(火) 23:44:49.83ID:s0lGjMWv0

RTX6000とRTX5090はVRAMの量が全然違うのに処理速度はあまり違わないと聞いたけど
それなら1つのマザボにRTX6000x1にするよりもRTX5090x2にした方が処理速度は速いということで合ってる？
LLMの推論とかWanの動画の生成速度が倍近く速くなるならVRAMが少なくても後者の方が利点あるかなと思ったんだけど
最近の欠品状態で買えるかどうかは別として

0434名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa9-oKN0)

2025/12/24(水) 00:54:25.02ID:jYiV1MBq0

マルチGPUを並列に動作させて高速に、っていうのはnvlinkがあるならまだしもただのpcieだけやと難しいみたいやで

0435名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f93-fMZT)

2025/12/24(水) 01:19:17.31ID:oW+19dlF0

MiniMaxも新しいモデル来てるな

0436名無しさん＠ピンキー (ﾜｯﾁｮｲ 7332-s35p)

2025/12/24(水) 02:55:23.28ID:12j5rJkL0

テンソル並列で動かせればPCIe5.0のx8接続の2台でも1.8倍以上は出るよ
llama.cppよりはvLLMやik_llama.cppを使うのがいいけど

0437名無しさん＠ピンキー (ｼｬﾁｰｸ 0C97-Fga2)

2025/12/24(水) 07:54:13.13ID:QIkAw9r0C

>>431
おおいいね
コンテキストサイズはどれくらいまでいける？

0438名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f55-lXFC)

2025/12/24(水) 11:42:49.04ID:Te1aIUVG0

なんとなく見始めた初心者なんやが4070tiで遊べるんか？
ゴツいグラボの話多くて震えてるわ

0439名無しさん＠ピンキー (ﾜｯﾁｮｲ cf36-rc7o)

2025/12/24(水) 11:43:18.09ID:Rca8HbnZ0

>>434
>>436
思ってたほど単純には実装できなさそう…
情報サンクス

0440名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fc7-SDhK)

2025/12/24(水) 12:06:32.13ID:eS2xEZTO0

>>437
コンテキストは全部GPUに振ってるからVRAM次第だけどRTX5090なら46Kまでいけた

以下参考
46K 30.7GB
32K 26.1GB
16K 20.4GB
8K 17.1GB
4K 16.0GB
2K 15.2GB
1K 15.0GB

KVキャッシュの量子化指定無し
LM Studioで確認

0441名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-s35p)

2025/12/24(水) 12:41:25.94ID:gBrvVDcu0

>>438
問題はVRAMの数だから3090も3060も現役で使えるよ
VRAMの数が少なかったら泣こう

0442名無しさん＠ピンキー (ｼｬﾁｰｸ 0C97-Fga2)

2025/12/24(水) 12:47:41.77ID:QIkAw9r0C

>>440
なるほどvramに割り当てればいいのか
自分はkobold使ってるけどFlash Attentionとかを使えばいけるかも
サンガツ

■ このスレッドは過去ログ倉庫に格納されています