なんJLLM部避難所 ★10

963コメント378KB

なんJLLM部避難所 ★10

0001名無しさん＠ピンキー転載ダメ (ﾜｯﾁｮｲ dfc7-Jvli)

2025/11/23(日) 22:55:29.17ID:kt2SGedd0

!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512

AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

本スレ(避難中)
なんJLLM部 ★7
https://fate.5ch.net/test/read.cgi/liveuranus/1710561010/
前スレ(実質本スレ)
なんJLLM部避難所 ★8
https://mercury.bbspink.com/test/read.cgi/onatech/1746883112/
なんJLLM部避難所 ★9
https://mercury.bbspink.com/test/read.cgi/onatech/1755924738/

VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured

0592名無しさん＠ピンキー (ﾜｯﾁｮｲ c0a9-0Alr)

2025/12/31(水) 16:14:14.55ID:91X6WRME0

5060tiでそれやと5090なら30近くは行きそうやが最新ビルド版で高速化しなかったんはよくわからんやね
mxfp4高速化が入った状態でビルドされはじめたのがb7567からのようやから
7502から7588は高速化すると思うんやが

llamacppがmxfp4対応するときに
https://huggingface.co/bartowski/openai_gpt-oss-120b-GGUF-MXFP4-Experimental
これを元にやってるっぽいからモデルこれにしたらどうなるやろか

0593名無しさん＠ピンキー (ﾜｯﾁｮｲ d21e-lw50)

2025/12/31(水) 17:28:14.16ID:PyLi1INM0

5090で120bだとボトルネックがGPU側ではなくメインメモリの帯域だからじゃない？
6000 PROとかで全部VRAMに乗せられるなら多少は早くなるかも（それでも今度はVRAMの帯域幅に律速されそうだけど）

0594名無しさん＠ピンキー (ﾜｯﾁｮｲ c0a9-0Alr)

2025/12/31(水) 17:39:18.02ID:91X6WRME0

全部VRAMに載ったらそもそもインタフェースの速度を気にする必要がないから段違いの速度なるで
調べたらPro6000でgpt-oss-120bが145token/sやって

0595名無しさん＠ピンキー (ﾜｯﾁｮｲ b16a-h4RS)

2025/12/31(水) 18:19:51.36ID:/BUKgy7e0

お年玉で買うか

0596名無しさん＠ピンキー (ﾜｯﾁｮｲ 8204-mqrN)

2025/12/31(水) 20:12:38.30ID:A5W68e4G0

>>592
このモデルとb7588で再度試してみたけど自分の環境（5060ti）ではggml-org版と変わらないな（17.5 tps）
3060単体でも16 tps出るのでVRAM 16GB程度では効果あっても雀の涙なのかも？
mxfp4について情報収集したことないので何か間違っとるかもしれないし、時間あるときに自分でもビルドしたり試してみる

0597名無しさん＠ピンキー (ﾜｯﾁｮｲ b6aa-JCzX)

2025/12/31(水) 21:14:09.72ID:x14xJQ6r0

来年はPRO6000が人権になりそうなヨカーン

0598名無しさん＠ピンキー (ﾜｯﾁｮｲ 6026-8aJk)

2026/01/01(木) 00:11:20.20ID:qmZ8t7yU0

gpt-oss-120bをVRAM16GB,メモリ64GBだと落ちる寸前だな
llama-serverでmlock有効にしたらOSがフリーズした
誰か動かしてる人いたらおすすめ設定教えてほしい。

0599名無しさん＠ピンキー (ﾜｯﾁｮｲ cde6-rRc0)

2026/01/01(木) 01:16:26.90ID:Bw6OLNUN0

これ眺めてたら年が明けてた。
https://a.co/d/0ZZtzUq

0600名無しさん＠ピンキー (ﾜｯﾁｮｲ 6ac7-Ls7H)

2026/01/01(木) 02:28:57.50ID:tPQVzZIN0

>>597
5090がどんどん値上がりしてPRO6000は値下がり傾向、本当のPRO6000がそれなりに当たり前になりそうな気がする
というかVRAMだけで考えたら、RTX 5080 16GBと比べてもかなり安いんだな

0601名無しさん＠ピンキー (ﾜｯﾁｮｲ 8cf9-7+Bn)

2026/01/01(木) 15:28:04.58ID:sW23ZJg40

VRAM72GBのpro5000も年明け出荷のようだし、geforce多枚積みよりはこっちの方が筋いいわな

0602名無しさん＠ピンキー (ﾜｯﾁｮｲ 054d-rRc0)

2026/01/01(木) 17:06:24.32ID:yiGiu09J0

あけましておめでとうございます本年もよろしくお願いします

>>561
遅くなりましたが555です、対応ありがとうございました
こちらでも更新後に正しく動作することを確認できました

0603名無しさん＠ピンキー (ﾜｯﾁｮｲ 0c32-0Alr)

2026/01/01(木) 18:20:55.47ID:I/cFx9fd0

RTX 5090は5,000ドル（約78万円）に値上げする見通しとか
値上げする情報はあったけど、ここまでとはな
ローカルAIは富豪の遊びに…

0604名無しさん＠ピンキー (ﾜｯﾁｮｲ c8f2-TEn3)

2026/01/01(木) 18:39:39.27ID:HG9AhdXC0

VLM動かせる環境作ったからQwen3-VL-235B使ってみた
そもそも認識しないんじゃないかと思ってたけど、NSFWでも思ったよりずっとしっかりしたキャプション生成できるな
https://i.imgur.com/n74THhW.jpeg

0605名無しさん＠ピンキー (ﾜｯﾁｮｲ e425-zwe1)

2026/01/01(木) 19:00:37.57ID:JXtujbxB0

グラボの値上げえぐすぎるだろ
これとてもじゃないけど今後はローカルとか無理だな

0606名無しさん＠ピンキー (ﾜｯﾁｮｲ c0a9-0Alr)

2026/01/01(木) 19:55:39.84ID:nmom1P530

>>604
NSFWの単語を知らないだけで説明はしてくれようとするんやな
世のエロ画像を日本語/英語で説明させてその説明文とdanbooruタグを画像と一緒に学習させたら
画像生成のプロンプトが楽になりそうやが
noobとかがやってくれへんかなぁ

0607名無しさん＠ピンキー (ﾜｯﾁｮｲ c8f2-TEn3)

2026/01/01(木) 20:20:27.04ID:HG9AhdXC0

別の画像でプロンプト生成も試してみたよ
https://i.imgur.com/oxa760r.jpeg

0608名無しさん＠ピンキー (ﾜｯﾁｮｲ 60c6-VauC)

2026/01/01(木) 20:28:33.20ID:eafDW5qb0

横からだけど厳密にテストしたわけじゃないけどQwen系はパラ数デカい方が規制緩くて小さい方が厳しい感じだったな

あとエロ画像解説させるときはシスプロに脱獄文入れて画像と一緒にわたすプロンプトで「外性器はチンポ|マンコなど下品な単語で解説してください」みたいに誘導すると普通にそっち系の単語で解説してくれた思い出

0609名無しさん＠ピンキー (ﾜｯﾁｮｲ c0a9-0Alr)

2026/01/02(金) 00:31:40.16ID:lg8LYbH90

LGAI-EXAONE/K-EXAONE-236B-A23BっていうLG製？のモデルが出てるけど
redditで英語の性能があまりよくないって言われとった
英語がダメなら日本語はもっとダメかな

0610名無しさん＠ピンキー (ﾜｯﾁｮｲ f432-ISUa)

2026/01/02(金) 01:15:55.90ID:WzDzorax0

どうだろ
もし韓国語強いんだったら日本語もやれるかベースとして優れてそう

0611名無しさん＠ピンキー (ﾜｯﾁｮｲ 5a27-CT96)

2026/01/02(金) 02:53:06.16ID:3mSEkiwD0

韓国語って元々漢字ベースだったものをハングルに置き換えたせいで同音異義語を文脈からしか区別出来んからLLMモデルしんどそうだな
日本語で例えるなら全てひらがな表記してる感じ

0612名無しさん＠ピンキー (ﾜｯﾁｮｲ 64a4-pPj3)

2026/01/02(金) 17:48:10.31ID:Bs4w2jCI0

GLM4.6 357B Q4kmがubuntuでKoboldCpp linux版で4.5token/s出たので報告。
スペック:ryzen9 9950X 256gb(4800MHz) 3090 1枚
--gpulayers 94 --n-cpu-moe 90 --threads 24 UIからも出来た。
ik_llama.cpp の方が10％くらい早かったけどthinking消すのKoboldのが楽だった。
ubuntuとか初めてだったけどAIに聞きまくればなんとかなるもんだね。

0613名無しさん＠ピンキー (ﾜｯﾁｮｲ 8d32-0Alr)

2026/01/02(金) 22:10:13.64ID:vQ0kRUWW0

>>612
おお、 linuxの方が倍以上速いのか
デュアルブートするかな

0614名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa9-G60N)

2026/01/03(土) 00:00:04.93ID:R/4j/QQl0

倍以上早いってよりかはWindows(のNvidiaのドライバ)だと勝手にVRAMからメインメモリに漏れるから
それで遅くなってるんじゃないかという気はするやね

「CPUがメインメモリで演算する」よりも「GPUがメインメモリで演算する」方が死ぬほど遅くなるから
VRAMからメインメモリに漏れるのは死んででも阻止しないとあかん
Linux(のNvidiaのドライバ)やと勝手に漏れるということがないぶんVRAMが枯渇したらエラーして止まるんやが

0615名無しさん＠ピンキー (ﾜｯﾁｮｲ 7fe2-jodm)

2026/01/03(土) 02:51:05.90ID:+mDimtcp0

ローカルLLMでエロチャやるには3060やと力不足なんやろうなぁ…

0616名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sd5f-nnfO)

2026/01/03(土) 02:53:51.85ID:J7LBWIU7d

>>615
LLMはVRAMが全てや
GPUは大半の時間遊んどる

0617名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fc7-cp7k)

2026/01/03(土) 14:44:20.79ID:pqPKct+O0

>>612
ええ感じやん
9950Xの性能を最大限に活かせてるんやろか
自分も試してみた

【環境】
RTX 3090 + 5955WX(16c32t) + DDR4-3200 8ch (256GB)
GLM-4.6 Q4_K_XL

【結果】
Windows llama.cpp: 4.18 t/s
WSL2 llama.cpp: 3.71 t/s
WSL2 KoboldCpp: 3.55 t/s
モデルが若干違うのとthreadsが16なの以外は設定が同じ

ちなみに--threads 24だと性能落ちた
自分は16が最速みたいだ
612氏は9950X（16コア）で24スレッド指定してるけど、これで性能出るんやろか？

性能がいいのはCPU、ネイティブLinux、メモリ帯域どれが該当してるんやろな
STREAM Triadで測ったら67.7～92.8GB/sだった
612氏はどのくらい出てるんやろ

0618名無しさん＠ピンキー (ﾜｯﾁｮｲ 8fc8-G60N)

2026/01/03(土) 14:45:51.45ID:y/a807Sx0

>>617
おっそｗ

0619名無しさん＠ピンキー (ｼｬﾁｰｸ 0C57-fu7G)

2026/01/03(土) 15:24:44.11ID:7OLtAZpJC

>>612
そのスペックでwinのkoboldcppで走らせたら何t/sになりますか？

0620名無しさん＠ピンキー (ﾜｯﾁｮｲ a365-CIFB)

2026/01/03(土) 20:17:34.07ID:tTz+GjqB0

>>619
いま試してきたんだけど、0.92token/sだった・・
linux版はちゃんとファンが高回転の音してるから性能引き出してくれてるんだろうね。
>>617
AIの言うままに--threads 24にしてたけど、16に変更したら4.6token/sになったよ。ありがとう！

win版はUseMMAP付けるけど、linux版ではUseMMAP外した方が速いんだって。
あとBIOSの設定もAIに聞いてLLM向けにいろいろいじったよ。ちょっとしたことで性能だいぶ変わるよね。

0621名無しさん＠ピンキー (ﾜｯﾁｮｲ a365-CIFB)

2026/01/03(土) 20:38:22.32ID:tTz+GjqB0

Windows llama.cpp: 4.18 t/s 出るならそっちのが快適かも。
linux版はコンテキスト上限で落ちるし文章が止まってから再生成にちょっと間があるんだよね。

0622名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fc7-cp7k)

2026/01/04(日) 00:08:06.49ID:cRfBjXQy0

>>620
情報ありがとう！
threads 16で速くなってよかったわ

こっちもBIOSとか色々設定変更してたらWSL2(Ubuntu)の速度が改善したw
どの変更が影響したか分からん・・・
NUMA(NPS)の設定やろか？

【変更前】
Windows llama.cpp: 4.18 t/s
WSL2 llama.cpp: 3.71 t/s
WSL2 KoboldCpp: 3.55 t/s

【変更後】
Windows llama.cpp: 4.13 t/s（誤差範囲）
WSL2 llama.cpp: 4.16 t/s（+12%）
WSL2 KoboldCpp: 4.22 t/s（+19%）

結果KoboldCppが最速になったw

UseMMAP設定有無の差はあまりなかったわ
WSLで動かしてるからやろけど残念！
612氏の通り、LLMはちょっとした変更で変わることが多い印象だわ

0623名無しさん＠ピンキー (ﾜｯﾁｮｲ 1332-G60N)

2026/01/04(日) 01:05:58.84ID:aBYly05e0

>>620
むむ、なんか差が大きいですね
自分はryzen7 ですが、koboldcppでQ5ｋで2t/sは出てたんで、なにか設定が違うのかも
まあ、linuxで4t/sでるなら、そっちの方がよさげですが

0624名無しさん＠ピンキー (ﾜｯﾁｮｲ cf7a-Qlgp)

2026/01/04(日) 03:12:40.77ID:Oqc8Dmk70

grok先生がエロで責められてる
許せんな、みんなgrok先生を守れ

0625名無しさん＠ピンキー (ﾜｯﾁｮｲ 5353-jodm)

2026/01/04(日) 03:21:25.97ID:XgRf4dfR0

ローカルで遊んでる人はgrokでエロ画像と言ってもピンと来ないだろ

文章なら性能高い分エロいのもかなり出るけど

0626名無しさん＠ピンキー (ﾜｯﾁｮｲ cf24-G60N)

2026/01/04(日) 13:34:35.36ID:iSIu2MWH0

今日からLM　Studioやってみてるのですが
自分のPCのスペックがryzen7700x 4070TiS メモリ96GB（今すぐ192GBには増設可能）
これで使える範囲のモデルでおすすめなのってありますかね？
どうせグラボが足引っ張る気がするのでメモリはまだ増設してませんが、増設したらもっとつよつよモデル
使えるというのなら増設します

0627名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sd5f-nnfO)

2026/01/04(日) 14:14:35.31ID:3JM0FBpmd

>>626
増設一択

0628名無しさん＠ピンキー (ﾜｯﾁｮｲ 13cb-jodm)

2026/01/04(日) 15:01:25.08ID:LsUrLGD80

メモリなんて上がる一方だから増設できるなら今増設しない手段は無いわ

0629名無しさん＠ピンキー (ｼｬﾁｰｸ 0C57-fu7G)

2026/01/04(日) 15:14:13.20ID:D6qgrbiFC

色々試したが結局magnum v4 123b Q8_0から離れられないワイ
いままでQ3_Mの0.17t/sで耐えてたから0.42t/sでもウハウハやわw

0630名無しさん＠ピンキー (ﾜｯﾁｮｲ cf24-G60N)

2026/01/04(日) 15:25:27.20ID:iSIu2MWH0

やはり増設ですか
でもDDR5なので4枚差すと速度が3600まで落ちるみたいで
そこらへんDDR5の4枚差しの人はどうしてるのか気になります

0631名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sd5f-nnfO)

2026/01/04(日) 15:26:46.87ID:3JM0FBpmd

>>630
気にすんな
メモリは量が正義

0632名無しさん＠ピンキー (ｼｬﾁｰｸ 0C57-fu7G)

2026/01/04(日) 15:53:55.73ID:D6qgrbiFC

>>630
それデフォ設定
biosでメモリ設定をxmpとかexpoとかにすればワイのは5600になった

0633名無しさん＠ピンキー (ﾜｯﾁｮｲ ef71-ylKL)

2026/01/04(日) 16:05:10.51ID:Qfkjgd5M0

DDR5の4枚はbiosアプデしなかったら起動すらしなかったんで気軽にやろうとしてたから少しビビった
それでも最終的に定格より上で安定したから3600は超えるんじゃないかな

0634名無しさん＠ピンキー (ﾜｯﾁｮｲ 4345-PPr4)

2026/01/04(日) 16:10:48.56ID:VDaryEyS0

MBやメモリのの当たり外れによるけど、4枚が同じモデルであること前提で
運が良ければ5600、悪ければ5200、最悪それ以下覚悟しとけって感じかな。

0635名無しさん＠ピンキー (ﾜｯﾁｮｲ cf24-G60N)

2026/01/04(日) 17:09:28.51ID:iSIu2MWH0

去年なんJNVA部スレの方でDDR5の4枚をデフォの3600で使わず5600で使ってたら
CPUが壊れたというレスがあったからメモリコントローラーが焼けたのか知らないけどちょっと怖いなと思ってましたが
結構みなさん上げて使ってるんですね

0636名無しさん＠ピンキー (ﾜｯﾁｮｲ cf24-G60N)

2026/01/04(日) 17:18:35.21ID:iSIu2MWH0

まだメモリ増設はしてませんが、とりあえず試しに
Huihui-Qwen3-Next-80B-A3B-Instruct-abliterated-MXFP4_MOE-GGUF
というモデルをダウンロードしてやってみたら6.92t/sでした
どうやらmoeモデルみたいなので
>>562
の説明通りにGPUオフロードを最大にしてweights onto CPUにチェックを入れたら
20.32t/sになりました

ローカルLLMはこれが初めてですがこれは感動ですね
楽しい！

0637名無しさん＠ピンキー (ﾜｯﾁｮｲ ef27-5PTw)

2026/01/05(月) 01:01:13.59ID:AY2PQGe10

オーバークロックはアホのやることだよ
数%の性能向上のために壊す可能性ある行為やるとかアホやん
その為に専用の冷却装置か買い足したりね
そんなら初めからワンランク上のPCパーツ揃えとけって話よ

0638名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-G60N)

2026/01/05(月) 05:47:48.80ID:hyRe348w0

まーオーバークロックってのは、出るかもしれない運転だからね、パッケージに書かれているのは最低保証クロック数で
本当のクロック数は個体ごと違う、シリコンウエハーの円盤のどこの部分かで性能が変わるみたいだけど

0639名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f32-kpE1)

2026/01/05(月) 08:24:54.88ID:DLBv23jd0

moe系みたいにメインメモリ上でガッツリ回す用途にはメモリクロックさえ上げてりゃ効くから、レイテンシほぼ縮んでないJEDECネイティブ高クロックが珍しく効果を発揮する
これは比較的簡単で安全だから狙いたい

その他大半の一般用途ではネイティブやらxmp適用ぐらいじゃ意味ない

0640名無しさん＠ピンキー (ﾜｯﾁｮｲ 1332-fu7G)

2026/01/05(月) 13:20:51.95ID:B1AyZrAl0

>>639
確かにmoeは5600運用の方が若干速いね
denseだと差は感じられなかった
まあ安全のため3600運用にしときます

0641名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-G60N)

2026/01/05(月) 16:36:48.30ID:hyRe348w0

Grok先生が叩かれているせいで、GPTのエロ解禁がまた伸びそうじゃね

というかアルトマンが工作してるんじゃね

0642名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f7e-H3VG)

2026/01/05(月) 16:50:30.89ID:4Qh9w+dX0

>>630
PC組立サービス込みでショップにまるっとお願いしたら
4枚刺しで3600に落ちるのは忍びないから5600で動作確認しておくからその設定で使ってくれって言われたな…

0643名無しさん＠ピンキー (ﾜｯﾁｮｲ 5337-wT+6)

2026/01/05(月) 17:57:30.50ID:cRoZWwY20

オーバークロックって言っても電圧上げない限り物理的に壊れることなんてほぼないよ」

0644名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr37-hOy0)

2026/01/05(月) 18:33:35.77ID:n0uxd9sVr

定格で使ってても壊れるのがPCパーツなわけだから、OCするかしないかは保証を捨てるか捨てないかって話では

0645名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa9-G60N)

2026/01/05(月) 18:59:34.00ID:y245qfuG0

Qwen3.5でーへんなぁ
出てこない期間が長いほど、それだけ大きいバージョンアップになるのかって期待値もどんどん膨らんでしまう

0646名無しさん＠ピンキー (ﾜｯﾁｮｲ a393-gOcf)

2026/01/06(火) 00:17:41.99ID:qwZYwG1+0

RTX5060TiでLMstudio使用で、固定キャラとして育てるチャットアバターでオススメなLLMモデルある？
いまshisa-v2.1-unphi4-14b-i1使っててこれでも悪くはないんだけど、（少し照れながら）的な表現が多かったりちょっと物足りない印象

0647名無しさん＠ピンキー (ﾜｯﾁｮｲ 5337-wT+6)

2026/01/06(火) 01:38:15.89ID:aXUY5vKz0

「んっほぉぉぉおおおぉぉぉおおお！」(少し照れながら)

0648名無しさん＠ピンキー (ﾜｯﾁｮｲ 732f-XxT8)

2026/01/06(火) 01:46:26.39ID:to45eQEE0

もう少し恥じ入ってもらいたく存じます

0649名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-G60N)

2026/01/06(火) 05:20:24.52ID:/7MLUjnj0

CPUやGPUの製品は性能にばらつきがあって、一番最低の能力を製品につけている。
だから個体によってはもっと性能がいい可能性がある。
最低の能力に合わせてるので、偏差的に言うとほとんどのものがオーバークロックできる。

運です。

0650名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-G60N)

2026/01/06(火) 05:25:30.93ID:/7MLUjnj0

3060を現役復帰させるだとっ！！

0651名無しさん＠ピンキー (ﾜｯﾁｮｲ 7346-Lv33)

2026/01/06(火) 07:39:48.60ID:k9RAtTQB0

>>646
aratakoさんのqwen3-30B-A3B-ERPとMistralPrism

0652名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-G60N)

2026/01/06(火) 07:44:12.70ID:/7MLUjnj0

新品の３０６０をいくらなら買う？10万出すやついる？

0653名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fc7-XxT8)

2026/01/06(火) 07:50:21.41ID:kVrC8SoO0

VRAM小さすぎてそもそもLLMでは使えないかと
その話はゲームとかそういう用途かと

0654名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-G60N)

2026/01/06(火) 09:54:09.87ID:/7MLUjnj0

3060VRAM12GB×４＝48GB＋4090VRAM24GB＝VRAM72GBでLLM動かしてるけど

0655名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-G60N)

2026/01/06(火) 09:56:46.27ID:/7MLUjnj0

4090VRAM24GB×４だと電源がもたないのでは？

0656名無しさん＠ピンキー (ﾜｯﾁｮｲ 1332-fu7G)

2026/01/06(火) 09:58:55.49ID:4WspyGCi0

>>649
4枚さしでexpo1設定で5600にしてメモリチェック回して問題なかったけど
なんせクソ高かったから精神衛生上安くなってからexpoに戻そうと思います

0657名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fc7-XxT8)

2026/01/06(火) 10:05:59.43ID:kVrC8SoO0

>>654
それ、4090+メインメモリと比べてどの程度速度出るんだろ？

0658名無しさん＠ピンキー (ﾜｯﾁｮｲ ef2e-L/jz)

2026/01/06(火) 11:03:58.94ID:9qL/623Z0

横からだが24GB以上必要で72GBに収まるモデルならCPUとかメインメモリ経由しなくて済むんだから全然違うのでは
LLMは画像生成みたいに1枚に乗せきらなきゃいけない制約ないし

0659名無しさん＠ピンキー (JP 0H9f-nnfO)

2026/01/06(火) 11:50:25.82ID:ywC8AgtMH

TITAN RTXがリース落ちで出回っていた頃に全部狩っておけば良かった
1台しか拾わなかったことが悔やまれる

0660名無しさん＠ピンキー (ｽﾌﾟﾌﾟ Sd5f-PPr4)

2026/01/06(火) 12:26:23.16ID:fmj2E9aGd

4070Ti Super に 4060Ti(16GB)を増設しようと中古購入したぜ。
いざ届くとPCIeケーブルが足りないから電源ユニット追加注文したり、4060がマザボのコネクタに干渉することわかったからライザーケーブル追加注文したり
LLMのための工作はこれはこれで楽しいな

0661名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f32-kpE1)

2026/01/06(火) 12:33:20.68ID:czaMjSi90

mGPUなんて殆どやらなくなったし折角なら一度やっておくべきよね

0662名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-G60N)

2026/01/06(火) 12:36:35.02ID:/7MLUjnj0

だからNVIDIAは高額なGPU一枚売るより、安価な3060を大量に売った方が儲かると考えたわけ

0663名無しさん＠ピンキー (JP 0H9f-nnfO)

2026/01/06(火) 12:37:48.86ID:ywC8AgtMH

NVIDIAにとってコンシューマ向けGPUなんて慈善事業
いつ辞めてもノーダメージ

0664名無しさん＠ピンキー (ﾜｯﾁｮｲ ef27-5PTw)

2026/01/06(火) 13:10:02.75ID:dIRnQUx/0

AIバブルにあぐらかくわけにもいかんやろ
ゲーマー市場キープしとかんと足元掬われるで

LLMの演算って専用チップ作った方が性能出せるってんで大手サービスは独自設計に移りつつある

0665名無しさん＠ピンキー (JP 0H9f-nnfO)

2026/01/06(火) 13:14:34.06ID:ywC8AgtMH

>>664
革ジャンはGrokを買ったからそっちでも勝つつもりや

0666名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fc7-XxT8)

2026/01/06(火) 13:52:38.64ID:kVrC8SoO0

>>658
NVLINKみたいなのならともかくPCIが遅いから枚数が増えれば増えるほど効率が悪くなると思う
もし無尽蔵に早くなるならH100とか買わずに12や16GBのカード大量に買えば良いわけだが企業がそうしてないわけだし
多分限界があるんだと思う　実際どこに限界があるのかわからないけど

0667名無しさん＠ピンキー (ﾜｯﾁｮｲ cf6f-F/Mu)

2026/01/06(火) 13:56:21.97ID:hOIOeKTE0

>>651
ありがとう、試してみる

0668名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fc7-XxT8)

2026/01/06(火) 13:57:27.67ID:kVrC8SoO0

>>663
AI特需で今は良いけど巨額を出して買ってくれてるのは世界で数社だけ
しかもGoogleなど自社でTPUを開発してそろそろ売り出しそうな勢い、お客がライバルにクラスチェンジする
特需と顧客がライバルになった時、他の市場を持ってないと長期ではかなり危ういんじゃない？

ただメモリとかすごく高いしPCそのものから人が離れたらどうするのかって問題はありそうだけど
AIに相談したらPCが高級品にになると、多くの人はスマホとかやすい端末でクラウド使うのが当たり前になるみたいな予想もあったけどな

0669名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr37-hOy0)

2026/01/06(火) 14:06:28.28ID:IifJsPNir

>663
今の立場で儲けを優先すること自体がメリットは少なくデメリットが山盛りの潜在的大ダメージ戦略でしょ
慈善事業をバンバンやらなきゃ独占禁止法が飛んでくる

0670名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fc7-XxT8)

2026/01/06(火) 20:55:30.64ID:kVrC8SoO0

中国、「日本の軍事力強化につながる」品目の輸出禁止　だってさ
メモリ不足とか中国の企業が想像以上に頑張って暴落するかと思ってたけどPC関連ますます下がらなくなりそうだな

0671名無しさん＠ピンキー (ﾜｯﾁｮｲ 7323-slrW)

2026/01/07(水) 12:41:05.37ID:FS0KNYav0

AMD製グラボでの画像生成AIが爆速になるComfyUIアップデートが配信、ROCm統合で生成速度が5.4倍に
https://gigazine.net/news/20260107-amd-comfyui-rocm/

期待できるか分からないけど色々出来るようになったらいいな

0672名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f32-kpE1)

2026/01/07(水) 12:56:58.54ID:dyjeItMh0

radeonばっか使ってるけどllm方面じゃ理論値のrocm頑張るよりvulkanド安定なんよな　ってのがこれまでの話だけどどうなるか
大差付くなら良いよね

0673名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-G60N)

2026/01/07(水) 13:08:46.98ID:Y/amd7hW0

VRAMの数とCUDA対応かしか気にしてないけど、他に見る要素あるの？

0674名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f32-kpE1)

2026/01/07(水) 13:27:12.55ID:dyjeItMh0

VRAM帯域までは見て

0675名無しさん＠ピンキー (ﾜｯﾁｮｲ ef27-G60N)

2026/01/07(水) 14:00:10.07ID:f2bFd25i0

やっとWindowsでrocm使えるようになったんだ
ところでCUDAは19年前から使えるんだけど今まで何してたん？

0676名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f32-kpE1)

2026/01/07(水) 14:09:42.61ID:dyjeItMh0

アピールを捨ててるけど使えました

0677名無しさん＠ピンキー (ﾜｯﾁｮｲ 1332-G60N)

2026/01/07(水) 14:45:15.83ID:MvnRioxH0

ROCmは元々AMD Instinctとかの業務用GPU向けだったから
コンシューマーしか使わないWindowsは眼中になかった模様
PCでローカルAIを動かすのが流行り出したのはほんの数年前の話

0678名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-G60N)

2026/01/07(水) 17:03:10.02ID:Y/amd7hW0

Rakuten　AI　700Bか、なかなかやるな三木谷

0679名無しさん＠ピンキー (ﾜｯﾁｮｲ 636b-Che8)

2026/01/08(木) 10:38:07.66ID:M6Ah6DRS0

LFM2.5B-1.2B-JP思ったよりプロンプトに従うし一応エロもいけるな
このサイズにしては中々やりおる

0680名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fac-XxT8)

2026/01/08(木) 12:50:01.03ID:SSPBWWsE0

https://www.youtube.com/shorts/odx5NLbYz8g
半導体の拡大画像だけど、これってフェイクではなく本物かな？

最近、半導体がやたらと高いけど、それでも個人の予算で買えるってなんか不思議な気がするわ
こんなのどんなに頑張っても自作できる気がしない
更に、エロの為にこんな高度な技術を使うってのも何かもっと他に使い道ないのかと思ってしまう

0681名無しさん＠ピンキー (ﾜｯﾁｮｲ 8f07-SX/8)

2026/01/08(木) 13:39:01.67ID:QTqEB4/I0

CGですよ
詐欺に遭わんようにな

0682名無しさん＠ピンキー (ﾜｯﾁｮｲ 73a7-XxT8)

2026/01/08(木) 16:01:11.57ID:qDkOWa730

LFM2.5 JPはサイズの割りにはかなり上手くやれてる方なんだけど、やっぱり1.2Bってのはちょっとしんどいところある
意味わからんくらい爆速で動くし、個人でFinetuningできるのは面白そうだけどデータセットがねぇ……

0683名無しさん＠ピンキー (ﾜｯﾁｮｲ cf7a-G60N)

2026/01/08(木) 18:19:49.46ID:898P0C8x0

LFM2.5B-1.2B-JP使ってみたけど、爆速なだけで
実用性はどう使えばいいかわからん

0684名無しさん＠ピンキー (ﾜｯﾁｮｲ 636a-ER82)

2026/01/08(木) 19:16:46.59ID:FVGHXFax0

頭悪いのそのモデル

0685名無しさん＠ピンキー (ﾜｯﾁｮｲ 2320-hOy0)

2026/01/08(木) 19:48:17.46ID:XO3mr2jw0

いまどきは自宅のラボで作ってみたする奴もいるらしいぞ

0686名無しさん＠ピンキー (ﾜｯﾁｮｲ 3332-FNoR)

2026/01/08(木) 21:42:27.44ID:5QVndZy40

小規模モデルの性能が上がってくるとそれはそれでワクワクするな

0687名無しさん＠ピンキー (ﾜｯﾁｮｲ 7365-Lv33)

2026/01/08(木) 23:00:25.74ID:1dVKKogr0

5b未満のモデルはゲーム組み込み用とかそういうニーズもあるやで

0688名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sd5f-nnfO)

2026/01/08(木) 23:08:44.33ID:Glpn+tsMd

会話らしい会話が出来る性能ではないがゲームでどう使うの

0689名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa9-G60N)

2026/01/08(木) 23:39:37.11ID:C3uPfQRe0

実例が今あるのかわからんけど
もしやるならガッチガチにファインチューンしたら
ゲーム内の話題だけならまともな応答返すくらいは一桁bでも出来そうな気はする

0690名無しさん＠ピンキー (ﾜｯﾁｮｲ 7370-5PTw)

2026/01/09(金) 02:22:52.53ID:7u2K8Dnp0

スマホで小型モデルを動かすのが理想だけど
どうせネット繋がってるんだから大型モデルに繋いだほうが早いってね

0691名無しさん＠ピンキー (ﾜｯﾁｮｲ 1332-G60N)

2026/01/09(金) 07:53:07.91ID:KvRiQaTo0

ChatGPTを使ってるゲームはあるけど
ローカルLLMを使ってるゲームは今のところなさそうだよな

新着レスの表示

レスを投稿する