なんJLLM部避難所 ★10

トップページ⇒オナテク(仮)＠bbspink掲示板

762コメント307KB

なんJLLM部避難所 ★10

0643名無しさん＠ピンキー (ﾜｯﾁｮｲ 5337-wT+6)

2026/01/05(月) 17:57:30.50ID:cRoZWwY20

オーバークロックって言っても電圧上げない限り物理的に壊れることなんてほぼないよ」

0644名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr37-hOy0)

2026/01/05(月) 18:33:35.77ID:n0uxd9sVr

定格で使ってても壊れるのがPCパーツなわけだから、OCするかしないかは保証を捨てるか捨てないかって話では

0645名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa9-G60N)

2026/01/05(月) 18:59:34.00ID:y245qfuG0

Qwen3.5でーへんなぁ
出てこない期間が長いほど、それだけ大きいバージョンアップになるのかって期待値もどんどん膨らんでしまう

0646名無しさん＠ピンキー (ﾜｯﾁｮｲ a393-gOcf)

2026/01/06(火) 00:17:41.99ID:qwZYwG1+0

RTX5060TiでLMstudio使用で、固定キャラとして育てるチャットアバターでオススメなLLMモデルある？
いまshisa-v2.1-unphi4-14b-i1使っててこれでも悪くはないんだけど、（少し照れながら）的な表現が多かったりちょっと物足りない印象

0647名無しさん＠ピンキー (ﾜｯﾁｮｲ 5337-wT+6)

2026/01/06(火) 01:38:15.89ID:aXUY5vKz0

「んっほぉぉぉおおおぉぉぉおおお！」(少し照れながら)

0648名無しさん＠ピンキー (ﾜｯﾁｮｲ 732f-XxT8)

2026/01/06(火) 01:46:26.39ID:to45eQEE0

もう少し恥じ入ってもらいたく存じます

0649名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-G60N)

2026/01/06(火) 05:20:24.52ID:/7MLUjnj0

CPUやGPUの製品は性能にばらつきがあって、一番最低の能力を製品につけている。
だから個体によってはもっと性能がいい可能性がある。
最低の能力に合わせてるので、偏差的に言うとほとんどのものがオーバークロックできる。

運です。

0650名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-G60N)

2026/01/06(火) 05:25:30.93ID:/7MLUjnj0

3060を現役復帰させるだとっ！！

0651名無しさん＠ピンキー (ﾜｯﾁｮｲ 7346-Lv33)

2026/01/06(火) 07:39:48.60ID:k9RAtTQB0

>>646
aratakoさんのqwen3-30B-A3B-ERPとMistralPrism

0652名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-G60N)

2026/01/06(火) 07:44:12.70ID:/7MLUjnj0

新品の３０６０をいくらなら買う？10万出すやついる？

0653名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fc7-XxT8)

2026/01/06(火) 07:50:21.41ID:kVrC8SoO0

VRAM小さすぎてそもそもLLMでは使えないかと
その話はゲームとかそういう用途かと

0654名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-G60N)

2026/01/06(火) 09:54:09.87ID:/7MLUjnj0

3060VRAM12GB×４＝48GB＋4090VRAM24GB＝VRAM72GBでLLM動かしてるけど

0655名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-G60N)

2026/01/06(火) 09:56:46.27ID:/7MLUjnj0

4090VRAM24GB×４だと電源がもたないのでは？

0656名無しさん＠ピンキー (ﾜｯﾁｮｲ 1332-fu7G)

2026/01/06(火) 09:58:55.49ID:4WspyGCi0

>>649
4枚さしでexpo1設定で5600にしてメモリチェック回して問題なかったけど
なんせクソ高かったから精神衛生上安くなってからexpoに戻そうと思います

0657名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fc7-XxT8)

2026/01/06(火) 10:05:59.43ID:kVrC8SoO0

>>654
それ、4090+メインメモリと比べてどの程度速度出るんだろ？

0658名無しさん＠ピンキー (ﾜｯﾁｮｲ ef2e-L/jz)

2026/01/06(火) 11:03:58.94ID:9qL/623Z0

横からだが24GB以上必要で72GBに収まるモデルならCPUとかメインメモリ経由しなくて済むんだから全然違うのでは
LLMは画像生成みたいに1枚に乗せきらなきゃいけない制約ないし

0659名無しさん＠ピンキー (JP 0H9f-nnfO)

2026/01/06(火) 11:50:25.82ID:ywC8AgtMH

TITAN RTXがリース落ちで出回っていた頃に全部狩っておけば良かった
1台しか拾わなかったことが悔やまれる

0660名無しさん＠ピンキー (ｽﾌﾟﾌﾟ Sd5f-PPr4)

2026/01/06(火) 12:26:23.16ID:fmj2E9aGd

4070Ti Super に 4060Ti(16GB)を増設しようと中古購入したぜ。
いざ届くとPCIeケーブルが足りないから電源ユニット追加注文したり、4060がマザボのコネクタに干渉することわかったからライザーケーブル追加注文したり
LLMのための工作はこれはこれで楽しいな

0661名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f32-kpE1)

2026/01/06(火) 12:33:20.68ID:czaMjSi90

mGPUなんて殆どやらなくなったし折角なら一度やっておくべきよね

0662名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-G60N)

2026/01/06(火) 12:36:35.02ID:/7MLUjnj0

だからNVIDIAは高額なGPU一枚売るより、安価な3060を大量に売った方が儲かると考えたわけ

0663名無しさん＠ピンキー (JP 0H9f-nnfO)

2026/01/06(火) 12:37:48.86ID:ywC8AgtMH

NVIDIAにとってコンシューマ向けGPUなんて慈善事業
いつ辞めてもノーダメージ

0664名無しさん＠ピンキー (ﾜｯﾁｮｲ ef27-5PTw)

2026/01/06(火) 13:10:02.75ID:dIRnQUx/0

AIバブルにあぐらかくわけにもいかんやろ
ゲーマー市場キープしとかんと足元掬われるで

LLMの演算って専用チップ作った方が性能出せるってんで大手サービスは独自設計に移りつつある

0665名無しさん＠ピンキー (JP 0H9f-nnfO)

2026/01/06(火) 13:14:34.06ID:ywC8AgtMH

>>664
革ジャンはGrokを買ったからそっちでも勝つつもりや

0666名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fc7-XxT8)

2026/01/06(火) 13:52:38.64ID:kVrC8SoO0

>>658
NVLINKみたいなのならともかくPCIが遅いから枚数が増えれば増えるほど効率が悪くなると思う
もし無尽蔵に早くなるならH100とか買わずに12や16GBのカード大量に買えば良いわけだが企業がそうしてないわけだし
多分限界があるんだと思う　実際どこに限界があるのかわからないけど

0667名無しさん＠ピンキー (ﾜｯﾁｮｲ cf6f-F/Mu)

2026/01/06(火) 13:56:21.97ID:hOIOeKTE0

>>651
ありがとう、試してみる

0668名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fc7-XxT8)

2026/01/06(火) 13:57:27.67ID:kVrC8SoO0

>>663
AI特需で今は良いけど巨額を出して買ってくれてるのは世界で数社だけ
しかもGoogleなど自社でTPUを開発してそろそろ売り出しそうな勢い、お客がライバルにクラスチェンジする
特需と顧客がライバルになった時、他の市場を持ってないと長期ではかなり危ういんじゃない？

ただメモリとかすごく高いしPCそのものから人が離れたらどうするのかって問題はありそうだけど
AIに相談したらPCが高級品にになると、多くの人はスマホとかやすい端末でクラウド使うのが当たり前になるみたいな予想もあったけどな

0669名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr37-hOy0)

2026/01/06(火) 14:06:28.28ID:IifJsPNir

>663
今の立場で儲けを優先すること自体がメリットは少なくデメリットが山盛りの潜在的大ダメージ戦略でしょ
慈善事業をバンバンやらなきゃ独占禁止法が飛んでくる

0670名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fc7-XxT8)

2026/01/06(火) 20:55:30.64ID:kVrC8SoO0

中国、「日本の軍事力強化につながる」品目の輸出禁止　だってさ
メモリ不足とか中国の企業が想像以上に頑張って暴落するかと思ってたけどPC関連ますます下がらなくなりそうだな

0671名無しさん＠ピンキー (ﾜｯﾁｮｲ 7323-slrW)

2026/01/07(水) 12:41:05.37ID:FS0KNYav0

AMD製グラボでの画像生成AIが爆速になるComfyUIアップデートが配信、ROCm統合で生成速度が5.4倍に
https://gigazine.net/news/20260107-amd-comfyui-rocm/

期待できるか分からないけど色々出来るようになったらいいな

0672名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f32-kpE1)

2026/01/07(水) 12:56:58.54ID:dyjeItMh0

radeonばっか使ってるけどllm方面じゃ理論値のrocm頑張るよりvulkanド安定なんよな　ってのがこれまでの話だけどどうなるか
大差付くなら良いよね

0673名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-G60N)

2026/01/07(水) 13:08:46.98ID:Y/amd7hW0

VRAMの数とCUDA対応かしか気にしてないけど、他に見る要素あるの？

0674名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f32-kpE1)

2026/01/07(水) 13:27:12.55ID:dyjeItMh0

VRAM帯域までは見て

0675名無しさん＠ピンキー (ﾜｯﾁｮｲ ef27-G60N)

2026/01/07(水) 14:00:10.07ID:f2bFd25i0

やっとWindowsでrocm使えるようになったんだ
ところでCUDAは19年前から使えるんだけど今まで何してたん？

0676名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f32-kpE1)

2026/01/07(水) 14:09:42.61ID:dyjeItMh0

アピールを捨ててるけど使えました

0677名無しさん＠ピンキー (ﾜｯﾁｮｲ 1332-G60N)

2026/01/07(水) 14:45:15.83ID:MvnRioxH0

ROCmは元々AMD Instinctとかの業務用GPU向けだったから
コンシューマーしか使わないWindowsは眼中になかった模様
PCでローカルAIを動かすのが流行り出したのはほんの数年前の話

0678名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-G60N)

2026/01/07(水) 17:03:10.02ID:Y/amd7hW0

Rakuten　AI　700Bか、なかなかやるな三木谷

0679名無しさん＠ピンキー (ﾜｯﾁｮｲ 636b-Che8)

2026/01/08(木) 10:38:07.66ID:M6Ah6DRS0

LFM2.5B-1.2B-JP思ったよりプロンプトに従うし一応エロもいけるな
このサイズにしては中々やりおる

0680名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fac-XxT8)

2026/01/08(木) 12:50:01.03ID:SSPBWWsE0

https://www.youtube.com/shorts/odx5NLbYz8g
半導体の拡大画像だけど、これってフェイクではなく本物かな？

最近、半導体がやたらと高いけど、それでも個人の予算で買えるってなんか不思議な気がするわ
こんなのどんなに頑張っても自作できる気がしない
更に、エロの為にこんな高度な技術を使うってのも何かもっと他に使い道ないのかと思ってしまう

0681名無しさん＠ピンキー (ﾜｯﾁｮｲ 8f07-SX/8)

2026/01/08(木) 13:39:01.67ID:QTqEB4/I0

CGですよ
詐欺に遭わんようにな

0682名無しさん＠ピンキー (ﾜｯﾁｮｲ 73a7-XxT8)

2026/01/08(木) 16:01:11.57ID:qDkOWa730

LFM2.5 JPはサイズの割りにはかなり上手くやれてる方なんだけど、やっぱり1.2Bってのはちょっとしんどいところある
意味わからんくらい爆速で動くし、個人でFinetuningできるのは面白そうだけどデータセットがねぇ……

0683名無しさん＠ピンキー (ﾜｯﾁｮｲ cf7a-G60N)

2026/01/08(木) 18:19:49.46ID:898P0C8x0

LFM2.5B-1.2B-JP使ってみたけど、爆速なだけで
実用性はどう使えばいいかわからん

0684名無しさん＠ピンキー (ﾜｯﾁｮｲ 636a-ER82)

2026/01/08(木) 19:16:46.59ID:FVGHXFax0

頭悪いのそのモデル

0685名無しさん＠ピンキー (ﾜｯﾁｮｲ 2320-hOy0)

2026/01/08(木) 19:48:17.46ID:XO3mr2jw0

いまどきは自宅のラボで作ってみたする奴もいるらしいぞ

0686名無しさん＠ピンキー (ﾜｯﾁｮｲ 3332-FNoR)

2026/01/08(木) 21:42:27.44ID:5QVndZy40

小規模モデルの性能が上がってくるとそれはそれでワクワクするな

0687名無しさん＠ピンキー (ﾜｯﾁｮｲ 7365-Lv33)

2026/01/08(木) 23:00:25.74ID:1dVKKogr0

5b未満のモデルはゲーム組み込み用とかそういうニーズもあるやで

0688名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sd5f-nnfO)

2026/01/08(木) 23:08:44.33ID:Glpn+tsMd

会話らしい会話が出来る性能ではないがゲームでどう使うの

0689名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa9-G60N)

2026/01/08(木) 23:39:37.11ID:C3uPfQRe0

実例が今あるのかわからんけど
もしやるならガッチガチにファインチューンしたら
ゲーム内の話題だけならまともな応答返すくらいは一桁bでも出来そうな気はする

0690名無しさん＠ピンキー (ﾜｯﾁｮｲ 7370-5PTw)

2026/01/09(金) 02:22:52.53ID:7u2K8Dnp0

スマホで小型モデルを動かすのが理想だけど
どうせネット繋がってるんだから大型モデルに繋いだほうが早いってね

0691名無しさん＠ピンキー (ﾜｯﾁｮｲ 1332-G60N)

2026/01/09(金) 07:53:07.91ID:KvRiQaTo0

ChatGPTを使ってるゲームはあるけど
ローカルLLMを使ってるゲームは今のところなさそうだよな

0692名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fc7-XxT8)

2026/01/09(金) 08:06:00.67ID:4HlRfj7C0

やったこと無いから知らないけど，アダルトな会話が楽しめるスマホアプリはローカルじゃないのか？

0693名無しさん＠ピンキー (ﾜｯﾁｮｲ 636a-ER82)

2026/01/09(金) 08:54:24.24ID:uQ17JKwQ0

いやー無理だろ

0694名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-G60N)

2026/01/09(金) 09:28:44.94ID:GOSYtxZi0

学習が少ないと日本語をまともに喋れない。

0695名無しさん＠ピンキー (ﾜｯﾁｮｲ cfd9-fu7G)

2026/01/09(金) 10:51:23.37ID:QgvGH3Ck0

>>691
あれってchatgpt以外のAPって使えないのかな？
macでAP発行してローカルで使うとかできんかな

0696名無しさん＠ピンキー (ﾜｯﾁｮｲ 231e-XxT8)

2026/01/09(金) 11:27:25.15ID:mNJOAcl90

LFM2.5B-1.2B-JP気になって覗きに来たけどローカルでエロチャするには微妙な感じか

0697名無しさん＠ピンキー (ﾜｯﾁｮｲ 3ff8-yDMQ)

2026/01/09(金) 11:34:42.40ID:ijDoORFo0

ローカルLLM使ったゲームはすでにたくさんあると思うよ
llama.cppを組み込むだけだし軽くググってもそれっぽいのが出てくる

0698名無しさん＠ピンキー (ﾜｯﾁｮｲ 53d0-F/Mu)

2026/01/09(金) 14:18:27.68ID:SpJSB7Fb0

>>691
FANZAにあったで
需要ないのか100円足らずで売られてた

0699名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sd5f-nnfO)

2026/01/09(金) 14:52:11.04ID:rpg+hvq7d

Cerebrasがzai-glm-4.7の無料Tierを公開したで
激烈に速いで
https://www.cerebras.ai/blog/glm-4-7

0700名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f9f-/lw7)

2026/01/09(金) 17:07:18.90ID:QRUXNry/0

Free TierでRPD=100か
性能もGemini3Pro並なら代替になるんやが

0701名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fd5-s3Q7)

2026/01/09(金) 18:07:58.26ID:PZmIb37G0

>>699
すごい
今までクオリティと速度を両立してたのってGemini Flashだけだったけど
これは段違いに速いうえにクオリティも高い

0702名無しさん＠ピンキー (ｽﾌﾟﾌﾟ Sd5f-PPr4)

2026/01/09(金) 18:29:48.22ID:EV20mKt7d

4.7Vか4.7-Airきてくれー

0703名無しさん＠ピンキー (ﾜｯﾁｮｲ 4264-kaFj)

2026/01/10(土) 00:46:48.25ID:twt9hJur0

これはモデルが早いというよりはハードウェアが超特殊だからな・・・。
確か一枚数億とかだったよなCerebrasのユニット

0704名無しさん＠ピンキー (ﾜｯﾁｮｲ 7273-oSIQ)

2026/01/10(土) 12:37:17.37ID:Wwd3v/Sq0

Cerebrasは半導体ウェハを切り取らずにそのまま使ってる
どんなマザーボードに載せてるんだろ
https://i.imgur.com/33194P8.jpeg

0705名無しさん＠ピンキー (ﾜｯﾁｮｲ 32ac-dyKC)

2026/01/10(土) 13:47:59.81ID:Yar5XSuB0

>>680
>>681
実際、この縮尺って合ってるのかね？
ちょっとした寒気みたいなものを覚えたんだけど

0706名無しさん＠ピンキー (ﾜｯﾁｮｲ 07a2-3T54)

2026/01/11(日) 15:48:48.43ID:w0p+zdqj0

>>699
試してみたらGLM4.7で330tok/出てて笑うしかなかった。これはもうハードウェアの暴力としか言いようがないな。

0707名無しさん＠ピンキー (ﾜｯﾁｮｲ f29f-6Z3P)

2026/01/11(日) 16:32:52.06ID:hUJonVEN0

Groqよりも速いのか？
微妙に使いたいモデルが提供されてないが……
https://console.groq.com/docs/models

0708名無しさん＠ピンキー (ﾜｯﾁｮｲ b7dd-vGEt)

2026/01/12(月) 13:24:07.64ID:lnBKDwIn0

>>699
GGUFで130GBもあるのか・・・

0709名無しさん＠ピンキー (ﾜｯﾁｮｲ b6a0-5de0)

2026/01/12(月) 13:44:49.50ID:hwlGh7wi0

最近始めた人は、日本一高い山は？って質問に富士山って答えられるかでＬＬＭの性能見ればいいよ

答えられないラインがある

0710名無しさん＠ピンキー (ﾜｯﾁｮｲ f232-+fC0)

2026/01/12(月) 13:47:52.81ID:8AlFQoI20

俺は2番目を聞く派だ

0711名無しさん＠ピンキー (ﾜｯﾁｮｲ 3e27-5de0)

2026/01/12(月) 14:22:17.16ID:8opZO6jU0

>>709
いつの話してるんだ…
LLM出始めは学習が不十分でその程度の話も答えられないケースはあったけど
2年ぐらい前にはそんなの何の役にも立たない質問するのは馬鹿のやることだって言われてたよ
今もそれ聞いてるのは知識がアップデートされてない老害だよ

0712名無しさん＠ピンキー (ﾜｯﾁｮｲ e36a-SydR)

2026/01/12(月) 14:34:36.73ID:GrWr5tZm0

>>709
それ通用したの2022年末くらいでは？

0713名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f32-cVtm)

2026/01/12(月) 14:56:28.29ID:LxRHWzDP0

ワイは
「小学生の男女がうんどうかいについて悪戯っ子ぽく話す会話を書いてくれ」って最初に聞いてる
これで日本語の小説のセリフ周りの性能や文の整合性チェックが分かるのでおすすめ

0714名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f32-cVtm)

2026/01/12(月) 14:57:36.43ID:LxRHWzDP0

ああミスった
運動会　漢字で

0715名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr17-UF1D)

2026/01/12(月) 15:15:08.69ID:UceslG1Pr

文章の良し悪しを判別すること自体も難易度が高いタスクなんだよな
判別できる人はLLMって文章上手くないな、じゃあこれで計ればいいやって自分で気付くはず

判別できないひとは、そもそもLLMって文章上手いよなとか、自信たっぷりだから信頼できるよなとか、言いだすわけで...

0716名無しさん＠ピンキー (ﾜｯﾁｮｲ 32c7-dyKC)

2026/01/12(月) 15:37:44.32ID:2OmvCRAT0

自分の得意な専門分野の事を聞いたら良いんじゃない？
LLMが偉くてもまだまだ人が強い分野だと思う
逆に知らないことを聞いたら全部説得力あって判定できないけどw

0717名無しさん＠ピンキー (ﾜｯﾁｮｲ f232-+fC0)

2026/01/12(月) 16:47:30.99ID:8AlFQoI20

知識方面は自分の専門聞くのがまあ定番よね

0718名無しさん＠ピンキー (ﾜｯﾁｮｲ 3381-NUe/)

2026/01/12(月) 20:50:57.53ID:AZ66r3L40

エロ画像を認識させて画像の内容をエロく説明させたいんだけど、おすすめの環境ある？

0719名無しさん＠ピンキー (ﾜｯﾁｮｲ 3eb3-/Z1g)

2026/01/12(月) 21:16:26.08ID:0fnRfN8z0

初心者はLM Studioが良いよ
単体で動かせてモデルダウンロードしやすいから

0720名無しさん＠ピンキー (ﾜｯﾁｮｲ 3365-NUe/)

2026/01/12(月) 23:31:00.56ID:AZ66r3L40

ありがとう
LMstudioでスレに有ったqwen3～ったので動かしてみた
期待した返答が来たけど、ちょっと速度が遅いな…
この辺はスペックをどうにかするしかないか

0721名無しさん＠ピンキー (ﾜｯﾁｮｲ f29f-6Z3P)

2026/01/12(月) 23:44:19.94ID:OIORPy+m0

これはSLMのカテゴリーかな頑張ってるけどまあ小さいなりの性能
https://www.liquid.ai/ja/blog/introducing-lfm2-5-the-next-generation-of-on-device-ai

0722名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr17-SydR)

2026/01/13(火) 09:54:32.11ID:AHx2N4uir

slmが凄いとかいう風潮やめて欲しいわ
gpt5.2ですら怪しいときがあるんだからそれより少ないのが役立つわけがない

0723名無しさん＠ピンキー (ﾜｯﾁｮｲ b732-8cZs)

2026/01/13(火) 10:39:18.45ID:gPGsq1yO0

そんな風潮あるか？

0724名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f32-5de0)

2026/01/13(火) 10:53:36.90ID:KI0ClFsj0

SLMは色々な用途で普通に役に立ってるし
性能が上がればさらなる小型化や同サイズでやれること増えるし
通信環境整えてサービスのAPIにつなげみたいな器材ばかりやないし
凄いの出てきたら開発も利用も用途増えるしすごいというよそりゃ

0725名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr17-UF1D)

2026/01/13(火) 11:14:32.58ID:Uk1lac2Cr

釣りタイトル文化に問題があるような
LFM2.5がすごい！という動画を拡散すると中身は見てないやつがすごいんだって記憶するという

LFM2.5は日本語が喋れるのに700MB！凄い！ってタイトルに入れてくれ

0726名無しさん＠ピンキー (ﾜｯﾁｮｲ 3e27-5de0)

2026/01/13(火) 12:21:54.93ID:QxpbyeuB0

AI驚き屋ってのがある
知識なくても何でも新技術凄いと騒げば
同じ様に知識無いけどAIは何か凄いと思ってる層が釣れる

0727名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sd12-PuTB)

2026/01/13(火) 13:00:59.15ID:f0/mo2LTd

ラズパイとかが好きなタイプの連中が騒いでるんじゃね
ミニチュアや箱庭が好きなんだろう
でんちゃと同じカテゴリー

0728名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f32-5de0)

2026/01/13(火) 13:34:38.68ID:KI0ClFsj0

SNSで新しいAI情報を紹介してるだけみたいなのまでAI驚き屋といって叩いて煽ってる側が
有料でAIの本質情報教えますマンみたいなのだったりする時代

0729名無しさん＠ピンキー (ﾜｯﾁｮｲ c7a8-btwR)

2026/01/13(火) 14:22:39.00ID:WR1YxfAx0

PC新調したしローカルLLM始めたいなと思ってスレ読んでたけど、割とグラボ複数でVRAM増強してる感じなんやね
グラボ1枚（VRAM16GB）だとローカルLLMはまだ難しい感じ？

0730名無しさん＠ピンキー (ﾜｯﾁｮｲ b732-8cZs)

2026/01/13(火) 14:27:27.51ID:gPGsq1yO0

VRAM16GBでもMoEならそれなりに遊べる

0731名無しさん＠ピンキー (ﾜｯﾁｮｲ 7247-YDYy)

2026/01/13(火) 14:29:25.64ID:/2Cg9zMf0

>>729
7B~14Bモデルならちゃんと動くよ
もちろんチャッピーなどオンラインモデルの性能を期待してはいけない
でも7Bってエロに関しては完全フリーだった頃のモデルばっかだから意外と楽しめる

0732名無しさん＠ピンキー (ﾜｯﾁｮｲ f232-+fC0)

2026/01/13(火) 14:35:31.61ID:O7FR8Zm10

ちょっと前に比べたらvram16gbに乗り切って日本語ちゃんと返せるモデルが乱立してるのは劇的進歩ではあるよ
普通に使えるっちゃ使える
moeも出てきたし

0733名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sd12-PuTB)

2026/01/13(火) 14:42:37.09ID:f0/mo2LTd

Qwen235bが出た時に速攻でメインメモリ128GB以上の環境を作れた奴が勝ち組

denseモデルだとVRAMかメインメモリかの2択になって大型モデルでGPUを全く活かせないからな

0734名無しさん＠ピンキー (ﾜｯﾁｮｲ c7a8-btwR)

2026/01/13(火) 14:48:54.18ID:WR1YxfAx0

軽量でも動く設定いれて軽いモデル入れれば動くやつもあるよって感じかな
もうちょい調べてお試ししてみるわ、あんがと

0735名無しさん＠ピンキー (ﾜｯﾁｮｲ 72c7-3e1D)

2026/01/13(火) 14:50:40.63ID:i0hzGkdj0

qwenやgpt-ossなどMoEだとGPUは1枚で十分
MoEはGPUの枚数増やすと性能が低下しちゃうんだよな
モデルを全部VRAMに載せられるならGPUの複数枚挿しもありだね

0736名無しさん＠ピンキー (ﾜｯﾁｮｲ 1b11-8EHP)

2026/01/13(火) 17:25:06.34ID:apbJBegp0

SLMでフィジカルAIって好きな特徴の女がいたらパシャパシャしまくるデバイスとかそんな奴やろ？

0737名無しさん＠ピンキー (ﾜｯﾁｮｲ 07d7-NCp1)

2026/01/13(火) 20:35:24.00ID:q/F/NBED0

ryzen haloってのはcpuオンダイメモリなん？
この時代マザーにポン付けで128GBもあって何かそこそこに動いたらええなあ

0738名無しさん＠ピンキー (ﾜｯﾁｮｲ b6a0-5de0)

2026/01/14(水) 08:01:05.78ID:TkgALyb20

3060復刻、DDR4復刻、AM4復刻

5年くらいこの状態になるってことだな、これ以上のスペックを求めるなら、高額な料金を出せと

0739名無しさん＠ピンキー (ｽﾌｯ Sd12-vlRz)

2026/01/14(水) 10:44:57.16ID:YwnyDflyd

>>726
あいつらレビューや批評はしないしな
この動画生成AIはアニメ動かしてもまともな挙動してくれないとか、そういう大切な情報ほどまったく出さない

0740名無しさん＠ピンキー (ﾜｯﾁｮｲ 3eb3-/Z1g)

2026/01/14(水) 10:56:25.16ID:py2XGvmY0

一般向けでこんなに高騰するんじゃ企業向けの高騰も時間の問題だよな
使うのにコストが掛かるんじゃ回収もキツくなるし流石に小型化が進みそう

0741名無しさん＠ピンキー (ﾜｯﾁｮｲ e36a-SydR)

2026/01/14(水) 11:58:16.52ID:TaHgEtC40

そう言えばなんで高騰してんの？

0742名無しさん＠ピンキー (ﾜｯﾁｮｲ 3e27-5de0)

2026/01/14(水) 12:33:36.64ID:EtnTl6+W0

OpenAIが数年分のメモリの大量発注かける
↓
メモリの生産ライン圧迫されて品薄になるのでは
↓
今のうちに在庫確保せなって皆が買い占めに走って高騰

メモリの会社が生産ライン増やせばいいという話でもなくて
工場作るには数年かかるし、その後に需要が減ったらメモリ会社が大損するから慎重になる
メモリ業界って相場の乱高下で体力無い会社から死んでるし迂闊に動かんのよ

0743名無しさん＠ピンキー (ﾜｯﾁｮｲ 7258-oSIQ)

2026/01/14(水) 14:13:22.39ID:xTKgHKvP0

DRAM事業はハイリスクハイリーターンだからな
ちょっと投資ミスるとすぐ倒産する

0744名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f32-5de0)

2026/01/15(木) 00:13:04.65ID:lvLdrOG20

破滅的忘却のせいでAIの性能に限界が出てくる
↓
MoE発明、モデルが巨大化する代わりに破滅的忘却の影響を軽減、劇的な性能アップに成功
↓
OpenAI、Google、AnthropicなどのAI企業が立て続けにAIデータセンター建設を開始
↓
OpenAIが先んじて数年分のメモリの大量発注かける
↓
HBMを輸入できない中国と値上がり情報を得た転売屋がDDR5メモリを買い占める
↓
今のうちに在庫確保せなって皆が買い占めに走って高騰

ここまで書かないと「OpenAIが、サム・アルトマンがすべて悪いんだ～」みたいな奴が増えかねないよ

0745名無しさん＠ピンキー (ﾜｯﾁｮｲ 3e27-hTMW)

2026/01/15(木) 01:01:25.39ID:U00pFogF0

最初の三行いる？

0746名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f32-5de0)

2026/01/15(木) 01:11:44.54ID:lvLdrOG20

>>745
OpenAIの買い占め報道でOpenAIを悪者にしてる奴が大量発生してるじゃん
OpenAIが買い占めなかったら競合AI企業が買い占めてただけなのに
あと、なぜAIに大容量メモリが必要になったのかを知らない人がいるかもしれない

0747名無しさん＠ピンキー (ﾜｯﾁｮｲ 520e-btwR)

2026/01/15(木) 01:12:33.18ID:gJr7NyHH0

>>744
いやgpuの製造はopenaiの仕事じゃないから普通にopenaiが悪いよ
あと2年以上前からmoeやってるしmoe化が進んでなかったらスケーリングでごり推すんだから今以上にデータセンター必要だぞ

0748名無しさん＠ピンキー (ﾜｯﾁｮｲ 666d-uqmN)

2026/01/15(木) 01:28:49.76ID:xG0eF0dQ0

ま、人類に与えられたリソースを食い潰す速度がとんでもなく加速してるって事よ
今生きてる人間にとっては楽しくて良い事だから遊びまくるしかねー

0749名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f32-5de0)

2026/01/15(木) 01:41:46.91ID:lvLdrOG20

>>747
MoEの理論自体は2013年発表だから時系列はおかしかったけど
Denseモデルでスケーリングごり押しができなくなったからMoE化が始まった認識であってるはず
Denseモデルはパラメーターを増やすと演算量が増えて遅くなる問題もあるから

0750名無しさん＠ピンキー (ﾜｯﾁｮｲ 7209-Bs3R)

2026/01/15(木) 01:53:48.85ID:43plYfkx0

べつにリソースを食い潰してるわけではないだろ
急激に需要が伸びたから不足しただけでスケーリングはできる分野だぞ

0751名無しさん＠ピンキー (ﾜｯﾁｮｲ 520e-btwR)

2026/01/15(木) 01:59:33.12ID:gJr7NyHH0

>>749
gpt4の時点からmoe使ってるってさんざん言われてたろ
多エキスパート小アクティブが進んだならわかるけどさ
ウエハの買い占めだって競合に嫌がらせしてnvidia相手に値切りたいだけだよ

0752名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f32-5de0)

2026/01/15(木) 02:23:10.99ID:lvLdrOG20

>>751
別にChatGPTだけじゃなくAI全体的な話なんだけどな
画像/動画生成も新世代モデルはMoE化してるし

OpenAIとNVIDIAの内部交渉的なことは情報がないのでわからん
あなたの妄想？

0753名無しさん＠ピンキー (ﾜｯﾁｮｲ d320-UF1D)

2026/01/15(木) 06:28:50.54ID:85Oqk5Iu0

誰のせいかと言えばトランプ関税のせいでしょう
気まぐれで関税が倍になる時代なんだから全員に先行して押さえておくインセンティブが発生してしまう
誰がやったか全く関係ない

0754名無しさん＠ピンキー (ﾜｯﾁｮｲ b6a0-5de0)

2026/01/15(木) 07:51:01.90ID:wIvUhweV0

旧世代回帰で、得をするのはインテルだな、いいね、13世代14世代なんてなかった。インテルの主力は12世代。
もうＤＤＲ３まで戻るって話もあるし、win11もいらなかったな

0755名無しさん＠ピンキー (ﾜｯﾁｮｲ fff6-3Sqk)

2026/01/15(木) 08:02:14.39ID:or5BJ6pD0

そのうちメモリ2Gも積んでるなんてスゲーみたいになるのか

0756名無しさん＠ピンキー (ﾜｯﾁｮｲ 07ee-YDYy)

2026/01/15(木) 08:16:20.78ID:Z7oUQcFB0

今SSDもヤバい事になってきてんだよね
サンディスクが前代未聞の1～3年分のSSD代の前払いを要求とかなんとか
こっちも需給が崩壊しつつあるみたい

0757名無しさん＠ピンキー (ﾜｯﾁｮｲ e36a-SydR)

2026/01/15(木) 11:15:13.47ID:4efICQPX0

だいたい悪いことは中国のせい
だからコレもそう
買い占めてるとかじゃねえの？

0758名無しさん＠ピンキー (ﾜｯﾁｮｲ 72c7-3e1D)

2026/01/15(木) 11:18:38.40ID:hPlUmZOu0

正月だったかパソコン工房でSSD4TBが3万円台で売ってけど買っとくべきだったな
HDDは余裕あるけどSSDはカツカツ
今度店行くときが怖いわ

0759名無しさん＠ピンキー (ﾜｯﾁｮｲ 7e1c-zzHJ)

2026/01/15(木) 17:08:12.65ID:1G9XiyS30

>>751
ウエハ買い占めは事実誤認
OpenAI批判以前の問題
自分がデマ信じ込んでるアホということを自覚したほうがいい

0760代行 (JP 0Hee-U7y1)

2026/01/15(木) 20:54:56.64ID:7dBSkyyoH

【本文】↓

LMSTUDIOで少し前までqwen3-vl-8b-nsfw-caption-v4.5でNSFWの質問に回答してくれていたのですが、今試すと
I'm sorry, but I can't fulfill this request.
The content you're asking for is not appropriate and violates my safety guidelines.
If you have any other questions or need assistance with something else, feel free to ask!
という回答が返ってきました。これは設定の問題でしょうか

0761名無しさん＠ピンキー (ﾜｯﾁｮｲ 36a9-5de0)

2026/01/15(木) 22:15:54.78ID:CTmaQDBZ0

llamacppで数日前にqwen3-nextの1～2割高速化のパッチが当たってたみたいやで
ただしGGUFも新しく作り直されたものを使う必要あり
unslothはもう新しいのだしとったけどqwen公式は古いままやな

0762名無しさん＠ピンキー (ﾜｯﾁｮｲ b732-8cZs)

2026/01/16(金) 05:31:22.71ID:763twXpD0

>>760
設定の問題だったりseedの問題だったり
他に何か思い当たる原因がある感じ？

新着レスの表示

レスを投稿する