なんJLLM部 避難所 ★9
0661名無しさん@ピンキー (ワッチョイ 5ffb-xebt)2025/10/16(木) 15:20:59.54ID:N2IolTdl0
>>660
https://x.com/AliDTwitt/status/1977685088285675860

以下GROKによる翻訳
Mac Studio M3 Ultra 512GB RAM 80 GPUでGLM 4.6 8bit(MLX)をローカルで実行中。LM Studioで書くと、380GBのRAMをガッツリ使いながら、たった3.5トークン/秒しか生成しない。壁のペンキが乾くのを見ている気分。

品質ではGPT5 Codex(High think)やSonnet 4.5を上回る。とにかく遅いだけ。
@Zai_org
の素晴らしい仕事、GLM 4.7が大幅に速くなることを期待してる。
0666名無しさん@ピンキー (ワッチョイ 3b8f-xFyt)2025/10/16(木) 17:26:24.77ID:LLWWm9uS0
といってもVRAMが300GB/s以下ってことは500GBのDenseモデルを動かすとしたら最大でも0.6トークン/sって事にならんか?
やっぱり帯域不足は痛いで。LPDDRを使う方向性はええと思うんやけど、それなりに高速なチップとクソ広バス幅用意してくれへん事にはなぁ……
0668名無しさん@ピンキー (ワッチョイ df67-s4CX)2025/10/16(木) 20:12:37.09ID:cCpqskzq0
MoEモデル前提だとLPDDR5選ぶ理由はないわねえ
70Bあたりのdenseモデルがスカスカだから活かしどころがないのも難点
0669名無しさん@ピンキー (スップ Sd7f-p9PY)2025/10/16(木) 20:15:02.24ID:mwCUko1ld
単一モデルでthink/no thinkモード切り替えみたいにnsfw/sfw切り替えできるようにならんかなー
0670名無しさん@ピンキー (ワッチョイ 3b10-dFrV)2025/10/16(木) 21:00:16.02ID:iYqYpuLM0
think/no think切り替えとnsfw/sft切り替えは
本質的に同じだからできるんだけど
やってくれる人がいないんだろうねw
一番最初が一番儲かるからがんばってみては?
レスを投稿する


ニューススポーツなんでも実況