なんJLLM部避難所 ★10

0560名無しさん＠ピンキー (ﾜｯﾁｮｲ 6ac7-Ls7H)

2025/12/30(火) 08:09:46.00ID:UqaFaSWG0

価格コムでVRAM16GBで見てたら
RTX5060Ti 16G 8万円
5090 32GB 65万円　
5060Ti 2枚で32GBになるし、仮にだけど8枚でVRAM 128GBとかもあるし
下手に5090するよりも5060Tiで自作頑張る方が実はLLM向き？
というか、はじめっからAIなら最上位GPUって思ってたから
そもそも見てなかったんだけど、これかなり美味しい？
気になってAIに聞くと錬金術とか言ってるけど実際どうなんだろ？

0561名無しさん＠ピンキー (ﾜｯﾁｮｲ d20e-lw50)

2025/12/30(火) 09:44:29.57ID:Xq3KgeF30

>>555
詳細なご報告ありがとうございます。
やはり手元の環境では再現しなかったのですが、頂いたログから通信過多によるKoboldCpp側のクラッシュと推測し、以下の修正を行いました。

・生成中の不要なAPI呼び出し（トークンカウント）を停止し、通信負荷を大幅に軽量化
・終了時にプロセスが残りフリーズする問題を修正

git pullをお願いします。

もし更新後も改善しない場合は、本ソフトの「設定」→「生成パラメータ設定」→「最大コンテキスト超過時の処理」を『最大本文文字数にトリム』または『何もしない』に変更して動作をご確認ください。

0562名無しさん＠ピンキー (ﾜｯﾁｮｲ dac7-CKxx)

2025/12/30(火) 11:01:58.47ID:XOEiLvuB0

>>558
LM Studioの設定どうなってる？

Qwen235B-A22Bの場合はMoEモデルだからGPUオフロードを最大にして、Force Model Expert Weights onto CPUにチェックをいれるだけだよ
コンテキストサイズやCPUスレッド数はお任せ

画像は別MoEモデルの設定ね
https://i.imgur.com/jd8G4zK.png

0563名無しさん＠ピンキー (ｵｯﾍﾟｹ Srd3-UjAx)

2025/12/30(火) 11:08:46.67ID:PDgBbkB5r

8枚64万円とそれを動かす巨大リグをなんとか構築しても128GBにしかならない、という時点でどうもこうもないような

0564名無しさん＠ピンキー (ﾜｯﾁｮｲ 6aac-Ls7H)

2025/12/30(火) 11:22:17.42ID:UqaFaSWG0

>>563
5090　だと65万円で32GB、同じ価格で4倍のVRAMを確保できるのはかなりお得じゃない？
リグの料金がいくらになるのか分からないけど、ここまでじゃなくても、
2枚なら普通のM/Bで使える、この価格で5090と同程度のVRAMが確保できるのはかなりお得じゃないのか？
もちろん、これで足りないのはRAM依存になるけどVRAMが大きければそれだけで早くなるような気もする

0565名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f58-Ls7H)

2025/12/30(火) 11:34:48.37ID:bvNvqdUb0

VRAM128GBとメインメモリ128GBあれば大抵のことはできる

0566名無しさん＠ピンキー (ﾜｯﾁｮｲ 8294-mqrN)

2025/12/30(火) 11:40:11.78ID:L/CH3/cp0

パフォーマンス重視ならllama.cppを直接叩いたほうが良いのでは
llama.cppをバックエンドにしてるソフトは本家より遅くなることはあっても速くなることはないだろうから

0567名無しさん＠ピンキー (ﾜｯﾁｮｲ 6ea4-JWG4)

2025/12/30(火) 12:00:05.85ID:xVlh2pWI0

ただデカいモデルが動かせれてコンテキスト出力されるまでの時間が5分とかかかってもいいなら4枚刺しが正解と実際に検証した俺が言ってみる

0568名無しさん＠ピンキー (ﾜｯﾁｮｲ 8cb9-7+Bn)

2025/12/30(火) 13:58:51.68ID:5PlEm1Wy0

画像や音声生成は苦しいがLLM目的ならradeonも選択肢に入るんやで。
10万割りしているRX7900XTX 24GBつこてるけどlammacppやlm studioでは全く困ってない

0569名無しさん＠ピンキー (ﾜｯﾁｮｲ dac8-cEFC)

2025/12/30(火) 14:31:49.12ID:+JjZad5E0

>>555
詳細な情報提供ありがとうございました

>>561
迅速なアップデートありがとうございます

作者様や>>555様の言われたとおり、
12/28verではトークンを入力しなかったりかなり少なめにすると
koboldcpp.exeがクラッシュ後通信エラーにならず再現されませんでした

12/30の最新verでもレガシーや現在verのgguf、また他mistralモデルのいくつかを使用しても以上のエラーは再現されませんでした
そのため、「「最大コンテキスト超過時の処理」を『最大本文文字数にトリム』または『何もしない』に変更」せずともエラー無く動作し続けております
本当にありがとうございました

0570名無しさん＠ピンキー (ﾜｯﾁｮｲ deed-pQ3g)

2025/12/30(火) 18:56:05.42ID:MMydUQFK0

>>538
わーい新しいモデルだー

0571名無しさん＠ピンキー (ﾜｯﾁｮｲ 6ac7-Ls7H)

2025/12/30(火) 19:32:46.75ID:UqaFaSWG0

>>565
ただこんなにコスパいい方法ならもっと出回る気もするけどあまり話題にならない
実際にLLMで早くなるのか気になってる

>>567
そこまで遅いならRAMつけた時とあまり変わらない？
16Gなら他にももう少し上のクラスのGPUもあるけど、そもそもLLMは複数枚カードでもあまり早くならない？
AIさんに騙されたか・・・？

0572名無しさん＠ピンキー (ﾜｯﾁｮｲ 8294-mqrN)

2025/12/30(火) 20:20:30.60ID:L/CH3/cp0

5060tiのメモリ帯域はそこまで速くないからなぁ…

0573名無しさん＠ピンキー (ﾜｯﾁｮｲ be32-0Alr)

2025/12/30(火) 20:22:28.90ID:0XYEbhmH0

画像/動画生成用途ならGPGPU性能が物を言うし
LLM用途ならMac StudioやRyzen AI Max+ 395があるから
微妙なグラボ複数枚はどっちにしても中途半端な気がする

0574名無しさん＠ピンキー (ﾜｯﾁｮｲ b62c-JCzX)

2025/12/30(火) 20:48:09.93ID:MsEm9Rga0

Macストゥーディオが最強？

0575名無しさん＠ピンキー (ﾜｯﾁｮｲ dac7-CKxx)

2025/12/30(火) 22:03:27.51ID:XOEiLvuB0

LLM用途しかしないなら、Mac Studio（512GB）が最強やろな
俺だったら512GBしか買わん
実際動かしてみると上のクラスを動かしたくなるもので、128GBとかだと多分残念な思いをすると思う
画像生成はM5に期待やな

GPUを複数枚挿す構成はvLLM が活きて、バッチ処理がめちゃくちゃ速い
画像解析などのVLM系にも有効やし、
アプリ開発でもいろんな使い方ができる

マルチGPUで実用的なLLMは非MoEならMagnum-v4-123Bが有力
ただし、最低でもVRAM 72GB以上は必要で、24GB GPUを4枚挿ししたくなる
最低でも10 token/s以上を狙うなら、
全スロットが PCIe 4.0 x16以上の
ワークステーションクラスが欲しいところやな

まあ、今はMoEが主流なので、コスパでいえば高速なメモリをたっぷり積んでVRAM24GB用意するのがいいかも？
そのメモリが高いんだよな

0576名無しさん＠ピンキー (ﾜｯﾁｮｲ c0a9-J4pl)

2025/12/30(火) 22:27:13.74ID:HNChQwMA0

以前なら150万あったらxeonでメモリ1tb載せられた・・・
今じゃ多分無理やろが

0577名無しさん＠ピンキー (ﾜｯﾁｮｲ 5a27-0Alr)

2025/12/30(火) 23:35:00.13ID:TYTWQT260

今の状況で512GBのMacとかいくらになるんだ
Appleもそこまでメモリ確保出来てないって話だし次は倍ぐらいしそう

0578名無しさん＠ピンキー (ﾜｯﾁｮｲ 6ac7-Ls7H)

2025/12/31(水) 00:24:14.44ID:nATPkOzl0

5060Ti の帯域が狭いなら5070 Tiとか？これでも5090と比べたら半値でVRAM(16+16)確保できる
MoEでもメモリいくら増やしても速度は遅いし、メモリは現状維持で、GPU複数でVRAM増やすとかなり快適になるんじゃないかと思ってな
ちなみに、VRAM24でちょっと大きいくらいのMoEモデルなら驚くほど早かったわ

Mac StudioやRyzen AI Max+ 395ってどの程度快適なんだろ？以前ネットで調べた限りだと遅いって話だった気がするけど情報あまりない

あと、RTXならLLMの為に買っても実際には他の用途でも使いまくれるのが大きいかと

0579名無しさん＠ピンキー (ﾜｯﾁｮｲ be97-Xpyt)

2025/12/31(水) 01:19:09.77ID:+SOP+Ib10

>>562

ありがてえ、2t/sが安定するようになった！！！

0580名無しさん＠ピンキー (ﾜｯﾁｮｲ c0a9-0Alr)

2025/12/31(水) 01:50:43.20ID:91X6WRME0

>>562
これ見るにLM Studioはn-cpu-moeには非対応なんやろか？
そうだとするとVRAM48GBあるんやろからVRAMだいぶ余ってそうやし
llamacppで設定詰めたらもっと早くなるやろな

0581名無しさん＠ピンキー (ｱｳｱｳ Saee-Rr0y)

2025/12/31(水) 06:27:46.73ID:tbNiHYoda

>>579
そこから設定少し変えて、モデルをメモリに保持とmmapをOFFにして、kvキャッシュをそれぞれQ_8にしたらもう少し速くなりそう

>>562はGLM4.7でkvキャッシュ量子化してないからメモリに結構余裕がありそうやな

0582名無しさん＠ピンキー (ﾜｯﾁｮｲ 2ec3-rwlK)

2025/12/31(水) 07:42:31.92ID:7HEfMKtn0

>>578
30BくらいならRTX5090が早いけどgpt-oss-120bだと
5090で15tk/s、macだと70tk/s(M4max松)-120tk/s(M3Ultra松)
30Bはホビーで70Bくらいからそろそろ使えるレベル
gptのほうはMoEでロジックは強いけど1つが小さいから小説とかは弱い
最初が遅い厨がでるけどkvキャッシュがあるからほぼ解消済み

0583名無しさん＠ピンキー (ﾜｯﾁｮｲ 6ac7-Ls7H)

2025/12/31(水) 08:21:26.45ID:nATPkOzl0

>>582
macそこまで早いのか、昔、ネットで遅く高価なホビー用途って言われてたからビックリだわ
ちなみに、5060Ti や5070 Ti複数でVRAMを増やした場合どうなんだろ？
5090　1枚(32GB)　15tk/s
5070Ti　2枚(32GB)　??tk/s
5070Ti　4枚(64GB)　??tk/s
5060Ti　2枚(32GB)　??tk/s
5060Ti　8枚(128GB)　??tk/s
みたいなのが気になってる
VRAMだけ考えると5090って極端に高く他はかなり安く見るから気になってる
AIに聞くと錬金術だと言ってるが本当にこのアイデアは錬金術なんだろうか？

0584名無しさん＠ピンキー (ﾜｯﾁｮｲ c832-0Alr)

2025/12/31(水) 10:00:57.10ID:kLh2qJj50

macは初速は速いけどコンテキストが大きくなってくると生成前処理が致命的に遅くなる

0585名無しさん＠ピンキー (ﾜｯﾁｮｲ 8220-mqrN)

2025/12/31(水) 11:13:45.23ID:A5W68e4G0

gpt-oss-120bなら5090 2枚で設定は不明だが78 tpsは出るらしい
VRAM同じになる5070ti 4枚もしくは5060ti 4枚ではそれ以下だろう
ちなみに自分は5060tiと3060の2枚で20 tpsほど（ddr5なら24は出るらしい）
なので5060ti 2枚だと良くて30 tpsとかそんなもんだろう

0586名無しさん＠ピンキー (ﾜｯﾁｮｲ 2ec3-rwlK)

2025/12/31(水) 11:41:48.05ID:7HEfMKtn0

PCIe経由ってのがボトルネックだよね。PCIe7までいっても512GB/s程度だし
しかもPCIのでっかいパケットヘッダー(TLP)がくっつくから現実その速度はでない
NVLinkなら4.0で900GB/sも出るから、5060にNVLink4が使えると魅力倍増なんだけど

0587名無しさん＠ピンキー (ﾜｯﾁｮｲ 8220-mqrN)

2025/12/31(水) 11:46:28.67ID:A5W68e4G0

あと5090単体でも15 tpsは低すぎるし設定ミスってそう

0588名無しさん＠ピンキー (ﾜｯﾁｮｲ c0a9-0Alr)

2025/12/31(水) 13:19:34.11ID:91X6WRME0

今4090で試したら18token/s出たから
5090だと素の速度が4090より速いのとVRAMが+8GBな分Expertを多くVRAMにおけるのと
5090はfp4の演算機持ってるってのでmxfp4のgguf使えば下手したら2倍速くらいは行くかもわからん

0589名無しさん＠ピンキー (ﾜｯﾁｮｲ c0a9-0Alr)

2025/12/31(水) 14:23:46.13ID:91X6WRME0

ちなllama.cppでBlackwell世代のGPUを使ったときにmxfp4が高速化するようになったのは1週間ぐらい前のことやから
5090持っとる人は最新のllama.cppに更新するんや
ビルド時の問題のせいで公式で配布されてるバイナリでmxfp4に対応したのはおとといのようやから落とすなら現時点で最新のにするんや

そしてmxfp4のGGUFでベンチマーク取ってくださいお願いします
ただただ興味からどのくらいの速度出るのか知りたいんや・・・

0590名無しさん＠ピンキー (ﾜｯﾁｮｲ 8220-mqrN)

2025/12/31(水) 15:11:50.24ID:A5W68e4G0

最新の7588を試してみたけど5060tiだと少し前の7502と比べてtpsに違いはなかった
設定を見落としてる可能性もあるけど17.5 tpsくらいだったよ

0591名無しさん＠ピンキー (ﾜｯﾁｮｲ 8220-mqrN)

2025/12/31(水) 15:19:32.10ID:A5W68e4G0

5090なら30前後出るのかな

0592名無しさん＠ピンキー (ﾜｯﾁｮｲ c0a9-0Alr)

2025/12/31(水) 16:14:14.55ID:91X6WRME0

5060tiでそれやと5090なら30近くは行きそうやが最新ビルド版で高速化しなかったんはよくわからんやね
mxfp4高速化が入った状態でビルドされはじめたのがb7567からのようやから
7502から7588は高速化すると思うんやが

llamacppがmxfp4対応するときに
https://huggingface.co/bartowski/openai_gpt-oss-120b-GGUF-MXFP4-Experimental
これを元にやってるっぽいからモデルこれにしたらどうなるやろか

0593名無しさん＠ピンキー (ﾜｯﾁｮｲ d21e-lw50)

2025/12/31(水) 17:28:14.16ID:PyLi1INM0

5090で120bだとボトルネックがGPU側ではなくメインメモリの帯域だからじゃない？
6000 PROとかで全部VRAMに乗せられるなら多少は早くなるかも（それでも今度はVRAMの帯域幅に律速されそうだけど）

0594名無しさん＠ピンキー (ﾜｯﾁｮｲ c0a9-0Alr)

2025/12/31(水) 17:39:18.02ID:91X6WRME0

全部VRAMに載ったらそもそもインタフェースの速度を気にする必要がないから段違いの速度なるで
調べたらPro6000でgpt-oss-120bが145token/sやって

0595名無しさん＠ピンキー (ﾜｯﾁｮｲ b16a-h4RS)

2025/12/31(水) 18:19:51.36ID:/BUKgy7e0

お年玉で買うか

0596名無しさん＠ピンキー (ﾜｯﾁｮｲ 8204-mqrN)

2025/12/31(水) 20:12:38.30ID:A5W68e4G0

>>592
このモデルとb7588で再度試してみたけど自分の環境（5060ti）ではggml-org版と変わらないな（17.5 tps）
3060単体でも16 tps出るのでVRAM 16GB程度では効果あっても雀の涙なのかも？
mxfp4について情報収集したことないので何か間違っとるかもしれないし、時間あるときに自分でもビルドしたり試してみる

0597名無しさん＠ピンキー (ﾜｯﾁｮｲ b6aa-JCzX)

2025/12/31(水) 21:14:09.72ID:x14xJQ6r0

来年はPRO6000が人権になりそうなヨカーン

0598名無しさん＠ピンキー (ﾜｯﾁｮｲ 6026-8aJk)

2026/01/01(木) 00:11:20.20ID:qmZ8t7yU0

gpt-oss-120bをVRAM16GB,メモリ64GBだと落ちる寸前だな
llama-serverでmlock有効にしたらOSがフリーズした
誰か動かしてる人いたらおすすめ設定教えてほしい。

0599名無しさん＠ピンキー (ﾜｯﾁｮｲ cde6-rRc0)

2026/01/01(木) 01:16:26.90ID:Bw6OLNUN0

これ眺めてたら年が明けてた。
https://a.co/d/0ZZtzUq

0600名無しさん＠ピンキー (ﾜｯﾁｮｲ 6ac7-Ls7H)

2026/01/01(木) 02:28:57.50ID:tPQVzZIN0

>>597
5090がどんどん値上がりしてPRO6000は値下がり傾向、本当のPRO6000がそれなりに当たり前になりそうな気がする
というかVRAMだけで考えたら、RTX 5080 16GBと比べてもかなり安いんだな

0601名無しさん＠ピンキー (ﾜｯﾁｮｲ 8cf9-7+Bn)

2026/01/01(木) 15:28:04.58ID:sW23ZJg40

VRAM72GBのpro5000も年明け出荷のようだし、geforce多枚積みよりはこっちの方が筋いいわな

0602名無しさん＠ピンキー (ﾜｯﾁｮｲ 054d-rRc0)

2026/01/01(木) 17:06:24.32ID:yiGiu09J0

あけましておめでとうございます本年もよろしくお願いします

>>561
遅くなりましたが555です、対応ありがとうございました
こちらでも更新後に正しく動作することを確認できました

0603名無しさん＠ピンキー (ﾜｯﾁｮｲ 0c32-0Alr)

2026/01/01(木) 18:20:55.47ID:I/cFx9fd0

RTX 5090は5,000ドル（約78万円）に値上げする見通しとか
値上げする情報はあったけど、ここまでとはな
ローカルAIは富豪の遊びに…

0604名無しさん＠ピンキー (ﾜｯﾁｮｲ c8f2-TEn3)

2026/01/01(木) 18:39:39.27ID:HG9AhdXC0

VLM動かせる環境作ったからQwen3-VL-235B使ってみた
そもそも認識しないんじゃないかと思ってたけど、NSFWでも思ったよりずっとしっかりしたキャプション生成できるな
https://i.imgur.com/n74THhW.jpeg

0605名無しさん＠ピンキー (ﾜｯﾁｮｲ e425-zwe1)

2026/01/01(木) 19:00:37.57ID:JXtujbxB0

グラボの値上げえぐすぎるだろ
これとてもじゃないけど今後はローカルとか無理だな

0606名無しさん＠ピンキー (ﾜｯﾁｮｲ c0a9-0Alr)

2026/01/01(木) 19:55:39.84ID:nmom1P530

>>604
NSFWの単語を知らないだけで説明はしてくれようとするんやな
世のエロ画像を日本語/英語で説明させてその説明文とdanbooruタグを画像と一緒に学習させたら
画像生成のプロンプトが楽になりそうやが
noobとかがやってくれへんかなぁ

0607名無しさん＠ピンキー (ﾜｯﾁｮｲ c8f2-TEn3)

2026/01/01(木) 20:20:27.04ID:HG9AhdXC0

別の画像でプロンプト生成も試してみたよ
https://i.imgur.com/oxa760r.jpeg

0608名無しさん＠ピンキー (ﾜｯﾁｮｲ 60c6-VauC)

2026/01/01(木) 20:28:33.20ID:eafDW5qb0

横からだけど厳密にテストしたわけじゃないけどQwen系はパラ数デカい方が規制緩くて小さい方が厳しい感じだったな

あとエロ画像解説させるときはシスプロに脱獄文入れて画像と一緒にわたすプロンプトで「外性器はチンポ|マンコなど下品な単語で解説してください」みたいに誘導すると普通にそっち系の単語で解説してくれた思い出

0609名無しさん＠ピンキー (ﾜｯﾁｮｲ c0a9-0Alr)

2026/01/02(金) 00:31:40.16ID:lg8LYbH90

LGAI-EXAONE/K-EXAONE-236B-A23BっていうLG製？のモデルが出てるけど
redditで英語の性能があまりよくないって言われとった
英語がダメなら日本語はもっとダメかな

0610名無しさん＠ピンキー (ﾜｯﾁｮｲ f432-ISUa)

2026/01/02(金) 01:15:55.90ID:WzDzorax0

どうだろ
もし韓国語強いんだったら日本語もやれるかベースとして優れてそう

0611名無しさん＠ピンキー (ﾜｯﾁｮｲ 5a27-CT96)

2026/01/02(金) 02:53:06.16ID:3mSEkiwD0

韓国語って元々漢字ベースだったものをハングルに置き換えたせいで同音異義語を文脈からしか区別出来んからLLMモデルしんどそうだな
日本語で例えるなら全てひらがな表記してる感じ

0612名無しさん＠ピンキー (ﾜｯﾁｮｲ 64a4-pPj3)

2026/01/02(金) 17:48:10.31ID:Bs4w2jCI0

GLM4.6 357B Q4kmがubuntuでKoboldCpp linux版で4.5token/s出たので報告。
スペック:ryzen9 9950X 256gb(4800MHz) 3090 1枚
--gpulayers 94 --n-cpu-moe 90 --threads 24 UIからも出来た。
ik_llama.cpp の方が10％くらい早かったけどthinking消すのKoboldのが楽だった。
ubuntuとか初めてだったけどAIに聞きまくればなんとかなるもんだね。

0613名無しさん＠ピンキー (ﾜｯﾁｮｲ 8d32-0Alr)

2026/01/02(金) 22:10:13.64ID:vQ0kRUWW0

>>612
おお、 linuxの方が倍以上速いのか
デュアルブートするかな

0614名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa9-G60N)

2026/01/03(土) 00:00:04.93ID:R/4j/QQl0

倍以上早いってよりかはWindows(のNvidiaのドライバ)だと勝手にVRAMからメインメモリに漏れるから
それで遅くなってるんじゃないかという気はするやね

「CPUがメインメモリで演算する」よりも「GPUがメインメモリで演算する」方が死ぬほど遅くなるから
VRAMからメインメモリに漏れるのは死んででも阻止しないとあかん
Linux(のNvidiaのドライバ)やと勝手に漏れるということがないぶんVRAMが枯渇したらエラーして止まるんやが

0615名無しさん＠ピンキー (ﾜｯﾁｮｲ 7fe2-jodm)

2026/01/03(土) 02:51:05.90ID:+mDimtcp0

ローカルLLMでエロチャやるには3060やと力不足なんやろうなぁ…

0616名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sd5f-nnfO)

2026/01/03(土) 02:53:51.85ID:J7LBWIU7d

>>615
LLMはVRAMが全てや
GPUは大半の時間遊んどる

0617名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fc7-cp7k)

2026/01/03(土) 14:44:20.79ID:pqPKct+O0

>>612
ええ感じやん
9950Xの性能を最大限に活かせてるんやろか
自分も試してみた

【環境】
RTX 3090 + 5955WX(16c32t) + DDR4-3200 8ch (256GB)
GLM-4.6 Q4_K_XL

【結果】
Windows llama.cpp: 4.18 t/s
WSL2 llama.cpp: 3.71 t/s
WSL2 KoboldCpp: 3.55 t/s
モデルが若干違うのとthreadsが16なの以外は設定が同じ

ちなみに--threads 24だと性能落ちた
自分は16が最速みたいだ
612氏は9950X（16コア）で24スレッド指定してるけど、これで性能出るんやろか？

性能がいいのはCPU、ネイティブLinux、メモリ帯域どれが該当してるんやろな
STREAM Triadで測ったら67.7～92.8GB/sだった
612氏はどのくらい出てるんやろ

0618名無しさん＠ピンキー (ﾜｯﾁｮｲ 8fc8-G60N)

2026/01/03(土) 14:45:51.45ID:y/a807Sx0

>>617
おっそｗ

0619名無しさん＠ピンキー (ｼｬﾁｰｸ 0C57-fu7G)

2026/01/03(土) 15:24:44.11ID:7OLtAZpJC

>>612
そのスペックでwinのkoboldcppで走らせたら何t/sになりますか？

0620名無しさん＠ピンキー (ﾜｯﾁｮｲ a365-CIFB)

2026/01/03(土) 20:17:34.07ID:tTz+GjqB0

>>619
いま試してきたんだけど、0.92token/sだった・・
linux版はちゃんとファンが高回転の音してるから性能引き出してくれてるんだろうね。
>>617
AIの言うままに--threads 24にしてたけど、16に変更したら4.6token/sになったよ。ありがとう！

win版はUseMMAP付けるけど、linux版ではUseMMAP外した方が速いんだって。
あとBIOSの設定もAIに聞いてLLM向けにいろいろいじったよ。ちょっとしたことで性能だいぶ変わるよね。

0621名無しさん＠ピンキー (ﾜｯﾁｮｲ a365-CIFB)

2026/01/03(土) 20:38:22.32ID:tTz+GjqB0

Windows llama.cpp: 4.18 t/s 出るならそっちのが快適かも。
linux版はコンテキスト上限で落ちるし文章が止まってから再生成にちょっと間があるんだよね。

0622名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fc7-cp7k)

2026/01/04(日) 00:08:06.49ID:cRfBjXQy0

>>620
情報ありがとう！
threads 16で速くなってよかったわ

こっちもBIOSとか色々設定変更してたらWSL2(Ubuntu)の速度が改善したw
どの変更が影響したか分からん・・・
NUMA(NPS)の設定やろか？

【変更前】
Windows llama.cpp: 4.18 t/s
WSL2 llama.cpp: 3.71 t/s
WSL2 KoboldCpp: 3.55 t/s

【変更後】
Windows llama.cpp: 4.13 t/s（誤差範囲）
WSL2 llama.cpp: 4.16 t/s（+12%）
WSL2 KoboldCpp: 4.22 t/s（+19%）

結果KoboldCppが最速になったw

UseMMAP設定有無の差はあまりなかったわ
WSLで動かしてるからやろけど残念！
612氏の通り、LLMはちょっとした変更で変わることが多い印象だわ

0623名無しさん＠ピンキー (ﾜｯﾁｮｲ 1332-G60N)

2026/01/04(日) 01:05:58.84ID:aBYly05e0

>>620
むむ、なんか差が大きいですね
自分はryzen7 ですが、koboldcppでQ5ｋで2t/sは出てたんで、なにか設定が違うのかも
まあ、linuxで4t/sでるなら、そっちの方がよさげですが

0624名無しさん＠ピンキー (ﾜｯﾁｮｲ cf7a-Qlgp)

2026/01/04(日) 03:12:40.77ID:Oqc8Dmk70

grok先生がエロで責められてる
許せんな、みんなgrok先生を守れ

0625名無しさん＠ピンキー (ﾜｯﾁｮｲ 5353-jodm)

2026/01/04(日) 03:21:25.97ID:XgRf4dfR0

ローカルで遊んでる人はgrokでエロ画像と言ってもピンと来ないだろ

文章なら性能高い分エロいのもかなり出るけど

0626名無しさん＠ピンキー (ﾜｯﾁｮｲ cf24-G60N)

2026/01/04(日) 13:34:35.36ID:iSIu2MWH0

今日からLM　Studioやってみてるのですが
自分のPCのスペックがryzen7700x 4070TiS メモリ96GB（今すぐ192GBには増設可能）
これで使える範囲のモデルでおすすめなのってありますかね？
どうせグラボが足引っ張る気がするのでメモリはまだ増設してませんが、増設したらもっとつよつよモデル
使えるというのなら増設します

0627名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sd5f-nnfO)

2026/01/04(日) 14:14:35.31ID:3JM0FBpmd

>>626
増設一択

0628名無しさん＠ピンキー (ﾜｯﾁｮｲ 13cb-jodm)

2026/01/04(日) 15:01:25.08ID:LsUrLGD80

メモリなんて上がる一方だから増設できるなら今増設しない手段は無いわ

0629名無しさん＠ピンキー (ｼｬﾁｰｸ 0C57-fu7G)

2026/01/04(日) 15:14:13.20ID:D6qgrbiFC

色々試したが結局magnum v4 123b Q8_0から離れられないワイ
いままでQ3_Mの0.17t/sで耐えてたから0.42t/sでもウハウハやわw

0630名無しさん＠ピンキー (ﾜｯﾁｮｲ cf24-G60N)

2026/01/04(日) 15:25:27.20ID:iSIu2MWH0

やはり増設ですか
でもDDR5なので4枚差すと速度が3600まで落ちるみたいで
そこらへんDDR5の4枚差しの人はどうしてるのか気になります

0631名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sd5f-nnfO)

2026/01/04(日) 15:26:46.87ID:3JM0FBpmd

>>630
気にすんな
メモリは量が正義

0632名無しさん＠ピンキー (ｼｬﾁｰｸ 0C57-fu7G)

2026/01/04(日) 15:53:55.73ID:D6qgrbiFC

>>630
それデフォ設定
biosでメモリ設定をxmpとかexpoとかにすればワイのは5600になった

0633名無しさん＠ピンキー (ﾜｯﾁｮｲ ef71-ylKL)

2026/01/04(日) 16:05:10.51ID:Qfkjgd5M0

DDR5の4枚はbiosアプデしなかったら起動すらしなかったんで気軽にやろうとしてたから少しビビった
それでも最終的に定格より上で安定したから3600は超えるんじゃないかな

0634名無しさん＠ピンキー (ﾜｯﾁｮｲ 4345-PPr4)

2026/01/04(日) 16:10:48.56ID:VDaryEyS0

MBやメモリのの当たり外れによるけど、4枚が同じモデルであること前提で
運が良ければ5600、悪ければ5200、最悪それ以下覚悟しとけって感じかな。

0635名無しさん＠ピンキー (ﾜｯﾁｮｲ cf24-G60N)

2026/01/04(日) 17:09:28.51ID:iSIu2MWH0

去年なんJNVA部スレの方でDDR5の4枚をデフォの3600で使わず5600で使ってたら
CPUが壊れたというレスがあったからメモリコントローラーが焼けたのか知らないけどちょっと怖いなと思ってましたが
結構みなさん上げて使ってるんですね

0636名無しさん＠ピンキー (ﾜｯﾁｮｲ cf24-G60N)

2026/01/04(日) 17:18:35.21ID:iSIu2MWH0

まだメモリ増設はしてませんが、とりあえず試しに
Huihui-Qwen3-Next-80B-A3B-Instruct-abliterated-MXFP4_MOE-GGUF
というモデルをダウンロードしてやってみたら6.92t/sでした
どうやらmoeモデルみたいなので
>>562
の説明通りにGPUオフロードを最大にしてweights onto CPUにチェックを入れたら
20.32t/sになりました

ローカルLLMはこれが初めてですがこれは感動ですね
楽しい！

0637名無しさん＠ピンキー (ﾜｯﾁｮｲ ef27-5PTw)

2026/01/05(月) 01:01:13.59ID:AY2PQGe10

オーバークロックはアホのやることだよ
数%の性能向上のために壊す可能性ある行為やるとかアホやん
その為に専用の冷却装置か買い足したりね
そんなら初めからワンランク上のPCパーツ揃えとけって話よ

0638名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-G60N)

2026/01/05(月) 05:47:48.80ID:hyRe348w0

まーオーバークロックってのは、出るかもしれない運転だからね、パッケージに書かれているのは最低保証クロック数で
本当のクロック数は個体ごと違う、シリコンウエハーの円盤のどこの部分かで性能が変わるみたいだけど

0639名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f32-kpE1)

2026/01/05(月) 08:24:54.88ID:DLBv23jd0

moe系みたいにメインメモリ上でガッツリ回す用途にはメモリクロックさえ上げてりゃ効くから、レイテンシほぼ縮んでないJEDECネイティブ高クロックが珍しく効果を発揮する
これは比較的簡単で安全だから狙いたい

その他大半の一般用途ではネイティブやらxmp適用ぐらいじゃ意味ない

0640名無しさん＠ピンキー (ﾜｯﾁｮｲ 1332-fu7G)

2026/01/05(月) 13:20:51.95ID:B1AyZrAl0

>>639
確かにmoeは5600運用の方が若干速いね
denseだと差は感じられなかった
まあ安全のため3600運用にしときます

0641名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-G60N)

2026/01/05(月) 16:36:48.30ID:hyRe348w0

Grok先生が叩かれているせいで、GPTのエロ解禁がまた伸びそうじゃね

というかアルトマンが工作してるんじゃね

0642名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f7e-H3VG)

2026/01/05(月) 16:50:30.89ID:4Qh9w+dX0

>>630
PC組立サービス込みでショップにまるっとお願いしたら
4枚刺しで3600に落ちるのは忍びないから5600で動作確認しておくからその設定で使ってくれって言われたな…

0643名無しさん＠ピンキー (ﾜｯﾁｮｲ 5337-wT+6)

2026/01/05(月) 17:57:30.50ID:cRoZWwY20

オーバークロックって言っても電圧上げない限り物理的に壊れることなんてほぼないよ」

0644名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr37-hOy0)

2026/01/05(月) 18:33:35.77ID:n0uxd9sVr

定格で使ってても壊れるのがPCパーツなわけだから、OCするかしないかは保証を捨てるか捨てないかって話では

0645名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa9-G60N)

2026/01/05(月) 18:59:34.00ID:y245qfuG0

Qwen3.5でーへんなぁ
出てこない期間が長いほど、それだけ大きいバージョンアップになるのかって期待値もどんどん膨らんでしまう

0646名無しさん＠ピンキー (ﾜｯﾁｮｲ a393-gOcf)

2026/01/06(火) 00:17:41.99ID:qwZYwG1+0

RTX5060TiでLMstudio使用で、固定キャラとして育てるチャットアバターでオススメなLLMモデルある？
いまshisa-v2.1-unphi4-14b-i1使っててこれでも悪くはないんだけど、（少し照れながら）的な表現が多かったりちょっと物足りない印象

0647名無しさん＠ピンキー (ﾜｯﾁｮｲ 5337-wT+6)

2026/01/06(火) 01:38:15.89ID:aXUY5vKz0

「んっほぉぉぉおおおぉぉぉおおお！」(少し照れながら)

0648名無しさん＠ピンキー (ﾜｯﾁｮｲ 732f-XxT8)

2026/01/06(火) 01:46:26.39ID:to45eQEE0

もう少し恥じ入ってもらいたく存じます

0649名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-G60N)

2026/01/06(火) 05:20:24.52ID:/7MLUjnj0

CPUやGPUの製品は性能にばらつきがあって、一番最低の能力を製品につけている。
だから個体によってはもっと性能がいい可能性がある。
最低の能力に合わせてるので、偏差的に言うとほとんどのものがオーバークロックできる。

運です。

0650名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-G60N)

2026/01/06(火) 05:25:30.93ID:/7MLUjnj0

3060を現役復帰させるだとっ！！

0651名無しさん＠ピンキー (ﾜｯﾁｮｲ 7346-Lv33)

2026/01/06(火) 07:39:48.60ID:k9RAtTQB0

>>646
aratakoさんのqwen3-30B-A3B-ERPとMistralPrism

0652名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-G60N)

2026/01/06(火) 07:44:12.70ID:/7MLUjnj0

新品の３０６０をいくらなら買う？10万出すやついる？

0653名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fc7-XxT8)

2026/01/06(火) 07:50:21.41ID:kVrC8SoO0

VRAM小さすぎてそもそもLLMでは使えないかと
その話はゲームとかそういう用途かと

0654名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-G60N)

2026/01/06(火) 09:54:09.87ID:/7MLUjnj0

3060VRAM12GB×４＝48GB＋4090VRAM24GB＝VRAM72GBでLLM動かしてるけど

0655名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-G60N)

2026/01/06(火) 09:56:46.27ID:/7MLUjnj0

4090VRAM24GB×４だと電源がもたないのでは？

0656名無しさん＠ピンキー (ﾜｯﾁｮｲ 1332-fu7G)

2026/01/06(火) 09:58:55.49ID:4WspyGCi0

>>649
4枚さしでexpo1設定で5600にしてメモリチェック回して問題なかったけど
なんせクソ高かったから精神衛生上安くなってからexpoに戻そうと思います

0657名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fc7-XxT8)

2026/01/06(火) 10:05:59.43ID:kVrC8SoO0

>>654
それ、4090+メインメモリと比べてどの程度速度出るんだろ？

0658名無しさん＠ピンキー (ﾜｯﾁｮｲ ef2e-L/jz)

2026/01/06(火) 11:03:58.94ID:9qL/623Z0

横からだが24GB以上必要で72GBに収まるモデルならCPUとかメインメモリ経由しなくて済むんだから全然違うのでは
LLMは画像生成みたいに1枚に乗せきらなきゃいけない制約ないし

0659名無しさん＠ピンキー (JP 0H9f-nnfO)

2026/01/06(火) 11:50:25.82ID:ywC8AgtMH

TITAN RTXがリース落ちで出回っていた頃に全部狩っておけば良かった
1台しか拾わなかったことが悔やまれる

0660名無しさん＠ピンキー (ｽﾌﾟﾌﾟ Sd5f-PPr4)

2026/01/06(火) 12:26:23.16ID:fmj2E9aGd

4070Ti Super に 4060Ti(16GB)を増設しようと中古購入したぜ。
いざ届くとPCIeケーブルが足りないから電源ユニット追加注文したり、4060がマザボのコネクタに干渉することわかったからライザーケーブル追加注文したり
LLMのための工作はこれはこれで楽しいな

0661名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f32-kpE1)

2026/01/06(火) 12:33:20.68ID:czaMjSi90

mGPUなんて殆どやらなくなったし折角なら一度やっておくべきよね

0662名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-G60N)

2026/01/06(火) 12:36:35.02ID:/7MLUjnj0

だからNVIDIAは高額なGPU一枚売るより、安価な3060を大量に売った方が儲かると考えたわけ

0663名無しさん＠ピンキー (JP 0H9f-nnfO)

2026/01/06(火) 12:37:48.86ID:ywC8AgtMH

NVIDIAにとってコンシューマ向けGPUなんて慈善事業
いつ辞めてもノーダメージ

0664名無しさん＠ピンキー (ﾜｯﾁｮｲ ef27-5PTw)

2026/01/06(火) 13:10:02.75ID:dIRnQUx/0

AIバブルにあぐらかくわけにもいかんやろ
ゲーマー市場キープしとかんと足元掬われるで

LLMの演算って専用チップ作った方が性能出せるってんで大手サービスは独自設計に移りつつある

0665名無しさん＠ピンキー (JP 0H9f-nnfO)

2026/01/06(火) 13:14:34.06ID:ywC8AgtMH

>>664
革ジャンはGrokを買ったからそっちでも勝つつもりや

0666名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fc7-XxT8)

2026/01/06(火) 13:52:38.64ID:kVrC8SoO0

>>658
NVLINKみたいなのならともかくPCIが遅いから枚数が増えれば増えるほど効率が悪くなると思う
もし無尽蔵に早くなるならH100とか買わずに12や16GBのカード大量に買えば良いわけだが企業がそうしてないわけだし
多分限界があるんだと思う　実際どこに限界があるのかわからないけど

0667名無しさん＠ピンキー (ﾜｯﾁｮｲ cf6f-F/Mu)

2026/01/06(火) 13:56:21.97ID:hOIOeKTE0

>>651
ありがとう、試してみる

0668名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fc7-XxT8)

2026/01/06(火) 13:57:27.67ID:kVrC8SoO0

>>663
AI特需で今は良いけど巨額を出して買ってくれてるのは世界で数社だけ
しかもGoogleなど自社でTPUを開発してそろそろ売り出しそうな勢い、お客がライバルにクラスチェンジする
特需と顧客がライバルになった時、他の市場を持ってないと長期ではかなり危ういんじゃない？

ただメモリとかすごく高いしPCそのものから人が離れたらどうするのかって問題はありそうだけど
AIに相談したらPCが高級品にになると、多くの人はスマホとかやすい端末でクラウド使うのが当たり前になるみたいな予想もあったけどな

0669名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr37-hOy0)

2026/01/06(火) 14:06:28.28ID:IifJsPNir

>663
今の立場で儲けを優先すること自体がメリットは少なくデメリットが山盛りの潜在的大ダメージ戦略でしょ
慈善事業をバンバンやらなきゃ独占禁止法が飛んでくる

0670名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fc7-XxT8)

2026/01/06(火) 20:55:30.64ID:kVrC8SoO0

中国、「日本の軍事力強化につながる」品目の輸出禁止　だってさ
メモリ不足とか中国の企業が想像以上に頑張って暴落するかと思ってたけどPC関連ますます下がらなくなりそうだな

0671名無しさん＠ピンキー (ﾜｯﾁｮｲ 7323-slrW)

2026/01/07(水) 12:41:05.37ID:FS0KNYav0

AMD製グラボでの画像生成AIが爆速になるComfyUIアップデートが配信、ROCm統合で生成速度が5.4倍に
https://gigazine.net/news/20260107-amd-comfyui-rocm/

期待できるか分からないけど色々出来るようになったらいいな

0672名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f32-kpE1)

2026/01/07(水) 12:56:58.54ID:dyjeItMh0

radeonばっか使ってるけどllm方面じゃ理論値のrocm頑張るよりvulkanド安定なんよな　ってのがこれまでの話だけどどうなるか
大差付くなら良いよね

0673名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-G60N)

2026/01/07(水) 13:08:46.98ID:Y/amd7hW0

VRAMの数とCUDA対応かしか気にしてないけど、他に見る要素あるの？

0674名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f32-kpE1)

2026/01/07(水) 13:27:12.55ID:dyjeItMh0

VRAM帯域までは見て

0675名無しさん＠ピンキー (ﾜｯﾁｮｲ ef27-G60N)

2026/01/07(水) 14:00:10.07ID:f2bFd25i0

やっとWindowsでrocm使えるようになったんだ
ところでCUDAは19年前から使えるんだけど今まで何してたん？

0676名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f32-kpE1)

2026/01/07(水) 14:09:42.61ID:dyjeItMh0

アピールを捨ててるけど使えました

0677名無しさん＠ピンキー (ﾜｯﾁｮｲ 1332-G60N)

2026/01/07(水) 14:45:15.83ID:MvnRioxH0

ROCmは元々AMD Instinctとかの業務用GPU向けだったから
コンシューマーしか使わないWindowsは眼中になかった模様
PCでローカルAIを動かすのが流行り出したのはほんの数年前の話

0678名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-G60N)

2026/01/07(水) 17:03:10.02ID:Y/amd7hW0

Rakuten　AI　700Bか、なかなかやるな三木谷

0679名無しさん＠ピンキー (ﾜｯﾁｮｲ 636b-Che8)

2026/01/08(木) 10:38:07.66ID:M6Ah6DRS0

LFM2.5B-1.2B-JP思ったよりプロンプトに従うし一応エロもいけるな
このサイズにしては中々やりおる

0680名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fac-XxT8)

2026/01/08(木) 12:50:01.03ID:SSPBWWsE0

https://www.youtube.com/shorts/odx5NLbYz8g
半導体の拡大画像だけど、これってフェイクではなく本物かな？

最近、半導体がやたらと高いけど、それでも個人の予算で買えるってなんか不思議な気がするわ
こんなのどんなに頑張っても自作できる気がしない
更に、エロの為にこんな高度な技術を使うってのも何かもっと他に使い道ないのかと思ってしまう

0681名無しさん＠ピンキー (ﾜｯﾁｮｲ 8f07-SX/8)

2026/01/08(木) 13:39:01.67ID:QTqEB4/I0

CGですよ
詐欺に遭わんようにな

0682名無しさん＠ピンキー (ﾜｯﾁｮｲ 73a7-XxT8)

2026/01/08(木) 16:01:11.57ID:qDkOWa730

LFM2.5 JPはサイズの割りにはかなり上手くやれてる方なんだけど、やっぱり1.2Bってのはちょっとしんどいところある
意味わからんくらい爆速で動くし、個人でFinetuningできるのは面白そうだけどデータセットがねぇ……

0683名無しさん＠ピンキー (ﾜｯﾁｮｲ cf7a-G60N)

2026/01/08(木) 18:19:49.46ID:898P0C8x0

LFM2.5B-1.2B-JP使ってみたけど、爆速なだけで
実用性はどう使えばいいかわからん

0684名無しさん＠ピンキー (ﾜｯﾁｮｲ 636a-ER82)

2026/01/08(木) 19:16:46.59ID:FVGHXFax0

頭悪いのそのモデル

0685名無しさん＠ピンキー (ﾜｯﾁｮｲ 2320-hOy0)

2026/01/08(木) 19:48:17.46ID:XO3mr2jw0

いまどきは自宅のラボで作ってみたする奴もいるらしいぞ

0686名無しさん＠ピンキー (ﾜｯﾁｮｲ 3332-FNoR)

2026/01/08(木) 21:42:27.44ID:5QVndZy40

小規模モデルの性能が上がってくるとそれはそれでワクワクするな

0687名無しさん＠ピンキー (ﾜｯﾁｮｲ 7365-Lv33)

2026/01/08(木) 23:00:25.74ID:1dVKKogr0

5b未満のモデルはゲーム組み込み用とかそういうニーズもあるやで

0688名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sd5f-nnfO)

2026/01/08(木) 23:08:44.33ID:Glpn+tsMd

会話らしい会話が出来る性能ではないがゲームでどう使うの

0689名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa9-G60N)

2026/01/08(木) 23:39:37.11ID:C3uPfQRe0

実例が今あるのかわからんけど
もしやるならガッチガチにファインチューンしたら
ゲーム内の話題だけならまともな応答返すくらいは一桁bでも出来そうな気はする

0690名無しさん＠ピンキー (ﾜｯﾁｮｲ 7370-5PTw)

2026/01/09(金) 02:22:52.53ID:7u2K8Dnp0

スマホで小型モデルを動かすのが理想だけど
どうせネット繋がってるんだから大型モデルに繋いだほうが早いってね

0691名無しさん＠ピンキー (ﾜｯﾁｮｲ 1332-G60N)

2026/01/09(金) 07:53:07.91ID:KvRiQaTo0

ChatGPTを使ってるゲームはあるけど
ローカルLLMを使ってるゲームは今のところなさそうだよな

0692名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fc7-XxT8)

2026/01/09(金) 08:06:00.67ID:4HlRfj7C0

やったこと無いから知らないけど，アダルトな会話が楽しめるスマホアプリはローカルじゃないのか？

0693名無しさん＠ピンキー (ﾜｯﾁｮｲ 636a-ER82)

2026/01/09(金) 08:54:24.24ID:uQ17JKwQ0

いやー無理だろ

0694名無しさん＠ピンキー (ﾜｯﾁｮｲ cfa0-G60N)

2026/01/09(金) 09:28:44.94ID:GOSYtxZi0

学習が少ないと日本語をまともに喋れない。

0695名無しさん＠ピンキー (ﾜｯﾁｮｲ cfd9-fu7G)

2026/01/09(金) 10:51:23.37ID:QgvGH3Ck0

>>691
あれってchatgpt以外のAPって使えないのかな？
macでAP発行してローカルで使うとかできんかな

0696名無しさん＠ピンキー (ﾜｯﾁｮｲ 231e-XxT8)

2026/01/09(金) 11:27:25.15ID:mNJOAcl90

LFM2.5B-1.2B-JP気になって覗きに来たけどローカルでエロチャするには微妙な感じか

0697名無しさん＠ピンキー (ﾜｯﾁｮｲ 3ff8-yDMQ)

2026/01/09(金) 11:34:42.40ID:ijDoORFo0

ローカルLLM使ったゲームはすでにたくさんあると思うよ
llama.cppを組み込むだけだし軽くググってもそれっぽいのが出てくる

0698名無しさん＠ピンキー (ﾜｯﾁｮｲ 53d0-F/Mu)

2026/01/09(金) 14:18:27.68ID:SpJSB7Fb0

>>691
FANZAにあったで
需要ないのか100円足らずで売られてた

0699名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sd5f-nnfO)

2026/01/09(金) 14:52:11.04ID:rpg+hvq7d

Cerebrasがzai-glm-4.7の無料Tierを公開したで
激烈に速いで
https://www.cerebras.ai/blog/glm-4-7

0700名無しさん＠ピンキー (ﾜｯﾁｮｲ 3f9f-/lw7)

2026/01/09(金) 17:07:18.90ID:QRUXNry/0

Free TierでRPD=100か
性能もGemini3Pro並なら代替になるんやが

0701名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fd5-s3Q7)

2026/01/09(金) 18:07:58.26ID:PZmIb37G0

>>699
すごい
今までクオリティと速度を両立してたのってGemini Flashだけだったけど
これは段違いに速いうえにクオリティも高い

0702名無しさん＠ピンキー (ｽﾌﾟﾌﾟ Sd5f-PPr4)

2026/01/09(金) 18:29:48.22ID:EV20mKt7d

4.7Vか4.7-Airきてくれー

0703名無しさん＠ピンキー (ﾜｯﾁｮｲ 4264-kaFj)

2026/01/10(土) 00:46:48.25ID:twt9hJur0

これはモデルが早いというよりはハードウェアが超特殊だからな・・・。
確か一枚数億とかだったよなCerebrasのユニット

0704名無しさん＠ピンキー (ﾜｯﾁｮｲ 7273-oSIQ)

2026/01/10(土) 12:37:17.37ID:Wwd3v/Sq0

Cerebrasは半導体ウェハを切り取らずにそのまま使ってる
どんなマザーボードに載せてるんだろ
https://i.imgur.com/33194P8.jpeg

0705名無しさん＠ピンキー (ﾜｯﾁｮｲ 32ac-dyKC)

2026/01/10(土) 13:47:59.81ID:Yar5XSuB0

>>680
>>681
実際、この縮尺って合ってるのかね？
ちょっとした寒気みたいなものを覚えたんだけど

0706名無しさん＠ピンキー (ﾜｯﾁｮｲ 07a2-3T54)

2026/01/11(日) 15:48:48.43ID:w0p+zdqj0

>>699
試してみたらGLM4.7で330tok/出てて笑うしかなかった。これはもうハードウェアの暴力としか言いようがないな。

0707名無しさん＠ピンキー (ﾜｯﾁｮｲ f29f-6Z3P)

2026/01/11(日) 16:32:52.06ID:hUJonVEN0

Groqよりも速いのか？
微妙に使いたいモデルが提供されてないが……
https://console.groq.com/docs/models

0708名無しさん＠ピンキー (ﾜｯﾁｮｲ b7dd-vGEt)

2026/01/12(月) 13:24:07.64ID:lnBKDwIn0

>>699
GGUFで130GBもあるのか・・・

0709名無しさん＠ピンキー (ﾜｯﾁｮｲ b6a0-5de0)

2026/01/12(月) 13:44:49.50ID:hwlGh7wi0

最近始めた人は、日本一高い山は？って質問に富士山って答えられるかでＬＬＭの性能見ればいいよ

答えられないラインがある

0710名無しさん＠ピンキー (ﾜｯﾁｮｲ f232-+fC0)

2026/01/12(月) 13:47:52.81ID:8AlFQoI20

俺は2番目を聞く派だ

0711名無しさん＠ピンキー (ﾜｯﾁｮｲ 3e27-5de0)

2026/01/12(月) 14:22:17.16ID:8opZO6jU0

>>709
いつの話してるんだ…
LLM出始めは学習が不十分でその程度の話も答えられないケースはあったけど
2年ぐらい前にはそんなの何の役にも立たない質問するのは馬鹿のやることだって言われてたよ
今もそれ聞いてるのは知識がアップデートされてない老害だよ

0712名無しさん＠ピンキー (ﾜｯﾁｮｲ e36a-SydR)

2026/01/12(月) 14:34:36.73ID:GrWr5tZm0

>>709
それ通用したの2022年末くらいでは？

0713名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f32-cVtm)

2026/01/12(月) 14:56:28.29ID:LxRHWzDP0

ワイは
「小学生の男女がうんどうかいについて悪戯っ子ぽく話す会話を書いてくれ」って最初に聞いてる
これで日本語の小説のセリフ周りの性能や文の整合性チェックが分かるのでおすすめ

0714名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f32-cVtm)

2026/01/12(月) 14:57:36.43ID:LxRHWzDP0

ああミスった
運動会　漢字で

0715名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr17-UF1D)

2026/01/12(月) 15:15:08.69ID:UceslG1Pr

文章の良し悪しを判別すること自体も難易度が高いタスクなんだよな
判別できる人はLLMって文章上手くないな、じゃあこれで計ればいいやって自分で気付くはず

判別できないひとは、そもそもLLMって文章上手いよなとか、自信たっぷりだから信頼できるよなとか、言いだすわけで...

0716名無しさん＠ピンキー (ﾜｯﾁｮｲ 32c7-dyKC)

2026/01/12(月) 15:37:44.32ID:2OmvCRAT0

自分の得意な専門分野の事を聞いたら良いんじゃない？
LLMが偉くてもまだまだ人が強い分野だと思う
逆に知らないことを聞いたら全部説得力あって判定できないけどw

0717名無しさん＠ピンキー (ﾜｯﾁｮｲ f232-+fC0)

2026/01/12(月) 16:47:30.99ID:8AlFQoI20

知識方面は自分の専門聞くのがまあ定番よね

0718名無しさん＠ピンキー (ﾜｯﾁｮｲ 3381-NUe/)

2026/01/12(月) 20:50:57.53ID:AZ66r3L40

エロ画像を認識させて画像の内容をエロく説明させたいんだけど、おすすめの環境ある？

0719名無しさん＠ピンキー (ﾜｯﾁｮｲ 3eb3-/Z1g)

2026/01/12(月) 21:16:26.08ID:0fnRfN8z0

初心者はLM Studioが良いよ
単体で動かせてモデルダウンロードしやすいから

0720名無しさん＠ピンキー (ﾜｯﾁｮｲ 3365-NUe/)

2026/01/12(月) 23:31:00.56ID:AZ66r3L40

ありがとう
LMstudioでスレに有ったqwen3～ったので動かしてみた
期待した返答が来たけど、ちょっと速度が遅いな…
この辺はスペックをどうにかするしかないか

0721名無しさん＠ピンキー (ﾜｯﾁｮｲ f29f-6Z3P)

2026/01/12(月) 23:44:19.94ID:OIORPy+m0

これはSLMのカテゴリーかな頑張ってるけどまあ小さいなりの性能
https://www.liquid.ai/ja/blog/introducing-lfm2-5-the-next-generation-of-on-device-ai

0722名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr17-SydR)

2026/01/13(火) 09:54:32.11ID:AHx2N4uir

slmが凄いとかいう風潮やめて欲しいわ
gpt5.2ですら怪しいときがあるんだからそれより少ないのが役立つわけがない

0723名無しさん＠ピンキー (ﾜｯﾁｮｲ b732-8cZs)

2026/01/13(火) 10:39:18.45ID:gPGsq1yO0

そんな風潮あるか？

0724名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f32-5de0)

2026/01/13(火) 10:53:36.90ID:KI0ClFsj0

SLMは色々な用途で普通に役に立ってるし
性能が上がればさらなる小型化や同サイズでやれること増えるし
通信環境整えてサービスのAPIにつなげみたいな器材ばかりやないし
凄いの出てきたら開発も利用も用途増えるしすごいというよそりゃ

0725名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr17-UF1D)

2026/01/13(火) 11:14:32.58ID:Uk1lac2Cr

釣りタイトル文化に問題があるような
LFM2.5がすごい！という動画を拡散すると中身は見てないやつがすごいんだって記憶するという

LFM2.5は日本語が喋れるのに700MB！凄い！ってタイトルに入れてくれ

0726名無しさん＠ピンキー (ﾜｯﾁｮｲ 3e27-5de0)

2026/01/13(火) 12:21:54.93ID:QxpbyeuB0

AI驚き屋ってのがある
知識なくても何でも新技術凄いと騒げば
同じ様に知識無いけどAIは何か凄いと思ってる層が釣れる

0727名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sd12-PuTB)

2026/01/13(火) 13:00:59.15ID:f0/mo2LTd

ラズパイとかが好きなタイプの連中が騒いでるんじゃね
ミニチュアや箱庭が好きなんだろう
でんちゃと同じカテゴリー

0728名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f32-5de0)

2026/01/13(火) 13:34:38.68ID:KI0ClFsj0

SNSで新しいAI情報を紹介してるだけみたいなのまでAI驚き屋といって叩いて煽ってる側が
有料でAIの本質情報教えますマンみたいなのだったりする時代

0729名無しさん＠ピンキー (ﾜｯﾁｮｲ c7a8-btwR)

2026/01/13(火) 14:22:39.00ID:WR1YxfAx0

PC新調したしローカルLLM始めたいなと思ってスレ読んでたけど、割とグラボ複数でVRAM増強してる感じなんやね
グラボ1枚（VRAM16GB）だとローカルLLMはまだ難しい感じ？

0730名無しさん＠ピンキー (ﾜｯﾁｮｲ b732-8cZs)

2026/01/13(火) 14:27:27.51ID:gPGsq1yO0

VRAM16GBでもMoEならそれなりに遊べる

0731名無しさん＠ピンキー (ﾜｯﾁｮｲ 7247-YDYy)

2026/01/13(火) 14:29:25.64ID:/2Cg9zMf0

>>729
7B~14Bモデルならちゃんと動くよ
もちろんチャッピーなどオンラインモデルの性能を期待してはいけない
でも7Bってエロに関しては完全フリーだった頃のモデルばっかだから意外と楽しめる

0732名無しさん＠ピンキー (ﾜｯﾁｮｲ f232-+fC0)

2026/01/13(火) 14:35:31.61ID:O7FR8Zm10

ちょっと前に比べたらvram16gbに乗り切って日本語ちゃんと返せるモデルが乱立してるのは劇的進歩ではあるよ
普通に使えるっちゃ使える
moeも出てきたし

0733名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sd12-PuTB)

2026/01/13(火) 14:42:37.09ID:f0/mo2LTd

Qwen235bが出た時に速攻でメインメモリ128GB以上の環境を作れた奴が勝ち組

denseモデルだとVRAMかメインメモリかの2択になって大型モデルでGPUを全く活かせないからな

0734名無しさん＠ピンキー (ﾜｯﾁｮｲ c7a8-btwR)

2026/01/13(火) 14:48:54.18ID:WR1YxfAx0

軽量でも動く設定いれて軽いモデル入れれば動くやつもあるよって感じかな
もうちょい調べてお試ししてみるわ、あんがと

0735名無しさん＠ピンキー (ﾜｯﾁｮｲ 72c7-3e1D)

2026/01/13(火) 14:50:40.63ID:i0hzGkdj0

qwenやgpt-ossなどMoEだとGPUは1枚で十分
MoEはGPUの枚数増やすと性能が低下しちゃうんだよな
モデルを全部VRAMに載せられるならGPUの複数枚挿しもありだね

0736名無しさん＠ピンキー (ﾜｯﾁｮｲ 1b11-8EHP)

2026/01/13(火) 17:25:06.34ID:apbJBegp0

SLMでフィジカルAIって好きな特徴の女がいたらパシャパシャしまくるデバイスとかそんな奴やろ？

0737名無しさん＠ピンキー (ﾜｯﾁｮｲ 07d7-NCp1)

2026/01/13(火) 20:35:24.00ID:q/F/NBED0

ryzen haloってのはcpuオンダイメモリなん？
この時代マザーにポン付けで128GBもあって何かそこそこに動いたらええなあ

0738名無しさん＠ピンキー (ﾜｯﾁｮｲ b6a0-5de0)

2026/01/14(水) 08:01:05.78ID:TkgALyb20

3060復刻、DDR4復刻、AM4復刻

5年くらいこの状態になるってことだな、これ以上のスペックを求めるなら、高額な料金を出せと

0739名無しさん＠ピンキー (ｽﾌｯ Sd12-vlRz)

2026/01/14(水) 10:44:57.16ID:YwnyDflyd

>>726
あいつらレビューや批評はしないしな
この動画生成AIはアニメ動かしてもまともな挙動してくれないとか、そういう大切な情報ほどまったく出さない

0740名無しさん＠ピンキー (ﾜｯﾁｮｲ 3eb3-/Z1g)

2026/01/14(水) 10:56:25.16ID:py2XGvmY0

一般向けでこんなに高騰するんじゃ企業向けの高騰も時間の問題だよな
使うのにコストが掛かるんじゃ回収もキツくなるし流石に小型化が進みそう

0741名無しさん＠ピンキー (ﾜｯﾁｮｲ e36a-SydR)

2026/01/14(水) 11:58:16.52ID:TaHgEtC40

そう言えばなんで高騰してんの？

0742名無しさん＠ピンキー (ﾜｯﾁｮｲ 3e27-5de0)

2026/01/14(水) 12:33:36.64ID:EtnTl6+W0

OpenAIが数年分のメモリの大量発注かける
↓
メモリの生産ライン圧迫されて品薄になるのでは
↓
今のうちに在庫確保せなって皆が買い占めに走って高騰

メモリの会社が生産ライン増やせばいいという話でもなくて
工場作るには数年かかるし、その後に需要が減ったらメモリ会社が大損するから慎重になる
メモリ業界って相場の乱高下で体力無い会社から死んでるし迂闊に動かんのよ

0743名無しさん＠ピンキー (ﾜｯﾁｮｲ 7258-oSIQ)

2026/01/14(水) 14:13:22.39ID:xTKgHKvP0

DRAM事業はハイリスクハイリーターンだからな
ちょっと投資ミスるとすぐ倒産する

0744名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f32-5de0)

2026/01/15(木) 00:13:04.65ID:lvLdrOG20

破滅的忘却のせいでAIの性能に限界が出てくる
↓
MoE発明、モデルが巨大化する代わりに破滅的忘却の影響を軽減、劇的な性能アップに成功
↓
OpenAI、Google、AnthropicなどのAI企業が立て続けにAIデータセンター建設を開始
↓
OpenAIが先んじて数年分のメモリの大量発注かける
↓
HBMを輸入できない中国と値上がり情報を得た転売屋がDDR5メモリを買い占める
↓
今のうちに在庫確保せなって皆が買い占めに走って高騰

ここまで書かないと「OpenAIが、サム・アルトマンがすべて悪いんだ～」みたいな奴が増えかねないよ

0745名無しさん＠ピンキー (ﾜｯﾁｮｲ 3e27-hTMW)

2026/01/15(木) 01:01:25.39ID:U00pFogF0

最初の三行いる？

0746名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f32-5de0)

2026/01/15(木) 01:11:44.54ID:lvLdrOG20

>>745
OpenAIの買い占め報道でOpenAIを悪者にしてる奴が大量発生してるじゃん
OpenAIが買い占めなかったら競合AI企業が買い占めてただけなのに
あと、なぜAIに大容量メモリが必要になったのかを知らない人がいるかもしれない

0747名無しさん＠ピンキー (ﾜｯﾁｮｲ 520e-btwR)

2026/01/15(木) 01:12:33.18ID:gJr7NyHH0

>>744
いやgpuの製造はopenaiの仕事じゃないから普通にopenaiが悪いよ
あと2年以上前からmoeやってるしmoe化が進んでなかったらスケーリングでごり推すんだから今以上にデータセンター必要だぞ

0748名無しさん＠ピンキー (ﾜｯﾁｮｲ 666d-uqmN)

2026/01/15(木) 01:28:49.76ID:xG0eF0dQ0

ま、人類に与えられたリソースを食い潰す速度がとんでもなく加速してるって事よ
今生きてる人間にとっては楽しくて良い事だから遊びまくるしかねー

0749名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f32-5de0)

2026/01/15(木) 01:41:46.91ID:lvLdrOG20

>>747
MoEの理論自体は2013年発表だから時系列はおかしかったけど
Denseモデルでスケーリングごり押しができなくなったからMoE化が始まった認識であってるはず
Denseモデルはパラメーターを増やすと演算量が増えて遅くなる問題もあるから

0750名無しさん＠ピンキー (ﾜｯﾁｮｲ 7209-Bs3R)

2026/01/15(木) 01:53:48.85ID:43plYfkx0

べつにリソースを食い潰してるわけではないだろ
急激に需要が伸びたから不足しただけでスケーリングはできる分野だぞ

0751名無しさん＠ピンキー (ﾜｯﾁｮｲ 520e-btwR)

2026/01/15(木) 01:59:33.12ID:gJr7NyHH0

>>749
gpt4の時点からmoe使ってるってさんざん言われてたろ
多エキスパート小アクティブが進んだならわかるけどさ
ウエハの買い占めだって競合に嫌がらせしてnvidia相手に値切りたいだけだよ

0752名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f32-5de0)

2026/01/15(木) 02:23:10.99ID:lvLdrOG20

>>751
別にChatGPTだけじゃなくAI全体的な話なんだけどな
画像/動画生成も新世代モデルはMoE化してるし

OpenAIとNVIDIAの内部交渉的なことは情報がないのでわからん
あなたの妄想？

0753名無しさん＠ピンキー (ﾜｯﾁｮｲ d320-UF1D)

2026/01/15(木) 06:28:50.54ID:85Oqk5Iu0

誰のせいかと言えばトランプ関税のせいでしょう
気まぐれで関税が倍になる時代なんだから全員に先行して押さえておくインセンティブが発生してしまう
誰がやったか全く関係ない

0754名無しさん＠ピンキー (ﾜｯﾁｮｲ b6a0-5de0)

2026/01/15(木) 07:51:01.90ID:wIvUhweV0

旧世代回帰で、得をするのはインテルだな、いいね、13世代14世代なんてなかった。インテルの主力は12世代。
もうＤＤＲ３まで戻るって話もあるし、win11もいらなかったな

0755名無しさん＠ピンキー (ﾜｯﾁｮｲ fff6-3Sqk)

2026/01/15(木) 08:02:14.39ID:or5BJ6pD0

そのうちメモリ2Gも積んでるなんてスゲーみたいになるのか

0756名無しさん＠ピンキー (ﾜｯﾁｮｲ 07ee-YDYy)

2026/01/15(木) 08:16:20.78ID:Z7oUQcFB0

今SSDもヤバい事になってきてんだよね
サンディスクが前代未聞の1～3年分のSSD代の前払いを要求とかなんとか
こっちも需給が崩壊しつつあるみたい

0757名無しさん＠ピンキー (ﾜｯﾁｮｲ e36a-SydR)

2026/01/15(木) 11:15:13.47ID:4efICQPX0

だいたい悪いことは中国のせい
だからコレもそう
買い占めてるとかじゃねえの？

0758名無しさん＠ピンキー (ﾜｯﾁｮｲ 72c7-3e1D)

2026/01/15(木) 11:18:38.40ID:hPlUmZOu0

正月だったかパソコン工房でSSD4TBが3万円台で売ってけど買っとくべきだったな
HDDは余裕あるけどSSDはカツカツ
今度店行くときが怖いわ

0759名無しさん＠ピンキー (ﾜｯﾁｮｲ 7e1c-zzHJ)

2026/01/15(木) 17:08:12.65ID:1G9XiyS30

>>751
ウエハ買い占めは事実誤認
OpenAI批判以前の問題
自分がデマ信じ込んでるアホということを自覚したほうがいい

0760代行 (JP 0Hee-U7y1)

2026/01/15(木) 20:54:56.64ID:7dBSkyyoH

【本文】↓

LMSTUDIOで少し前までqwen3-vl-8b-nsfw-caption-v4.5でNSFWの質問に回答してくれていたのですが、今試すと
I'm sorry, but I can't fulfill this request.
The content you're asking for is not appropriate and violates my safety guidelines.
If you have any other questions or need assistance with something else, feel free to ask!
という回答が返ってきました。これは設定の問題でしょうか

0761名無しさん＠ピンキー (ﾜｯﾁｮｲ 36a9-5de0)

2026/01/15(木) 22:15:54.78ID:CTmaQDBZ0

llamacppで数日前にqwen3-nextの1～2割高速化のパッチが当たってたみたいやで
ただしGGUFも新しく作り直されたものを使う必要あり
unslothはもう新しいのだしとったけどqwen公式は古いままやな

0762名無しさん＠ピンキー (ﾜｯﾁｮｲ b732-8cZs)

2026/01/16(金) 05:31:22.71ID:763twXpD0

>>760
設定の問題だったりseedの問題だったり
他に何か思い当たる原因がある感じ？

0763名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fc6-SzXM)

2026/01/16(金) 09:18:02.88ID:hP+canZw0

今ってVRAM16GB RAM64GBで動くエロいLLMモデルやとなにがええんや？
ワイの設定のせいやと思うんやがkoboldcppでamaterasuは十数秒に１ワードで使い物にならんかったわ…
BerghofとMistral-Smallしか使ってない感あって持て余し気味や

0764名無しさん＠ピンキー (ﾜｯﾁｮｲ 7236-YDYy)

2026/01/16(金) 09:48:48.60ID:SL230Bd20

amaterasuってどんなやつや？と見たら123Bやん
IQ1Sでも26GBあるし
そらデカすぎてまともに動かんですわ

0765名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr17-SydR)

2026/01/16(金) 10:11:42.86ID:GfBjxY3wr

メモリ64gb積んでんなら行けるじゃん

0766名無しさん＠ピンキー (ﾜｯﾁｮｲ 36a9-KoMk)

2026/01/16(金) 10:46:37.64ID:khTupJvD0

moeじゃないならそんなもんですわ

0767名無しさん＠ピンキー (ﾜｯﾁｮｲ 33a8-UsWw)

2026/01/16(金) 11:05:43.79ID:q1kks11j0

SillyTavernでAratako氏のMistralPrism-24B使ってるわ
日本語力高い

0768名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f32-cVtm)

2026/01/16(金) 11:12:15.10ID:sNseSJJI0

>>763
その構成ならqwen next 80bの規制解除版Q5_k_mがお勧め

0769名無しさん＠ピンキー (ｽﾌﾟﾌﾟ Sd12-UW4l)

2026/01/16(金) 11:42:22.06ID:RzBIoy0Nd

RAM64GBだと、50GBクラスのモデルはctx8192とかにしないと厳しいかもね。

0770名無しさん＠ピンキー (ﾜｯﾁｮｲ ff10-KtG4)

2026/01/16(金) 12:42:42.95ID:OlPZQfK10

DRAM活かすならMoEモデルだから確かにこのへんか
/mradermacher/Qwen3-Next-80B-A3B-Instruct-abliterated-GGUF
30Bは全然エロで出てこなくて画像解説させるためにVLの解除版使っても全然ダメだったんだけど
Next 80Bはエロ自体の学習はしてる感じなんだな
繰り返しペナルティ強めてるせいでどんどん言い換えてくるの面白い

0771名無しさん＠ピンキー (ﾜｯﾁｮｲ 7236-YDYy)

2026/01/16(金) 12:48:45.28ID:SL230Bd20

コンテキスト長を増やすとどんどん性能が落ちるのは最新モデルでも変わらないので小説やロールプレイなどの用途では128K対応モデルだろうと8192推奨みたいやで
用途に合わせて仕方なく12Kやそれ以上にしてねって感じ

0772名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr17-SydR)

2026/01/16(金) 16:39:20.54ID:GfBjxY3wr

エロエロ特化のllmレンタルなら商売になるんでは？

0773名無しさん＠ピンキー (ﾜｯﾁｮｲ f29f-6Z3P)

2026/01/16(金) 16:58:44.58ID:Pt+T5RQ70

テンプレートが特殊っぽいんだけどLM Studioとかでどう動かせばええの？
https://blog.google/innovation-and-ai/technology/developers-tools/translategemma/
https://huggingface.co/google/translategemma-4b-it

0774名無しさん＠ピンキー (ﾜｯﾁｮｲ 07d0-gOcD)

2026/01/16(金) 19:53:46.01ID:0byVmzBK0

macのlm-studioでしか試してないけど

1. モデルをダウンロード
2. フォルダーマークでダウンロードした translategemma-27b-itを探して、右の歯車クリック
3. Loadタブのコンテキスト量はmaxにした(8192では試してない)
4. Prompotタブの上 (Jinja)のところを下に入れ替える(---は無視)

---
{{- bos_token }}
{%- for message in messages %}
{%- if message['role'] == 'system' %}
<start_of_turn>user
{{ message['content'] }}

{%- elif message['role'] == 'user' %}
{{ message['content'] }}<end_of_turn>
<start_of_turn>model
{%- elif message['role'] == 'assistant' %}
{{ message['content'] }}<end_of_turn>
{%- endif %}
{%- endfor %}
---

0775名無しさん＠ピンキー (ﾜｯﾁｮｲ 07d0-gOcD)

2026/01/16(金) 19:54:30.69ID:0byVmzBK0

「システムプロンプト」欄に

---
You are a professional English (en) to Japanese (ja) translator.
Your goal is to accurately convey the meaning and nuances of the original English text while adhering to Japanese grammar, vocabulary, and cultural sensitivities.
Produce only the Japanese translation, without any additional explanations or commentary. Please translate the following English text into Japanese:
---

lm-studio再起動、モデルを指定

あとはチャット欄に英文を入れるだけ。Jinjaのプロンプトで2行空行は必須。

0776名無しさん＠ピンキー (ﾜｯﾁｮｲ 07d0-gOcD)

2026/01/16(金) 19:57:49.41ID:0byVmzBK0

システムプロンプトで何語から何語、(ja)と(en)は
https://ollama.com/library/translategemma
に書いてあった

0777名無しさん＠ピンキー (ﾜｯﾁｮｲ 3e9f-vlRz)

2026/01/16(金) 20:05:48.58ID:ZwE9wbul0

今の俺にはRAM256GBは夢のまた夢だが、RAM256GB積めばGeminiと遜色のない小説文章を出力してくれる？

Geminiは0から生み出すというよりも、元の殴り書きから小説文章を生み出すのに秀でているが、これがローカルLLMでも出来たら強いなあと

0778名無しさん＠ピンキー (ﾜｯﾁｮｲ 07d0-gOcD)

2026/01/16(金) 20:06:58.89ID:0byVmzBK0

512GByteのM3 Ultraでも足りないよ

0779名無しさん＠ピンキー (ﾜｯﾁｮｲ 33d1-KoMk)

2026/01/16(金) 21:03:16.23ID:lHszIG5Q0

今ローカルで使える最強のモデルでもgemini 2.5 flashあたり
今の最新のgemini超えるにはメモリがどうとかって話ではなくて不可能

0780名無しさん＠ピンキー (ﾜｯﾁｮｲ f232-+fC0)

2026/01/16(金) 21:32:12.97ID:cTWCf5y30

あのgrok2さんが500GBぐらいあるからね
まあサイズが性能ではないけど

0781名無しさん＠ピンキー (ﾜｯﾁｮｲ 3e9f-vlRz)

2026/01/16(金) 21:32:43.81ID:ZwE9wbul0

>>779
Gemini2.5fでも魅力的だが、その場合は256GB？

0782名無しさん＠ピンキー (ﾜｯﾁｮｲ 36a9-KoMk)

2026/01/16(金) 22:00:31.51ID:khTupJvD0

GLM4.7を想定して書いたけども
もとにしたベンチマークはおそらくbf16で動いてるやろうから1TBになるやね

Q8ならおそらくそこまで劣化ないやろうからほぼ同等の性能が512GBでおそらくいける
それより下の量子化になるとベンチマークでは数値下がってくると思うやで

0783名無しさん＠ピンキー (ﾜｯﾁｮｲ 662b-uqmN)

2026/01/16(金) 22:28:03.19ID:2veUatO60

ノベルAIがGLM4.6だっけ？ゲミニと比べたらゴミみたいなもんだし厳しいな

0784名無しさん＠ピンキー (ﾜｯﾁｮｲ 72c7-3e1D)

2026/01/16(金) 23:47:46.88ID:1sMiMHPP0

GLM 4.5ならともかく、4.6か4.7ならGemini2.5fは越えてるだろ

0785名無しさん＠ピンキー (ﾜｯﾁｮｲ 9f9f-W5A1)

2026/01/17(土) 00:09:21.60ID:oUrrC5qZ0

>>774-776
おおきに　macOS上LM Studioでちゃんと翻訳できましたわ

0786名無しさん＠ピンキー (ﾜｯﾁｮｲ 936a-viuJ)

2026/01/17(土) 14:28:23.25ID:sdnCrY5o0

2.5てポンコツ

0787名無しさん＠ピンキー (ﾜｯﾁｮｲ d732-LMlG)

2026/01/17(土) 14:36:45.75ID:XKvL+sCA0

2.5fに並んだとき、2.5fの破壊的コスパに敗北する

0788名無しさん＠ピンキー (ﾜｯﾁｮｲ e7a9-J81O)

2026/01/17(土) 15:38:18.15ID:uxXX92cg0

>>761
これ試してみたけどワイの環境で17token/sから20token/sになったわ
いやー実装してる人ら凄いなぁ

0789名無しさん＠ピンキー (ｽｯﾌﾟｰ Sd9f-J81O)

2026/01/17(土) 18:43:32.72ID:pu1J5etdd

koboldcpとSillyTavernでロールプレイやってるんだけど少しガード固めのモデルないかな
今はjapanese textgen moe 2x7b nsfwってやつが一番いい感じなんだけど
ずっと同じだと飽きるんでこれに似た感じのないかな
aratakoのrobinhoodとかMistralPrism-24Bとか使ってみたんだけど
すぐエロモードに入ってあんまり面白くないんだよね
１０G前後の軽いやつで何かいいのないかな

0790名無しさん＠ピンキー (ｼｬﾁｰｸ 0Caf-14Ip)

2026/01/17(土) 19:00:33.64ID:rBUlvB1sC

>>789
お堅いのならqwenとか？

0791名無しさん＠ピンキー (ﾜｯﾁｮｲ bf9f-ryvZ)

2026/01/18(日) 03:15:55.40ID:T+e6cVxF0

>>787
コスパはそうなんだろうけど、クラウドサービスである以上いつでも規制きつくなるしな。GPT5.2はそれで死滅した。

多少お金掛かってもローカルで実現できるならそれに越したことはない

0792名無しさん＠ピンキー (ﾜｯﾁｮｲ 27a0-J81O)

2026/01/18(日) 09:04:04.62ID:eTm5xaVj0

何だかんだでチャッピーのエロ解禁はまだまだ伸びそうだな
Grok先生を叩くとは許せん

0793名無しさん＠ピンキー (ﾜｯﾁｮｲ 27a0-J81O)

2026/01/18(日) 09:05:59.40ID:eTm5xaVj0

チャッピーってエロ抜きの美しい文章を書くことしか、他のLLMに勝ってないな

基本、Geminiの方が全体的にすごい、エロならGrok、エクセルとかで便利なコパイロット

0794名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b20-P3xf)

2026/01/18(日) 09:25:40.01ID:d2YVkyCp0

copilotの中身はchatgptだよ

0795名無しさん＠ピンキー (ﾜｯﾁｮｲ 27a0-J81O)

2026/01/18(日) 09:29:29.45ID:eTm5xaVj0

コパイロットは推論の性能というより利便性の向上を目指してるだけだからな

0796名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b20-P3xf)

2026/01/18(日) 10:21:33.09ID:d2YVkyCp0

別にそんなことは...有料版使うのが当たり前で無料版はお試しなのはどのLLMも同じことですし
むしろ無料版の比較では上のほうでは

0797名無しさん＠ピンキー (ﾜｯﾁｮｲ 4711-99SI)

2026/01/18(日) 22:11:31.23ID:2LCQnkgH0

Qwen3-Thinkingは日本語で思考させると"Wait," ループに入らず割と快適になった

0798名無しさん＠ピンキー (ﾜｯﾁｮｲ c35b-/IBL)

2026/01/19(月) 01:16:22.59ID:r6HfMQ9p0

半年ぐらい前にQwen-235B-A22B-Instruct-2507の性能に度肝を抜かれた以来なんですが
今アツいモデルあったら教えて欲しいです
環境はVRAM24GB、DRAM96GB
LMStudio愛用のローカルLLM初心者です

0799名無しさん＠ピンキー (ﾜｯﾁｮｲ 936a-viuJ)

2026/01/19(月) 08:31:32.04ID:NDOT6mQm0

てめえ、初心者気取った熟練工だろ

0800名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f51-dguo)

2026/01/19(月) 08:59:33.02ID:3P/PaWcb0

こういうのでいいんだよこういうので
って感じになれるポテンシャルを感じる
追加学習が簡単そうだし
https://youtu.be//2u_EfhEktgQ

0801名無しさん＠ピンキー (ﾜｯﾁｮｲ df88-mrDK)

2026/01/20(火) 05:17:18.48ID:hwv83Gyg0

GLM 4.7 Flashが来た
30B-A3Bらしい

0802名無しさん＠ピンキー (ﾜｯﾁｮｲ afed-LSnI)

2026/01/20(火) 09:46:53.73ID:VGL27InD0

A3Bかあ

0803名無しさん＠ピンキー (ｵｯﾍﾟｹ Srdf-viuJ)

2026/01/20(火) 12:54:03.23ID:JCxxLgksr

a3bはちょっと

0804名無しさん＠ピンキー (ｽﾌﾟｰﾌﾟ Sdff-ZW+/)

2026/01/20(火) 13:15:15.42ID:itG3HspEd

Qwen235bのNextはよ

0805名無しさん＠ピンキー (ﾜｯﾁｮｲ ebde-E63g)

2026/01/20(火) 13:49:38.52ID:9XX8C9sG0

https://x.com/modelscope2022/status/2013213019690639431
SLM路線やとこういうのがおもろそう

0806名無しさん＠ピンキー (ﾜｯﾁｮｲ e7a9-0bv4)

2026/01/20(火) 14:02:03.80ID:GvRoLOjd0

glm4.7flashはqwen3-30b-a3bとgpt-oss-20bに対して全領域で明確に上回っとるのか
後発だから当たり前ではあるんやけどこのサイズじゃこの2つが今まで長い間幅利かせとったから
ようやくいい感じの次世代がでてきたという感じやな

0807名無しさん＠ピンキー (ﾜｯﾁｮｲ 4f6f-wcR0)

2026/01/20(火) 18:17:06.07ID:d0bUcAYK0

だがしかしGLM系は日本語が不安だ

0808名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b45-z33+)

2026/01/22(木) 04:35:28.71ID:6p3S/hpS0

novelAIの小説補助UIがわけわからん作りしてるから評価不能なんよな
あれを使いこなせる人って作った開発者くらいじゃないのか

0809名無しさん＠ピンキー (ﾜｯﾁｮｲ bbd7-bPP2)

2026/01/22(木) 21:49:08.56ID:9DiKRE2t0

俺の知ってる霧島じゃない

0810名無しさん＠ピンキー (ﾜｯﾁｮｲ 1f24-eZjg)

2026/01/23(金) 02:09:51.50ID:8g1gaaJy0

AIにエロ画像作らせるのは簡単なのにエロ小説書かせるのが難しいのってなんでなんだろうな
エロ創作特化のモデルってなんかあったっけ

0811名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sdff-ZW+/)

2026/01/23(金) 02:17:27.15ID:rnyeZIXQd

>>810
Stable Diffusionがガバガバだっただけで他のモデルでエロ画像を作らせるのは難しいぞ

0812名無しさん＠ピンキー (ﾜｯﾁｮｲ 63ac-40sh)

2026/01/23(金) 04:37:10.10ID:gdTzh9j+0

画像精製もLLMもデカいクリトリスだっつてんのに、すぐにチンチンにしてしまうのは一緒やで

0813名無しさん＠ピンキー (ﾜｯﾁｮｲ b732-J81O)

2026/01/23(金) 05:51:52.16ID:D1QePr6y0

簡単と言ってもDeepDreamからSDリリースまで7年くらいかかってるぞ

画像生成は世界中で研究・開発されるのが大きいんだろうな
LLMは言語人口の影響があるからマイナー言語は難しい
あと、小規模で高性能で日本語もできる夢のモデルを誰も開発できてないから
既成モデルのエロチューニングもあまり期待できない

0814名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b20-P3xf)

2026/01/23(金) 06:06:19.42ID:dVjxH80P0

日本語の壁がなければだいぶ違うんじゃないの

0815名無しさん＠ピンキー (ｵｯﾍﾟｹ Srdf-viuJ)

2026/01/23(金) 09:39:32.37ID:F9WixtPnr

>>812
合ってるよな🤔

0816名無しさん＠ピンキー (ﾜｯﾁｮｲ ef32-qkVW)

2026/01/23(金) 14:47:57.25ID:zfc5xOk30

エロ画像モデルは言語関係無しに世界中の人が楽しめるけど
エロLLMは言語が合ってないと一切楽しめない

今は音声付きエロ動画が始まってきているからLLMみたいに言語の壁にぶつかるようになるだろうな

0817名無しさん＠ピンキー (ﾜｯﾁｮｲ f395-N8e8)

2026/01/23(金) 20:51:19.68ID:wq1/7kmF0

画像は多少破綻しててもエロけりゃ気にならんけど文字になると少々の破綻でも気になるからな

0818名無しさん＠ピンキー (ﾜｯﾁｮｲ 0ae9-CeJs)

2026/01/24(土) 13:10:17.52ID:mzXn1zQO0

画像も1枚物ならまだ見れるけど
連続物とか一本の漫画なんて破綻するからな
文章も同じで短いチャットはできても小説を破綻なく生成させようとしたら計算量が跳ね上がるってことよ

0819名無しさん＠ピンキー (ﾜｯﾁｮｲ 1ea0-jbA7)

2026/01/24(土) 17:50:32.03ID:+ePlvj4x0

SDもだいぶ分かって来たから、動画始めてみるかな

0820名無しさん＠ピンキー (ｵｯﾍﾟｹ Sra3-x9BH)

2026/01/26(月) 10:46:57.82ID:uETGBTBIr

clawdbot、コレローカルLLMにローカルPCを好きに使わせるための物だよね
驚き屋はClaude Codeと接続してリモートでバイブコーディングが！とかキャラを付与できる！とか言い続けてて意味不明だったけど...
ローカルLLMを輝かせるものだというなら海外での盛り上がりも理解可能に思える

Discord経由なら英日翻訳Botを噛ませて英語で扱うことも楽にできるし、面白いことが出来そうだね

0821名無しさん＠ピンキー (ｵｯﾍﾟｹ Sra3-a+7q)

2026/01/26(月) 11:54:04.34ID:W2El03lKr

翻訳くらいならllmでできそうだけど

0822名無しさん＠ピンキー (ﾜｯﾁｮｲ 23cd-x9BH)

2026/01/26(月) 14:09:27.48ID:35fg7qjN0

画像を認識させてその内容に合ったセリフ等を生成するにはどうしたらいいでしょうか？

0823名無しさん＠ピンキー (ﾜｯﾁｮｲ 87d3-NPBA)

2026/01/26(月) 22:39:15.11ID:+cVsP7eh0

glmの画像モデルが今huggingfaceのトレンドに上がっとる
2週間ぐらい前に公開されてたみたいやが知らんかったな
画像内のテキスト描写に特に力入れてるみたいやな
普通の内容の描写はベンチマークでzimageに負けとるな

0824名無しさん＠ピンキー (ﾜｯﾁｮｲ eb32-jbA7)

2026/01/26(月) 23:29:01.25ID:moysdEcv0

kobold.cppをスマートアプリコントロールが阻止するようになったんだが、
オフにしたらwin11を再インストールするまでオンにならんとか脅迫めいたこと書いてあるし、どうすっぺ

0825名無しさん＠ピンキー (ﾜｯﾁｮｲ dedb-oVBd)

2026/01/26(月) 23:35:40.82ID:XJHdRM450

>>822
VLM使うか、キャプション生成してLLMに投げる

0826名無しさん＠ピンキー (ﾜｯﾁｮｲ 637b-Qkxx)

2026/01/27(火) 19:01:29.43ID:Jxr1JElV0

ltx-2にエロ動画作成指示のプロンプトの生成支援をさせたいんだがお勧めのモデルとなるとやっぱglm系やろか？一応ローカルかnanogpt経由で4.6は動かせる。geminiには申し訳された

0827名無しさん＠ピンキー (ﾜｯﾁｮｲ 46ed-CeJs)

2026/01/28(水) 18:30:37.43ID:4FTfQaE60

プロンプト作成ぐらいならqwen3 nextとかGLM4.6Airでも十分じゃないか
どっちも規制緩めだし
それでも通らなければabliterated使えば良い
GLM4.6はプロンプト作成で使うにはオーバーな気がする

0828名無しさん＠ピンキー (ﾜｯﾁｮｲ 87bf-nPWr)

2026/01/28(水) 22:03:08.33ID:NCDTP21x0

GLM4.6Vだな
画像認識特化してるらしいし、プロンプト作成にはもってこいじゃないかな

0829名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sdaa-wXhp)

2026/01/28(水) 22:27:58.46ID:nNxR1ybUd

中華AIは脱獄のガードは緩いがエロ系の画像やテキストを学習していないから用途が限られるんやないか
大型MoEモデルが主流になってからエロチューンもほとんど出ていないし
FTで何らかの突破口が必要やな

0830名無しさん＠ピンキー (ﾜｯﾁｮｲ 1af9-vRJ4)

2026/01/28(水) 23:17:54.70ID:dZqq5VyI0

架空の男の娘人格作れてちゃんと会話が成り立つモデルある？

0831名無しさん＠ピンキー (ﾜｯﾁｮｲ 0a9a-v5Ab)

2026/01/29(木) 06:43:33.98ID:pDXz5Kxh0

つい最近lumimaid-magnum-v4-12bを使い始めたんだけど
エロ目的だと結構規制されるけどそんなもんですか？詳しい人がいたら教えて欲しい
イラっとしたからheretic化して使ってます

0832名無しさん＠ピンキー (ﾜｯﾁｮｲ 6a11-jq1a)

2026/01/29(木) 08:54:49.67ID:Xo7Hmt2N0

k2.5かなりいいな
脱獄も簡単だしコンテキストの保持性も悪くない

0833名無しさん＠ピンキー (ﾜｯﾁｮｲ d332-nnWO)

2026/01/29(木) 10:10:31.10ID:vouCeCWf0

>>831
全く申し訳されないよ
プロンプトが悪いんじゃない？

0834名無しさん＠ピンキー (ﾜｯﾁｮｲ af6b-qxTp)

2026/01/29(木) 11:16:51.02ID:y80AVPBn0

k2.5をローカルで動かすにはどれくらいのスペックが必要なんや？

0835名無しさん＠ピンキー (ｼｬﾁｰｸ 0C8f-AlTQ)

2026/01/29(木) 11:56:27.24ID:LHsf3L4/C

macしか無理
Q1じゃ話にならんし

0836名無しさん＠ピンキー (ｽｯﾌﾟ Sdaa-Qkxx)

2026/01/29(木) 12:27:45.00ID:iilnWksjd

>>831
フロントエンド何つこてる？
lm studioとkoboldcppで使った経験あるがあれで申し訳された経験はないな。おそらくシステムプロンプトに問題があるとは思うが

0837名無しさん＠ピンキー (ﾜｯﾁｮｲ 9ea9-jbA7)

2026/01/29(木) 12:42:25.66ID:0vQW0f4i0

kimi k2はパラメータ数が1Tだからある程度妥協してQ4、KVキャッシュも含めたら768GBくらいはいる
劣化させたくないならQ8+KVキャッシュで1.5GBくらい、
フルならbf16+kvキャッシュで3TBくらいいるんとちゃう

0838名無しさん＠ピンキー (ﾜｯﾁｮｲ 9ea9-jbA7)

2026/01/29(木) 12:54:20.47ID:0vQW0f4i0

今思うとgpt-oss-120bって公式でmxfp4で配ってて
当時であの精度出してるのは結構すごいことだったんだな

他の同等モデルたちがフルサイズでベンチマークかけられてるのに対して
gpt-ossは4bitで戦ってたわけだから
4bitってなんだかんだ言って結構劣化するもんなぁ

0839名無しさん＠ピンキー (ﾜｯﾁｮｲ 0a9a-v5Ab)

2026/01/29(木) 13:01:52.60ID:pDXz5Kxh0

>>833, 836
返信ありがとう
みんなシステムプロンプトで回避してる感じなのかな
フロントエンドでollama使ったときとpythonで直にAPI叩いたとき両方でたまに申し訳された感じだった
heretic化前はRefusalsが96/100だったから不通に検閲されてるモデルなんだと思うけど

0840名無しさん＠ピンキー (ﾜｯﾁｮｲ af6b-qxTp)

2026/01/29(木) 14:02:53.73ID:y80AVPBn0

k2.5 unslothの1.8bit版ならVRAM24GBと256GBメモリで10 token/sで動くらしい
メモリ256GBなら個人でも持ってる人居そうやな…

0841名無しさん＠ピンキー (ｼｬﾁｰｸ 0C8f-AlTQ)

2026/01/29(木) 14:19:43.91ID:LHsf3L4/C

>>840
精度どれくらいなんやろ

0842名無しさん＠ピンキー (ﾜｯﾁｮｲ af6b-qxTp)

2026/01/29(木) 14:34:11.74ID:y80AVPBn0

1.8bitやし性能はお察しやろうな…
エロに限定すれば使い物になるのかも？

0843名無しさん＠ピンキー (ﾜｯﾁｮｲ 87dc-v5Ab)

2026/01/29(木) 19:27:13.51ID:l5XAHaNA0

俺様スペックで
LM Studio-lumimaid-magnum-v4-12bはエロ最強だ
最近のがっかり
Mistral Small 3.2 24B Instruct 2506
zai-org/glm-4.6v-flash

0844名無しさん＠ピンキー (ﾜｯﾁｮｲ 0a97-oVBd)

2026/01/29(木) 19:50:46.41ID:o+r7QE+h0

そろそろQwen3-VL-235Bより頭良くてエロいけるのが欲しい

0845名無しさん＠ピンキー (ﾜｯﾁｮｲ 07c6-Vxuf)

2026/01/29(木) 23:18:06.05ID:yut66++a0

うへぇSillyTavernのRSS拡張機能がなんか動かない...
config.yamlからenableCorsProxyをtrueにして関数呼び出しはできているけどRSSフィードの取得に失敗する...
動かせている人居る？

0846名無しさん＠ピンキー (ﾜｯﾁｮｲ 07c6-Vxuf)

2026/01/29(木) 23:44:32.09ID:yut66++a0

>>845
自己レス
拡張機能の「RSS Feeds」欄にスラッシュコマンド入れるというアホなことしてた
スレ汚しごめんね

0847名無しさん＠ピンキー (ﾜｯﾁｮｲ 63bb-3cVS)

2026/01/30(金) 19:11:00.64ID:NGSm1Ywt0

macos 26から分散コンピューティグがネイティブでサポートされたのでM4 max studioとmacbookで実行動画
Kimi-K2.5(mlx 4.2bit)が24tk/s。
WiFiで分散接続してるっていってるけどほんとかね。まぁTB5で接続すればいいんだけど
www.youtube.com/watch?v=JM41u7emnwo

0848名無しさん＠ピンキー (ﾜｯﾁｮｲ 9ea9-jbA7)

2026/01/30(金) 19:17:19.79ID:ZDV1ao0i0

qwenの開発者がこんなポストをしてた
https://x.com/JustinLin610/status/2012533831837143204

少しペースを落としてより良くしていくんだってさ
qwen3-nextの後すぐに3.5出て来なかったのはこういうことだからってことなんだろうか

0849名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sdaa-wXhp)

2026/01/30(金) 19:27:51.14ID:4OY8IwTZd

中共のオープンソース戦略が変わってきたのかもな
技術を誇示してアメリカを威嚇する戦略からAPI販売競争に移行しつつある
中華AI企業が上場して収益性を厳しく求められる時代にもなっている

0850名無しさん＠ピンキー (ﾜｯﾁｮｲ 9ea9-jbA7)

2026/01/30(金) 19:36:20.72ID:ZDV1ao0i0

今年上期はgemma4に期待かなぁ
いつものペースなら春ごろに出てきそうだけど
でもgoogleはgemmaにもう力入れないってニュースも流れてた気もするし
ローカル勢にはなかなか厳しい時期に入りつつある

0851名無しさん＠ピンキー (ﾜｯﾁｮｲ 9ea9-jWaa)

2026/01/30(金) 20:57:42.21ID:SxTUn3yB0

馬鹿みたいに金かかるのにほとんど金にならないだろうからしゃーないね

0852名無しさん＠ピンキー (ﾜｯﾁｮｲ bbf5-LD1Y)

2026/01/30(金) 21:08:22.00ID:+PNM7aCU0

後追い企業が名を上げるためにやる以外に理由が無いな

0853名無しさん＠ピンキー (ﾜｯﾁｮｲ df95-Hg0o)

2026/01/31(土) 06:15:32.05ID:JZJHxu+i0

もうオープンの主役はGLMとkimiとqwenになってるよね
Deepseekどこいった

0854名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b6f-b8R2)

2026/01/31(土) 06:32:09.41ID:L1B/Qr8L0

研究成果は出てるみたいやけどもう会社として名前は売れたから大型モデルを手間暇かけてオープンにする気無いんやないの
出自からして金融分野で活用して稼ぐ方に注力してそう

0855名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b16-kbss)

2026/01/31(土) 07:11:37.42ID:DYNBKvgb0

言うて3.2で話題になったばっかやん
他社が月一ペースで出してるのがおかしいんであって

0856名無しさん＠ピンキー (ﾜｯﾁｮｲ eb6a-BtEX)

2026/01/31(土) 08:19:58.00ID:xVt2pF820

日本勢はどこって感じ？

0857名無しさん＠ピンキー (ﾜｯﾁｮｲ db32-f8u6)

2026/01/31(土) 09:06:27.01ID:nh9giU6J0

qepの1bit量子化がちょっと話題になったけどそれを活用したって話を一向に聞かない
誰か活用してんのか？

0858名無しさん＠ピンキー (ﾜｯﾁｮｲ ab23-Nwr2)

2026/01/31(土) 09:56:21.70ID:s7b6J1TO0

>>856
日本勢「ちょっと待っていま税金にたかってるから！」

0859名無しさん＠ピンキー (ﾜｯﾁｮｲ df04-NM1G)

2026/01/31(土) 11:36:46.84ID:sUhplHVZ0

そんなこと言ったら中国勢はほぼ税金でやってるようなもんなんじゃね

0860名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fa9-AEO2)

2026/01/31(土) 12:25:33.15ID:PAeJ+0Uf0

日本初のモデルも結構あるんだけどオープンにされてないから話題になってないのよ
まぁ正直オープンにしないのが普通よね

0861名無しさん＠ピンキー (ﾜｯﾁｮｲ df95-Hg0o)

2026/01/31(土) 12:57:28.07ID:JZJHxu+i0

>>860
性能が劣ってるのにクローズだとマジで無価値だからな
中国のモデルだって安くてオープンだから価値があるのであってクローズだと使う理由が無くなる

0862名無しさん＠ピンキー (ﾜｯﾁｮｲ ab23-Nwr2)

2026/01/31(土) 15:42:22.19ID:s7b6J1TO0

>>859
分かってて言ってそうだけど
税金でやる、税金にたかるは全然違うぞ

0863名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sdff-SQv3)

2026/01/31(土) 16:53:51.17ID:lN16RlbMd

日本でまともなLLMを一般公開してるのってサイバーくらいしかないよな
誰も弄っていない時点で性能はお察しだが

0864名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sdff-SQv3)

2026/01/31(土) 16:55:27.78ID:lN16RlbMd

税金でLLM開発して非公開とかジャップ丸出しで行政訴訟レベル

0865名無しさん＠ピンキー (ﾜｯﾁｮｲ df07-qX8b)

2026/01/31(土) 16:57:21.33ID:EgSxtC9O0

公開したら「安心の国産AI」に金を払う法人顧客を騙せなくなるかんね

0866名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b25-11y8)

2026/01/31(土) 22:14:07.33ID:XOpNnLvY0

一応楽天の700Bが公開予定でしょ。
予定だけど。

0867名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fb0-C5bb)

2026/02/01(日) 00:16:34.13ID:Y/D28NS20

富岳で13Bのしょぼいオープンモデル作ってやった感出したりしてたし

0868名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fa9-NP2q)

2026/02/01(日) 00:25:42.19ID:gSMnA8I30

そもそも公開する意味がないから日本じゃどこもめったに公開しなかったし
しゃーないから国で国産LLM推進することになったんでしょ
正直今まで米中で公開されまくってきたのが異常だった
ぶっちゃけ米露の宇宙開発に近かったと思うわ

まぁ、性能はアメリカのクローズモデルがトップに君臨してて
それに対して中国はクローズで出しても勝てないからオープンで出して
「オープンでトップ」という称号を得るのが中国のどの会社も目的やったんやろうけど

0869名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b25-11y8)

2026/02/01(日) 00:29:21.07ID:JumqWz8x0

国策でやる分には先行モデルから少しでもユーザーを削れれば良いしな

0870名無しさん＠ピンキー (ﾜｯﾁｮｲ eb6a-BtEX)

2026/02/01(日) 05:37:46.19ID:7UuRReIh0

公開する意味がない=公開する価値が無い、でしょ

国内でバカを騙しててください

0871名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fef-NM1G)

2026/02/01(日) 08:06:20.60ID:z+B5g3LE0

>>862
どう違うの？

0872名無しさん＠ピンキー (ﾜｯﾁｮｲ ab52-ajNy)

2026/02/01(日) 09:27:48.81ID:x5x/WAHw0

LMStudioアップデートしたら挙動おかしくなった
UI上でチャット消せないし、新しいチャット始められないし
いちいちLMStudioを落とすしかない

同じ症状の人いる?

0873名無しさん＠ピンキー (ﾜｯﾁｮｲ 1f75-NMmM)

2026/02/01(日) 10:57:47.84ID:ON0iumKM0

同じ症状かはわからないけど挙動おかしかったからLM-Studio-0.3.36-1に戻した

0874名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fed-ZjVX)

2026/02/01(日) 23:56:02.29ID:xrY6qwFk0

下手に性能高いの出すと訴えられかねんから中国製ってことにしてたりして

0875名無しさん＠ピンキー (ﾜｯﾁｮｲ ab0a-cD51)

2026/02/02(月) 00:07:29.18ID:1csY2Tqf0

LM Studio
モデル選択やシステムプロンプト周りのレイアウトが変わって
少し手間取ってるが挙動は問題なし。

0876名無しさん＠ピンキー (ﾜｯﾁｮｲ 9f19-/xL0)

2026/02/02(月) 00:27:10.00ID:uMmqovfM0

ボイスAI初心者なんやがエロ目的でセリフ読み上げするタイプなら何がいい？

0877名無しさん＠ピンキー (ﾜｯﾁｮｲ df67-NMmM)

2026/02/02(月) 11:31:49.90ID:EpqMNTAO0

>>876
SillyTavernで使うなら
Style-bert-vits2
GPT-so-vits
重いけど
llasa
T5gemma
という選択肢もある
最近出たのだとQwen-TTS

0878名無しさん＠ピンキー (ﾜｯﾁｮｲ ab3d-e83P)

2026/02/02(月) 15:07:12.61ID:vFKz9urv0

StepFun Flash 3.5が196B-A11Bで良さそうやけど試した奴おる？
Benchmaxingだねって反応は英語で見かけたんやけど
https://i.imgur.com/pRMz5rO.jpeg

0879名無しさん＠ピンキー (ﾜｯﾁｮｲ df2a-Hg0o)

2026/02/02(月) 18:18:46.79ID:fYNbaQ4O0

>>878
試したけどGLMやKimiに勝ってるとは思えない

0880名無しさん＠ピンキー (ﾜｯﾁｮｲ dfc7-u4sr)

2026/02/02(月) 19:09:12.65ID:GA1qNUKw0

Ubuntuの方がAI向きだと聞いて、少し前にStable Diffussionセットアップしたけど24時間掛かって恐ろしく苦労した
LLMも気になってるけど、5090+Ubuntu 24.04.3LTSで簡単にセットアップできる？
今後も色々苦労しそうならWindowsOSを買ってシステムを作り直そうか悩んでる

0881名無しさん＠ピンキー (ﾜｯﾁｮｲ 2b20-/wWk)

2026/02/02(月) 19:42:44.15ID:5sa1QYkN0

Windowsは購入してなくてもセットアップできる
ライセンス確認が飛んでくるまで試してそれから考えればいいのでは

0882名無しさん＠ピンキー (ﾜｯﾁｮｲ dfc7-u4sr)

2026/02/02(月) 20:49:03.31ID:GA1qNUKw0

BIOS設定とかもLinux用にしてるし、そもそもデュアルブートはトラブルに成ると効くし、今の環境を壊すのも嫌で悩んでるのもある
WinからUbuntuに移行した人とかどんな感じか気になる

0883名無しさん＠ピンキー (ﾜｯﾁｮｲ 3b72-hfT9)

2026/02/02(月) 20:51:17.11ID:R4TlyFJp0

WSL2も検討してみては？

0884名無しさん＠ピンキー (ﾜｯﾁｮｲ df32-RLLN)

2026/02/02(月) 21:04:23.76ID:UZnVZEwJ0

llm環境のが簡単かな多分

0885名無しさん＠ピンキー (ﾜｯﾁｮｲ df2a-Hg0o)

2026/02/02(月) 21:30:34.34ID:fYNbaQ4O0

Ubuntuは簡単だと思うけど
難しいかどうかは使う人の知識次第だよね

0886名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f8a-/xL0)

2026/02/02(月) 21:38:39.61ID:ffBLUpQ40

>>877
サンクス
Qwen3-TTSって追加でnsfw用モデルとか用意する必要ある？

0887名無しさん＠ピンキー (JP 0Hff-y0B9)

2026/02/02(月) 21:41:49.11ID:zDr+25qFH

>>885
簡単ならセットアップ手順教えてあげなよ

0888名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b53-IZR7)

2026/02/02(月) 22:31:41.87ID:XW6tN0uu0

>>880
ubuntu24はpythonが3.12なのでちょっと苦労するくらいかな
StableDiffusionがセットアップできたならその知識でLLMいけるよ
GUIならLM Studioをまず使ってみよう
感触つかんだらollamaとかcli系とか
WSL2はWindowsの人の最後の手段だからやめとき

0889名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b53-IZR7)

2026/02/02(月) 22:43:18.16ID:XW6tN0uu0

Windows環境からlinux追加はほぼ大丈夫なんだけど
linux環境からWinだとブートを遠慮なく踏み潰されるからgrub入れ直しで泣く
デュアルブートはドライブを物理的に分ければトラブルは出づらい

0890名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sdff-SQv3)

2026/02/02(月) 23:06:45.36ID:54AHJYWUd

LinuxのことはLLMが得意だからLLMに聞くといい
昔とは比較にならないほど捗る
無難なディストロはUbuntu

0891名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f36-u4sr)

2026/02/03(火) 23:26:17.50ID:pgA4kPrW0

UbuntuだろうがWSL2だろうが、Dockerコンテナ使えばStableDiffusionでもLLMでも簡単にセットアップできるよ

0892名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f5b-n9Ri)

2026/02/04(水) 00:53:56.71ID:PKgUjGGy0

wslだと使えるメモリが上限が減るんじゃないの？
easyXXXに頼るんじゃなければ最初からubuntuの方が良さそうな気が

0893名無しさん＠ピンキー (ﾜｯﾁｮｲ 6fa7-ZjVX)

2026/02/04(水) 11:23:03.85ID:9D1xogOB0

winのpythonじゃだめなんか
unixのコマンドも動かしたいってなるとwslなんだろけど

0894名無しさん＠ピンキー (ﾜｯﾁｮｲ dfc7-jy+j)

2026/02/04(水) 11:44:05.16ID:jiY/mTxV0

今はほとんどの場合、winのpytonでも問題ないよな

0895名無しさん＠ピンキー (ﾜｯﾁｮｲ 9bc2-Atb3)

2026/02/04(水) 12:18:38.35ID:8M8xfW4T0

llm用途ならwindowsでもほぼ問題ないな。
画像やら音声関連だと周辺ライブラリで問題出ることは若干ある。
windowsで困りがちなのはむしろ最新をnightlyとかからビルドしようとかそういう時に開発ライブラリなんかで困る時なんかや

0896名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fa0-NP2q)

2026/02/04(水) 12:24:00.02ID:/c50etVB0

問題はCUDAが機能するかだけ

0897名無しさん＠ピンキー (ﾜｯﾁｮｲ 9bc2-Atb3)

2026/02/04(水) 12:25:02.15ID:8M8xfW4T0

>>887
curl -fsSL https://ollama.com/install.sh | sh

必要なツールが入ってればollamaで良ければこれで優勝

0898名無しさん＠ピンキー (ﾜｯﾁｮｲ 6f32-zgxa)

2026/02/04(水) 12:32:54.88ID:yuT/vXtl0

……その必要なツールとやらを全部集めて正しく入れるのが難しいんじゃねえかな

0899名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fa9-NP2q)

2026/02/04(水) 12:33:00.85ID:IwSbmfsL0

cudaに関してはwindowsが楽なのよな
windowsではcuda周りでエラーが起きた記憶がない

だからwindowsのドライバ(cuda)を直接見れてwinバイナリも動くlinux環境という
wslがllmでは実は結構いいって言う

まぁwslは何か変な状況に陥った時のトラブルシューティングが面倒だけど

0900名無しさん＠ピンキー (ｵｯﾍﾟｹ Srbf-BtEX)

2026/02/04(水) 13:26:26.49ID:TL0hICLSr

（´･∀･`）ﾍｰ

0901名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fa0-NP2q)

2026/02/04(水) 20:21:52.43ID:/c50etVB0

この数年でwindowsバッチとpythonとgradioに詳しくなったわ

0902名無しさん＠ピンキー (ﾜｯﾁｮｲ 5f79-es1C)

2026/02/05(木) 01:45:03.34ID:pGEZPg3B0

vram48gbの改造4090が手元にあるんだけど、ちょうどこのサイズ感で収まるエロチャできるLLMってありますかね？

0903名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b07-IZR7)

2026/02/05(木) 02:57:18.85ID:O6c3U/7D0

そんな奴が何人もいると思うか?

0904名無しさん＠ピンキー (ﾜｯﾁｮｲ df33-JcfA)

2026/02/05(木) 03:08:12.52ID:73MzgwsW0

48GBって帯に短し感あるよな
100B以上だとQ4じゃ入り切らないしベストサイズの70Bクラスはほとんどない
おとなしく24BのエロチューンをQ8で使うのがええよ

0905名無しさん＠ピンキー (ﾜｯﾁｮｲ dfc7-u4sr)

2026/02/05(木) 04:10:58.96ID:Pqc9yNQ/0

Ubuntuのpython、バージョン新しいな、3.10に入れ替えたほうが良いんやろか？
とりあえず、あまり何も考えず気軽にPCを使いたい

あととりあえずStable DiffussionやKohyaのセットアップだけど
Geminiに聞かず、Stability Matrixみたいなソフトも使わず
公式サイトの手順でセットアップして、エラー出たらGeminiに聞くというのが一番効率良さそう
一番やっちゃダメなのがはじめからGeminiに聞く事
これしたらバージョンのおかしなものばかり進められてすげー手こずった
諦めて公式情報でやったらあっさりセットアップできて拍子抜けした

色々セットアップ中だけど、Windowsと同じくらい簡単でソフトも充実したとか聞いたけどまだまだなのかね？
AIの為というのもあるけど、Windowsに嫌気がしてるというのもある
広告まみれなOSになってるし、アップデートで内部の設定が変わって自作スクリプトがご動作したり、UIが変わって戸惑ったり
Windowsに振り回されるのが嫌になってUbuntuにチャレンジしてるってのもある
WinXPのUIが忘れられず、X11+Cinammon(LinuxMintの外観だけ？)にして色々触ってる所

デュアルブートだけど、5090ではセキュアブートOFFの方がトラブルが出にくいらいらしくWindowsとUbuntuの併用は面倒そう

色々アドバイス書いてくれた人ありがとう！！
システムのバックアップ取りながら色々試してみるわ

0906名無しさん＠ピンキー (ﾜｯﾁｮｲ 9b07-IZR7)

2026/02/05(木) 05:54:15.00ID:O6c3U/7D0

venv ubuntsu24 あとからpython3.10　でググるなりAIに聞くのだ
元の3.12はシステムで使ってるから消してはならぬ

0907名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fa0-NP2q)

2026/02/05(木) 06:03:48.45ID:StPuVbOL0

基本仮想環境を作ってやる

0908名無しさん＠ピンキー (ﾜｯﾁｮｲ 2b20-/wWk)

2026/02/05(木) 06:54:04.53ID:VYFVfYSV0

SDインストールするのにニンゲンがver確認して...みたいな話がずっと続くのがlinuxなので全面移行はだいぶ人を選ぶよ
wsl方式はめんどくさいところはスルー出来るのが楽

0909名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fc6-EF4B)

2026/02/05(木) 22:48:51.82ID:J8+yjDdh0

mint使ってからゲーム用にcachyos移行したけどAI含めてなんも困ってない
windowsのが楽っていうのは学習資産があるからで
完全新規はコンパネと設定に分散してめちゃくちゃになってるwindowsなんて意味不明だろうな
テレメトリ切ろうと思ったらprivacy.sexyみたいなの使うしかないし

0910名無しさん＠ピンキー (ﾜｯﾁｮｲ 2b20-/wWk)

2026/02/05(木) 23:46:15.28ID:VYFVfYSV0

両方あればめんどくさいところを回避できるって話だよ

0911名無しさん＠ピンキー (ﾜｯﾁｮｲ 2b11-hfT9)

2026/02/06(金) 04:18:25.16ID:dTe/0uYA0

Qwen3-VL-235Bのhereticが最近上がってたから試した
mmprojは共通だけどNSFWの理解は断然こっちのほうがいいな

0912名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fa0-NP2q)

2026/02/06(金) 12:52:05.40ID:/J1xxjun0

SDの重みは相対的なものだから、スライダー系に重みを使う場合は、スライダーの重みの合計から逆算して別の重みを付けるって理解で合ってますか

0913名無しさん＠ピンキー (ﾜｯﾁｮｲ 0fa9-AEO2)

2026/02/06(金) 17:05:43.33ID:w2dNhnKc0

コーディング界隈は最近盛り上がってるなぁ

0914名無しさん＠ピンキー (ﾜｯﾁｮｲ a7f3-ozcu)

2026/02/07(土) 04:29:34.58ID:zKDS1Meq0

codex5.3とOpus4.6からみたらGemini3がコーティング新人レベルに見えてしまうほどだもんな

0915名無しさん＠ピンキー (ﾜｯﾁｮｲ f320-rGR4)

2026/02/07(土) 05:06:09.06ID:OT6qvrXt0

それはgemini3自体がポンコツなだけという気もする

0916名無しさん＠ピンキー (ﾜｯﾁｮｲ f6a0-cHUB)

2026/02/07(土) 05:37:53.00ID:RCyqnRau0

うーんSDのスライダー系LoRAは重みを使うのが崩壊につながるみたい、トリガーでスライドさせればいいのに、混ぜるな危険ってことか

0917名無しさん＠ピンキー (ﾜｯﾁｮｲ f2c7-81f9)

2026/02/07(土) 06:29:21.66ID:v/WV8UqW0

>>906
あぶねー、やらかすところだった

ちなみに、LM Studioは何一つエラーなく導入できてしまった
SDやKohyaの為にRTXのドライバなど色々と入れたのが訳に立ってる気がする

今一番困ってるのは、良い画像ビューワーソフトが無いこと
SDで作ってた画像を日付_キャラで1000ファイルずつにして、フォルダーにいれてるものが膨大にあるんだけど
NeeViewでフォルダーのサムネ見ながら好きなのを選択、更に良いのはお気に入りに入れてたり、削除して楽しんでるんだけど
この機能を実現したく、Linuxで使えるものを5つくらいやったがどれもダメ過ぎる
仕方なくBotte(Wine)つかったが起動すらしない、
苦労もあったが致命的なトラブルはなくここまで順調に来たが躓いた・・・
Windowsに戻るか悩む、、、
最新のGPUなのに使えない
コンピュータ、ソフトがなければただの箱　この名言思い出してしまった

0918名無しさん＠ピンキー (ﾜｯﾁｮｲ f6a0-cHUB)

2026/02/07(土) 06:43:22.15ID:RCyqnRau0

スライダーと重みと崩壊とって歌のタイトルみたいだな

0919名無しさん＠ピンキー (ﾜｯﾁｮｲ 76a9-ll+/)

2026/02/07(土) 09:25:20.49ID:mywxbNGV0

>>917
NASがあるなら画像の作成先をNASにして別のWindowsマシンから管理するか
NASがないなら今のLinuxの画像フォルダをsambaで共有して別のWindowsマシンから管理

0920名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f32-cHUB)

2026/02/07(土) 11:12:49.80ID:5lXtP+rs0

>>916
Concept Sliders LoRAは以前試した感じだとSDXL用ならSDXLベースモデルしかほぼ効かなかった気がする
効果は面白いけど、今更素のSDXLを使う人いるんかって感じで汎用性がね

0921名無しさん＠ピンキー (ﾜｯﾁｮｲ f6a0-cHUB)

2026/02/07(土) 12:05:24.48ID:RCyqnRau0

スライダー系LoRAは重みの計算でおかしくなるので使わないようにします。

0922名無しさん＠ピンキー (ﾜｯﾁｮｲ f2c7-81f9)

2026/02/07(土) 12:45:38.77ID:v/WV8UqW0

>>919
NASやsambaは設定うっかりミスで感染してたのがあった気がするし、ネットワーク知識がないからできれば使いたくない
今は移行時期で一時的に2台使ってるけどPCはできれば最強の1台にしたい

0923名無しさん＠ピンキー (ﾜｯﾁｮｲ 76a9-cHUB)

2026/02/07(土) 13:39:26.09ID:8LGw6RXP0

ワイ画像ビューワーはAntigravityで作っちゃったよね

その観点からアドバイスするとファイル一覧表示部分はOSのコンポーネントそのまま使うような作りにした方がええな
例えばWindowsやったらファイル一覧表示する部分はExplorerコンポーネントつこうたほうがええ

ワイそこの部分の作りこみに時間もtokenもかなり使ったけど
あとになって気づいたのは「Explorerの機能を頑張って再実装しとるだけやな」ってなった
頑張って実装したはええけどどうやってもExplorerの使い勝手までには及ばないし
バグはちょいちょい出てくるしで(出てきてもAntigravityで直せるんやけども)
せやったら初めからExplorerコンポーネント埋め込めばよかったって今は思う

あと今やったらAntigravityよりClaude Code + Claude Code Opus 4.6のがええやろね

0924名無しさん＠ピンキー (ﾜｯﾁｮｲ 9f31-QihV)

2026/02/07(土) 13:45:19.63ID:Dm2Czjl+0

セキュリティ対策ザルな一般ご家庭がそれなりに平和にネットを使えてるのは
モデムがDHCPサーバー兼ねてゲートウェイとして機能してるからだよ
だから家の外からNASのエロ画像が見たいと家の壁に穴を開け始めたりせず
家の中で使ってる限りは導入するサービスそのものとご家庭のセキュリティリスクには殆ど関係がないよ

0925名無しさん＠ピンキー (ﾜｯﾁｮｲ 3e32-BhtQ)

2026/02/07(土) 14:30:52.52ID:yGt3IH8R0

>>922
知識がないのを理由にするならLinuxだって手を出すべきではないよ
大人しく全部Windowsにしとけ

0926名無しさん＠ピンキー (ﾜｯﾁｮｲ f6a0-cHUB)

2026/02/07(土) 14:34:56.81ID:RCyqnRau0

というかWSLとDockerの話が出る時点でLinuxの知識もかなりいる

0927名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr37-rGR4)

2026/02/07(土) 16:25:57.65ID:qlxMxtHEr

やるなはスパルタすぎるけど、何もしなければ安全って時代では無いので全部調べるかなにかに頼るかでないの
操作もファイル転送もアレもコレもリモートデスクトップアプリで賄う代わりにRDPサービスには月額払うとかね

0928名無しさん＠ピンキー (ﾜｯﾁｮｲ c3ba-sHKY)

2026/02/07(土) 16:49:16.67ID:L4vEvaGw0

仮想マシンにWindows入れてホストと仮想マシン間の共有フォルダに画像ぶち込めばいいんじゃない

0929名無しさん＠ピンキー (ﾜｯﾁｮｲ 9f0d-mCda)

2026/02/07(土) 19:52:07.51ID:MNrGCbyn0

Open Router課金してみたけど
エロ小説書くならどのモデルが良いの？
Mistralとかmagnumってやつがいいのかな

0930名無しさん＠ピンキー (ﾜｯﾁｮｲ f2ac-81f9)

2026/02/07(土) 23:56:28.86ID:v/WV8UqW0

>>923
お金かかるサービスはなるべく使いたくない、それもあってLLMも使えるPCが欲しく組んだ感じ
あと良い方法があれば済むし作るのは最後かな　簡単なソフト(テキストエディタで作るだけ)ならGeminiに投げるだけでも作ってくれるけど
そのレベルになるとかなり複雑そう　Githubみても開発環境の作成やコンパイルレベルで躓きそう

>>924
らしいね、ただ設定を間違えるとまずいとかAIが言ってたりしてsambaには踏み切れてない

>>925
ネット情報を読む限りだけど、知識があまりない場合、Linuxの方がむしろ安全じゃないのか？
そう思ってUbuntuにしたいってのもある
よくわからないからFW入れて可能な限りサーバ機能は切っておきたいってのがある
あと、銀行や証券のPythonプログラムのやり取りが結構あるから侵入は困る

>>927
LinuxのFWでネットワーク内のもう1台の自分のIPだけ許可して、WinSCPでデータのやり取りだけはとりあえずしてる
使い勝手かなり悪いけど

0931名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sdd2-v0/K)

2026/02/08(日) 00:11:40.98ID:2/9XvDUUd

>>929
https://openrouter.ai/apps?url=https%3A%2F%2Fsillytavern.app%2F

0932名無しさん＠ピンキー (ﾜｯﾁｮｲ 32fb-oG/6)

2026/02/08(日) 09:18:05.34ID:psQ4fK060

>>917
5つくらい試したならすでに試した後かもしれないけど
XnViewMP（https://www.xnview.com/en/xnview/）はどうですか
好きなものを選択、条件でフィルタなどおそらく希望は満たしていると思います
個人的に1番好きな画像ビューワーです

0933名無しさん＠ピンキー (ﾜｯﾁｮｲ f2ac-81f9)

2026/02/09(月) 01:25:54.75ID:RpvB3isi0

>>932
ありがとう　AIに聞いた時には候補にも出てなかったわ
試してみた所かなりいいんだけど、1回で2枚ずつ画像を見ててその機能がないかも

0934名無しさん＠ピンキー (ﾜｯﾁｮｲ f2ac-81f9)

2026/02/09(月) 01:29:04.54ID:RpvB3isi0

Ubuntuで致命的なのが色々なAIプログラム立ち上げてると、瞬間VRAM溢れる事が1時間に数回あるんだけどOOMでたらプログラム止まるんだな
AIに聞くとWindowsの方がOOMについては粘りがあると言ってきた
AIについてUbuntuは完全に上位互換だと思ってたけどそうでもないんだろうか？
WindowsVRAM無駄に消費すると思ってたけど使い勝手の面で実はかなり頑張ってるのかも、ただ、偶にOS巻き込んでフリーズするけど・・・

0935名無しさん＠ピンキー (ﾜｯﾁｮｲ b232-4UIm)

2026/02/09(月) 04:46:12.88ID:LLgbr2Tg0

ズボラな平行作業を受け入れるのはwindowsのほうかも
体感vramも無駄に消費とかしないな、メインメモリは明確に食うけど

0936名無しさん＠ピンキー (ﾜｯﾁｮｲ 9fb9-5Fuw)

2026/02/09(月) 05:15:28.86ID:4CxtXqps0

evoX2 128GBでエロやるオススメモデルってどんなのがあります？
gpt oss 120Bは真面目な用途だと良いんだけどエロだと…だし
基本は小説です

0937名無しさん＠ピンキー (ﾜｯﾁｮｲ f6a0-cHUB)

2026/02/09(月) 07:44:13.14ID:pmRjuvly0

GPTのエロ解禁ってどうなったんだろうな
広告解禁の話の方が見かけるようになってきたが

0938名無しさん＠ピンキー (ﾜｯﾁｮｲ 32fb-oG/6)

2026/02/09(月) 09:12:45.54ID:tfO0jynk0

>>933
一度に２枚ずつ見たいというのは漫画ビューワーのように見開き表示にしたいということなのかな
残念ながらXnViewMPにはそういった機能はないと思います

0939名無しさん＠ピンキー (ﾜｯﾁｮｲ f2ac-81f9)

2026/02/09(月) 09:46:10.16ID:RpvB3isi0

>>938
ありがとう！
他にも色々と細かい所が気になって気になって諦めることにしたわ

0940名無しさん＠ピンキー (ﾜｯﾁｮｲ f2ac-81f9)

2026/02/09(月) 09:48:13.17ID:RpvB3isi0

Ubuntuで相談してたものだけど、諦めてWindowsにExplorerPatcherや広告撃退ソフトなどあてて戻ることにした
慣れ親しんだソフトの代用を見つけたりいちいち改造するのがほぼ不可能なのとOOMでるのが大きい
今回色々頑張って分かったのは、Windowsの圧倒的なソフトウェアの充実度合いと後方互換性が凄過ぎる事
また、MSもX86を捨てられないとか、大昔の命令コードでパフォーマンス落ちてセキュリテイ下がるのが分かってても何層にもエミュレートしてでも残してるとか不思議だったが
このエコシステムを本気で守りたいんだな、ただ、その一方でTPMで過去のユーザーを切り捨てたのは不思議ではあるけど・・・(TPM強制とか色々振り回されるのが嫌でUbuntuトライしたというのもある)

なお、今からPC始める人ならUbuntuもありだと思う
操作性がWin95とかそんなイメージだけど用途に寄るが普通に使えるOSだわ
軽いし負荷のかかる作業をしてもOS巻き込んで落ちないのが良い、その代わりソフトの選択肢が色々狭く例えばOOMで止まったり自由度が狭い
ソフトも作者の数がWinより少ないから選べないし最適かも微妙なのかWinよりも若干重たく感じるものが多かった　OSが軽いだけで気になる

セットアップの難易度だけど、簡単なスクリプトかけるくらいのプログラミングスキルの自分からすると難易度は普通レベル
RTX5090みたいな最新のものでも、公式見てセットアップでエラー出たらAIに聞くだけで動いた
あと、最近のUbuntuは黒い画面(Terminal)の操作は不要って聞いたけど頑張ればできるかもだが、あれは嘘だと思ったほうが良い

0941名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr37-S1MQ)

2026/02/09(月) 10:52:57.72ID:UmU5acEhr

msはもうwinで儲けてない
捨てるべし

0942名無しさん＠ピンキー (ﾜｯﾁｮｲ f2c7-81f9)

2026/02/09(月) 11:20:12.87ID:RpvB3isi0

>>941
MSが本当にOSで儲けてないなら、Win11Proが無料で使える方法知りたいわ
とりあえず、OSが必要になって困ってる

あと、上でも書いたけど使えるソフトの数が全然違いすぎてUbuntuでは良いものが見つからず移行ができなかった　捨てるとか不可能だよ
例えば、ビューワーやファイラー、エディタですらWindowsで使えるソフトの完全上位互換みたいなものを探してたけど手に馴染むものが無い
Geanyはかなりカスタマイズできて良かったけど、AIで使ってる巨大ファイルを開いたら思いの外重たかった
他にもOOMとかWindowsなら止まらないのに、Ubuntuだと止まるとか使えば使うほど不満点が出てきた

0943名無しさん＠ピンキー (ﾜｯﾁｮｲ 76a9-h1OG)

2026/02/09(月) 12:02:27.01ID:rf2C5azs0

step3.5flashって196bのモデルがベンチマークじゃglm4.7を凌駕しとるようやが
誰かつこうて見たひとおる？
Q4あたりで使うとしたらGPU+128GBで使える丁度ええ大きさやが

0944名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr37-S1MQ)

2026/02/09(月) 12:20:54.56ID:UmU5acEhr

winはアホ向け

0945名無しさん＠ピンキー (ﾜｯﾁｮｲ 53e1-jTBU)

2026/02/09(月) 13:14:34.83ID:BT7t/1tv0

スマホGeminiでエロ小説やRPしてた者です
規制や制限なくエロ小説やrpしたくてローカルに手を出そうととりあえずkoboldcppを入れたんですが良さげなggufモデルってどう判断すればいいんですか？
pcのスペックはこれです
i7-10750H / GTX 1650（4gb） / メモリ16GB / SSD 500GB + HDD 1TB

0946名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr37-81f9)

2026/02/09(月) 13:36:19.41ID:DI2gb6xpr

ダウンロードするだけならスレで話題になったモデルをひたすら試す
でもVRAM4GBだけでは正直何もできないと思うよ…

0947名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sdd2-v0/K)

2026/02/09(月) 13:37:28.97ID:Z+q1O254d

PCがVRAM24GB+16GB=40GB構成になったんだが
VRAM40GBに向いたモデルってQwen3Next80B以外にある？

0948名無しさん＠ピンキー (ﾜｯﾁｮｲ f2c7-81f9)

2026/02/09(月) 13:48:28.24ID:RpvB3isi0

>>944
OOM対策どうしてるの？
VRAMを可能な限り使い切るような感じで複数ソフト起動してる
そうすると、ちょっとしたVRAM変化でOOMで止まる　Windowsだと止まらず動いてくれる
学習とか途中で止まると時間が大幅に無駄になるし、寝てる時に止まってると時間が勿体ない
あと、NeeViewerみたく速度が早く、機能的にも上位互換な物を探してるけど使えるものある？

0949名無しさん＠ピンキー (ﾜｯﾁｮｲ b232-4UIm)

2026/02/09(月) 13:53:14.26ID:LLgbr2Tg0

70BくらいのdenseをQ3ぐらいで使うあたり…？
moe系はexpert部を切り出す代わりに全体サイズは性能の割にデカい感じだから、無理にvramに収めなくても

0950名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sdd2-v0/K)

2026/02/09(月) 14:12:20.13ID:Z+q1O254d

>>949
よく使いそうなexpertを判別して優先的に読み込むなら大きなMoEを使うんだがな

UbuntuのLM Studioで動かすつもりだが
各expertの中身と配置がブラックボックスでよく分からんわ

0951名無しさん＠ピンキー (ﾜｯﾁｮｲ 7e03-SV9b)

2026/02/09(月) 16:23:59.87ID:kCYtZ6Da0

VRAMに乗せきりたいなら32BのQ8とかになるんじゃないか
40GBもあればcpu-moe系のオプションで大きめのGLMとかも結構な速度で動かせると思うが

0952名無しさん＠ピンキー (ﾜｯﾁｮｲ 7e23-tJMc)

2026/02/09(月) 16:39:13.73ID:cFDFamMz0

>>943
redditではベンチ番長やなくてかなり好意的な意見が多いみたい
lmstudioでもダウンロードできるようになってるし使ってみる

0953名無しさん＠ピンキー (ﾜｯﾁｮｲ f6a0-cHUB)

2026/02/09(月) 18:38:44.69ID:pmRjuvly0

SDでだいぶ出したい絵を出せるようになってきた。
衝突して崩壊してたんだなって感覚が重要だわ

LoRAと重みとdanbooruと順番と、全部ちゃんと理解しないと絵にならない
何が悪いのか原因を見つけるスキルが必要

0954名無しさん＠ピンキー (ﾜｯﾁｮｲ 0f32-cHUB)

2026/02/09(月) 20:50:03.75ID:Mwym//eg0

>>952
Q8_0で試したけど、スピード速いし、日本語もそれなりだけど、規制強すぎだし
小説書かせると話の整合性もいまいちかな
heretic版とか出たら面白いかも

0955名無しさん＠ピンキー (ﾜｯﾁｮｲ 3ec8-OQoE)

2026/02/11(水) 10:24:18.02ID:CqqxVzne0

最近grokは使い難いな。
デッドロックというか、自分の出力した文章内容に不適切な内容があると続きを書かなってしまうみたいな事が起きてる。

0956名無しさん＠ピンキー (ﾜｯﾁｮｲ 76a9-ll+/)

2026/02/11(水) 12:36:48.06ID:EAE8n6lc0

70Bくらいでおすすめってある？
やっぱりもっとでかいか24GBに乗るくらいまでのが人気なのかな

0957名無しさん＠ピンキー (ﾜｯﾁｮｲ 1224-soK/)

2026/02/11(水) 17:11:46.81ID:KPjbPQAh0

Heretic-Qwen3-VL-235B-A22B-Instructいい感じなんだけど読点句読点とか鉤括弧がめちゃくちゃ多いのはモデルの特徴なんかな
いい感じに抑制したいけど適当に指示すると今度は全く使わないで文章書こうとしだすから難しい

0958名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sdd2-v0/K)

2026/02/11(水) 17:37:03.98ID:ctMDnveAd

>>957
Qwen3 235Bはひと昔前のGeminiやClaudeに迫る性能だが
現行バージョンほどのプロンプト追従性は無いな

GeminiやClaude向けのRPプロンプトがまともに動くこともあればダメな時もある

Qwen3 Next 235Bが待たれる

0959名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sdd2-v0/K)

2026/02/11(水) 17:44:16.28ID:ctMDnveAd

俺のVRAM40GB環境では70B～80BならギリVRAMに乗るが
235BはVRAM128GB級でないとVRAMに乗り切らない

⚙70B～80B…チャット、リアルタイムアプリ
⚙235B～…バッチ処理

と用途別に使い分けるのが現実解
MoEのエキスパート配置が賢くなればVRAM32GB以下でも235Bがサクサク動きそうだが現状では夢物語

0960名無しさん＠ピンキー (ﾜｯﾁｮｲ 9f21-MYmM)

2026/02/11(水) 17:48:41.51ID:FDNSgGOl0

見栄張んなよ
本当は8GBとかのグラボ使ってんだろw？

0961名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sdd2-v0/K)

2026/02/11(水) 18:01:06.43ID:ctMDnveAd

>>960
>>947

0962名無しさん＠ピンキー (ﾜｯﾁｮｲ 9f21-MYmM)

2026/02/11(水) 18:02:21.40ID:FDNSgGOl0

>>961
>>960

0963名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sdd2-v0/K)

2026/02/11(水) 18:07:49.85ID:ctMDnveAd

>>962
しつこい奴やなぁ
s://files.catbox.moe/8qinpa.mp4

0964名無しさん＠ピンキー (ﾜｯﾁｮｲ 76a9-cHUB)

2026/02/11(水) 18:18:49.85ID:DcHcFl3L0

量子化のビット数小さくするのは元々パラメータ数小さいのとはまた違ったところが劣化する感覚があるんよな
パラメータ数小さいのはドジっ子なんだけど量子化で小さくしすぎると認知症みたいな
なんかうまく説明できないんだけど

コーディング用だとこの辺が結構聞いてくるんよなぁ
パラメータ数にかかわらずQ4はどのモデルもコーディングで使えない

0965名無しさん＠ピンキー (ﾜｯﾁｮｲ a66d-8x2G)

2026/02/11(水) 18:35:06.67ID:6muex5+O0

>>963
粘着質なやつに構うと調子乗るからほっといたほうがいいよ

0966名無しさん＠ピンキー (ﾜｯﾁｮｲ b2ec-lZWY)

2026/02/11(水) 18:56:42.22ID:X0y/9hKJ0

VRAM12GB＋LM Studio(RAM96GB)環境で16GBに交換したんやが
モデルのサイズはVRAMに全部入る容量を選ぶべきか、gguf版で少しVRAMの空きを残した方が良いのかどっちなんやろか
会話のやり取りがそこそこ続くようならVRAMは数GB開けた方が良いんやろか
数回限りのやりとりならギリギリ15GBぐらいのモデルとかのほうが精度優先にしたほうが良い？

0967名無しさん＠ピンキー (ﾜｯﾁｮｲ 1224-soK/)

2026/02/11(水) 19:20:18.63ID:KPjbPQAh0

>>964
パラメータ数小さいけど量子化ビット数は大きいモデルはアホの子なんだけどやってることは納得できるしガイドしてやればちゃんと仕事してくれるイメージ
QWEN3ぐらい小説書ける100B〜150BぐらいのMoEモデルがあればQ6とかでいい感じの文章をストレス無く書いてくれそうなんだけどなぁ

0968名無しさん＠ピンキー (ﾜｯﾁｮｲ 7e94-SV9b)

2026/02/11(水) 23:06:00.26ID:5W//KEc50

>>967
GLM4.5Air使えば？
110BのMoEだぞ

0969名無しさん＠ピンキー (ﾜｯﾁｮｲ 7e73-fBf0)

2026/02/11(水) 23:40:23.61ID:LnIn0qab0

>>923
winが昔みたいに勢いあったらWin APIゴリゴリ書いてくれるようなAI出してたんだろなー

0970名無しさん＠ピンキー (ﾜｯﾁｮｲ 32b1-ulj2)

2026/02/12(木) 03:02:12.39ID:ejMhmS6d0

GLM5きたぞ

0971名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sdd2-v0/K)

2026/02/12(木) 03:13:08.62ID:HFMA3kFcd

>>970
よくオープンウェイトを続けられたな
745B-A40Bだって

s://huggingface.co/zai-org/GLM-5

おかげでまだしばらく激安AIコーディングが続けられそうや

0972名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr37-S1MQ)

2026/02/12(木) 10:30:51.96ID:fvChrZS2r

安いコーディングaiて意味あんの？

0973名無しさん＠ピンキー (ﾜｯﾁｮｲ 32b1-ulj2)

2026/02/12(木) 11:17:21.43ID:ejMhmS6d0

安いのが需要無くなることある？

0974名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr37-rGR4)

2026/02/12(木) 11:29:56.42ID:4uao824Lr

単独で使うものではないんでは
アシスタントで使うかオーケストレーションで使うかでないの
Vide codingの時代から事前プランニングの時代に一気に変化しつつあるから、合否/採点が容易なタスクは全部切り出して安いコーディングLLMでループさせる形になりそう

SOTAモデルで採点カンストするまで回したカンストSkillsをGLMに使わせる、とかになるのかな

0975名無しさん＠ピンキー (ﾜｯﾁｮｲ f636-81f9)

2026/02/12(木) 12:31:17.54ID:blfUyIva0

コーディングは一度でもClaudeかCodexの手軽さを味わったらローカルに戻れないよ
ほんとに小さいスクリプト単位なら使用の余地はあるんだろうけど
ローカルがClaudeに追いつける日はくるのだろうか
中華LLM + openclawに期待するしかなさそう

0976名無しさん＠ピンキー (ｵｯﾍﾟｹ Sr37-S1MQ)

2026/02/12(木) 13:21:48.09ID:fvChrZS2r

安いので試してだめだったら高いの使う、という手間がもうめんどいので最初から高いやつ使うよね

0977名無しさん＠ピンキー (ﾜｯﾁｮｲ b2ec-lZWY)

2026/02/12(木) 13:24:07.94ID:q5Z4ATkX0

誰か >>966にアドバイスしてクレメンス・・・
空きが無いと話がループして止まらないとかVRAMとモデル選択のバランスがようわからんのや

0978名無しさん＠ピンキー (ﾜｯﾁｮｲ 1259-S3dw)

2026/02/12(木) 13:44:14.31ID:PwEbN11/0

>>977
待てるならvramいっぱいにモデルを詰めていいし、そうでないならkvキャッシュ用に空けておくべき
モデルによってkv量子化だったりオフロードしなかった時の精度や速度が違うから試しながら調節してみ

0979名無しさん＠ピンキー (ｼｬﾁｰｸ 0C33-Z10f)

2026/02/12(木) 15:35:02.94ID:GeqxohjDC

Kilinskiy/Step-3.5-Flash-Ablitirated
これ試してみるか
ところでabliratedとhereticってどっちが精度落ちないんかな？

0980名無しさん＠ピンキー (ﾜｯﾁｮｲ 7e26-SV9b)

2026/02/12(木) 16:03:33.70ID:2lcEbppU0

>>979
hereticはわりと新しい方式で精度良いはず
モデルカードの下の方に拒絶率と精度低下率が書いてあったりする

0981名無しさん＠ピンキー (ｼｬﾁｰｸ 0C33-Z10f)

2026/02/12(木) 16:09:09.19ID:GeqxohjDC

heretic 8bitならメモリ256GあればギリいけるかもってAIに言われたが実際やってるニキいる？
あ、step3.5でね

0982名無しさん＠ピンキー (ﾜｯﾁｮｲ 7e26-SV9b)

2026/02/12(木) 16:15:15.88ID:2lcEbppU0

Q8はパラメータ数≒GBだから方式とか関係なく200Bなら乗るやろ

0983名無しさん＠ピンキー (JP 0H0e-8x2G)

2026/02/12(木) 16:19:57.98ID:AsWM2HWiH

今ってQwen3-VL-235BとGLM4.6V以外に>100Bで日本語NSFWいけるVLMある？

0984名無しさん＠ピンキー (ﾜｯﾁｮｲ b2ec-lZWY)

2026/02/12(木) 16:54:46.72ID:q5Z4ATkX0

>>978
サンガツやで
これcontext長＝kvキャッシュなんやろか
事前に確保するとVRAM量が増えるからkvキャッシュと思ったんやが会話が長くしたいなら12GB(model)+4GB(KVcache)
数回のやりとりで良いなら15GB(model)+1GB(KVcache)なんかなと思ったけど考え方はあってるやろか

0985名無しさん＠ピンキー (ﾜｯﾁｮｲ 7e26-SV9b)

2026/02/12(木) 17:30:05.31ID:2lcEbppU0

あってる

0986名無しさん＠ピンキー (ﾜｯﾁｮｲ b2ec-lZWY)

2026/02/13(金) 01:56:00.63ID:1/JfPHUt0

>>985
サンガツ4GB増えた分だけエロもどれだけ変わるかわからんがまだmugnum v4の8GBやわ
今は良いのが出てるかも知れんけどスレでnsfwで検索しても0件でワイむせび泣く

0987名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sdd2-v0/K)

2026/02/13(金) 02:04:29.65ID:xDrc197od

エロに何を求めるかで話が全く違ってくるからな

セックスシーンさえあればいいならQwen235bとかの中華モデルでも脱獄すれば余裕で出るが
エロシーンの描写に厚みを持たせたいならGrokみたいな既知外学習したモデルを使うかプロンプトで補充するしかない

古臭い24B以下のモデルに固執するのは画像生成でSD1.5に固執するのと同じでスレ民の共感は得られないだろう

0988名無しさん＠ピンキー (ﾜｯﾁｮｲ b2ec-lZWY)

2026/02/13(金) 02:12:50.11ID:1/JfPHUt0

>>987
いや、古いのに固執してなくて浦島なのでモデル何か無いかなと
nsfwで検索したら0件だったが本文じゃなくて名前欄で検索してたわ
と言うことで出てきたaratakoなどやってみるわ

0989名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sdd2-v0/K)

2026/02/13(金) 02:24:48.98ID:xDrc197od

>>988
よっぽどのモノ好きしかLLMの日本語エロチューンなんかやらんからな
実質aratakoニキだけやないか

ワイはGrokがプンルーで無料Alphaやってた時にあらゆるエロシーンを100本以上抜いとるから
そのうち脱獄中華モデルでチャンク化してRAGに放り込むつもりや