なんJLLM部避難所 ★10

トップページ⇒オナテク(仮)＠bbspink掲示板

989コメント388KB

なんJLLM部避難所 ★10

レス数が950を超えています。1000を超えると書き込みができなくなります。

0978名無しさん＠ピンキー (ﾜｯﾁｮｲ 1259-S3dw)

2026/02/12(木) 13:44:14.31ID:PwEbN11/0

>>977
待てるならvramいっぱいにモデルを詰めていいし、そうでないならkvキャッシュ用に空けておくべき
モデルによってkv量子化だったりオフロードしなかった時の精度や速度が違うから試しながら調節してみ

0979名無しさん＠ピンキー (ｼｬﾁｰｸ 0C33-Z10f)

2026/02/12(木) 15:35:02.94ID:GeqxohjDC

Kilinskiy/Step-3.5-Flash-Ablitirated
これ試してみるか
ところでabliratedとhereticってどっちが精度落ちないんかな？

0980名無しさん＠ピンキー (ﾜｯﾁｮｲ 7e26-SV9b)

2026/02/12(木) 16:03:33.70ID:2lcEbppU0

>>979
hereticはわりと新しい方式で精度良いはず
モデルカードの下の方に拒絶率と精度低下率が書いてあったりする

0981名無しさん＠ピンキー (ｼｬﾁｰｸ 0C33-Z10f)

2026/02/12(木) 16:09:09.19ID:GeqxohjDC

heretic 8bitならメモリ256GあればギリいけるかもってAIに言われたが実際やってるニキいる？
あ、step3.5でね

0982名無しさん＠ピンキー (ﾜｯﾁｮｲ 7e26-SV9b)

2026/02/12(木) 16:15:15.88ID:2lcEbppU0

Q8はパラメータ数≒GBだから方式とか関係なく200Bなら乗るやろ

0983名無しさん＠ピンキー (JP 0H0e-8x2G)

2026/02/12(木) 16:19:57.98ID:AsWM2HWiH

今ってQwen3-VL-235BとGLM4.6V以外に>100Bで日本語NSFWいけるVLMある？

0984名無しさん＠ピンキー (ﾜｯﾁｮｲ b2ec-lZWY)

2026/02/12(木) 16:54:46.72ID:q5Z4ATkX0

>>978
サンガツやで
これcontext長＝kvキャッシュなんやろか
事前に確保するとVRAM量が増えるからkvキャッシュと思ったんやが会話が長くしたいなら12GB(model)+4GB(KVcache)
数回のやりとりで良いなら15GB(model)+1GB(KVcache)なんかなと思ったけど考え方はあってるやろか

0985名無しさん＠ピンキー (ﾜｯﾁｮｲ 7e26-SV9b)

2026/02/12(木) 17:30:05.31ID:2lcEbppU0

あってる

0986名無しさん＠ピンキー (ﾜｯﾁｮｲ b2ec-lZWY)

2026/02/13(金) 01:56:00.63ID:1/JfPHUt0

>>985
サンガツ4GB増えた分だけエロもどれだけ変わるかわからんがまだmugnum v4の8GBやわ
今は良いのが出てるかも知れんけどスレでnsfwで検索しても0件でワイむせび泣く

0987名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sdd2-v0/K)

2026/02/13(金) 02:04:29.65ID:xDrc197od

エロに何を求めるかで話が全く違ってくるからな

セックスシーンさえあればいいならQwen235bとかの中華モデルでも脱獄すれば余裕で出るが
エロシーンの描写に厚みを持たせたいならGrokみたいな既知外学習したモデルを使うかプロンプトで補充するしかない

古臭い24B以下のモデルに固執するのは画像生成でSD1.5に固執するのと同じでスレ民の共感は得られないだろう

0988名無しさん＠ピンキー (ﾜｯﾁｮｲ b2ec-lZWY)

2026/02/13(金) 02:12:50.11ID:1/JfPHUt0

>>987
いや、古いのに固執してなくて浦島なのでモデル何か無いかなと
nsfwで検索したら0件だったが本文じゃなくて名前欄で検索してたわ
と言うことで出てきたaratakoなどやってみるわ

0989名無しさん＠ピンキー (ｽｯﾌﾟﾌﾟ Sdd2-v0/K)

2026/02/13(金) 02:24:48.98ID:xDrc197od

>>988
よっぽどのモノ好きしかLLMの日本語エロチューンなんかやらんからな
実質aratakoニキだけやないか

ワイはGrokがプンルーで無料Alphaやってた時にあらゆるエロシーンを100本以上抜いとるから
そのうち脱獄中華モデルでチャンク化してRAGに放り込むつもりや

新着レスの表示

レスを投稿する

レス数が950を超えています。1000を超えると書き込みができなくなります。