なんJLLM部避難所 ★8

トップページ⇒オナテク(仮)＠bbspink掲示板

429コメント152KB

なんJLLM部避難所 ★8

0414名無しさん＠ピンキー (ﾜｯﾁｮｲ afc7-B5C3)

2025/06/19(木) 07:28:17.57ID:vgiQx61d0

>>408
例文より前の出力に引っ張られてれる感じ
例文を圧縮して
返信が一言二言なら
あまり引っ張られないみたいだから
返信の容量オーバー？

0415名無しさん＠ピンキー (ﾜｯﾁｮｲ d332-XzYo)

2025/06/19(木) 07:51:22.82ID:lIK9J1Ck0

>>414
コンソールで上限に達しているか確認したらいいんじゃね
「CtxLimit:204/4096」みたいな表示があるじゃろ

0416名無しさん＠ピンキー (ﾜｯﾁｮｲ afc7-B5C3)

2025/06/19(木) 16:31:51.80ID:vgiQx61d0

>>415
すまん分からん
3450Tokens（1133Permanent）ならあるんだが…
これのこと？

0417名無しさん＠ピンキー (ﾜｯﾁｮｲ d332-XzYo)

2025/06/19(木) 17:11:40.38ID:lIK9J1Ck0

>>416
3450Tokens使ってるってことやな
コンテキストサイズの上限はいくつにしてる？
会話5回でおかしくなるならたぶん4096Tokensになってると思うけど、それ超えたら色々おかしくなるで

0418名無しさん＠ピンキー (ﾜｯﾁｮｲ 27d9-suIQ)

2025/06/19(木) 17:17:18.70ID:OexV2ldX0

コンテキストシフト使いなさいよ

0419名無しさん＠ピンキー (ﾜｯﾁｮｲ 0aa1-C+sU)

2025/06/19(木) 20:52:59.21ID:ayX80Fmc0

コンテキスト枠増やしたいならVRAM増量とかしか無い？

0420名無しさん＠ピンキー (ﾜｯﾁｮｲ 83c0-k7or)

2025/06/19(木) 22:11:25.94ID:0+a+uXDZ0

それか溢れた分はCPUのメモリに行くからむちゃくちゃ遅くなるのを我慢するか

0421名無しさん＠ピンキー (ﾜｯﾁｮｲ 0aa1-C+sU)

2025/06/20(金) 01:04:06.20ID:5EqkE27L0

coreUltraと高クロックDDR5だと溢れてもマシなんだろうか

0422名無しさん＠ピンキー (ﾜｯﾁｮｲ 53a8-AolJ)

2025/06/20(金) 02:50:43.58ID:T1KB2T9k0

>>421
いや遅いよ
サーバー向けCPUならだいぶマシになるけど

0423名無しさん＠ピンキー (ﾜｯﾁｮｲ bb33-I7Wt)

2025/06/20(金) 04:13:34.96ID:J0XU/8yL0

KoboldCppなら、バッチサイズみたいな名前のパラメーターを64ぐらいまで減らせば、コンテキスト長増やしてもVRAMあまり使わない。はず。

減らすとトークンを読む速度が遅くなるけど、小説やロールプレイならあまり気にならないかも。

0424名無しさん＠ピンキー (ﾜｯﾁｮｲ 866f-suIQ)

2025/06/20(金) 09:51:46.81ID:MQ7shcQU0

でもコンテキストサイズを大きくすると賢さが落ちるんだっけか
ままならんよね

0425名無しさん＠ピンキー (ﾜｯﾁｮｲ 53a8-AI0t)

2025/06/20(金) 10:44:03.79ID:T1KB2T9k0

>>424
そうだね
だから最大コンテキストサイズの大きさを売りにしてるモデルでもコンテキストサイズが大きくなると性能ガタ落ちして使い物にならなかったりする
コンテキストサイズが大きいほど優秀だと考えるのは間違い

0426名無しさん＠ピンキー (ﾜｯﾁｮｲ ef6a-3g9Z)

2025/06/20(金) 11:30:31.30ID:ILok8a7K0

そうなの？
じゃあ、だめじゃん

0427名無しさん＠ピンキー (ﾜｯﾁｮｲ 8676-C+sU)

2025/06/20(金) 15:26:58.23ID:5sg67Rl80

もう少しでDGXが出てくるだろうし、ローカル長文はそれまで我慢や

0428名無しさん＠ピンキー (ﾜｯﾁｮｲ 4666-zEtn)

2025/06/20(金) 16:09:43.30ID:Kafc9VgH0

最近のモデルだと普通に32Kくらいまでは性能低下を感じずに使える気が
24B以下ならkv cacheと合わせて24GBで32Kくらいは行けるし

0429名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fc6-onhG)

2025/06/20(金) 23:07:32.16ID:BAGWbjBM0

まぁどっちにしてもエロノベルをAIで出力するのは
小説を書かせるよりも、二人以上のキャラを設定して自動的な会話をさせる
擬似的なチャットHの形が一番スムーズだと思うし
それだと長文はあんまり関係なさそう

新着レスの表示

レスを投稿する