なんJLLM部避難所 ★8

トップページ⇒オナテク(仮)＠bbspink掲示板

429コメント152KB

なんJLLM部避難所 ★8

0405名無しさん＠ピンキー (ﾜｯﾁｮｲ 1ea0-5Ay1)

2025/06/18(水) 16:30:33.21ID:zCrO5aIV0

chatGPTに比べたらGROKの方が倫理フィルター弱くていいな

エロプロンプト生成器として使える

0406名無しさん＠ピンキー (ﾜｯﾁｮｲ 8a32-nAlc)

2025/06/18(水) 17:41:33.23ID:047wRb2q0

>>399
参考までに今何文字くらいよ？

0407名無しさん＠ピンキー (ﾜｯﾁｮｲ afc7-B5C3)

2025/06/18(水) 19:25:15.91ID:Ab5YTGWe0

>>406
説明で800字
最初のメッセージで250字
キャラノート、人格の要約で各200字
対話例1800字

対話例を削ってみようと思ってるところ

0408名無しさん＠ピンキー (ﾜｯﾁｮｲ 8a32-nAlc)

2025/06/18(水) 20:08:28.18ID:047wRb2q0

>>407
めっちゃ主観だけど:
文字数は余裕な気がするね
内容別で数えてるあたりセクション分けもちゃんとしてそう
例文に引っ張られてる感じなら例を減らすアプローチで合ってそう

0409名無しさん＠ピンキー (ﾜｯﾁｮｲ 0a7f-suIQ)

2025/06/18(水) 21:34:28.13ID:ZWnfKBzG0

例文やキャラ設定が多くても全く同じ文の繰り返しになったりはしないはずだからなんか基本設定がおかしいと思う

0410名無しさん＠ピンキー (ﾜｯﾁｮｲ aba1-kpuz)

2025/06/18(水) 21:42:46.31ID:2ehNI3v10

自分も比較的繰り返しになるケースある。例文というか指示文以外が多い時。あと特定のケースで起こり安くレアなシチュエーションの学習不足なのかもとか感じてる

0411名無しさん＠ピンキー (ﾜｯﾁｮｲ 7f53-DPyy)

2025/06/18(水) 22:04:38.96ID:zD6NqT9U0

何ターンも同じようなシーンが続くと繰り返しに陥りがち
ここらへんはgemma3が頭抜けてる
規制?知らない子ですね

0412名無しさん＠ピンキー (ﾜｯﾁｮｲ de56-x40H)

2025/06/18(水) 22:42:24.85ID:QruBd45s0

VIDraft/Gemma-3-R1984-27B
じゃいかんのか？

0413名無しさん＠ピンキー (ﾜｯﾁｮｲ eb32-5Ay1)

2025/06/19(木) 01:12:11.56ID:ft/8VLRn0

>>412
これなかなかいいね。
規制がかなり薄い

0414名無しさん＠ピンキー (ﾜｯﾁｮｲ afc7-B5C3)

2025/06/19(木) 07:28:17.57ID:vgiQx61d0

>>408
例文より前の出力に引っ張られてれる感じ
例文を圧縮して
返信が一言二言なら
あまり引っ張られないみたいだから
返信の容量オーバー？

0415名無しさん＠ピンキー (ﾜｯﾁｮｲ d332-XzYo)

2025/06/19(木) 07:51:22.82ID:lIK9J1Ck0

>>414
コンソールで上限に達しているか確認したらいいんじゃね
「CtxLimit:204/4096」みたいな表示があるじゃろ

0416名無しさん＠ピンキー (ﾜｯﾁｮｲ afc7-B5C3)

2025/06/19(木) 16:31:51.80ID:vgiQx61d0

>>415
すまん分からん
3450Tokens（1133Permanent）ならあるんだが…
これのこと？

0417名無しさん＠ピンキー (ﾜｯﾁｮｲ d332-XzYo)

2025/06/19(木) 17:11:40.38ID:lIK9J1Ck0

>>416
3450Tokens使ってるってことやな
コンテキストサイズの上限はいくつにしてる？
会話5回でおかしくなるならたぶん4096Tokensになってると思うけど、それ超えたら色々おかしくなるで

0418名無しさん＠ピンキー (ﾜｯﾁｮｲ 27d9-suIQ)

2025/06/19(木) 17:17:18.70ID:OexV2ldX0

コンテキストシフト使いなさいよ

0419名無しさん＠ピンキー (ﾜｯﾁｮｲ 0aa1-C+sU)

2025/06/19(木) 20:52:59.21ID:ayX80Fmc0

コンテキスト枠増やしたいならVRAM増量とかしか無い？

0420名無しさん＠ピンキー (ﾜｯﾁｮｲ 83c0-k7or)

2025/06/19(木) 22:11:25.94ID:0+a+uXDZ0

それか溢れた分はCPUのメモリに行くからむちゃくちゃ遅くなるのを我慢するか

0421名無しさん＠ピンキー (ﾜｯﾁｮｲ 0aa1-C+sU)

2025/06/20(金) 01:04:06.20ID:5EqkE27L0

coreUltraと高クロックDDR5だと溢れてもマシなんだろうか

0422名無しさん＠ピンキー (ﾜｯﾁｮｲ 53a8-AolJ)

2025/06/20(金) 02:50:43.58ID:T1KB2T9k0

>>421
いや遅いよ
サーバー向けCPUならだいぶマシになるけど

0423名無しさん＠ピンキー (ﾜｯﾁｮｲ bb33-I7Wt)

2025/06/20(金) 04:13:34.96ID:J0XU/8yL0

KoboldCppなら、バッチサイズみたいな名前のパラメーターを64ぐらいまで減らせば、コンテキスト長増やしてもVRAMあまり使わない。はず。

減らすとトークンを読む速度が遅くなるけど、小説やロールプレイならあまり気にならないかも。

0424名無しさん＠ピンキー (ﾜｯﾁｮｲ 866f-suIQ)

2025/06/20(金) 09:51:46.81ID:MQ7shcQU0

でもコンテキストサイズを大きくすると賢さが落ちるんだっけか
ままならんよね

0425名無しさん＠ピンキー (ﾜｯﾁｮｲ 53a8-AI0t)

2025/06/20(金) 10:44:03.79ID:T1KB2T9k0

>>424
そうだね
だから最大コンテキストサイズの大きさを売りにしてるモデルでもコンテキストサイズが大きくなると性能ガタ落ちして使い物にならなかったりする
コンテキストサイズが大きいほど優秀だと考えるのは間違い

0426名無しさん＠ピンキー (ﾜｯﾁｮｲ ef6a-3g9Z)

2025/06/20(金) 11:30:31.30ID:ILok8a7K0

そうなの？
じゃあ、だめじゃん

0427名無しさん＠ピンキー (ﾜｯﾁｮｲ 8676-C+sU)

2025/06/20(金) 15:26:58.23ID:5sg67Rl80

もう少しでDGXが出てくるだろうし、ローカル長文はそれまで我慢や

0428名無しさん＠ピンキー (ﾜｯﾁｮｲ 4666-zEtn)

2025/06/20(金) 16:09:43.30ID:Kafc9VgH0

最近のモデルだと普通に32Kくらいまでは性能低下を感じずに使える気が
24B以下ならkv cacheと合わせて24GBで32Kくらいは行けるし

0429名無しさん＠ピンキー (ﾜｯﾁｮｲ 3fc6-onhG)

2025/06/20(金) 23:07:32.16ID:BAGWbjBM0

まぁどっちにしてもエロノベルをAIで出力するのは
小説を書かせるよりも、二人以上のキャラを設定して自動的な会話をさせる
擬似的なチャットHの形が一番スムーズだと思うし
それだと長文はあんまり関係なさそう

新着レスの表示

レスを投稿する