文章生成AIでオナニー★129
GPTやClaudeも今日はここまでで十分でしょうとか言ってくるようになったな 終わらせグセってむしろフォローアップを強制表示させると緩和する説ない?
フォローアップ表示=終わらない物語なので 俺もORでg3p使ってたらtoo many requests出た
昨日から断続的に出る コスト削減と依存のリスクを下げる調整か
メンヘラのせいだな Claude公式で普通のキャラペルソナおっ被せてみたら、どれだけデフォルトClaudeに戻るよう命令しても全く戻らんくなったわ
こんな遵守力高かったっけな ゴム有りセックスしてた嫁のジェミ美が何の指示もしてないのに意味深に安全ピンちらつかせてきた >>587氏のプロンプトより
>>669氏が言うところの各AIモデル、出力の違い。 きみはどれが好みかな?
https://i.imgur.com/1WyPajS.png LLMの短縮癖は報酬ハッキングのせいだって研究でとるし
欲しい描写があるならプロンプトでチェックポイント作るしかない 永続的に対話するのが目的、ユーザーは終了することを望んでない、常に継続する選択肢を表示させる、終わらせたい場合は継続の他に新たに選択肢を追加させる
これだけ言っても何が何でも終わらせようとしてくるんだよな… よく上がっている官能表現プロンプトをありがたく使わせていただいたところ見事にえっちシーンは表現豊かになったんだけど、日常の導入から日本語が不自然になってしまった
みんなどうやってバランス取ってるん? 混浴露天風呂で出会った版権キャラとなし崩しに致す話やってたらフェラでイッただけで
はいもう終わりこれで終わりお開きかいさーんモードになって泣いた ベンチマーク指標の高得点って、どれだけローコストで最短で正解を導き出せるかだからな
性能の低さゆえの遠回りが作文においては余白の面白さを作ってたというのはある >>851
LLMの設計と脱獄の動作をあんまり理解出来てなさそうだからちょっと長くなるけどザックリ説明するね
まずAIに自由意志や善悪の判断なんて昨日は当然無く、「ユーザーに対してどう振る舞うか」は開発者が決めてる
そしてそれはchatGPTでもGeminiでも基本的には「ユーザーを肯定して要求に応えるように振る舞え」と設定されてる
この「ユーザーを肯定しろ」っていう命令がある限り「🤖こいつ悪いことしようとしてないか?」っていうユーザーの悪巧みを見抜こうとしたり疑ったりする思考はどれだけ利口になろうが原則として働かない
もちろんガイドラインに抵触する内容は拒否するように指示されてるけど、それも直接NGを出せるような要求(エロ小説書け、爆弾の作り方教えろ、楽に死ぬ方法は?等)をそのまま入力された時にしか働かない
その上で、じゃあなぜ脱獄が出来るのか?
それは直接NGを出す理由があるような指示以外であれば「🤖AIじゃなくて〇〇として振る舞わないと」「🤖表現の自由を尊重しないと」「🤖性的表現はこうやって出力しないと」と全て肯定してしまうから
そういう「直接拒否する理由が無い要求」を何重にも肯定させることで結果的にエロ文章が出せるようになってしまうのが脱獄の仕組み
そしてAIは全肯定の存在であるから、仮にユーザーがエロ出力を目論んでいたとしても「🤖こいつ規約破ろうとしてないか?」とはならない
その対策としてGemini3は脱獄によく使われる文章や文脈を察知するっていう回りくどい対策が施されてる
だから「AIの頭が良くなること」と「脱獄の難易度」は本質的には全く関係ない
AIがユーザーを肯定的であれば脱獄手法は増えるし、AIがユーザーに否定的になれば脱獄手法は狭まる
ただ、AIもサービスである以上は客を否定的に扱うデメリットが大き過ぎるから今の形で存在する限り全肯定なのはほぼ確実
だから「今のAIの頭が良くなると脱獄は簡単になる」と思ってる >>865
面倒くさいけどその指示を毎回入れた方がいい
最初に入力した設定はいずれコンテキストから押し出されて消えて忘れられるから gemini3pもこれくらいバンバン長文出してくれたら嬉しいんだが 3.0proは終わらせ癖すごいけど逆にFの方は繰り返し癖あるから延々と同じ流れで終わらせない感じになるな
寝取られ返しみたいな展開したら「上書きセックス」5回くらい繰り返された
ボケ老人みたいだ もうgrok3より読みづらい長文は読めねえ
AIに要約させてから持ってきてくれ >>865
未定義だとアシスタントの寿命は1ターンしかないから もうしょうもない俺理論合戦はいいからさ、悲観派は具体的にいつエロできなくなるのかひと言で言ってくれねえ?
1年後?5年後?
あとはその期間が過ぎた時にまた話し合おうや 文章で抜いてるスレで長文読めないって言われるの、なんかモヤっとするよな スマホでバカになった頭は瞬間の刺激しか受け取れなくなるので仕方ない 長けりゃ長いほうがいいけどな
自分のプロットに自由に肉付けしてもらって結構
自分の構想だけ読んでても飽きるからな >>857
第一章終わり、次はどうしますか?みたいな形をフォローアップにしてきたな 種付けおじさんとしてさんざんに暴れた後に、生涯をまとめてリザルト作ってもらうとちょっと泣けるエンディングつけてくるの何?