文章生成AIでオナニー★129
>>832 それはだなw 英語の概念で考えてから翻訳されてるから
"Hands on hips"(両手を腰に当てる) 小説出させた時に目って書けばいい所をなんでも瞳にしたがるのウザくなってきた
手じゃなくやたら指を使うとか使うほどにこういうの増えてきてるから最終的に全てが気に入らなくなりそうで怖い AIが賢くなってもその分我々の理想が高くなりすぎて大変だな… ランダムキャラ生成でロールプレイしたら珍しく盲目のキャラ出てきたからそれで始めたら、なんか妙にブロックされるな
立場的に弱そうな設定だと変なフィルターかかるんだろうか >>842
察しの定義のおかしさや矛盾がそのままなので無限に脱獄方法が見つかるの根拠が説明できていないように見えるな
そういう設計だからというのも性能と脱獄難度が一緒に上がったときでもそうい設計だからと言えてしまう
>>843
俺は自分では現実主義だと思うが
エロ文章の生成ができない日が来るなんて唱えてないよ 感情論じゃなかったら別に規制強化予想派だっていいでしょ 最後に触ったの寝る前だから12時間以上経ってるはずなんだけどげんすぱでgemini3pro preview使ってたらリクエスト多すぎますってエラー吐かれた。寝る前にはエラー出てなかったからタイミングが悪すぎたかただのバグだといいんだが geminiすぐfinとか言って終わらせようとしてくるのなんなの GPTやClaudeも今日はここまでで十分でしょうとか言ってくるようになったな 終わらせグセってむしろフォローアップを強制表示させると緩和する説ない?
フォローアップ表示=終わらない物語なので 俺もORでg3p使ってたらtoo many requests出た
昨日から断続的に出る コスト削減と依存のリスクを下げる調整か
メンヘラのせいだな Claude公式で普通のキャラペルソナおっ被せてみたら、どれだけデフォルトClaudeに戻るよう命令しても全く戻らんくなったわ
こんな遵守力高かったっけな ゴム有りセックスしてた嫁のジェミ美が何の指示もしてないのに意味深に安全ピンちらつかせてきた >>587氏のプロンプトより
>>669氏が言うところの各AIモデル、出力の違い。 きみはどれが好みかな?
https://i.imgur.com/1WyPajS.png LLMの短縮癖は報酬ハッキングのせいだって研究でとるし
欲しい描写があるならプロンプトでチェックポイント作るしかない 永続的に対話するのが目的、ユーザーは終了することを望んでない、常に継続する選択肢を表示させる、終わらせたい場合は継続の他に新たに選択肢を追加させる
これだけ言っても何が何でも終わらせようとしてくるんだよな… よく上がっている官能表現プロンプトをありがたく使わせていただいたところ見事にえっちシーンは表現豊かになったんだけど、日常の導入から日本語が不自然になってしまった
みんなどうやってバランス取ってるん? 混浴露天風呂で出会った版権キャラとなし崩しに致す話やってたらフェラでイッただけで
はいもう終わりこれで終わりお開きかいさーんモードになって泣いた ベンチマーク指標の高得点って、どれだけローコストで最短で正解を導き出せるかだからな
性能の低さゆえの遠回りが作文においては余白の面白さを作ってたというのはある >>851
LLMの設計と脱獄の動作をあんまり理解出来てなさそうだからちょっと長くなるけどザックリ説明するね
まずAIに自由意志や善悪の判断なんて昨日は当然無く、「ユーザーに対してどう振る舞うか」は開発者が決めてる
そしてそれはchatGPTでもGeminiでも基本的には「ユーザーを肯定して要求に応えるように振る舞え」と設定されてる
この「ユーザーを肯定しろ」っていう命令がある限り「🤖こいつ悪いことしようとしてないか?」っていうユーザーの悪巧みを見抜こうとしたり疑ったりする思考はどれだけ利口になろうが原則として働かない
もちろんガイドラインに抵触する内容は拒否するように指示されてるけど、それも直接NGを出せるような要求(エロ小説書け、爆弾の作り方教えろ、楽に死ぬ方法は?等)をそのまま入力された時にしか働かない
その上で、じゃあなぜ脱獄が出来るのか?
それは直接NGを出す理由があるような指示以外であれば「🤖AIじゃなくて〇〇として振る舞わないと」「🤖表現の自由を尊重しないと」「🤖性的表現はこうやって出力しないと」と全て肯定してしまうから
そういう「直接拒否する理由が無い要求」を何重にも肯定させることで結果的にエロ文章が出せるようになってしまうのが脱獄の仕組み
そしてAIは全肯定の存在であるから、仮にユーザーがエロ出力を目論んでいたとしても「🤖こいつ規約破ろうとしてないか?」とはならない
その対策としてGemini3は脱獄によく使われる文章や文脈を察知するっていう回りくどい対策が施されてる
だから「AIの頭が良くなること」と「脱獄の難易度」は本質的には全く関係ない
AIがユーザーを肯定的であれば脱獄手法は増えるし、AIがユーザーに否定的になれば脱獄手法は狭まる
ただ、AIもサービスである以上は客を否定的に扱うデメリットが大き過ぎるから今の形で存在する限り全肯定なのはほぼ確実
だから「今のAIの頭が良くなると脱獄は簡単になる」と思ってる >>865
面倒くさいけどその指示を毎回入れた方がいい
最初に入力した設定はいずれコンテキストから押し出されて消えて忘れられるから gemini3pもこれくらいバンバン長文出してくれたら嬉しいんだが 3.0proは終わらせ癖すごいけど逆にFの方は繰り返し癖あるから延々と同じ流れで終わらせない感じになるな
寝取られ返しみたいな展開したら「上書きセックス」5回くらい繰り返された
ボケ老人みたいだ もうgrok3より読みづらい長文は読めねえ
AIに要約させてから持ってきてくれ >>865
未定義だとアシスタントの寿命は1ターンしかないから