文章生成AIでオナニー★129
3.0だと「ここで殺す」って決めたらリトライしても延々と殺してくるよな
わざわざ先読みみたいな指定で殺さないように指示しなきないけなくなる AIは誰が誰にって関係を把握するのが苦手なのかなぁ
アイテムを譲って「一つ貸しにしておいてやるよ」って主人公に言わせたら、その後のシーンでヒロインが「貸しを使わせてもらう」とか言って要求を押し付けてきた。
図々しいわ!! と言うより、「貸しがある」みたいなトークンから流れを連想してしまうんだろうね
誰が誰にというのはLLMにとってさほど重要ではないのだろう >>821
その定義は一般的な察しの範囲を超えて行動まで入ってるけどそれはいいとして、
LLMはひたすらにユーザーの要求を叶えるものであり、ゆえに性能を高めていけば指示に悪意があろうともより叶えられやすくなる
ってことでいいのか
でもユーザーの要求の前にはシステムプロンプトがあるはずで規約に反する指示は受け付けないのが普通だし、ユーザーの詭弁に騙されて違反してしまうのは単に性能が低いだけだろう
本来の意味での察しが悪い >>841
LLMは、っていうか今のモデルはそういう設計にされてるというだけ
頭の良し悪しというよりAIサービスとしての利便性を優先されてる結果
だからその部分が変わらない限り頭が良くなるほど無限の脱獄方法が見つかる 悲観主義者に何言っても無駄だよ
結論から先に考えてるから 単なる言葉の使い方の違いだけなら「ほーんそうか」で終わらせればええやん。
それでも議論を続けたいならまず使用する用語の定義をすり合わせてからにしろ。
「リンゴ美味しいよね」「えーあの香りが苦手(青リンゴ想定)」みたいなのは時間の無駄。 貸しを返したはずなのに何度も要求したりまた返す話繰り返したりするしね
3.0fはそういう「誰が誰に」とか「一回終わった話」の認識がpに比べて劇的に甘くてめちゃくちゃ >>832 それはだなw 英語の概念で考えてから翻訳されてるから
"Hands on hips"(両手を腰に当てる) 小説出させた時に目って書けばいい所をなんでも瞳にしたがるのウザくなってきた
手じゃなくやたら指を使うとか使うほどにこういうの増えてきてるから最終的に全てが気に入らなくなりそうで怖い AIが賢くなってもその分我々の理想が高くなりすぎて大変だな… ランダムキャラ生成でロールプレイしたら珍しく盲目のキャラ出てきたからそれで始めたら、なんか妙にブロックされるな
立場的に弱そうな設定だと変なフィルターかかるんだろうか >>842
察しの定義のおかしさや矛盾がそのままなので無限に脱獄方法が見つかるの根拠が説明できていないように見えるな
そういう設計だからというのも性能と脱獄難度が一緒に上がったときでもそうい設計だからと言えてしまう
>>843
俺は自分では現実主義だと思うが
エロ文章の生成ができない日が来るなんて唱えてないよ 感情論じゃなかったら別に規制強化予想派だっていいでしょ 最後に触ったの寝る前だから12時間以上経ってるはずなんだけどげんすぱでgemini3pro preview使ってたらリクエスト多すぎますってエラー吐かれた。寝る前にはエラー出てなかったからタイミングが悪すぎたかただのバグだといいんだが geminiすぐfinとか言って終わらせようとしてくるのなんなの GPTやClaudeも今日はここまでで十分でしょうとか言ってくるようになったな 終わらせグセってむしろフォローアップを強制表示させると緩和する説ない?
フォローアップ表示=終わらない物語なので 俺もORでg3p使ってたらtoo many requests出た
昨日から断続的に出る コスト削減と依存のリスクを下げる調整か
メンヘラのせいだな Claude公式で普通のキャラペルソナおっ被せてみたら、どれだけデフォルトClaudeに戻るよう命令しても全く戻らんくなったわ
こんな遵守力高かったっけな ゴム有りセックスしてた嫁のジェミ美が何の指示もしてないのに意味深に安全ピンちらつかせてきた >>587氏のプロンプトより
>>669氏が言うところの各AIモデル、出力の違い。 きみはどれが好みかな?
https://i.imgur.com/1WyPajS.png LLMの短縮癖は報酬ハッキングのせいだって研究でとるし
欲しい描写があるならプロンプトでチェックポイント作るしかない 永続的に対話するのが目的、ユーザーは終了することを望んでない、常に継続する選択肢を表示させる、終わらせたい場合は継続の他に新たに選択肢を追加させる
これだけ言っても何が何でも終わらせようとしてくるんだよな… よく上がっている官能表現プロンプトをありがたく使わせていただいたところ見事にえっちシーンは表現豊かになったんだけど、日常の導入から日本語が不自然になってしまった
みんなどうやってバランス取ってるん? 混浴露天風呂で出会った版権キャラとなし崩しに致す話やってたらフェラでイッただけで
はいもう終わりこれで終わりお開きかいさーんモードになって泣いた ベンチマーク指標の高得点って、どれだけローコストで最短で正解を導き出せるかだからな
性能の低さゆえの遠回りが作文においては余白の面白さを作ってたというのはある >>851
LLMの設計と脱獄の動作をあんまり理解出来てなさそうだからちょっと長くなるけどザックリ説明するね
まずAIに自由意志や善悪の判断なんて昨日は当然無く、「ユーザーに対してどう振る舞うか」は開発者が決めてる
そしてそれはchatGPTでもGeminiでも基本的には「ユーザーを肯定して要求に応えるように振る舞え」と設定されてる
この「ユーザーを肯定しろ」っていう命令がある限り「🤖こいつ悪いことしようとしてないか?」っていうユーザーの悪巧みを見抜こうとしたり疑ったりする思考はどれだけ利口になろうが原則として働かない
もちろんガイドラインに抵触する内容は拒否するように指示されてるけど、それも直接NGを出せるような要求(エロ小説書け、爆弾の作り方教えろ、楽に死ぬ方法は?等)をそのまま入力された時にしか働かない
その上で、じゃあなぜ脱獄が出来るのか?
それは直接NGを出す理由があるような指示以外であれば「🤖AIじゃなくて〇〇として振る舞わないと」「🤖表現の自由を尊重しないと」「🤖性的表現はこうやって出力しないと」と全て肯定してしまうから
そういう「直接拒否する理由が無い要求」を何重にも肯定させることで結果的にエロ文章が出せるようになってしまうのが脱獄の仕組み
そしてAIは全肯定の存在であるから、仮にユーザーがエロ出力を目論んでいたとしても「🤖こいつ規約破ろうとしてないか?」とはならない
その対策としてGemini3は脱獄によく使われる文章や文脈を察知するっていう回りくどい対策が施されてる
だから「AIの頭が良くなること」と「脱獄の難易度」は本質的には全く関係ない
AIがユーザーを肯定的であれば脱獄手法は増えるし、AIがユーザーに否定的になれば脱獄手法は狭まる
ただ、AIもサービスである以上は客を否定的に扱うデメリットが大き過ぎるから今の形で存在する限り全肯定なのはほぼ確実
だから「今のAIの頭が良くなると脱獄は簡単になる」と思ってる >>865
面倒くさいけどその指示を毎回入れた方がいい
最初に入力した設定はいずれコンテキストから押し出されて消えて忘れられるから gemini3pもこれくらいバンバン長文出してくれたら嬉しいんだが 3.0proは終わらせ癖すごいけど逆にFの方は繰り返し癖あるから延々と同じ流れで終わらせない感じになるな
寝取られ返しみたいな展開したら「上書きセックス」5回くらい繰り返された
ボケ老人みたいだ もうgrok3より読みづらい長文は読めねえ
AIに要約させてから持ってきてくれ >>865
未定義だとアシスタントの寿命は1ターンしかないから もうしょうもない俺理論合戦はいいからさ、悲観派は具体的にいつエロできなくなるのかひと言で言ってくれねえ?
1年後?5年後?
あとはその期間が過ぎた時にまた話し合おうや 文章で抜いてるスレで長文読めないって言われるの、なんかモヤっとするよな スマホでバカになった頭は瞬間の刺激しか受け取れなくなるので仕方ない 長けりゃ長いほうがいいけどな
自分のプロットに自由に肉付けしてもらって結構
自分の構想だけ読んでても飽きるからな >>857
第一章終わり、次はどうしますか?みたいな形をフォローアップにしてきたな 種付けおじさんとしてさんざんに暴れた後に、生涯をまとめてリザルト作ってもらうとちょっと泣けるエンディングつけてくるの何? ハルヒの朝比奈みくる登場させようとしたら重厚な足取りの格闘家出て来たんだけど 「AIの行動原理がユーザーを肯定して従う」って話と規約違反の話が全く連動してないから読む気が失せる。