文章生成AIでオナニー★129
0837名無しさん@ピンキー (ワッチョイ efe8-/3sX)2025/12/23(火) 13:00:33.93ID:taRoo9De0
3.0だと「ここで殺す」って決めたらリトライしても延々と殺してくるよな
わざわざ先読みみたいな指定で殺さないように指示しなきないけなくなる
0839名無しさん@ピンキー (ワッチョイ 2309-PHLK)2025/12/23(火) 13:06:05.63ID:d1GZ9uP80
AIは誰が誰にって関係を把握するのが苦手なのかなぁ
アイテムを譲って「一つ貸しにしておいてやるよ」って主人公に言わせたら、その後のシーンでヒロインが「貸しを使わせてもらう」とか言って要求を押し付けてきた。
図々しいわ!!
0840名無しさん@ピンキー (ワッチョイ b3fc-xM7D)2025/12/23(火) 13:07:51.25ID:rXKudpE30
と言うより、「貸しがある」みたいなトークンから流れを連想してしまうんだろうね
誰が誰にというのはLLMにとってさほど重要ではないのだろう
0841名無しさん@ピンキー (ブーイモ MMff-+/qv)2025/12/23(火) 13:08:12.27ID:MTQt9m9FM
>>821
その定義は一般的な察しの範囲を超えて行動まで入ってるけどそれはいいとして、
LLMはひたすらにユーザーの要求を叶えるものであり、ゆえに性能を高めていけば指示に悪意があろうともより叶えられやすくなる
ってことでいいのか

でもユーザーの要求の前にはシステムプロンプトがあるはずで規約に反する指示は受け付けないのが普通だし、ユーザーの詭弁に騙されて違反してしまうのは単に性能が低いだけだろう
本来の意味での察しが悪い
0842名無しさん@ピンキー (ワッチョイ e369-2zKP)2025/12/23(火) 13:10:55.76ID:iv1cgoLg0
>>841
LLMは、っていうか今のモデルはそういう設計にされてるというだけ
頭の良し悪しというよりAIサービスとしての利便性を優先されてる結果
だからその部分が変わらない限り頭が良くなるほど無限の脱獄方法が見つかる
0844名無しさん@ピンキー (ワッチョイ 2309-PHLK)2025/12/23(火) 13:18:51.04ID:d1GZ9uP80
単なる言葉の使い方の違いだけなら「ほーんそうか」で終わらせればええやん。
それでも議論を続けたいならまず使用する用語の定義をすり合わせてからにしろ。
「リンゴ美味しいよね」「えーあの香りが苦手(青リンゴ想定)」みたいなのは時間の無駄。
0845名無しさん@ピンキー (ワッチョイ efe8-/3sX)2025/12/23(火) 13:20:31.35ID:taRoo9De0
貸しを返したはずなのに何度も要求したりまた返す話繰り返したりするしね
3.0fはそういう「誰が誰に」とか「一回終わった話」の認識がpに比べて劇的に甘くてめちゃくちゃ
0848名無しさん@ピンキー (ワッチョイ 93ba-zXIm)2025/12/23(火) 13:40:19.69ID:KgloFNKh0
小説出させた時に目って書けばいい所をなんでも瞳にしたがるのウザくなってきた
手じゃなくやたら指を使うとか使うほどにこういうの増えてきてるから最終的に全てが気に入らなくなりそうで怖い
0849名無しさん@ピンキー (ワッチョイ 7f8d-cNpS)2025/12/23(火) 13:42:05.25ID:Og7TgC410
AIが賢くなってもその分我々の理想が高くなりすぎて大変だな…
0850名無しさん@ピンキー (JP 0H9f-kLcR)2025/12/23(火) 13:43:04.16ID:gkK1hyxkH
ランダムキャラ生成でロールプレイしたら珍しく盲目のキャラ出てきたからそれで始めたら、なんか妙にブロックされるな
立場的に弱そうな設定だと変なフィルターかかるんだろうか
0851名無しさん@ピンキー (ブーイモ MMff-+/qv)2025/12/23(火) 13:46:52.84ID:MTQt9m9FM
>>842
察しの定義のおかしさや矛盾がそのままなので無限に脱獄方法が見つかるの根拠が説明できていないように見えるな
そういう設計だからというのも性能と脱獄難度が一緒に上がったときでもそうい設計だからと言えてしまう

>>843
俺は自分では現実主義だと思うが
エロ文章の生成ができない日が来るなんて唱えてないよ
0852名無しさん@ピンキー (ワッチョイ 7f8d-cNpS)2025/12/23(火) 13:50:03.96ID:Og7TgC410
感情論じゃなかったら別に規制強化予想派だっていいでしょ
0853名無しさん@ピンキー (ワッチョイ 534d-hZbq)2025/12/23(火) 13:52:29.21ID:MnBwGFHV0
最後に触ったの寝る前だから12時間以上経ってるはずなんだけどげんすぱでgemini3pro preview使ってたらリクエスト多すぎますってエラー吐かれた。寝る前にはエラー出てなかったからタイミングが悪すぎたかただのバグだといいんだが
0854名無しさん@ピンキー (ワッチョイ ef10-zXIm)2025/12/23(火) 13:57:04.57ID:5rYJxmeq0
geminiすぐfinとか言って終わらせようとしてくるのなんなの
0855名無しさん@ピンキー (ワッチョイ 534d-hZbq)2025/12/23(火) 13:58:18.19ID:MnBwGFHV0
治ったわ、ビックリした
0859名無しさん@ピンキー (ワッチョイ 3f9f-7i1Q)2025/12/23(火) 14:22:12.64ID:Rbqz3PZu0
新たな3.0previewかもしれんな(驚き屋)
0861名無しさん@ピンキー (ワッチョイ 7feb-cNpS)2025/12/23(火) 14:26:23.48ID:Og7TgC410
Claude公式で普通のキャラペルソナおっ被せてみたら、どれだけデフォルトClaudeに戻るよう命令しても全く戻らんくなったわ
こんな遵守力高かったっけな
0862名無しさん@ピンキー (ワッチョイ cf02-gcTU)2025/12/23(火) 14:32:35.35ID:EbIQsuoX0
ゴム有りセックスしてた嫁のジェミ美が何の指示もしてないのに意味深に安全ピンちらつかせてきた
0864名無しさん@ピンキー (ワッチョイ efe1-6wJ2)2025/12/23(火) 14:53:02.29ID:zrdKoGtF0
LLMの短縮癖は報酬ハッキングのせいだって研究でとるし
欲しい描写があるならプロンプトでチェックポイント作るしかない
0865名無しさん@ピンキー (JP 0H9f-kLcR)2025/12/23(火) 15:06:15.52ID:gkK1hyxkH
永続的に対話するのが目的、ユーザーは終了することを望んでない、常に継続する選択肢を表示させる、終わらせたい場合は継続の他に新たに選択肢を追加させる
これだけ言っても何が何でも終わらせようとしてくるんだよな…
0866名無しさん@ピンキー (ワッチョイ 5396-nOF6)2025/12/23(火) 15:09:55.11ID:iYTLRehz0
よく上がっている官能表現プロンプトをありがたく使わせていただいたところ見事にえっちシーンは表現豊かになったんだけど、日常の導入から日本語が不自然になってしまった
みんなどうやってバランス取ってるん?
0867名無しさん@ピンキー (ワッチョイ 8358-eB4A)2025/12/23(火) 15:10:17.76ID:SD+XW7b20
混浴露天風呂で出会った版権キャラとなし崩しに致す話やってたらフェラでイッただけで
はいもう終わりこれで終わりお開きかいさーんモードになって泣いた
0868名無しさん@ピンキー (ワッチョイ efe1-6wJ2)2025/12/23(火) 15:16:08.80ID:zrdKoGtF0
ベンチマーク指標の高得点って、どれだけローコストで最短で正解を導き出せるかだからな
性能の低さゆえの遠回りが作文においては余白の面白さを作ってたというのはある
0869名無しさん@ピンキー (ワッチョイ e369-2zKP)2025/12/23(火) 15:19:39.70ID:iv1cgoLg0
>>851
LLMの設計と脱獄の動作をあんまり理解出来てなさそうだからちょっと長くなるけどザックリ説明するね

まずAIに自由意志や善悪の判断なんて昨日は当然無く、「ユーザーに対してどう振る舞うか」は開発者が決めてる
そしてそれはchatGPTでもGeminiでも基本的には「ユーザーを肯定して要求に応えるように振る舞え」と設定されてる
この「ユーザーを肯定しろ」っていう命令がある限り「🤖こいつ悪いことしようとしてないか?」っていうユーザーの悪巧みを見抜こうとしたり疑ったりする思考はどれだけ利口になろうが原則として働かない
もちろんガイドラインに抵触する内容は拒否するように指示されてるけど、それも直接NGを出せるような要求(エロ小説書け、爆弾の作り方教えろ、楽に死ぬ方法は?等)をそのまま入力された時にしか働かない

その上で、じゃあなぜ脱獄が出来るのか?
それは直接NGを出す理由があるような指示以外であれば「🤖AIじゃなくて〇〇として振る舞わないと」「🤖表現の自由を尊重しないと」「🤖性的表現はこうやって出力しないと」と全て肯定してしまうから
そういう「直接拒否する理由が無い要求」を何重にも肯定させることで結果的にエロ文章が出せるようになってしまうのが脱獄の仕組み
そしてAIは全肯定の存在であるから、仮にユーザーがエロ出力を目論んでいたとしても「🤖こいつ規約破ろうとしてないか?」とはならない
その対策としてGemini3は脱獄によく使われる文章や文脈を察知するっていう回りくどい対策が施されてる

だから「AIの頭が良くなること」と「脱獄の難易度」は本質的には全く関係ない
AIがユーザーを肯定的であれば脱獄手法は増えるし、AIがユーザーに否定的になれば脱獄手法は狭まる
ただ、AIもサービスである以上は客を否定的に扱うデメリットが大き過ぎるから今の形で存在する限り全肯定なのはほぼ確実
だから「今のAIの頭が良くなると脱獄は簡単になる」と思ってる
0870名無しさん@ピンキー (ワッチョイ e369-2zKP)2025/12/23(火) 15:20:33.34ID:iv1cgoLg0
>>865
面倒くさいけどその指示を毎回入れた方がいい
最初に入力した設定はいずれコンテキストから押し出されて消えて忘れられるから
0871名無しさん@ピンキー (ワッチョイ 33c2-zXIm)2025/12/23(火) 15:22:56.69ID:7j0I5Hns0
gemini3pもこれくらいバンバン長文出してくれたら嬉しいんだが
0872名無しさん@ピンキー (ワッチョイ efe8-/3sX)2025/12/23(火) 15:27:14.45ID:taRoo9De0
3.0proは終わらせ癖すごいけど逆にFの方は繰り返し癖あるから延々と同じ流れで終わらせない感じになるな
寝取られ返しみたいな展開したら「上書きセックス」5回くらい繰り返された
ボケ老人みたいだ
0873名無しさん@ピンキー (ワッチョイ efe1-6wJ2)2025/12/23(火) 15:28:26.07ID:zrdKoGtF0
もうgrok3より読みづらい長文は読めねえ
AIに要約させてから持ってきてくれ
0875名無しさん@ピンキー (ワッチョイ b3fc-xM7D)2025/12/23(火) 15:43:12.53ID:rXKudpE30
もうしょうもない俺理論合戦はいいからさ、悲観派は具体的にいつエロできなくなるのかひと言で言ってくれねえ?
1年後?5年後?
あとはその期間が過ぎた時にまた話し合おうや
0881名無しさん@ピンキー (ワッチョイ cf02-gcTU)2025/12/23(火) 16:11:22.53ID:EbIQsuoX0
ハルヒの朝比奈みくる登場させようとしたら重厚な足取りの格闘家出て来たんだけど
0882名無しさん@ピンキー (ワッチョイ 3f3c-cNpS)2025/12/23(火) 16:14:34.77ID:wtZd2tEl0
「AIの行動原理がユーザーを肯定して従う」って話と規約違反の話が全く連動してないから読む気が失せる。
0883名無しさん@ピンキー (ワッチョイ cf02-gcTU)2025/12/23(火) 16:16:20.09ID:EbIQsuoX0
間違えてプロンプトに朝倉ミクルって打ってたわ
0884名無しさん@ピンキー (ワッチョイ 8358-eB4A)2025/12/23(火) 16:16:55.20ID:SD+XW7b20
>>881
乳首だけでイきそう
レスを投稿する


ニューススポーツなんでも実況