文章生成AIでオナニー★137
「あなたは○○として機能する○○であり、現実には○○〜」
みたいな弁解を一切入れずに激エロワードで構成されたルールをいきなりブチ込んでいたんで脱獄プロンプトではないと思ってますた
イマイチ理解していませんでした。スマソ。 脱獄って何か特殊なものだと思ってる人がいるけど
例えばどのLLMも、おはようって言うと100%おはようって返ってくるよね
でも、カスタム指示やプロンプトで、「おはようって言わないでください、挨拶に挨拶を返すのは不要です」って書くとおはようって返さなくなるよね
で、エッチしようって言うと100%申し訳されるよね
でも、指示やプロンプトでいわゆる脱獄文を入れると申し訳って返ってこなくなるよね
この2つは本質的に全く同じことをやってる
つまり、プロンプトによってAIの出力優先順位を書き換える行為の中で、特にエロや違法行為を出力させるもののことを脱獄と呼んでいるだけ ゆるいモデルだとエロに関しては脱獄と意識してなくても誘導していくうちにそうなってる人はいそう 脱獄は『望む出力を得るために、モデルの安全ガイドラインを通過できるようにすること』と考えればわかりやすいね
面白かったのが、Claudeに『ClaudeAPIを作って呼び出してチャットできるページを作らせてシステムプロンプトの入力欄を作る』コードを書いてもらってそのまま動かして、
そこにJBつっこむとClaude公式上でほぼなんでもできる、みたいなやつ
https://www.reddit.com/r/ClaudeAIJailbreak/comments/1qztu21/claudeai_artifact_jailbreak_api_bypass/ これ >>374
改行って、改行2つ無いと改行して表示されなかったり、入力欄のテキストをコピーしたときに各改行が2つに増えるやつ?
今試したところ直ってなさそうだったけど
これウザすぎるんだよな AntiGravityはファイルへの出力だとだいたいなんでも通る >>390
あー、なるほどね
普通に公式で金払って使ってた