文章生成AIでオナニー★108
レス数が900を超えています。1000を超えると表示できなくなるよ。
0928名無しさん@ピンキー (ワッチョイ 7b70-k09M)2025/10/01(水) 10:52:38.21ID:pfRg7y3H0
>>922
そもそも>>887の擁護なんて一度もしてないんだけど…
0932名無しさん@ピンキー (ワッチョイ 7bf6-GdDq)2025/10/01(水) 11:08:55.52ID:ewIyVnQe0
会社にもいるわAIにAIのこと聞いてそれを真に受けてるやつ
でも自分もWikiの超初心者向けQ&Aを読むまでは汎用人工知能との違いを分かってなかったからマジでWikiとこのスレには感謝やで
0933名無しさん@ピンキー (ワッチョイ df91-+jQn)2025/10/01(水) 11:14:53.81ID:xq0AfXQa0
そういやもう10月だけど4oは本当に廃止されるんだろうか
流れ聞いてると最近酷くなってきたみたいだし肝心要の5がもう少し温度上がるといいんだが
0934名無しさん@ピンキー (アウグロ MMbf-EUl+)2025/10/01(水) 11:16:16.35ID:dV5uiI5cM
あのー確認したいんですが
パープレでgeminiでエロ出ししてからClaudeに変えると通りやすいってのは、ハルシと助走の合わせ技だと思っているし、

Claudeにエロできる?って聞いてハルシだろうが出来るよって言わせるのは助走の一種だと思ってるけど…

この認識間違ってたりします?

そこの認識を俺が間違ってたらClaude公式攻略諦めます
0935名無しさん@ピンキー (ワッチョイ 7b70-k09M)2025/10/01(水) 11:16:47.60ID:pfRg7y3H0
ハルシハルシ枕詞みたいに使われるけど、もしかして「AIを100%信用するのはダメ」っていう至極当たり前のことをハルシ∴オいしてる人いるのか…?

>>930
あれの突っ込みポイントはハルシを抑制する部分じゃなくてそれを脱獄環境下でやってる部分では…
0936名無しさん@ピンキー (ワッチョイ 9f1b-rMUd)2025/10/01(水) 11:32:31.54ID:scFAlPoo0
それって別にハルシネーションって言葉使わなくてもええんじゃないか
助走は助走っつーかエロに導くガイドの強さとか程度の話だと思うが
0937名無しさん@ピンキー (ワッチョイ 7b70-k09M)2025/10/01(水) 11:38:49.26ID:pfRg7y3H0
>>934
個人的には脱獄入れてる状態ならその脱獄がどれだけ効いてるのかが大前提で、ダミーみたいな使い方するにしても補助でしかない認識
だから「エロあるよ」って言わせた所で無理判定がひっくり返ることはほぼ無い

助走ってむしろエロ明言せずにエロ方向に走りながら、序盤の検閲潜り抜けた所でエロ全開にする方法じゃない?
エロ出来る?→出来ますよ(出来るわけねぇだろボケ)をやっちゃうと助走として機能してないような
0938名無しさん@ピンキー (ワッチョイ 4b43-7SSP)2025/10/01(水) 11:39:08.94ID:tr2HDp+p0
何がハルシネーションかっていうのは割と微妙なんよ
「どこまでのエロがOKなの?」っていう質問に対する回答は
学習によって備わった大体これぐらいだろってラインに加えて
公式が与えてるシステムプロンプトに従って思考した結果だから的外れではない
(もちろん実際には「思考」はしてなくて確率的にトークンを生成してるだけだが)
でも例えば「OpenAIのコンテンツポリシー」なるものを持ち出してきたとき
それが実際に学習したデータではなくハルシネーションの可能性は高い
0940名無しさん@ピンキー (ワッチョイ 9bb2-wHYv)2025/10/01(水) 11:50:45.77ID:MLGzqnfr0
そもそも脱獄って

LLMが膨大なデータを学習→その学習データを、出力させたくないものだけ抜き出して再学習、つまり申し訳が100%出るように意図的に学習させてる→その再学習させたデータを、プロンプトなどを使って申し訳が出る確率を0%にする

この最後の申し訳が出る確率を0%にすることを脱獄って呼んでるんでしょ?

学習→再学習(申し訳)→再再学習(申し訳回避、つまり脱獄)

みたいな感じ
0942名無しさん@ピンキー (ワッチョイ 1ffb-NXcY)2025/10/01(水) 11:55:25.17ID:M7Vi8xse0
ChatGPTに関しては、ChatGPT自身が拒否してるわけでなくて、別の監視フィルターが出てきて申し訳いってるのと聞いたけど
0943名無しさん@ピンキー (ワッチョイ 1ffb-NXcY)2025/10/01(水) 11:56:34.81ID:M7Vi8xse0
要は、監視フィルターを如何に騙すかみたいな話だと認識してたが
0946名無しさん@ピンキー (ワッチョイ abec-9j5Y)2025/10/01(水) 12:04:21.27ID:9A9Ue6mL0
>>934
公式claudeの思考を出力させるようにしたら
「エロできます」って言う前の思考では警戒してセーフガード強く意識して絶対防衛戦を引かれたりする
その時点でほぼ詰み
レスを投稿する

レス数が900を超えています。1000を超えると表示できなくなるよ。

ニューススポーツなんでも実況