>>736
「大規模言語モデル」はモデレーションだから、脱獄不足というよりは不同意描写が引っかかってる 入力を変えて出力を変えるとか、プロンプトで伏せ字にするとかしないとだめ