Anthropic、AIの問題行動を抑制する新手法を発表--「性格変化」の兆候を検出(ZDNET Japan) - Yahoo!ニュース
https://share.google/rCHs424BRc4IeDP4c
余計なことをしてくれる…
いやこっちが悪いんだけど
早くローカルモデル発展しねえかなあ