>>668
> 全部教える必要がある

う〜ん……むしろ>>667 がそれなりに正しいんだけど
CLIPがゼロショット学習できてるから、SDもこれだけ多様な画像を生成できるわけだし
(もちろんデジタルを知ってるならアナログを知ってるとは必ずしもいえないけど)

>>663
不可能って……オズマ問題じゃないんだからw(モデルにはヒトの言語も画像も学習させるしね)