>>646
色移りについてはその色の単語(トークン)のそれ以外の各単語(トークン)に対するAttentionの重みが100:0じゃなくて、まだらな確率分布になるからあり得るかなとは思う
翻訳とかだと結果的に最大確率のものを1つ選ぶから混ざるってことは起きづらいけど、画像だとむしろ混ざらないと雰囲気描写の副詞や形容詞が効かないから択一にならずに確率分布を汲んで描画されるんじゃね?たぶんだが
まあ、それ以外のことででTEはちゃんと理解しているはずなのにおかしいじゃんってことあるから、結局よくわからんのは変わらんが