>>682
さすがにこのスレで語るんだから「嫁」は3Dモデルじゃない?

>>677
> セリフ、行動を別々に任意のフォーマットで出力させて

セリフはいいとして、行動の方はどうやればいいんだろね
文章から表情や動作の箇所を抜き出すとして、表情はモーフでいけるけど、動作はMotion Diffusionかなあ
それでも動きが不連続になったり予想外になったりして、まだ厳しそう

> シーン内の物体の位置関係なども指定できる

GPT-4 になると身体性にからむ文脈も的確に覚えるしね
というか、このあたりのふるまいはもう人間とは違うなにかだよ……