ついでに、複数の音声モデルを
同じ画像で口パクしてみる実験
https://files.catbox.moe/jvq8bz.mp4
(※音量注意)

この音声には2Dアニメ系の絵の方が
あいそうだけど、SadTalkerは2D系が苦手で
うまく口パクしてくれない