音声のギャラってテキスト量に比例するのか?
アニメみたいに収録一回あたりで一律だと思ってた