サンガツ!すごいな、こんなに多種多彩にいけるのか。。。
サンプル音声のトータル長さは30分も要らないんだね
まだ良くわからないんだけど、この声の最後の方で言うと
1.表現薄い話し方
2.表現薄いささやき声
3.はぁはぁイキそうって言ってる人の声
の3種類は要るってことよね?
で、1,2,3それぞれトータルで5分くらいのサンプルがあればそれぞれ1音声ずつ学習させれば良いってことかな?
あと3の声を学習する時のサンプルは、このトーンでずっと関係ない文章を読むのがいいか、それともずっと喘ぎ声系を5分用意した方がいいの?