Aratako
@Aratako_LM
最近個人開発で作っていたLLMベースのTTSモデルを公開しました!T5GemmaというEncoder-Decoderモデルがベースとなっています。
英語・中国語・日本語を話せます。また、生成音声の長さ制御も可能です。
モデル・デモ・学習 / 推論コード・学習ログなど一通り公開しています!

https://huggingface.co/Aratako/T5Gemma-TTS-2b-2b

しゃべらせる方にも期待