Article title:
АСПЕКТЫ ЧЕЛОВЕКО-МАШИННОГО ВЗАИМОДЕЙСТВИЯ В TTS-СИСТЕМАХ РЕАЛЬНОГО ВРЕМЕНИ
Authors:
Белоножко П. Е., Федоров В. О.
Keywords: Мел-спектрограмма, человеко-машинное взаимодействие, преобразование текста в речь, Tacotron, WaveNet
Páginas: 65-72
Abstract: Рассмотрено человеко-машинное взаимодействие в системах преобразования текста в речь (TTS) с использованием анализа мел-спектрограмм. Представлены основные концепции в TTS-системах, построенных на генеративных архитектурах WaveNet и Tacotron-2. Показан конвейерный процесс преобразования текста в речь, в котором ключевые функции выполняют WaveNet и Tacotron. Анализ мел-спектрограммы рассмотрен как важный метод для понимания звукового содержания, внесший изменения в представление спектральной информации. Подчеркнуто влияние распределения энергии по частотам и динамики изменений во времени на выделение звуковых элементов и контекста звука. Сделан вывод о уникальности платформы, позволяющей обучение моделей отдельно на различных наборах данных для повышения устойчивости к шуму.
Full text is not available
Download full text
Our expert team reviews the manuscript and prepares a useful report regarding what can be improved. It's fast and it's FREE.
We are also professionals in language editing. Try us and learn more about what our services by clicking here
Archive
- 2024 - Том 14, Выпуск 11
- 2024 - Том 14, Выпуск 10
- 2024 - Том 14, Выпуск 9
- 2024 - Том 14, Выпуск 8
- 2024 - Том 14, Выпуск 7
- 2024 - Том 14, Выпуск 6
- 2024 - Том 14, Выпуск 5
- 2024 - Том 14, Выпуск 4
- 2024 - Том 14, Выпуск 3
- 2024 - Том 14, Выпуск 2
-
Full archive