Síntesis de texto a voz en kurdo central con entrenamiento novedoso de transformador de extremo a extremo
Autores: Ahmad, Hawraz A.; Rashid, Tarik A.
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Síntesis de texto a voz en kurdo central con entrenamiento novedoso de transformador de extremo a extremo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Avances
Modelos de texto a voz
Idioma kurdo
Modelo TTS de extremo a extremo
Autoencoder variacional
Predictor de duración estocástica
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 33
Citaciones: Sin citaciones
Los avances recientes en los modelos de texto a voz (TTS) han buscado simplificar el proceso de dos etapas en un enfoque de entrenamiento de una sola etapa. Sin embargo, muchos modelos de una sola etapa aún se rezagan en calidad de audio, especialmente al manejar texto y voz en kurdo.
Descripción
Los avances recientes en los modelos de texto a voz (TTS) han buscado simplificar el proceso de dos etapas en un enfoque de entrenamiento de una sola etapa. Sin embargo, muchos modelos de una sola etapa aún se rezagan en calidad de audio, especialmente al manejar texto y voz en kurdo.