Sistema para asignación automática de acento léxico en croata
Autores: Mikeli Preradovi, Nives; Nacinovic Prskalo, Lucia
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Sistema para asignación automática de acento léxico en croata
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Interfaces de voz populares
Prosodia
Habla
Modelado
Idioma croata
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 24
Citaciones: Sin citaciones
Es muy popular hoy en día integrar interfaces de voz en dispositivos IoT. La pronunciación y la prosodia adecuada del habla juegan un papel importante en la inteligibilidad y naturalidad de las voces sintetizadas. Cada idioma tiene sus propias características prosódicas. En este documento, presentamos los resultados de un estudio destinado a probar la aplicabilidad de métodos para modelar y predecir las características prosódicas del idioma croata. Se investigó en qué medida su rendimiento puede mejorarse incorporando características lingüísticas y peculiaridades lingüísticas específicas del idioma croata. En el proceso de aprendizaje del modelo, se utilizó la clasificación de árboles para predecir la posición del acento léxico y el tipo de acento en una palabra, y se utilizó un léxico de 1,011,785 formas de palabras como conjunto de aprendizaje del modelo. Se crearon modelos separados para predecir la posición y el tipo de acento léxico. Los resultados mejoraron significativamente después de aplicar las reglas para las palabras átonas (clíticos). También se propuso un enfoque híbrido que combina un enfoque basado en reglas y un enfoque de modelado. La precisión final de asignar el acento léxico utilizando el enfoque híbrido fue del 95.3%.
Descripción
Es muy popular hoy en día integrar interfaces de voz en dispositivos IoT. La pronunciación y la prosodia adecuada del habla juegan un papel importante en la inteligibilidad y naturalidad de las voces sintetizadas. Cada idioma tiene sus propias características prosódicas. En este documento, presentamos los resultados de un estudio destinado a probar la aplicabilidad de métodos para modelar y predecir las características prosódicas del idioma croata. Se investigó en qué medida su rendimiento puede mejorarse incorporando características lingüísticas y peculiaridades lingüísticas específicas del idioma croata. En el proceso de aprendizaje del modelo, se utilizó la clasificación de árboles para predecir la posición del acento léxico y el tipo de acento en una palabra, y se utilizó un léxico de 1,011,785 formas de palabras como conjunto de aprendizaje del modelo. Se crearon modelos separados para predecir la posición y el tipo de acento léxico. Los resultados mejoraron significativamente después de aplicar las reglas para las palabras átonas (clíticos). También se propuso un enfoque híbrido que combina un enfoque basado en reglas y un enfoque de modelado. La precisión final de asignar el acento léxico utilizando el enfoque híbrido fue del 95.3%.