El Corpus BioVisualSpeech de Palabras con Sibilantes para el Desarrollo de Juegos de Terapia del Habla
Autores: Cavaco, Sofia; Guimarães, Isabel; Ascensão, Mariana; Abad, Alberto; Anjos, Ivo; Oliveira, Francisco; Martins, Sofia; Marques, Nuno; Eskenazi, Maxine; Magalhães, João; Grilo, Margarida
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
El Corpus BioVisualSpeech de Palabras con Sibilantes para el Desarrollo de Juegos de Terapia del Habla
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Desarrollar herramientas informáticas
Terapia del habla
Corpora de producción del habla
Población objetivo
Trastornos del sonido del habla
Niños portugueses
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Para desarrollar herramientas informáticas para la terapia del habla que clasifiquen de manera confiable las producciones del habla, es necesario contar con corpora de producción del habla que caractericen a la población objetivo en términos de edad, género y lengua materna. Además de incluir producciones del habla correctas, para caracterizar a la población objetivo, los corpora también deberían incluir muestras de personas con trastornos de los sonidos del habla. Además, la anotación de los datos debería incluir información sobre la corrección de las producciones del habla. Siguiendo estos criterios, recopilamos un corpus que puede ser utilizado para desarrollar herramientas informáticas para la terapia del habla y del lenguaje de niños portugueses con sigmatismo. El corpus propuesto contiene producciones de palabras de niños de portugués europeo en las que las palabras tienen consonantes sibilantes. El corpus tiene producciones de 356 niños de 5 a 9 años de edad. Algunas características importantes de este corpus, que son relevantes para la terapia del habla y del lenguaje y la investigación en informática, son que (1) el corpus incluye datos de niños con trastornos de los sonidos del habla; y (2) las producciones fueron anotadas de acuerdo con los criterios de los patólogos del habla y del lenguaje, y tienen información sobre los errores de producción del habla. Estas son características relevantes para el desarrollo y la evaluación de herramientas de procesamiento del habla para la terapia del habla de niños portugueses. Además, como ilustración de cómo utilizar el corpus, presentamos tres juegos de terapia del habla que utilizan un clasificador de sibilantes basado en redes neuronales convolucionales entrenado con datos de este corpus y un módulo de reconocimiento de palabras entrenado con datos adicionales de niños y calibrado y evaluado con el corpus recopilado.
Descripción
Para desarrollar herramientas informáticas para la terapia del habla que clasifiquen de manera confiable las producciones del habla, es necesario contar con corpora de producción del habla que caractericen a la población objetivo en términos de edad, género y lengua materna. Además de incluir producciones del habla correctas, para caracterizar a la población objetivo, los corpora también deberían incluir muestras de personas con trastornos de los sonidos del habla. Además, la anotación de los datos debería incluir información sobre la corrección de las producciones del habla. Siguiendo estos criterios, recopilamos un corpus que puede ser utilizado para desarrollar herramientas informáticas para la terapia del habla y del lenguaje de niños portugueses con sigmatismo. El corpus propuesto contiene producciones de palabras de niños de portugués europeo en las que las palabras tienen consonantes sibilantes. El corpus tiene producciones de 356 niños de 5 a 9 años de edad. Algunas características importantes de este corpus, que son relevantes para la terapia del habla y del lenguaje y la investigación en informática, son que (1) el corpus incluye datos de niños con trastornos de los sonidos del habla; y (2) las producciones fueron anotadas de acuerdo con los criterios de los patólogos del habla y del lenguaje, y tienen información sobre los errores de producción del habla. Estas son características relevantes para el desarrollo y la evaluación de herramientas de procesamiento del habla para la terapia del habla de niños portugueses. Además, como ilustración de cómo utilizar el corpus, presentamos tres juegos de terapia del habla que utilizan un clasificador de sibilantes basado en redes neuronales convolucionales entrenado con datos de este corpus y un módulo de reconocimiento de palabras entrenado con datos adicionales de niños y calibrado y evaluado con el corpus recopilado.