Investigación sobre la detección y clasificación del lenguaje hablado en contenido de audio transmitido
Autores: Kotsakis, Rigas; Matsiola, Maria; Kalliris, George; Dimoulas, Charalampos
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Investigación sobre la detección y clasificación del lenguaje hablado en contenido de audio transmitido
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Investigación
Clasificación de lenguajes hablados
Contenido de transmisión de audio
Preprocesamiento de detección de lenguajes
Experimentos de clasificación adaptativa
Aprendizaje automático
Modelo genérico de reconocimiento de lenguajes
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El presente documento se centra en la investigación de la clasificación del lenguaje hablado en contenido de transmisión de audio. El enfoque refleja un escenario del mundo real, encontrado en organizaciones modernas de medios/monitoreo, donde se despliega un indexado/documentación semi-automático, que podría ser facilitado por el preprocesamiento de detección de lenguaje propuesto. Grabaciones de audio multilingües de flujos de radio específicos se forman en un pequeño conjunto de datos, que se utiliza para los experimentos de clasificación adaptativa, sin buscar, en este paso, un modelo de reconocimiento de lenguaje genérico. Específicamente, se siguen esquemas de discriminación jerárquica para separar las señales de voz antes de clasificar los lenguajes hablados. Se utiliza aprendizaje automático supervisado y no supervisado en varias configuraciones de ventana para probar la validez de nuestra hipótesis. Además del análisis de los puntajes de reconocimiento logrados (parciales y generales), se proponen modelos de integración tardía para la anotación semi-automática de nuevas grabaciones de audio. Por lo tanto, se ofrecen mecanismos de aumento de datos, con el objetivo de formular gradualmente un Repositorio Genérico de Clasificación de Lenguaje de Audio. Esta base de datos constituye una colección adaptativa al programa que, además de los mecanismos de metadatos de auto-indexación, podría facilitar modelos de clasificación de lenguaje genérico en el futuro, a través de técnicas de vanguardia como el aprendizaje profundo. Este enfoque coincide con el inicio investigativo del proyecto, que busca indicadores que podrían aplicarse en un segundo paso con un conjunto de datos más grande y/o un modelo ya preentrenado, con el propósito de ofrecer resultados generales.
Descripción
El presente documento se centra en la investigación de la clasificación del lenguaje hablado en contenido de transmisión de audio. El enfoque refleja un escenario del mundo real, encontrado en organizaciones modernas de medios/monitoreo, donde se despliega un indexado/documentación semi-automático, que podría ser facilitado por el preprocesamiento de detección de lenguaje propuesto. Grabaciones de audio multilingües de flujos de radio específicos se forman en un pequeño conjunto de datos, que se utiliza para los experimentos de clasificación adaptativa, sin buscar, en este paso, un modelo de reconocimiento de lenguaje genérico. Específicamente, se siguen esquemas de discriminación jerárquica para separar las señales de voz antes de clasificar los lenguajes hablados. Se utiliza aprendizaje automático supervisado y no supervisado en varias configuraciones de ventana para probar la validez de nuestra hipótesis. Además del análisis de los puntajes de reconocimiento logrados (parciales y generales), se proponen modelos de integración tardía para la anotación semi-automática de nuevas grabaciones de audio. Por lo tanto, se ofrecen mecanismos de aumento de datos, con el objetivo de formular gradualmente un Repositorio Genérico de Clasificación de Lenguaje de Audio. Esta base de datos constituye una colección adaptativa al programa que, además de los mecanismos de metadatos de auto-indexación, podría facilitar modelos de clasificación de lenguaje genérico en el futuro, a través de técnicas de vanguardia como el aprendizaje profundo. Este enfoque coincide con el inicio investigativo del proyecto, que busca indicadores que podrían aplicarse en un segundo paso con un conjunto de datos más grande y/o un modelo ya preentrenado, con el propósito de ofrecer resultados generales.