logo móvil
Contáctanos

Investigación sobre la detección y clasificación del lenguaje hablado en contenido de audio transmitido

Autores: Kotsakis, Rigas; Matsiola, Maria; Kalliris, George; Dimoulas, Charalampos

Idioma: Inglés

Editor: MDPI

Año: 2020

Descargar PDF

Acceso abierto

Artículo científico
2020

Investigación sobre la detección y clasificación del lenguaje hablado en contenido de audio transmitido


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Investigación
Clasificación de lenguajes hablados
Contenido de transmisión de audio
Preprocesamiento de detección de lenguajes
Experimentos de clasificación adaptativa
Aprendizaje automático
Modelo genérico de reconocimiento de lenguajes

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
El presente documento se centra en la investigación de la clasificación del lenguaje hablado en contenido de transmisión de audio. El enfoque refleja un escenario del mundo real, encontrado en organizaciones modernas de medios/monitoreo, donde se despliega un indexado/documentación semi-automático, que podría ser facilitado por el preprocesamiento de detección de lenguaje propuesto. Grabaciones de audio multilingües de flujos de radio específicos se forman en un pequeño conjunto de datos, que se utiliza para los experimentos de clasificación adaptativa, sin buscar, en este paso, un modelo de reconocimiento de lenguaje genérico. Específicamente, se siguen esquemas de discriminación jerárquica para separar las señales de voz antes de clasificar los lenguajes hablados. Se utiliza aprendizaje automático supervisado y no supervisado en varias configuraciones de ventana para probar la validez de nuestra hipótesis. Además del análisis de los puntajes de reconocimiento logrados (parciales y generales), se proponen modelos de integración tardía para la anotación semi-automática de nuevas grabaciones de audio. Por lo tanto, se ofrecen mecanismos de aumento de datos, con el objetivo de formular gradualmente un Repositorio Genérico de Clasificación de Lenguaje de Audio. Esta base de datos constituye una colección adaptativa al programa que, además de los mecanismos de metadatos de auto-indexación, podría facilitar modelos de clasificación de lenguaje genérico en el futuro, a través de técnicas de vanguardia como el aprendizaje profundo. Este enfoque coincide con el inicio investigativo del proyecto, que busca indicadores que podrían aplicarse en un segundo paso con un conjunto de datos más grande y/o un modelo ya preentrenado, con el propósito de ofrecer resultados generales.

Otros recursos que podrían interesarte

Temas Virtualpro