Investigación sobre la detección y clasificación del lenguaje hablado en contenido de audio transmitido

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Investigación sobre la detección y clasificación del lenguaje hablado en contenido de audio transmitido

Autores: Kotsakis, Rigas; Matsiola, Maria; Kalliris, George; Dimoulas, Charalampos

Idioma: Inglés

Editor: MDPI

Año: 2020

Descargar PDF

Acceso abierto

Artículo científico

2020

Investigación sobre la detección y clasificación del lenguaje hablado en contenido de audio transmitido

Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Investigación

Clasificación de lenguajes hablados

Contenido de transmisión de audio

Preprocesamiento de detección de lenguajes

Experimentos de clasificación adaptativa

Aprendizaje automático

Modelo genérico de reconocimiento de lenguajes

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones

El presente documento se centra en la investigación de la clasificación del lenguaje hablado en contenido de transmisión de audio. El enfoque refleja un escenario del mundo real, encontrado en organizaciones modernas de medios/monitoreo, donde se despliega un indexado/documentación semi-automático, que podría ser facilitado por el preprocesamiento de detección de lenguaje propuesto. Grabaciones de audio multilingües de flujos de radio específicos se forman en un pequeño conjunto de datos, que se utiliza para los experimentos de clasificación adaptativa, sin buscar, en este paso, un modelo de reconocimiento de lenguaje genérico. Específicamente, se siguen esquemas de discriminación jerárquica para separar las señales de voz antes de clasificar los lenguajes hablados. Se utiliza aprendizaje automático supervisado y no supervisado en varias configuraciones de ventana para probar la validez de nuestra hipótesis. Además del análisis de los puntajes de reconocimiento logrados (parciales y generales), se proponen modelos de integración tardía para la anotación semi-automática de nuevas grabaciones de audio. Por lo tanto, se ofrecen mecanismos de aumento de datos, con el objetivo de formular gradualmente un Repositorio Genérico de Clasificación de Lenguaje de Audio. Esta base de datos constituye una colección adaptativa al programa que, además de los mecanismos de metadatos de auto-indexación, podría facilitar modelos de clasificación de lenguaje genérico en el futuro, a través de técnicas de vanguardia como el aprendizaje profundo. Este enfoque coincide con el inicio investigativo del proyecto, que busca indicadores que podrían aplicarse en un segundo paso con un conjunto de datos más grande y/o un modelo ya preentrenado, con el propósito de ofrecer resultados generales.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro