Revisión de avances en procesamiento del habla con enfoque en redes neuronales artificiales
Autores: O"Shaughnessy, Douglas
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Revisión de avances en procesamiento del habla con enfoque en redes neuronales artificiales
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Discurso
Computadoras
Bases de datos
Técnicas de procesamiento
Redes neuronales artificiales
Investigación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 40
Citaciones: Sin citaciones
El habla es la forma principal a través de la cual la mayoría de los humanos se comunican. Los ordenadores facilitan esta transferencia de información, especialmente cuando las personas interactúan con bases de datos. Aunque algunos métodos para manipular e interpretar el habla se remontan a varias décadas atrás (por ejemplo, el análisis de Fourier), otras técnicas de procesamiento se desarrollaron a finales del siglo pasado (por ejemplo, la codificación predictiva lineal y los modelos ocultos de Markov). No obstante, en los últimos 25 años se han producido avances significativos que han llevado a la amplia aceptación del procesamiento del habla basado en ordenadores, por ejemplo, los teléfonos celulares y las conversaciones en línea en tiempo real. Este artículo revisa técnicas antiguas y métodos recientes que se centran principalmente en las redes neuronales artificiales. Se examinan los principales aspectos destacados en la investigación del habla, sin profundizar en detalles matemáticos, al mismo tiempo que se ofrece una visión sobre las elecciones de investigación que se han realizado. El enfoque de este trabajo es comprender cómo y por qué funcionan bien los métodos discutidos.
Descripción
El habla es la forma principal a través de la cual la mayoría de los humanos se comunican. Los ordenadores facilitan esta transferencia de información, especialmente cuando las personas interactúan con bases de datos. Aunque algunos métodos para manipular e interpretar el habla se remontan a varias décadas atrás (por ejemplo, el análisis de Fourier), otras técnicas de procesamiento se desarrollaron a finales del siglo pasado (por ejemplo, la codificación predictiva lineal y los modelos ocultos de Markov). No obstante, en los últimos 25 años se han producido avances significativos que han llevado a la amplia aceptación del procesamiento del habla basado en ordenadores, por ejemplo, los teléfonos celulares y las conversaciones en línea en tiempo real. Este artículo revisa técnicas antiguas y métodos recientes que se centran principalmente en las redes neuronales artificiales. Se examinan los principales aspectos destacados en la investigación del habla, sin profundizar en detalles matemáticos, al mismo tiempo que se ofrece una visión sobre las elecciones de investigación que se han realizado. El enfoque de este trabajo es comprender cómo y por qué funcionan bien los métodos discutidos.