La sinergia entre un robot humanoide y Whisper: acortando una brecha en la educación
Autores: Pande, Akshara; Mishra, Deepti
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
La sinergia entre un robot humanoide y Whisper: acortando una brecha en la educación
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Problemas
Concentración
Robot humanoide
Pepper
Sistema de reconocimiento de voz
Educación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
Los estudiantes pueden enfrentar problemas para concentrarse durante una conferencia debido a varias razones, que pueden estar relacionadas con el acento del educador o las dificultades auditivas del estudiante. Esto puede llevar a una reducción en la participación y un bajo rendimiento en la clase. En este documento, exploramos si la incorporación del robot humanoide Pepper puede ayudar a mejorar la experiencia de aprendizaje. Pepper puede capturar el audio de una persona; sin embargo, no hay garantía de precisión del audio grabado debido a varios factores. Por lo tanto, investigamos las limitaciones del sistema de reconocimiento de voz de Pepper con el objetivo de observar el efecto de la distancia, la edad, el género y la complejidad de las afirmaciones. Realizamos un experimento con ocho personas, incluyendo cinco mujeres y tres hombres, que pronunciaron afirmaciones proporcionadas a diferentes distancias. Estas afirmaciones fueron clasificadas utilizando diferentes puntajes estadísticos. Pepper no tiene la funcionalidad para transcribir discursos en texto. Para superar este problema, integramos a Pepper con una herramienta de reconocimiento de voz a texto, Whisper, que transcribe el discurso en texto que puede mostrarse en la pantalla de Pepper utilizando su servicio. El propósito del estudio es desarrollar un sistema donde el robot humanoide Pepper y la herramienta de reconocimiento de voz a texto Whisper actúen en sinergia para cerrar la brecha entre la comunicación verbal y visual en la educación. Este sistema podría ser beneficioso para los estudiantes, ya que comprenderán mejor el contenido a través de la representación visual de las palabras habladas del profesor, independientemente de cualquier problema de audición y acento. La metodología implica grabar el discurso del participante, seguido de su transcripción a texto por Whisper, y luego la evaluación del texto generado utilizando varios puntajes estadísticos. Anticipamos que el sistema propuesto podrá aumentar la experiencia de aprendizaje, el compromiso y la inmersión de los estudiantes en un entorno de aula.
Descripción
Los estudiantes pueden enfrentar problemas para concentrarse durante una conferencia debido a varias razones, que pueden estar relacionadas con el acento del educador o las dificultades auditivas del estudiante. Esto puede llevar a una reducción en la participación y un bajo rendimiento en la clase. En este documento, exploramos si la incorporación del robot humanoide Pepper puede ayudar a mejorar la experiencia de aprendizaje. Pepper puede capturar el audio de una persona; sin embargo, no hay garantía de precisión del audio grabado debido a varios factores. Por lo tanto, investigamos las limitaciones del sistema de reconocimiento de voz de Pepper con el objetivo de observar el efecto de la distancia, la edad, el género y la complejidad de las afirmaciones. Realizamos un experimento con ocho personas, incluyendo cinco mujeres y tres hombres, que pronunciaron afirmaciones proporcionadas a diferentes distancias. Estas afirmaciones fueron clasificadas utilizando diferentes puntajes estadísticos. Pepper no tiene la funcionalidad para transcribir discursos en texto. Para superar este problema, integramos a Pepper con una herramienta de reconocimiento de voz a texto, Whisper, que transcribe el discurso en texto que puede mostrarse en la pantalla de Pepper utilizando su servicio. El propósito del estudio es desarrollar un sistema donde el robot humanoide Pepper y la herramienta de reconocimiento de voz a texto Whisper actúen en sinergia para cerrar la brecha entre la comunicación verbal y visual en la educación. Este sistema podría ser beneficioso para los estudiantes, ya que comprenderán mejor el contenido a través de la representación visual de las palabras habladas del profesor, independientemente de cualquier problema de audición y acento. La metodología implica grabar el discurso del participante, seguido de su transcripción a texto por Whisper, y luego la evaluación del texto generado utilizando varios puntajes estadísticos. Anticipamos que el sistema propuesto podrá aumentar la experiencia de aprendizaje, el compromiso y la inmersión de los estudiantes en un entorno de aula.