Una interfaz de lenguaje natural para un sistema de control de cámara autónomo en el robot quirúrgico da Vinci
Autores: Elazzazi, Maysara; Jawad, Luay; Hilfi, Mohammed; Pandya, Abhilash
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Una interfaz de lenguaje natural para un sistema de control de cámara autónomo en el robot quirúrgico da Vinci
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Cámara
Cirugía
Interfaz de voz
Sistema autónomo
Procedimientos robóticos
Precisión de reconocimiento
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 27
Citaciones: Sin citaciones
Posicionar una cámara durante procedimientos laparoscópicos y robóticos es un desafío y es esencial para operaciones exitosas. Durante la cirugía, si la vista de la cámara no es óptima, la cirugía se vuelve más compleja y potencialmente propensa a errores. Para abordar esta necesidad, hemos desarrollado una interfaz de voz para un sistema de cámara autónoma que puede desencadenar cambios de comportamiento y ser más un socio para el cirujano. De manera similar a un operador humano, la cámara puede tomar señales del cirujano para ayudar a crear vistas de cámara quirúrgica optimizadas. Tiene la ventaja de un comportamiento nominal que es útil en la mayoría de los casos generales y cuenta con una interfaz de lenguaje natural que la hace dinámicamente personalizable y bajo demanda. Permite el control de una cámara con un mayor nivel de abstracción. Este documento muestra los detalles de implementación y la usabilidad de un sistema de cámara autónoma activada por voz. Se realizó una prueba de activación por voz en un conjunto limitado de frases clave practicadas utilizando sistemas de reconocimiento de voz tanto en línea como fuera de línea. Los resultados muestran una precisión de reconocimiento superior al 94% en promedio para el sistema en línea y del 86% para el sistema fuera de línea. Sin embargo, el tiempo de respuesta del sistema en línea fue superior a 1.5 s, mientras que el sistema local fue de 0.6 s. Este trabajo es un paso hacia robots quirúrgicos cooperativos que se asociarán eficazmente con operadores humanos para permitir cirugías más robustas. Se proporciona un enlace de video del sistema en operación en este documento.
Descripción
Posicionar una cámara durante procedimientos laparoscópicos y robóticos es un desafío y es esencial para operaciones exitosas. Durante la cirugía, si la vista de la cámara no es óptima, la cirugía se vuelve más compleja y potencialmente propensa a errores. Para abordar esta necesidad, hemos desarrollado una interfaz de voz para un sistema de cámara autónoma que puede desencadenar cambios de comportamiento y ser más un socio para el cirujano. De manera similar a un operador humano, la cámara puede tomar señales del cirujano para ayudar a crear vistas de cámara quirúrgica optimizadas. Tiene la ventaja de un comportamiento nominal que es útil en la mayoría de los casos generales y cuenta con una interfaz de lenguaje natural que la hace dinámicamente personalizable y bajo demanda. Permite el control de una cámara con un mayor nivel de abstracción. Este documento muestra los detalles de implementación y la usabilidad de un sistema de cámara autónoma activada por voz. Se realizó una prueba de activación por voz en un conjunto limitado de frases clave practicadas utilizando sistemas de reconocimiento de voz tanto en línea como fuera de línea. Los resultados muestran una precisión de reconocimiento superior al 94% en promedio para el sistema en línea y del 86% para el sistema fuera de línea. Sin embargo, el tiempo de respuesta del sistema en línea fue superior a 1.5 s, mientras que el sistema local fue de 0.6 s. Este trabajo es un paso hacia robots quirúrgicos cooperativos que se asociarán eficazmente con operadores humanos para permitir cirugías más robustas. Se proporciona un enlace de video del sistema en operación en este documento.