Lectura de Máquinas a Gran Escala: Un Motor de Búsqueda para la Investigación Científica y Académica
Autores: Sousa, Norberto; Oliveira, Nuno; Praça, Isabel
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Lectura de Máquinas a Gran Escala: Un Motor de Búsqueda para la Investigación Científica y Académica
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Sistemas
Palabras clave
Internet
Sobrecarga de información
Motores de búsqueda
Inteligencia artificial
Procesamiento de lenguaje natural
Recuperación de información
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 34
Citaciones: Sin citaciones
Internet, al igual que nuestro universo, está en constante expansión. La información, en los formatos más variados, se añade continuamente hasta el punto de la sobrecarga de información. En consecuencia, la capacidad de navegar por este océano de datos es crucial en nuestra vida diaria, con herramientas familiares como los motores de búsqueda abriendo un camino a través de lo desconocido. En el mundo de la investigación, se publican diariamente artículos sobre una miríada de temas con distintos niveles de complejidad, lo que requiere herramientas especializadas para facilitar el acceso y la evaluación de la información contenida. Los recientes esfuerzos en inteligencia artificial, y en el procesamiento del lenguaje natural en particular, pueden verse como soluciones potenciales para romper la sobrecarga de información y proporcionar mecanismos de búsqueda mejorados mediante algoritmos avanzados. A medida que la llegada de modelos de lenguaje basados en transformadores contribuyó a un análisis más completo tanto de las intenciones codificadas en texto como del verdadero significado semántico de los documentos, también hay una necesidad simultánea de recursos computacionales adicionales. Los métodos de recuperación de información pueden actuar como filtros de baja complejidad, pero fiables, para alimentar algoritmos más pesados, reduciendo así los requisitos computacionales de manera sustancial. En este trabajo, se propone un nuevo motor de búsqueda, abordando la lectura automática a gran escala en el contexto de la investigación científica y académica. Combina algoritmos de vanguardia para tareas de recuperación de información y comprensión lectora para extraer respuestas significativas de un corpus de documentos científicos. La solución se prueba luego en dos temas actuales y relevantes, ciberseguridad y energía, demostrando que el sistema es capaz de funcionar en distintos dominios de conocimiento mientras logra un rendimiento competente.
Descripción
Internet, al igual que nuestro universo, está en constante expansión. La información, en los formatos más variados, se añade continuamente hasta el punto de la sobrecarga de información. En consecuencia, la capacidad de navegar por este océano de datos es crucial en nuestra vida diaria, con herramientas familiares como los motores de búsqueda abriendo un camino a través de lo desconocido. En el mundo de la investigación, se publican diariamente artículos sobre una miríada de temas con distintos niveles de complejidad, lo que requiere herramientas especializadas para facilitar el acceso y la evaluación de la información contenida. Los recientes esfuerzos en inteligencia artificial, y en el procesamiento del lenguaje natural en particular, pueden verse como soluciones potenciales para romper la sobrecarga de información y proporcionar mecanismos de búsqueda mejorados mediante algoritmos avanzados. A medida que la llegada de modelos de lenguaje basados en transformadores contribuyó a un análisis más completo tanto de las intenciones codificadas en texto como del verdadero significado semántico de los documentos, también hay una necesidad simultánea de recursos computacionales adicionales. Los métodos de recuperación de información pueden actuar como filtros de baja complejidad, pero fiables, para alimentar algoritmos más pesados, reduciendo así los requisitos computacionales de manera sustancial. En este trabajo, se propone un nuevo motor de búsqueda, abordando la lectura automática a gran escala en el contexto de la investigación científica y académica. Combina algoritmos de vanguardia para tareas de recuperación de información y comprensión lectora para extraer respuestas significativas de un corpus de documentos científicos. La solución se prueba luego en dos temas actuales y relevantes, ciberseguridad y energía, demostrando que el sistema es capaz de funcionar en distintos dominios de conocimiento mientras logra un rendimiento competente.