logo móvil
Contáctanos

Sistema de Recuperación de Información Sindhi Basado en Modelado Probabilístico y Descubrimiento de Patrones

Autores: Hakro, Dil Nawaz; Abbasi, Abdullah; Bhat, Anjum Zameer; Raza, Saleem; Babar, Muhammad; Rahbi, Osama Al

Idioma: Inglés

Editor: MDPI

Año: 2026

Descargar PDF

Acceso abierto

Artículo científico
2026

Sistema de Recuperación de Información Sindhi Basado en Modelado Probabilístico y Descubrimiento de Patrones


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Procesamiento de lenguaje natural
Recuperación de información
Sindhi
Documentos
Modelado probabilístico
Relevancia

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
El procesamiento del lenguaje natural es la tecnología utilizada para interactuar con computadoras usando lenguas humanas. Una tecnología superpuesta es la Recuperación de Información (IR), en la que un usuario busca los documentos demandados o requeridos entre un número de documentos que ya están almacenados. El documento requerido se recupera de acuerdo con la relevancia de la consulta del usuario, y los resultados se presentan en orden descendente. Muchos de los idiomas tienen sus propios sistemas de IR, mientras que un sistema de IR dedicado para el sindhi aún necesita atención. Se han propuesto varios enfoques para una recuperación de información efectiva. Dado que el sindhi es un idioma antiguo con una rica historia y literatura, necesita IR. Para el desarrollo de IR en sindhi, se requiere una base de datos de documentos para que los documentos puedan ser recuperados en consecuencia. Se identificaron y recopilaron muchos documentos en sindhi de diversas fuentes, como libros, revistas, y periódicos. Estos documentos fueron identificados como potenciales para su uso en indexación y otras formas de procesamiento. Se utilizaron modelos probabilísticos y descubrimiento de patrones para encontrar patrones y para una recuperación y relevancia efectivas. Los resultados para los sistemas de Recuperación de Información en sindhi son prometedores y presentaron más del 90% de relevancia. El tiempo transcurrido se registró entre 0.2 y 4.8 s para una sola palabra y 4.6 s con una oración en sindhi, con el mismo tiempo de inicio de 0.2 s. El sistema de IR para el sindhi puede ser ajustado y utilizado para otros idiomas con las mismas características, que adoptan la escritura árabe.

Otros recursos que podrían interesarte

Temas Virtualpro