Sistema de Recuperación de Información Sindhi Basado en Modelado Probabilístico y Descubrimiento de Patrones
Autores: Hakro, Dil Nawaz; Abbasi, Abdullah; Bhat, Anjum Zameer; Raza, Saleem; Babar, Muhammad; Rahbi, Osama Al
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Sistema de Recuperación de Información Sindhi Basado en Modelado Probabilístico y Descubrimiento de Patrones
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Procesamiento de lenguaje natural
Recuperación de información
Sindhi
Documentos
Modelado probabilístico
Relevancia
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El procesamiento del lenguaje natural es la tecnología utilizada para interactuar con computadoras usando lenguas humanas. Una tecnología superpuesta es la Recuperación de Información (IR), en la que un usuario busca los documentos demandados o requeridos entre un número de documentos que ya están almacenados. El documento requerido se recupera de acuerdo con la relevancia de la consulta del usuario, y los resultados se presentan en orden descendente. Muchos de los idiomas tienen sus propios sistemas de IR, mientras que un sistema de IR dedicado para el sindhi aún necesita atención. Se han propuesto varios enfoques para una recuperación de información efectiva. Dado que el sindhi es un idioma antiguo con una rica historia y literatura, necesita IR. Para el desarrollo de IR en sindhi, se requiere una base de datos de documentos para que los documentos puedan ser recuperados en consecuencia. Se identificaron y recopilaron muchos documentos en sindhi de diversas fuentes, como libros, revistas, y periódicos. Estos documentos fueron identificados como potenciales para su uso en indexación y otras formas de procesamiento. Se utilizaron modelos probabilísticos y descubrimiento de patrones para encontrar patrones y para una recuperación y relevancia efectivas. Los resultados para los sistemas de Recuperación de Información en sindhi son prometedores y presentaron más del 90% de relevancia. El tiempo transcurrido se registró entre 0.2 y 4.8 s para una sola palabra y 4.6 s con una oración en sindhi, con el mismo tiempo de inicio de 0.2 s. El sistema de IR para el sindhi puede ser ajustado y utilizado para otros idiomas con las mismas características, que adoptan la escritura árabe.
Descripción
El procesamiento del lenguaje natural es la tecnología utilizada para interactuar con computadoras usando lenguas humanas. Una tecnología superpuesta es la Recuperación de Información (IR), en la que un usuario busca los documentos demandados o requeridos entre un número de documentos que ya están almacenados. El documento requerido se recupera de acuerdo con la relevancia de la consulta del usuario, y los resultados se presentan en orden descendente. Muchos de los idiomas tienen sus propios sistemas de IR, mientras que un sistema de IR dedicado para el sindhi aún necesita atención. Se han propuesto varios enfoques para una recuperación de información efectiva. Dado que el sindhi es un idioma antiguo con una rica historia y literatura, necesita IR. Para el desarrollo de IR en sindhi, se requiere una base de datos de documentos para que los documentos puedan ser recuperados en consecuencia. Se identificaron y recopilaron muchos documentos en sindhi de diversas fuentes, como libros, revistas, y periódicos. Estos documentos fueron identificados como potenciales para su uso en indexación y otras formas de procesamiento. Se utilizaron modelos probabilísticos y descubrimiento de patrones para encontrar patrones y para una recuperación y relevancia efectivas. Los resultados para los sistemas de Recuperación de Información en sindhi son prometedores y presentaron más del 90% de relevancia. El tiempo transcurrido se registró entre 0.2 y 4.8 s para una sola palabra y 4.6 s con una oración en sindhi, con el mismo tiempo de inicio de 0.2 s. El sistema de IR para el sindhi puede ser ajustado y utilizado para otros idiomas con las mismas características, que adoptan la escritura árabe.