La Paradoja de la Escala de Calificación: Inestabilidad Semántica versus Pérdida de Información
Autores: Giacomelli, Jacopo
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
La Paradoja de la Escala de Calificación: Inestabilidad Semántica versus Pérdida de Información
Categoría
Procesos industriales
Subcategoría
Gestion y control de procesos
Palabras clave
Sistemas de calificación
Información
Escala
Calidad
Partición
Muescas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 21
Citaciones: Sin citaciones
Los sistemas de calificación se aplican a una amplia variedad de contextos diferentes como una herramienta para mapear una gran cantidad de información a un símbolo, o muesca, elegida de un conjunto finito y ordenado. Tal conjunto se conoce comúnmente como la escala de calificación, y sus elementos representan todos los diferentes grados de calidad, en cierto sentido, que un sistema de calificación dado pretende expresar. Este trabajo investiga una paradoja simple pero no trivial en la construcción de esa escala. Cuando el parámetro de calidad considerado es continuo, debe existir una biyección entre una partición específica de su dominio y la escala de calificación. El número de muescas y sus significados se definen comúnmente a priori en función de la conveniencia de los usuarios del sistema de calificación. Sin embargo, en lo que respecta a la partición, el número de subconjuntos y sus amplitudes deben elegirse a posteriori para minimizar la inevitable pérdida de información debido a la discretización. Considerando el caso típico de un sistema de calificación de solvencia basado en un modelo de regresión logística, discutimos hasta qué punto este contraste puede impactar un marco realista y cómo una definición adecuada de la escala de calificación puede manejarlo. De hecho, mostramos que elegir entre métodos a priori, que privilegian el significado de la escala de calificación, y métodos a posteriori, que minimizan la pérdida de información, no es estrictamente necesario. Es posible mezclar los dos enfoques en su lugar, eligiendo un criterio híbrido ajustable de acuerdo con las necesidades del usuario del modelo de calificación.
Descripción
Los sistemas de calificación se aplican a una amplia variedad de contextos diferentes como una herramienta para mapear una gran cantidad de información a un símbolo, o muesca, elegida de un conjunto finito y ordenado. Tal conjunto se conoce comúnmente como la escala de calificación, y sus elementos representan todos los diferentes grados de calidad, en cierto sentido, que un sistema de calificación dado pretende expresar. Este trabajo investiga una paradoja simple pero no trivial en la construcción de esa escala. Cuando el parámetro de calidad considerado es continuo, debe existir una biyección entre una partición específica de su dominio y la escala de calificación. El número de muescas y sus significados se definen comúnmente a priori en función de la conveniencia de los usuarios del sistema de calificación. Sin embargo, en lo que respecta a la partición, el número de subconjuntos y sus amplitudes deben elegirse a posteriori para minimizar la inevitable pérdida de información debido a la discretización. Considerando el caso típico de un sistema de calificación de solvencia basado en un modelo de regresión logística, discutimos hasta qué punto este contraste puede impactar un marco realista y cómo una definición adecuada de la escala de calificación puede manejarlo. De hecho, mostramos que elegir entre métodos a priori, que privilegian el significado de la escala de calificación, y métodos a posteriori, que minimizan la pérdida de información, no es estrictamente necesario. Es posible mezclar los dos enfoques en su lugar, eligiendo un criterio híbrido ajustable de acuerdo con las necesidades del usuario del modelo de calificación.