¿funciona bien el aprendizaje profundo para conjuntos de datos categóricos con atributos principalmente nominales?
Autores: Hayashi, Yoichi
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
¿funciona bien el aprendizaje profundo para conjuntos de datos categóricos con atributos principalmente nominales?
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Conjuntos de datos
DL
Atributos categóricos
Atributos nominales
Clasificadores
Alta precisión
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 34
Citaciones: Sin citaciones
Dada la complejidad de los conjuntos de datos del mundo real, es difícil presentar estructuras de datos utilizando modelos de aprendizaje profundo (DL) existentes. La mayoría de las investigaciones hasta la fecha se han concentrado en conjuntos de datos con solo un tipo de atributo: categórico o numérico. Los datos categóricos son comunes en conjuntos de datos como el conjunto de datos de calificación crediticia alemán (-categórico), que contiene atributos numéricos, ordinales y nominales. La estructura heterogénea de este conjunto de datos hace que sea muy difícil lograr una precisión muy alta. Los métodos basados en DL han logrado una alta precisión (99.68%) para el conjunto de datos de cáncer de mama de Wisconsin, mientras que los métodos inspirados en DL han logrado una alta precisión (97.39%) para el conjunto de datos de crédito australiano. Sin embargo, hasta donde sabemos, no se ha propuesto ningún método para clasificar el conjunto de datos de crédito alemán. Este estudio tuvo como objetivo proporcionar nuevas ideas sobre las razones por las que los clasificadores basados en DL y los inspirados en DL no funcionan bien para conjuntos de datos categóricos, que consisten principalmente en atributos nominales. También discutimos los problemas asociados con el uso de atributos nominales para diseñar clasificadores de alto rendimiento. Teniendo en cuenta la utilidad ampliada de DL, los hallazgos de este estudio deberían ayudar en el desarrollo de un nuevo tipo de DL que pueda manejar conjuntos de datos categóricos que consisten principalmente en atributos nominales, que se utilizan comúnmente en la evaluación de riesgos, finanzas, banca y marketing.
Descripción
Dada la complejidad de los conjuntos de datos del mundo real, es difícil presentar estructuras de datos utilizando modelos de aprendizaje profundo (DL) existentes. La mayoría de las investigaciones hasta la fecha se han concentrado en conjuntos de datos con solo un tipo de atributo: categórico o numérico. Los datos categóricos son comunes en conjuntos de datos como el conjunto de datos de calificación crediticia alemán (-categórico), que contiene atributos numéricos, ordinales y nominales. La estructura heterogénea de este conjunto de datos hace que sea muy difícil lograr una precisión muy alta. Los métodos basados en DL han logrado una alta precisión (99.68%) para el conjunto de datos de cáncer de mama de Wisconsin, mientras que los métodos inspirados en DL han logrado una alta precisión (97.39%) para el conjunto de datos de crédito australiano. Sin embargo, hasta donde sabemos, no se ha propuesto ningún método para clasificar el conjunto de datos de crédito alemán. Este estudio tuvo como objetivo proporcionar nuevas ideas sobre las razones por las que los clasificadores basados en DL y los inspirados en DL no funcionan bien para conjuntos de datos categóricos, que consisten principalmente en atributos nominales. También discutimos los problemas asociados con el uso de atributos nominales para diseñar clasificadores de alto rendimiento. Teniendo en cuenta la utilidad ampliada de DL, los hallazgos de este estudio deberían ayudar en el desarrollo de un nuevo tipo de DL que pueda manejar conjuntos de datos categóricos que consisten principalmente en atributos nominales, que se utilizan comúnmente en la evaluación de riesgos, finanzas, banca y marketing.