¿funciona bien el aprendizaje profundo para conjuntos de datos categóricos con atributos principalmente nominales?

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

¿funciona bien el aprendizaje profundo para conjuntos de datos categóricos con atributos principalmente nominales?

Autores: Hayashi, Yoichi

Idioma: Inglés

Editor: MDPI

Año: 2020

Acceso abierto

Artículo científico

2020

¿funciona bien el aprendizaje profundo para conjuntos de datos categóricos con atributos principalmente nominales?

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Conjuntos de datos

DL

Atributos categóricos

Atributos nominales

Clasificadores

Alta precisión

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 34

Citaciones: Sin citaciones

Dada la complejidad de los conjuntos de datos del mundo real, es difícil presentar estructuras de datos utilizando modelos de aprendizaje profundo (DL) existentes. La mayoría de las investigaciones hasta la fecha se han concentrado en conjuntos de datos con solo un tipo de atributo: categórico o numérico. Los datos categóricos son comunes en conjuntos de datos como el conjunto de datos de calificación crediticia alemán (-categórico), que contiene atributos numéricos, ordinales y nominales. La estructura heterogénea de este conjunto de datos hace que sea muy difícil lograr una precisión muy alta. Los métodos basados en DL han logrado una alta precisión (99.68%) para el conjunto de datos de cáncer de mama de Wisconsin, mientras que los métodos inspirados en DL han logrado una alta precisión (97.39%) para el conjunto de datos de crédito australiano. Sin embargo, hasta donde sabemos, no se ha propuesto ningún método para clasificar el conjunto de datos de crédito alemán. Este estudio tuvo como objetivo proporcionar nuevas ideas sobre las razones por las que los clasificadores basados en DL y los inspirados en DL no funcionan bien para conjuntos de datos categóricos, que consisten principalmente en atributos nominales. También discutimos los problemas asociados con el uso de atributos nominales para diseñar clasificadores de alto rendimiento. Teniendo en cuenta la utilidad ampliada de DL, los hallazgos de este estudio deberían ayudar en el desarrollo de un nuevo tipo de DL que pueda manejar conjuntos de datos categóricos que consisten principalmente en atributos nominales, que se utilizan comúnmente en la evaluación de riesgos, finanzas, banca y marketing.

Descripción

Dada la complejidad de los conjuntos de datos del mundo real, es difícil presentar estructuras de datos utilizando modelos de aprendizaje profundo (DL) existentes. La mayoría de las investigaciones hasta la fecha se han concentrado en conjuntos de datos con solo un tipo de atributo: categórico o numérico. Los datos categóricos son comunes en conjuntos de datos como el conjunto de datos de calificación crediticia alemán (-categórico), que contiene atributos numéricos, ordinales y nominales. La estructura heterogénea de este conjunto de datos hace que sea muy difícil lograr una precisión muy alta. Los métodos basados en DL han logrado una alta precisión (99.68%) para el conjunto de datos de cáncer de mama de Wisconsin, mientras que los métodos inspirados en DL han logrado una alta precisión (97.39%) para el conjunto de datos de crédito australiano. Sin embargo, hasta donde sabemos, no se ha propuesto ningún método para clasificar el conjunto de datos de crédito alemán. Este estudio tuvo como objetivo proporcionar nuevas ideas sobre las razones por las que los clasificadores basados en DL y los inspirados en DL no funcionan bien para conjuntos de datos categóricos, que consisten principalmente en atributos nominales. También discutimos los problemas asociados con el uso de atributos nominales para diseñar clasificadores de alto rendimiento. Teniendo en cuenta la utilidad ampliada de DL, los hallazgos de este estudio deberían ayudar en el desarrollo de un nuevo tipo de DL que pueda manejar conjuntos de datos categóricos que consisten principalmente en atributos nominales, que se utilizan comúnmente en la evaluación de riesgos, finanzas, banca y marketing.

Otros recursos que podrían interesarte

Temas Virtualpro