Componentes y principios fundamentales de flujos de trabajo de aprendizaje supervisado con datos numéricos y categóricos
Autores: Kampezidou, Styliani I.; Tikayat Ray, Archana; Bhat, Anirudh Prabhakara; Pinon Fischer, Olivia J.; Mavris, Dimitri N.
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Componentes y principios fundamentales de flujos de trabajo de aprendizaje supervisado con datos numéricos y categóricos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería General
Palabras clave
Aprendizaje automático
Aprendizaje supervisado
Flujos de trabajo
Automatización
Modelos
Ciencia de datos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 28
Citaciones: Sin citaciones
Este documento ofrece un examen exhaustivo del proceso involucrado en el desarrollo y la automatización de flujos de trabajo de aprendizaje automático supervisado de extremo a extremo para fines de pronóstico y clasificación. Ofrece una visión completa de los componentes (es decir, ingeniería de características y selección de modelos), principios (es decir, descomposición sesgo-varianza, complejidad del modelo, sobreajuste, sensibilidad del modelo a suposiciones y escalado de características, e interpretabilidad de la salida), modelos (es decir, redes neuronales y modelos de regresión), métodos (es decir, validación cruzada y aumento de datos), métricas (es decir, Error Cuadrático Medio y puntuación F1) y herramientas que rigen la mayoría de las aplicaciones de aprendizaje supervisado con datos numéricos y categóricos, así como su integración, automatización e implementación. El objetivo final y la contribución de este documento es la educación y orientación de la comunidad académica no experta en IA con respecto a flujos de trabajo de aprendizaje automático completos y rigurosos y prácticas de ciencia de datos, desde la delimitación del problema hasta el diseño y las herramientas de automatización de vanguardia, incluidos los principios básicos y el razonamiento en la elección de métodos. El documento profundiza en las etapas críticas del desarrollo de flujos de trabajo de aprendizaje automático supervisado, muchas de las cuales a menudo son omitidas por los investigadores, y cubre conceptos fundamentales esenciales para comprender y optimizar un flujo de trabajo de aprendizaje automático funcional, ofreciendo así una visión holística del desarrollo de aplicaciones específicas de tareas para investigadores aplicados que no son expertos en IA. Este documento puede tener un valor significativo para los investigadores académicos que desarrollan y prototipan flujos de trabajo de aprendizaje automático para su propia investigación o como soluciones personalizadas para socios gubernamentales e industriales.
Descripción
Este documento ofrece un examen exhaustivo del proceso involucrado en el desarrollo y la automatización de flujos de trabajo de aprendizaje automático supervisado de extremo a extremo para fines de pronóstico y clasificación. Ofrece una visión completa de los componentes (es decir, ingeniería de características y selección de modelos), principios (es decir, descomposición sesgo-varianza, complejidad del modelo, sobreajuste, sensibilidad del modelo a suposiciones y escalado de características, e interpretabilidad de la salida), modelos (es decir, redes neuronales y modelos de regresión), métodos (es decir, validación cruzada y aumento de datos), métricas (es decir, Error Cuadrático Medio y puntuación F1) y herramientas que rigen la mayoría de las aplicaciones de aprendizaje supervisado con datos numéricos y categóricos, así como su integración, automatización e implementación. El objetivo final y la contribución de este documento es la educación y orientación de la comunidad académica no experta en IA con respecto a flujos de trabajo de aprendizaje automático completos y rigurosos y prácticas de ciencia de datos, desde la delimitación del problema hasta el diseño y las herramientas de automatización de vanguardia, incluidos los principios básicos y el razonamiento en la elección de métodos. El documento profundiza en las etapas críticas del desarrollo de flujos de trabajo de aprendizaje automático supervisado, muchas de las cuales a menudo son omitidas por los investigadores, y cubre conceptos fundamentales esenciales para comprender y optimizar un flujo de trabajo de aprendizaje automático funcional, ofreciendo así una visión holística del desarrollo de aplicaciones específicas de tareas para investigadores aplicados que no son expertos en IA. Este documento puede tener un valor significativo para los investigadores académicos que desarrollan y prototipan flujos de trabajo de aprendizaje automático para su propia investigación o como soluciones personalizadas para socios gubernamentales e industriales.