Dentro de la ciencia de datos de producción: explorando las tareas principales de los científicos de datos en entornos de producción
Autores: Schmetz, Arno; Kampker, Achim
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Dentro de la ciencia de datos de producción: explorando las tareas principales de los científicos de datos en entornos de producción
Categoría
Ingeniería y Tecnología
Subcategoría
Inteligencia Artificial
Palabras clave
Analítica basada en datos
Procesos de producción
Científicos de datos
Preprocesamiento de datos
Calidad de datos
Datos de producción
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 23
Citaciones: Sin citaciones
La producción moderna se basa en análisis de datos para la predicción y optimización de los procesos de producción. Los científicos de datos especializados realizan tareas en empresas e instituciones de investigación, trabajando con datos reales de entornos de producción reales. Los roles de preprocesamiento de datos y calidad de datos son cruciales en la ciencia de datos, y un campo de investigación activo se ocupa de metodologías y tecnologías para esto. Mientras que anécdotas y encuestas generalizadas indican que el preprocesamiento es la tarea operativa principal para los científicos de datos, falta una visión detallada de las subtareas y el dominio de los datos de producción. En este artículo, presentamos una encuesta de múltiples etapas sobre las tareas de ciencia de datos en la práctica en el campo de la producción. Utilizando conocimientos e ideas de expertos, encontramos que el preprocesamiento de datos es la parte principal de las tareas de los científicos de datos. En detalle, descubrimos que abordar valores faltantes, encontrar significados de puntos de datos y sincronizar múltiples series temporales eran a menudo las tareas de preprocesamiento más consumidoras de tiempo.
Descripción
La producción moderna se basa en análisis de datos para la predicción y optimización de los procesos de producción. Los científicos de datos especializados realizan tareas en empresas e instituciones de investigación, trabajando con datos reales de entornos de producción reales. Los roles de preprocesamiento de datos y calidad de datos son cruciales en la ciencia de datos, y un campo de investigación activo se ocupa de metodologías y tecnologías para esto. Mientras que anécdotas y encuestas generalizadas indican que el preprocesamiento es la tarea operativa principal para los científicos de datos, falta una visión detallada de las subtareas y el dominio de los datos de producción. En este artículo, presentamos una encuesta de múltiples etapas sobre las tareas de ciencia de datos en la práctica en el campo de la producción. Utilizando conocimientos e ideas de expertos, encontramos que el preprocesamiento de datos es la parte principal de las tareas de los científicos de datos. En detalle, descubrimos que abordar valores faltantes, encontrar significados de puntos de datos y sincronizar múltiples series temporales eran a menudo las tareas de preprocesamiento más consumidoras de tiempo.