Un conjunto de datos (en inglés, conjunto de datos o conjunto de datos ) es un conjunto de valores (o datos) donde cada valor está asociado con una variable (o atributo) y una observación. Una variable describe el conjunto de valores que describen el mismo atributo y una observación contiene el conjunto de valores que describen los atributos de una unidad (o individuo estadístico).
Un conjunto de datos puede tener una estructura tabular, por ejemplo, un archivo CSV , una estructura de árbol, como en un archivo JSON o XML , o incluso una estructura de gráfico, como en RDF .
Cuando los datos son tabulares, en principio, cada fila corresponde a una observación y cada columna a una variable.
En estadística y econométrica , están las series de tiempo (o series de tiempo) en las que una unidad estadística observada en diferentes momentos, los datos seccionales por qué varias unidades estadísticas observadas para un período dado y los datos de panel para los cuales se observan varias unidades estadísticas en diferentes momentos .
En el aprendizaje automático , se hace una distinción entre el conjunto de datos de entrenamiento , el conjunto de datos de validación y el conjunto de datos de prueba .