Ciencia de datos - ¿Qué son los datos?


¿Qué son los datos?

Los datos son una colección de información.

Uno de los propósitos de la ciencia de datos es estructurar los datos, haciéndolos interpretables y fáciles de trabajar.

Los datos se pueden clasificar en dos grupos:

  • Datos estructurados
  • Datos no estructurados

Datos no estructurados

Los datos no estructurados no están organizados. Debemos organizar los datos para fines de análisis.

Datos no estructurados

Datos no estructurados


Datos estructurados

Los datos estructurados están organizados y es más fácil trabajar con ellos.

Datos estructurados


¿Cómo estructurar los datos?

Podemos usar una matriz o una tabla de base de datos para estructurar o presentar datos.

Ejemplo de una matriz:

[80, 85, 90, 95, 100, 105, 110, 115, 120, 125]

El siguiente ejemplo muestra cómo crear una matriz en Python:

Ejemplo

Array = [80, 85, 90, 95, 100, 105, 110, 115, 120, 125]
print(Array)

Es común trabajar con conjuntos de datos muy grandes en Data Science.

En este tutorial intentaremos que sea lo más fácil posible entender los conceptos de Data Science. Por lo tanto, trabajaremos con un conjunto de datos pequeño y fácil de interpretar.