Ciencia de datos - ¿Qué son los datos?
¿Qué son los datos?
Los datos son una colección de información.
Uno de los propósitos de la ciencia de datos es estructurar los datos, haciéndolos interpretables y fáciles de trabajar.
Los datos se pueden clasificar en dos grupos:
- Datos estructurados
- Datos no estructurados
Datos no estructurados
Los datos no estructurados no están organizados. Debemos organizar los datos para fines de análisis.
Datos estructurados
Los datos estructurados están organizados y es más fácil trabajar con ellos.
¿Cómo estructurar los datos?
Podemos usar una matriz o una tabla de base de datos para estructurar o presentar datos.
Ejemplo de una matriz:
[80, 85, 90, 95, 100, 105, 110, 115, 120, 125]
El siguiente ejemplo muestra cómo crear una matriz en Python:
Ejemplo
Array = [80, 85, 90, 95, 100, 105, 110, 115, 120, 125]
print(Array)
Es común trabajar con conjuntos de datos muy grandes en Data Science.
En este tutorial intentaremos que sea lo más fácil posible entender los conceptos de Data Science. Por lo tanto, trabajaremos con un conjunto de datos pequeño y fácil de interpretar.