Ciencia de datos - Introducción a las estadísticas
Introducción a la Estadística
La estadística es la ciencia del análisis de datos.
Cuando hemos creado un modelo para la predicción, debemos evaluar la fiabilidad de la predicción.
Después de todo, ¿de qué vale una predicción si no podemos confiar en ella?
Estadísticas descriptivas
Primero cubriremos algunas estadísticas descriptivas básicas.
Las estadísticas descriptivas resumen las características importantes de un conjunto de datos, tales como:
- Contar
- Suma
- Desviación Estándar
- percentil
- Promedio
- Etc..
Es un buen punto de partida para familiarizarse con los datos.
Podemos usar la describe()
función en Python para resumir los datos:
Ejemplo
print (full_health_data.describe())
Producción:
¿Ves algo interesante aquí?