Ciencia de datos - Introducción a las estadísticas


Introducción a la Estadística

La estadística es la ciencia del análisis de datos.

Cuando hemos creado un modelo para la predicción, debemos evaluar la fiabilidad de la predicción.

Después de todo, ¿de qué vale una predicción si no podemos confiar en ella?


Estadísticas descriptivas

Primero cubriremos algunas estadísticas descriptivas básicas.

Las estadísticas descriptivas resumen las características importantes de un conjunto de datos, tales como:

  • Contar
  • Suma
  • Desviación Estándar
  • percentil
  • Promedio
  • Etc..

Es un buen punto de partida para familiarizarse con los datos.

Podemos usar la describe()función en Python para resumir los datos:

Ejemplo

print (full_health_data.describe())

Producción:

Estadísticas Describir

¿Ves algo interesante aquí?