Introducción a la ciencia de datos


La ciencia de datos es una combinación de múltiples disciplinas que utiliza estadísticas, análisis de datos y aprendizaje automático para analizar datos y extraer conocimiento e información de ellos.


¿Qué es la ciencia de datos?

La ciencia de datos se trata de la recopilación, el análisis y la toma de decisiones de datos.

Data Science se trata de encontrar patrones en los datos, a través del análisis y hacer predicciones futuras.

Mediante el uso de Data Science, las empresas pueden hacer:

  • Mejores decisiones (si elegimos A o B)
  • Análisis predictivo (¿qué pasará después?)
  • Descubrimientos de patrones (encontrar patrones o tal vez información oculta en los datos)

¿Dónde se necesita la ciencia de datos?

La ciencia de datos se utiliza en muchas industrias en el mundo de hoy, por ejemplo, banca, consultoría, atención médica y fabricación.

Ejemplos de dónde se necesita Data Science:

  • Para la planificación de rutas: para descubrir las mejores rutas para enviar
  • Para prever retrasos en vuelos/barcos/trenes, etc. (mediante análisis predictivo)
  • Para crear ofertas promocionales
  • Para encontrar el momento más adecuado para la entrega de mercancías.
  • Pronosticar los ingresos de los próximos años para una empresa
  • Analizar el beneficio para la salud del entrenamiento.
  • Para predecir quién ganará las elecciones

La ciencia de datos se puede aplicar en casi todas las partes de una empresa donde hay datos disponibles. Los ejemplos son:

  • Bienes de consumo
  • Los mercados de valores
  • Industria
  • Política
  • Empresas de logística
  • comercio electrónico

¿Cómo trabaja un científico de datos?

Un científico de datos requiere experiencia en varios campos:

  • Aprendizaje automático
  • Estadísticas
  • Programación (Python o R)
  • Matemáticas
  • bases de datos

Un científico de datos debe encontrar patrones dentro de los datos. Antes de que pueda encontrar los patrones, debe organizar los datos en un formato estándar.

Así es como funciona un científico de datos:

  1. Hacer las preguntas correctas - Para entender el problema empresarial.
  2. Explore y recopile datos : desde la base de datos, registros web, comentarios de los clientes, etc.
  3. Extraiga los datos : transforme los datos a un formato estandarizado.
  4. Limpie los datos : elimine los valores erróneos de los datos.
  5. Buscar y reemplazar valores perdidos : compruebe los valores perdidos y reemplácelos con un valor adecuado (por ejemplo, un valor promedio).
  6. Normalizar datos : escalar los valores en un rango práctico (por ejemplo, 140 cm es más pequeño que 1,8 m. Sin embargo, el número 140 es más grande que 1,8, por lo que la escala es importante).
  7. Analice datos, encuentre patrones y haga predicciones futuras .
  8. Representar el resultado : presentar el resultado con información útil de una manera que la "empresa" pueda entender.

¿Donde empezar?

En este tutorial, comenzaremos presentando qué son los datos y cómo se pueden analizar.

Aprenderá a usar estadísticas y funciones matemáticas para hacer predicciones.