Aprendizaje automático
Machine Learning hace que la computadora aprenda a partir del estudio de datos y estadísticas.
El aprendizaje automático es un paso en la dirección de la inteligencia artificial (IA).
Machine Learning es un programa que analiza datos y aprende a predecir el resultado.
¿Donde empezar?
En este tutorial volveremos a las matemáticas y estudiaremos estadísticas, y cómo calcular números importantes basados en conjuntos de datos.
También aprenderemos a usar varios módulos de Python para obtener las respuestas que necesitamos.
Y aprenderemos a crear funciones que puedan predecir el resultado en función de lo que hemos aprendido.
Conjunto de datos
En la mente de una computadora, un conjunto de datos es cualquier colección de datos. Puede ser cualquier cosa, desde una matriz hasta una base de datos completa.
Ejemplo de una matriz:
[99,86,87,88,111,86,103,87,94,78,77,85,86]
Ejemplo de una base de datos:
nombre clave | Color | Envejecer | Velocidad | Pase automático |
BMW | rojo | 5 | 99 | Y |
volvo | negro | 7 | 86 | Y |
vw | gris | 8 | 87 | norte |
vw | blanco | 7 | 88 | Y |
Vado | blanco | 2 | 111 | Y |
vw | blanco | 17 | 86 | Y |
tesla | rojo | 2 | 103 | Y |
BMW | negro | 9 | 87 | Y |
volvo | gris | 4 | 94 | norte |
Vado | blanco | 11 | 78 | norte |
Toyota | gris | 12 | 77 | norte |
vw | blanco | 9 | 85 | norte |
Toyota | azul | 6 | 86 | Y |
Al observar la matriz, podemos adivinar que el valor promedio es probablemente alrededor de 80 o 90, y también podemos determinar el valor más alto y el valor más bajo, pero ¿qué más podemos hacer?
Y al mirar la base de datos podemos ver que el color más popular es el blanco, y el automóvil más antiguo tiene 17 años, pero ¿y si pudiéramos predecir si un automóvil tiene un AutoPass con solo mirar los otros valores?
¡Para eso está el aprendizaje automático! ¡Analizar datos y predecir el resultado!
En Machine Learning es común trabajar con conjuntos de datos muy grandes. En este tutorial intentaremos que sea lo más fácil posible entender los diferentes conceptos de aprendizaje automático y trabajaremos con pequeños conjuntos de datos fáciles de entender.
Tipos de datos
Para analizar datos, es importante saber qué tipo de datos estamos tratando.
Podemos dividir los tipos de datos en tres categorías principales:
- Numérico
- Categórico
- Ordinal
Los datos numéricos son números y se pueden dividir en dos categorías numéricas:
- Datos discretos
: números que se limitan a números enteros. Ejemplo: El número de coches que pasan. - Datos continuos
: números que tienen un valor infinito. Ejemplo: el precio de un artículo o el tamaño de un artículo
Los datos categóricos son valores que no se pueden comparar entre sí. Ejemplo: un valor de color, o cualquier valor sí/no.
Los datos ordinales son como datos categóricos, pero se pueden comparar entre sí. Ejemplo: calificaciones escolares donde A es mejor que B y así sucesivamente.
Al conocer el tipo de datos de su fuente de datos, podrá saber qué técnica utilizar al analizarlos.
Aprenderá más sobre estadísticas y análisis de datos en los próximos capítulos.