Tutorial de Python

Pitón INICIO Introducción a Python Python Empezar Sintaxis de Python Comentarios de Python Variables de Python Tipos de datos de Python Números de Python Fundición de Python Cadenas de pitón Booleanos de Python Operadores de Python Listas de Python Tuplas de Python Conjuntos de Python Diccionarios de Python Python si... si no Ciclos while de Python Python para bucles Funciones de Python pitón lambda Matrices de Python Clases/Objetos de Python Herencia de Python Iteradores de Python Alcance de Python Módulos de Python Fechas de Python Python Matemáticas PythonJSON Python expresión regular PIP de Python Prueba Python... Excepto Entrada de usuario de Python Formato de cadenas de Python

Manejo de archivos

Manejo de archivos de Python Python Leer archivos Python escribir/crear archivos Python Eliminar archivos

Módulos de Python

Tutorial NumPy Pandas Tutorial SciPy Tutorial

Matplotlib de Python

Introducción a Matplotlib Matplotlib Comenzar Pyplot de Matplotlib Trazado de Matplotlib Marcadores Matplotlib Línea Matplotlib Etiquetas Matplotlib Cuadrícula Matplotlib Subparcelas de Matplotlib Dispersión de Matplotlib Barras Matplotlib Histogramas de Matplotlib Gráficos circulares de Matplotlib

Aprendizaje automático

Empezando Media Mediana Moda Desviación Estándar percentil Distribución de datos Distribución normal de datos Gráfico de dispersión Regresión lineal Regresión polinomial Regresión múltiple Escala Entrenar/Prueba Árbol de decisión

pitón mysql

MySQL Empezar Crear base de datos MySQL Crear tabla MySQL Insertar MySQL Seleccionar MySQL mysql donde MySQL Ordenar por MySQL Eliminar Tabla desplegable de MySQL Actualización de MySQL Límite MySQL unirse a mysql

Python MongoDB

MongoDB Empezar MongoDB Crear base de datos MongoDB Crear colección Insertar MongoDB MongoDB Buscar Consulta MongoDB MongoDB Ordenar Eliminar MongoDB Colección de eliminación de MongoDB Actualización de MongoDB Límite de MongoDB

Referencia de Python

Descripción general de Python Funciones integradas de Python Métodos de cadenas de Python Métodos de lista de Python Métodos de diccionario de Python Métodos de tupla de Python Métodos de conjuntos de Python Métodos de archivos de Python Palabras clave de Python Excepciones de Python Glosario de Python

Referencia del módulo

Módulo aleatorio Módulo de Solicitudes Módulo de estadísticas Módulo Matemático cMódulo Matemático

Python Cómo

Eliminar duplicados de lista Invertir una cadena Añadir dos números

Ejemplos de Python

Ejemplos de Python Compilador de Python Ejercicios de pitón Cuestionario de Python Certificado de Python

Aprendizaje automático - Diagrama de dispersión


Gráfico de dispersión

Un diagrama de dispersión es un diagrama donde cada valor en el conjunto de datos está representado por un punto.

El módulo Matplotlib tiene un método para dibujar diagramas de dispersión, necesita dos matrices de la misma longitud, una para los valores del eje x y otra para los valores del eje y:

x = [5,7,8,7,2,17,2,9,4,11,12,9,6]

y = [99,86,87,88,111,86,103,87,94,78,77,85,86]

La xmatriz representa la edad de cada automóvil.

La ymatriz representa la velocidad de cada automóvil.

Ejemplo

Utilice el scatter()método para dibujar un diagrama de dispersión:

import matplotlib.pyplot as plt

x = [5,7,8,7,2,17,2,9,4,11,12,9,6]
y = [99,86,87,88,111,86,103,87,94,78,77,85,86]

plt.scatter(x, y)
plt.show()

Resultado:

Diagrama de dispersión explicado

El eje x representa edades y el eje y representa velocidades.

Lo que podemos leer del diagrama es que los dos autos más rápidos tenían 2 años y el auto más lento tenía 12 años.

Nota: Parece que cuanto más nuevo es el auto, más rápido conduce, pero eso podría ser una coincidencia, después de todo, solo registramos 13 autos.



Distribuciones aleatorias de datos

En Machine Learning, los conjuntos de datos pueden contener miles o incluso millones de valores.

Es posible que no tenga datos del mundo real cuando esté probando un algoritmo, es posible que deba usar valores generados aleatoriamente.

Como hemos aprendido en el capítulo anterior, ¡el módulo NumPy puede ayudarnos con eso!

Vamos a crear dos matrices que estén llenas con 1000 números aleatorios de una distribución de datos normal.

La primera matriz tendrá la media establecida en 5,0 con una desviación estándar de 1,0.

La segunda matriz tendrá la media establecida en 10,0 con una desviación estándar de 2,0:

Ejemplo

Un diagrama de dispersión con 1000 puntos:

import numpy
import matplotlib.pyplot as plt

x = numpy.random.normal(5.0, 1.0, 1000)
y = numpy.random.normal(10.0, 2.0, 1000)

plt.scatter(x, y)
plt.show()

Resultado:

Diagrama de dispersión explicado

Podemos ver que los puntos se concentran alrededor del valor 5 en el eje x y 10 en el eje y.

También podemos ver que la dispersión es más amplia en el eje y que en el eje x.