Distribución Zipf
Las distribuciones de Zipf se utilizan para muestrear datos según la ley de zipf.
Ley de Zipf: En una colección el n-ésimo término común es 1/n veces el término más común. Por ejemplo, la quinta palabra común en inglés aparece casi 1/5 de la palabra más utilizada.
Tiene dos parámetros:
a
- parámetro de distribución.
size
- La forma de la matriz devuelta.
Ejemplo
Extraiga una muestra para la distribución zipf con el parámetro de distribución 2 con tamaño 2x3:
from numpy import random
x = random.zipf(a=2, size=(2, 3))
print(x)
Visualización de la Distribución Zipf
Muestra 1000 puntos pero trazando solo aquellos con un valor < 10 para un gráfico más significativo.
Ejemplo
from numpy import random
import matplotlib.pyplot as plt
import seaborn as sns
x = random.zipf(a=2, size=1000)
sns.distplot(x[x<10], kde=False)
plt.show()