Distribución Zipf


Las distribuciones de Zipf se utilizan para muestrear datos según la ley de zipf.

Ley de Zipf: En una colección el n-ésimo término común es 1/n veces el término más común. Por ejemplo, la quinta palabra común en inglés aparece casi 1/5 de la palabra más utilizada.

Tiene dos parámetros:

a - parámetro de distribución.

size - La forma de la matriz devuelta.

Ejemplo

Extraiga una muestra para la distribución zipf con el parámetro de distribución 2 con tamaño 2x3:

from numpy import random

x = random.zipf(a=2, size=(2, 3))

print(x)

Visualización de la Distribución Zipf

Muestra 1000 puntos pero trazando solo aquellos con un valor < 10 para un gráfico más significativo.

Ejemplo

from numpy import random
import matplotlib.pyplot as plt
import seaborn as sns

x = random.zipf(a=2, size=1000)
sns.distplot(x[x<10], kde=False)

plt.show()

Resultado