zipf 배포


zipf 분포는 zipf의 법칙에 따라 데이터를 샘플링하는 데 사용됩니다.

Zipf의 법칙: 컬렉션에서 n번째 공통 용어는 가장 일반적인 용어의 1/n배입니다. 예를 들어 영어에서 5번째 일반적인 단어는 가장 많이 사용되는 단어의 1/5에 가까운 빈도로 발생합니다.

두 개의 매개변수가 있습니다.

a - 분포 매개변수.

size - 반환된 배열의 모양입니다.

예시

크기가 2x3인 분포 매개변수 2를 사용하여 zipf 분포에 대한 샘플을 그립니다.

from numpy import random

x = random.zipf(a=2, size=(2, 3))

print(x)

Zipf 분포의 시각화

1000개의 포인트를 샘플링하지만 보다 의미 있는 차트를 위해 값이 10 미만인 포인트만 플로팅합니다.

예시

from numpy import random
import matplotlib.pyplot as plt
import seaborn as sns

x = random.zipf(a=2, size=1000)
sns.distplot(x[x<10], kde=False)

plt.show()

결과