zipf 배포
zipf 분포는 zipf의 법칙에 따라 데이터를 샘플링하는 데 사용됩니다.
Zipf의 법칙: 컬렉션에서 n번째 공통 용어는 가장 일반적인 용어의 1/n배입니다. 예를 들어 영어에서 5번째 일반적인 단어는 가장 많이 사용되는 단어의 1/5에 가까운 빈도로 발생합니다.
두 개의 매개변수가 있습니다.
a
- 분포 매개변수.
size
- 반환된 배열의 모양입니다.
예시
크기가 2x3인 분포 매개변수 2를 사용하여 zipf 분포에 대한 샘플을 그립니다.
from numpy import random
x = random.zipf(a=2, size=(2, 3))
print(x)
Zipf 분포의 시각화
1000개의 포인트를 샘플링하지만 보다 의미 있는 차트를 위해 값이 10 미만인 포인트만 플로팅합니다.
예시
from numpy import random
import matplotlib.pyplot as plt
import seaborn as sns
x = random.zipf(a=2, size=1000)
sns.distplot(x[x<10], kde=False)
plt.show()