기계 학습 - 정규 데이터 분포

정규 데이터 분포

이전 장에서 우리는 주어진 크기와 주어진 두 값 사이에서 완전히 무작위 배열을 만드는 방법을 배웠습니다.

이 장에서는 주어진 값 주위에 값이 집중되는 배열을 만드는 방법을 배웁니다.

확률 이론에서 이러한 종류의 데이터 분포는 이 데이터 분포의 공식을 고안한 수학자 Carl Friedrich Gauss의 이름을 따서 정규 데이터 분포 또는 가우스 데이터 분포 로 알려져 있습니다 .

일반적인 정규 데이터 분포:

import numpy
import matplotlib.pyplot as plt

x = numpy.random.normal(5.0, 1.0, 100000)

plt.hist(x, 100)
plt.show()

참고: 정규 분포 그래프는 종 모양의 특징적인 모양 때문에 종 모양 곡선 이라고도 합니다 .

100000개의 값 이 있는 메서드의 배열을 사용하여 numpy.random.normal() 100개의 막대가 있는 히스토그램을 그립니다.

평균 값이 5.0이고 표준 편차가 1.0이라고 지정합니다.

이는 값이 5.0 주위에 집중되어야 하고 평균에서 1.0보다 더 멀리 떨어져 있는 경우가 거의 없음을 의미합니다.

그리고 히스토그램에서 볼 수 있듯이 대부분의 값은 4.0에서 6.0 사이이며 상단은 약 5.0입니다.