데이터 과학 - 통계 표준 편차

표준 편차

표준 편차는 관측치가 얼마나 퍼져 있는지를 설명하는 숫자입니다.

관측값이 "확산"된 경우 수학 함수는 정확한 값을 예측하는 데 어려움을 겪을 것입니다. 표준 편차는 불확실성의 척도입니다.

낮은 표준 편차는 대부분의 숫자가 평균(평균) 값에 가깝다는 것을 의미합니다.

표준 편차가 높다는 것은 값이 더 넓은 범위에 퍼져 있음을 의미합니다.

표준 편차는 종종 기호 시그마로 표시됩니다. σ

Numpy의 함수를 사용하여 std()변수의 표준 편차를 찾을 수 있습니다.

import numpy as np

std = np.std(full_health_data)
print(std)

출력:

이 숫자는 무엇을 의미합니까?

변동 계수는 표준 편차가 얼마나 큰지 파악하는 데 사용됩니다.

수학적으로 변동 계수는 다음과 같이 정의됩니다.

Coefficient of Variation = Standard Deviation / Mean

다음 코드로 진행하면 Python에서 이 작업을 수행할 수 있습니다.

import numpy as np

cv = np.std(full_health_data) / np.mean(full_health_data)
print(cv)

출력:

Duration, Calorie_Burnage 및 Hours_Work 변수는 Max_Pulse, Average_Pulse 및 Hours_Sleep에 비해 표준 편차가 높음을 알 수 있습니다.