데이터 과학 - 통계 표준 편차
표준 편차
표준 편차는 관측치가 얼마나 퍼져 있는지를 설명하는 숫자입니다.
관측값이 "확산"된 경우 수학 함수는 정확한 값을 예측하는 데 어려움을 겪을 것입니다. 표준 편차는 불확실성의 척도입니다.
낮은 표준 편차는 대부분의 숫자가 평균(평균) 값에 가깝다는 것을 의미합니다.
표준 편차가 높다는 것은 값이 더 넓은 범위에 퍼져 있음을 의미합니다.
표준 편차는 종종 기호 시그마로 표시됩니다. σ
Numpy의 함수를 사용하여 std()
변수의 표준 편차를 찾을 수 있습니다.
예시
import numpy as np
std = np.std(full_health_data)
print(std)
출력:
이 숫자는 무엇을 의미합니까?
변동 계수
변동 계수는 표준 편차가 얼마나 큰지 파악하는 데 사용됩니다.
수학적으로 변동 계수는 다음과 같이 정의됩니다.
Coefficient of Variation = Standard Deviation / Mean
다음 코드로 진행하면 Python에서 이 작업을 수행할 수 있습니다.
예시
import numpy as np
cv = np.std(full_health_data) / np.mean(full_health_data)
print(cv)
출력:
Duration, Calorie_Burnage 및 Hours_Work 변수는 Max_Pulse, Average_Pulse 및 Hours_Sleep에 비해 표준 편차가 높음을 알 수 있습니다.