데이터 과학 - 통계 입문
통계 소개
통계는 데이터를 분석하는 과학입니다.
예측을 위한 모델을 만들 때 예측의 신뢰성을 평가해야 합니다.
결국, 우리가 그것에 의존할 수 없다면 예측 가치가 무엇입니까?
기술 통계
먼저 몇 가지 기본적인 기술 통계를 다룰 것입니다.
기술 통계는 다음과 같은 데이터 세트의 중요한 기능을 요약합니다.
- 세다
- 합집합
- 표준 편차
- 백분위수
- 평균
- 등..
데이터에 익숙해지는 것이 좋은 출발점입니다.
Python의 함수를 사용 describe()
하여 데이터를 요약할 수 있습니다.
예시
print (full_health_data.describe())
산출:
여기서 흥미로운 점을 발견하셨습니까?