데이터 과학 - 통계 입문


통계 소개

통계는 데이터를 분석하는 과학입니다.

예측을 위한 모델을 만들 때 예측의 신뢰성을 평가해야 합니다.

결국, 우리가 그것에 의존할 수 없다면 예측 가치가 무엇입니까?


기술 통계

먼저 몇 가지 기본적인 기술 통계를 다룰 것입니다.

기술 통계는 다음과 같은 데이터 세트의 중요한 기능을 요약합니다.

  • 세다
  • 합집합
  • 표준 편차
  • 백분위수
  • 평균
  • 등..

데이터에 익숙해지는 것이 좋은 출발점입니다.

Python의 함수를 사용 describe()하여 데이터를 요약할 수 있습니다.

예시

print (full_health_data.describe())

산출:

통계 설명

여기서 흥미로운 점을 발견하셨습니까?