데이터 과학 - 데이터란?


데이터란 무엇입니까?

데이터는 정보의 모음입니다.

데이터 과학의 한 가지 목적은 데이터를 구조화하여 해석 가능하고 작업하기 쉽게 만드는 것입니다.

데이터는 두 그룹으로 분류할 수 있습니다.

  • 구조화된 데이터
  • 비정형 데이터

비정형 데이터

비정형 데이터는 정리되지 않습니다. 분석 목적으로 데이터를 구성해야 합니다.

비정형 데이터

비정형 데이터


구조화된 데이터

구조화된 데이터는 조직화되어 작업하기 쉽습니다.

구조화된 데이터


데이터를 구조화하는 방법?

배열이나 데이터베이스 테이블을 사용하여 데이터를 구조화하거나 표시할 수 있습니다.

배열의 예:

[80, 85, 90, 95, 100, 105, 110, 115, 120, 125]

다음 예제에서는 Python에서 배열을 만드는 방법을 보여줍니다.

예시

Array = [80, 85, 90, 95, 100, 105, 110, 115, 120, 125]
print(Array)

데이터 과학에서는 매우 큰 데이터 세트로 작업하는 것이 일반적입니다.

이 튜토리얼에서는 데이터 과학의 개념을 가능한 한 쉽게 이해할 수 있도록 노력할 것입니다. 따라서 우리는 해석하기 쉬운 작은 데이터 세트로 작업할 것입니다.