데이터 과학 소개


데이터 과학은 통계, 데이터 분석 및 기계 학습을 사용하여 데이터를 분석하고 지식과 통찰력을 추출하는 여러 분야의 조합입니다.


데이터 과학이란 무엇입니까?

데이터 과학은 데이터 수집, 분석 및 의사 결정에 관한 것입니다.

데이터 과학은 분석을 통해 데이터의 패턴을 찾고 미래를 예측하는 것입니다.

기업은 데이터 과학을 사용하여 다음을 수행할 수 있습니다.

  • 더 나은 결정(A 또는 B를 선택해야 함)
  • 예측 분석(다음에는 어떻게 될까요?)
  • 패턴 발견(패턴 또는 데이터에서 숨겨진 정보 찾기)

데이터 과학은 어디에 필요한가요?

데이터 과학은 오늘날 은행, 컨설팅, 의료 및 제조와 같은 전 세계의 많은 산업에서 사용됩니다.

데이터 과학이 필요한 곳의 예:

  • 항로 계획을 위해: 최적의 선박 항로를 찾기 위해
  • 항공편/선박/열차 등의 지연을 예측하기 위해(예측 분석을 통해)
  • 판촉 제안을 생성하려면
  • 상품 배송에 가장 적합한 시간을 찾기 위해
  • 회사의 다음 해 수익을 예측하려면
  • 훈련의 건강상의 이점을 분석하려면
  • 선거에서 누가 이길지 예측하려면

데이터 과학은 데이터를 사용할 수 있는 비즈니스의 거의 모든 부분에 적용될 수 있습니다. 예는 다음과 같습니다.

  • 소비재
  • 주식 시장
  • 산업
  • 정치
  • 물류 회사
  • 전자상거래

데이터 과학자는 어떻게 작동합니까?

데이터 과학자는 여러 배경에 대한 전문 지식이 필요합니다.

  • 기계 학습
  • 통계
  • 프로그래밍(Python 또는 R)
  • 수학
  • 데이터베이스

데이터 과학자는 데이터 내에서 패턴을 찾아야 합니다. 패턴을 찾기 전에 데이터를 표준 형식으로 구성해야 합니다.

데이터 과학자의 작동 방식은 다음과 같습니다.

  1. 올바른 질문 을 하십시오 - 비즈니스 문제를 이해하기 위해.
  2. 데이터 탐색 및 수집 - 데이터베이스, 웹 로그, 고객 피드백 등
  3. 데이터 추출 - 데이터를 표준화된 형식으로 변환합니다.
  4. 데이터 정리 - 데이터에서 잘못된 값을 제거합니다.
  5. 누락된 값 찾기 및 바꾸기 - 누락된 값을 확인하고 적절한 값(예: 평균 값)으로 바꿉니다.
  6. 데이터 정규화 - 실제 범위의 값을 조정합니다(예: 140cm는 1,8m보다 작습니다. 그러나 숫자 140은 1,8보다 큽니다. - 따라서 크기 조정이 중요합니다).
  7. 데이터를 분석하고 패턴을 찾고 미래를 예측 합니다.
  8. 결과 표현 - "회사"가 이해할 수 있는 유용한 인사이트로 결과를 제시합니다.

어디서 시작하나요?

이 자습서에서는 데이터가 무엇이며 데이터를 분석할 수 있는 방법을 제시하는 것으로 시작합니다.

통계 및 수학 함수를 사용하여 예측하는 방법을 배웁니다.