파이썬 튜토리얼

파이썬 홈 파이썬 소개 파이썬 시작하기 파이썬 구문 파이썬 주석 파이썬 변수 파이썬 데이터 유형 파이썬 숫자 파이썬 캐스팅 파이썬 문자열 파이썬 부울 파이썬 연산자 파이썬 목록 파이썬 튜플 파이썬 세트 파이썬 사전 파이썬 If...Else 파이썬 while 루프 Python For 루프 파이썬 함수 파이썬 람다 파이썬 배열 파이썬 클래스/객체 파이썬 상속 파이썬 반복자 파이썬 범위 파이썬 모듈 파이썬 날짜 파이썬 수학 파이썬 JSON 파이썬 정규식 파이썬 PIP 파이썬 시도...제외 파이썬 사용자 입력 파이썬 문자열 포맷

파일 처리

파이썬 파일 처리 파이썬 읽기 파일 Python 파일 작성/작성 파이썬 파일 삭제

파이썬 모듈

넘파이 튜토리얼 팬더 연습 사이피 튜토리얼

파이썬 Matplotlib

Matplotlib 소개 Matplotlib 시작하기 Matplotlib 파이플로트 Matplotlib 플로팅 Matplotlib 마커 Matplotlib 라인 Matplotlib 레이블 Matplotlib 그리드 Matplotlib 서브플롯 Matplotlib 분산 Matplotlib 바 Matplotlib 히스토그램 Matplotlib 파이 차트

기계 학습

시작하기 평균 중앙값 모드 표준 편차 백분위수 데이터 배포 정규 데이터 분포 산포도 선형 회귀 다항식 회귀 다중 회귀 규모 훈련/시험 의사결정나무

파이썬 MySQL

MySQL 시작하기 MySQL 데이터베이스 생성 MySQL 테이블 생성 MySQL 삽입 MySQL 선택 MySQL 어디 MySQL 주문 기준 MySQL 삭제 MySQL 삭제 테이블 MySQL 업데이트 MySQL 제한 MySQL 조인

파이썬 몽고DB

몽고DB 시작하기 MongoDB 데이터베이스 생성 MongoDB 컬렉션 생성 몽고DB 삽입 몽고DB 찾기 몽고DB 쿼리 몽고DB 정렬 몽고DB 삭제 MongoDB 드롭 컬렉션 몽고DB 업데이트 몽고DB 제한

파이썬 참조

파이썬 개요 파이썬 내장 함수 파이썬 문자열 메서드 파이썬 목록 메서드 파이썬 사전 메서드 파이썬 튜플 메서드 파이썬 세트 메소드 파이썬 파일 메서드 파이썬 키워드 파이썬 예외 파이썬 용어집

모듈 참조

랜덤 모듈 요청 모듈 통계 모듈 수학 모듈 cMath 모듈

파이썬 방법

목록 중복 제거 문자열 반전 두 개의 숫자 더하기

파이썬 예제

파이썬 예제 파이썬 컴파일러 파이썬 연습 파이썬 퀴즈 파이썬 인증서

기계 학습

머신 러닝은 컴퓨터가 데이터와 통계 연구를 통해 학습하도록 하는 것입니다.

머신 러닝은 인공 지능(AI) 방향으로 나아가는 단계입니다.

머신 러닝은 데이터를 분석하고 결과를 예측하는 방법을 학습하는 프로그램입니다.

어디서 시작하나요?

이 튜토리얼에서는 수학으로 돌아가 통계를 연구하고 데이터 세트를 기반으로 중요한 숫자를 계산하는 방법을 알아보겠습니다.

또한 다양한 Python 모듈을 사용하여 필요한 답변을 얻는 방법을 배우게 됩니다.

그리고 학습한 내용을 바탕으로 결과를 예측할 수 있는 함수를 만드는 방법을 배우게 됩니다.


데이터 세트

컴퓨터의 마음에서 데이터 세트는 모든 데이터 모음입니다. 어레이에서 완전한 데이터베이스에 이르기까지 무엇이든 될 수 있습니다.

배열의 예:

[99,86,87,88,111,86,103,87,94,78,77,85,86]

데이터베이스의 예:

카르나메색상나이속도오토패스
BMW빨간색599와이
볼보검은 색786와이
폭스바겐회색887N
폭스바겐하얀색788와이
포드하얀색2111와이
폭스바겐하얀색1786와이
테슬라빨간색2103와이
BMW검은 색987와이
볼보회색494N
포드하얀색1178N
도요타회색1277N
폭스바겐하얀색985N
도요타푸른686와이

배열을 보면 평균값이 대략 80이나 90일 것이라고 추측할 수 있고 가장 높은 값과 가장 낮은 값도 결정할 수 있지만 그 외에 무엇을 할 수 있습니까?

그리고 데이터베이스를 보면 가장 인기 있는 색상은 흰색이고 가장 오래된 차는 17년인데, 다른 값만 보고 AutoPass가 있는 자동차인지 예측할 수 있다면 어떨까요?

그것이 바로 머신 러닝의 목적입니다! 데이터 분석과 결과 예측!

머신 러닝에서는 매우 큰 데이터 세트로 작업하는 것이 일반적입니다. 이 튜토리얼에서 우리는 기계 학습의 다양한 개념을 가능한 한 쉽게 이해하려고 노력할 것이며 이해하기 쉬운 작은 데이터 세트로 작업할 것입니다.


데이터 유형

데이터를 분석하려면 우리가 다루고 있는 데이터의 유형을 아는 것이 중요합니다.

데이터 유형을 세 가지 주요 범주로 나눌 수 있습니다.

  • 수치
  • 범주형
  • 서수

숫자 데이터는 숫자이며 두 가지 숫자 범주로 나눌 수 있습니다.

  • 이산 데이터
    - 정수로 제한되는 숫자입니다. 예: 지나가는 자동차의 수.
  • 연속 데이터
    - 값이 무한한 숫자입니다. 예: 품목의 가격 또는 품목의 크기

범주형 데이터는 서로 비교할 수 없는 값입니다. 예: 색상 값 또는 예/아니오 값.

순서 형 데이터는 범주형 데이터와 비슷하지만 서로 비교하여 측정할 수 있습니다. 예: A가 B보다 우수한 학교 성적 등.

데이터 소스의 데이터 유형을 알면 데이터를 분석할 때 어떤 기술을 사용해야 하는지 알 수 있습니다.

다음 장에서 통계 및 데이터 분석에 대해 자세히 알아볼 것입니다.