데이터 과학 기능


이 장에서는 데이터 과학으로 작업할 때 일반적으로 사용되는 세 가지 함수인 max(), min() 및 mean()을 보여줍니다.


스포츠 시계 데이터 세트

지속 Average_Pulse Max_Pulse 칼로리_소모 근무시간_근무 시간_수면
30 80 120 240 10 7
30 85 120 250 10 7
45 90 130 260 8 7
45 95 130 270 8 7
45 100 140 280 0 7
60 105 140 290 7 8
60 110 145 300 7 8
60 115 145 310 8 8
75 120 150 320 0 8
75 125 150 330 8 8

위의 데이터 세트는 각각 10개의 관측값이 있는 6개의 변수로 구성됩니다.

  • 기간 - 교육 세션이 몇 분 동안 지속되었습니까?
  • Average_Pulse - 교육 세션의 평균 맥박은 얼마입니까? 이것은 분당 비트 수로 측정됩니다.
  • Max_Pulse - 교육 세션의 최대 펄스는 얼마였습니까?
  • Calorie_Burnage - 훈련 세션에서 소모된 칼로리는 얼마입니까?
  • Hours_Work - 교육 세션 전에 직장에서 몇 시간 일했습니까?
  • Hours_Sleep - 훈련 세션 전날 밤에 얼마나 잤습니까?

파이썬은 공백을 구분 기호로 읽을 수 없기 때문에 밑줄(_)을 사용하여 문자열을 구분합니다.



max() 함수

Python max()함수는 배열에서 가장 높은 값을 찾는 데 사용됩니다.

예시

Average_pulse_max = max(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)

print (Average_pulse_max)

min() 함수

Python min()함수는 배열에서 가장 낮은 값을 찾는 데 사용됩니다.

예시

Average_pulse_min = min(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)

print (Average_pulse_min)

평균() 함수

NumPy mean()함수는 배열의 평균값을 찾는 데 사용됩니다.

예시

import numpy as np

Calorie_burnage = [240, 250, 260, 270, 280, 290, 300, 310, 320, 330]

Average_calorie_burnage = np.mean(Calorie_burnage)

print(Average_calorie_burnage)

우리는 np 를 씁니다 . Numpy 라이브러리 에서 mean 함수 를 활성화하고 싶다는 것을 Python에 알리기 위해 mean 앞에 있습니다.