데이터 과학 - 선형 함수 플로팅
스포츠 시계 데이터 세트
건강 데이터 세트를 살펴보십시오.
지속 | Average_Pulse | Max_Pulse | 칼로리_소모 | 근무시간_근무 | 시간_수면 |
---|---|---|---|---|---|
30 | 80 | 120 | 240 | 10 | 7 |
30 | 85 | 120 | 250 | 10 | 7 |
45 | 90 | 130 | 260 | 8 | 7 |
45 | 95 | 130 | 270 | 8 | 7 |
45 | 100 | 140 | 280 | 0 | 7 |
60 | 105 | 140 | 290 | 7 | 8 |
60 | 110 | 145 | 300 | 7 | 8 |
60 | 115 | 145 | 310 | 8 | 8 |
75 | 120 | 150 | 320 | 0 | 8 |
75 | 125 | 150 | 330 | 8 | 8 |
Python에서 기존 데이터 플로팅
이제 matplotlib 라이브러리를 사용하여 Calorie_Burnage에 대한 Average_Pulse의 값을 먼저 플롯할 수 있습니다.
이 plot()
함수는 점 x,y의 2D 육각형 비닝 플롯을 만드는 데 사용됩니다.
예시
import matplotlib.pyplot as plt
health_data.plot(x ='Average_Pulse',
y='Calorie_Burnage', kind='line'),
plt.ylim(ymin=0)
plt.xlim(xmin=0)
plt.show()
예시 설명
- matplotlib 라이브러리의 pyplot 모듈 가져오기
- Calorie_Burnage에 대해 Average_Pulse의 데이터를 플로팅합니다.
kind='line'
우리가 원하는 플롯 유형을 알려줍니다. 여기서 우리는 직선을 원합니다.- plt.ylim() 및 plt.xlim()은 축을 시작하려는 값을 알려줍니다. 여기서 우리는 축이 0에서 시작하기를 원합니다.
- plt.show()는 출력을 보여줍니다.
위의 코드는 다음과 같은 결과를 생성합니다.
그래프 출력
우리가 볼 수 있듯이 Average_Pulse와 Calorie_Burnage 사이에는 관계가 있습니다. Calorie_Burnage는 Average_Pulse에 비례하여 증가합니다. 즉, Average_Pulse를 사용하여 Calorie_Burnage를 예측할 수 있습니다.
선이 y축까지 완전히 그려지지 않은 이유는 무엇입니까?
그 이유는 Average_Pulse 또는 Calorie_Burnage가 0인 관측치가 없기 때문입니다. 80은 Average_Pulse의 첫 번째 관찰이고 240은 Calorie_Burnage의 첫 번째 관찰입니다.
라인을 보세요. 평균 맥박이 80에서 90으로 증가하면 칼로리 소모는 어떻게 됩니까?
대각선을 사용하여 칼로리 소모량을 예측하는 수학 함수를 찾을 수 있습니다.
결과:
- 평균 맥박이 80이면 칼로리 소모량은 240입니다.
- 평균 맥박이 90이면 칼로리 소모량은 260입니다.
- 평균 맥박이 100이면 칼로리 소모량은 280입니다.
패턴이 있습니다. 평균 맥박이 10 증가하면 칼로리 소모량이 20 증가합니다.