팬더 - 플로팅



플로팅

Pandas는 이 plot()방법을 사용하여 다이어그램을 만듭니다.

Matplotlib 라이브러리의 하위 모듈인 Pyplot을 사용하여 화면에 다이어그램을 시각화할 수 있습니다.

Matplotlib Tutorial 에서 Matplotlib에 대해 자세히 알아보세요 .

예시

Matplotlib에서 pyplot을 가져오고 DataFrame을 시각화합니다.

import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv('data.csv')

df.plot()

plt.show()

이 페이지의 예에서는 'data.csv'라는 CSV 파일을 사용합니다.

data.csv 다운로드 또는 data.csv 열기


산포도

kind인수 를 사용하여 산점도를 원한다고 지정합니다 .

kind = 'scatter'

산점도에는 x축과 y축이 필요합니다.

아래 예에서는 x축에 "지속시간"을, y축에 "칼로리"를 사용합니다.

다음과 같이 x 및 y 인수를 포함합니다.

x = 'Duration', y = 'Calories'

예시

import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv('data.csv')

df.plot(kind = 'scatter', x = 'Duration', y = 'Calories')

plt.show()

결과

기억하십시오: 이전 예에서 우리는 "지속 시간"과 "칼로리" 사이의 상관 관계가 임을 배웠고 지속 0.922721시간이 길수록 더 많은 칼로리가 소모된다는 사실로 결론을 내렸습니다.

산점도를 보면 동의합니다.

상관 관계가 있는 "Duration" 및 "Maxpulse"와 같은 열 사이에 나쁜 관계가 있는 또 다른 산점도를 생성해 보겠습니다 0.009403.

예시

열 사이에 관계가 없는 산점도:

import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv('data.csv')

df.plot(kind = 'scatter', x = 'Duration', y = 'Maxpulse')

plt.show()

결과


w3schools CERTIFIED . 2021

인증을 받으세요!

Pandas 모듈을 완료하고, 연습을 수행하고, 시험에 응시하면 w3schools 인증을 받게 됩니다!

$10 등록

히스토그램

kind히스토그램을 원하는지 지정 하려면 인수를 사용하십시오 .

kind = 'hist'

히스토그램에는 하나의 열만 필요합니다.

히스토그램은 각 간격의 빈도를 보여줍니다(예: 50분에서 60분 사이에 지속된 운동 횟수는?).

아래 예에서는 "Duration" 열을 사용하여 히스토그램을 생성합니다.

예시

df["Duration"].plot(kind = 'hist')

결과

참고: 히스토그램은 50분에서 60분 사이에 지속된 운동이 100개가 넘는다고 알려줍니다.


연습으로 자신을 테스트하십시오

연습:

DataFrame의 데이터를 다이어그램으로 시각화하기 위한 올바른 구문을 삽입합니다(플로팅).

df.()