팬더 데이터 프레임


데이터프레임이란?

Pandas DataFrame은 2차원 배열 또는 행과 열이 있는 테이블과 같은 2차원 데이터 구조입니다.

예시

간단한 Pandas DataFrame을 만듭니다.

import pandas as pd

data = {
  "calories": [420, 380, 390],
  "duration": [50, 40, 45]
}

#load data into a DataFrame object:
df = pd.DataFrame(data)

print(df) 

결과

     calories  duration
  0       420        50
  1       380        40
  2       390        45


행 찾기

위의 결과에서 알 수 있듯이 DataFrame은 행과 열이 있는 테이블과 같습니다.

팬더는 loc속성을 사용하여 하나 이상의 지정된 행을 반환합니다 .

예시

행 0 반환:

#refer to the row index:
print(df.loc[0])

결과

  calories    420
  duration     50
  Name: 0, dtype: int64

참고: 이 예는 Pandas Series 를 반환합니다 .

예시

행 0 및 1 반환:

#use a list of indexes:
print(df.loc[[0, 1]])

결과

     calories  duration
  0       420        50
  1       380        40

참고: 를 사용할 때 []결과는 Pandas DataFrame 입니다.


w3schools CERTIFIED . 2021

인증을 받으세요!

Pandas 모듈을 완료하고, 연습을 수행하고, 시험에 응시하면 w3schools 인증을 받게 됩니다!

$10 등록

명명된 인덱스

index인수를 사용하여 고유한 인덱스의 이름을 지정할 수 있습니다 .

예시

이름 목록을 추가하여 각 행에 이름을 지정합니다.

import pandas as pd

data = {
  "calories": [420, 380, 390],
  "duration": [50, 40, 45]
}

df = pd.DataFrame(data, index = ["day1", "day2", "day3"])

print(df) 

결과

        calories  duration
  day1       420        50
  day2       380        40
  day3       390        45

명명된 인덱스 찾기

속성 에서 명명된 인덱스를 사용하여 loc지정된 행을 반환합니다.

예시

"day2" 반환:

#refer to the named index:
print(df.loc["day2"])

결과

  calories    380
  duration     40
  Name: 0, dtype: int64


DataFrame에 파일 로드

데이터 세트가 파일에 저장된 경우 Pandas는 이를 DataFrame에 로드할 수 있습니다.

예시

쉼표로 구분된 파일(CSV 파일)을 DataFrame에 로드합니다.

import pandas as pd

df = pd.read_csv('data.csv')

print(df) 

다음 장에서 파일 가져오기에 대해 자세히 알아볼 것입니다.


연습으로 자신을 테스트하십시오

연습:

올바른 Pandas 메서드를 삽입하여 DataFrame을 만듭니다.

pd.(data)