팬더 데이터 프레임
데이터프레임이란?
Pandas DataFrame은 2차원 배열 또는 행과 열이 있는 테이블과 같은 2차원 데이터 구조입니다.
예시
간단한 Pandas DataFrame을 만듭니다.
import pandas as pd
data = {
"calories": [420, 380, 390],
"duration":
[50, 40, 45]
}
#load data into a DataFrame object:
df = pd.DataFrame(data)
print(df)
결과
calories duration 0 420 50 1 380 40 2 390 45
행 찾기
위의 결과에서 알 수 있듯이 DataFrame은 행과 열이 있는 테이블과 같습니다.
팬더는 loc
속성을 사용하여 하나 이상의 지정된 행을 반환합니다 .
예시
행 0 반환:
#refer to the row index:
print(df.loc[0])
결과
calories 420 duration 50 Name: 0, dtype: int64
참고: 이 예는 Pandas Series 를 반환합니다 .
예시
행 0 및 1 반환:
#use a list of indexes:
print(df.loc[[0, 1]])
결과
calories duration 0 420 50 1 380 40
참고: 를 사용할 때 []
결과는 Pandas DataFrame 입니다.
명명된 인덱스
index
인수를 사용하여 고유한 인덱스의 이름을 지정할 수 있습니다 .
예시
이름 목록을 추가하여 각 행에 이름을 지정합니다.
import pandas as pd
data = {
"calories": [420, 380, 390],
"duration":
[50, 40, 45]
}
df = pd.DataFrame(data, index = ["day1", "day2",
"day3"])
print(df)
결과
calories duration day1 420 50 day2 380 40 day3 390 45
명명된 인덱스 찾기
속성 에서 명명된 인덱스를 사용하여 loc
지정된 행을 반환합니다.
예시
"day2" 반환:
#refer to the named index:
print(df.loc["day2"])
결과
calories 380 duration 40 Name: 0, dtype: int64
DataFrame에 파일 로드
데이터 세트가 파일에 저장된 경우 Pandas는 이를 DataFrame에 로드할 수 있습니다.
예시
쉼표로 구분된 파일(CSV 파일)을 DataFrame에 로드합니다.
import pandas as pd
df = pd.read_csv('data.csv')
print(df)
다음 장에서 파일 가져오기에 대해 자세히 알아볼 것입니다.