데이터 과학 - Python DataFrame


Pandas로 DataFrame 만들기

데이터 프레임은 데이터의 구조화된 표현입니다.

가상 숫자가 있는 3개의 열과 5개의 행이 있는 데이터 프레임을 정의해 보겠습니다.

예시

import pandas as pd

d = {'col1': [1, 2, 3, 4, 7], 'col2': [4, 5, 6, 9, 5], 'col3': [7, 8, 12, 1, 11]}

df = pd.DataFrame(data=d)

print(df)

예시 설명

  • Pandas 라이브러리를 pd로 가져오기
  • d라는 변수의 열과 행으로 데이터 정의
  • pd.DataFrame() 함수를 사용하여 데이터 프레임 만들기
  • 데이터 프레임에는 3개의 열과 5개의 행이 있습니다.
  • print() 함수를 사용하여 데이터 프레임 출력을 인쇄합니다.

우리는 PD를 씁니다 . Pandas 라이브러리에서 DataFrame() 함수를 활성화하고 싶다는 것을 Python에 알리기 위해 DataFrame() 앞에 추가합니다.

DataFrame의 대문자 D와 F에 유의하십시오!


출력 해석

출력은 다음과 같습니다.

데이터 프레임 출력

"col1", "col2" 및 "col3"이 열 이름임을 알 수 있습니다.

0-4 범위의 수직 숫자에 대해 혼동하지 마십시오. 그들은 우리에게 행의 위치에 대한 정보를 알려줍니다.

Python에서 행 번호는 0부터 시작합니다.

이제 Python을 사용하여 열과 행을 계산할 수 있습니다.

df.shape[1]을 사용하여 열 수를 찾을 수 있습니다.

예시

열 수를 계산합니다.

count_column = df.shape[1]
print(count_column)

df.shape[0]을 사용하여 행 수를 찾을 수 있습니다.

예시

행 수를 계산합니다.

count_row = df.shape[0]
print(count_row)

행과 열을 스스로 셀 수 없는 이유는 무엇입니까?

많은 열과 행이 있는 더 큰 데이터 세트로 작업하는 경우 혼자서 계산하는 것은 혼란스러울 것입니다. 잘못 계산할 위험이 있습니다. Python에서 내장 함수를 올바르게 사용하면 개수가 정확한지 확인할 수 있습니다.