데이터 과학 - Python DataFrame
Pandas로 DataFrame 만들기
데이터 프레임은 데이터의 구조화된 표현입니다.
가상 숫자가 있는 3개의 열과 5개의 행이 있는 데이터 프레임을 정의해 보겠습니다.
예시
import pandas as pd
d = {'col1': [1, 2, 3, 4, 7], 'col2': [4, 5, 6, 9,
5], 'col3': [7, 8, 12, 1, 11]}
df = pd.DataFrame(data=d)
print(df)
예시 설명
- Pandas 라이브러리를 pd로 가져오기
- d라는 변수의 열과 행으로 데이터 정의
- pd.DataFrame() 함수를 사용하여 데이터 프레임 만들기
- 데이터 프레임에는 3개의 열과 5개의 행이 있습니다.
- print() 함수를 사용하여 데이터 프레임 출력을 인쇄합니다.
우리는 PD를 씁니다 . Pandas 라이브러리에서 DataFrame() 함수를 활성화하고 싶다는 것을 Python에 알리기 위해 DataFrame() 앞에 추가합니다.
DataFrame의 대문자 D와 F에 유의하십시오!
출력 해석
출력은 다음과 같습니다.
"col1", "col2" 및 "col3"이 열 이름임을 알 수 있습니다.
0-4 범위의 수직 숫자에 대해 혼동하지 마십시오. 그들은 우리에게 행의 위치에 대한 정보를 알려줍니다.
Python에서 행 번호는 0부터 시작합니다.
이제 Python을 사용하여 열과 행을 계산할 수 있습니다.
df.shape[1]을 사용하여 열 수를 찾을 수 있습니다.
예시
열 수를 계산합니다.
count_column = df.shape[1]
print(count_column)
df.shape[0]을 사용하여 행 수를 찾을 수 있습니다.
예시
행 수를 계산합니다.
count_row = df.shape[0]
print(count_row)
행과 열을 스스로 셀 수 없는 이유는 무엇입니까?
많은 열과 행이 있는 더 큰 데이터 세트로 작업하는 경우 혼자서 계산하는 것은 혼란스러울 것입니다. 잘못 계산할 위험이 있습니다. Python에서 내장 함수를 올바르게 사용하면 개수가 정확한지 확인할 수 있습니다.