팬더 - 중복 제거


중복 검색

중복 행은 두 번 이상 등록된 행입니다.

      Duration          Date  Pulse  Maxpulse  Calories
  0         60  '2020/12/01'    110       130     409.1
  1         60  '2020/12/02'    117       145     479.0
  2         60  '2020/12/03'    103       135     340.0
  3         45  '2020/12/04'    109       175     282.4
  4         45  '2020/12/05'    117       148     406.0
  5         60  '2020/12/06'    102       127     300.0
  6         60  '2020/12/07'    110       136     374.0
  7        450  '2020/12/08'    104       134     253.3
  8         30  '2020/12/09'    109       133     195.1
  9         60  '2020/12/10'     98       124     269.0
  10        60  '2020/12/11'    103       147     329.3
  11        60  '2020/12/12'    100       120     250.7
  12        60  '2020/12/12'    100       120     250.7
  13        60  '2020/12/13'    106       128     345.3
  14        60  '2020/12/14'    104       132     379.3
  15        60  '2020/12/15'     98       123     275.0
  16        60  '2020/12/16'     98       120     215.2
  17        60  '2020/12/17'    100       120     300.0
  18        45  '2020/12/18'     90       112       NaN
  19        60  '2020/12/19'    103       123     323.0
  20        45  '2020/12/20'     97       125     243.0
  21        60  '2020/12/21'    108       131     364.2
  22        45           NaN    100       119     282.0
  23        60  '2020/12/23'    130       101     300.0
  24        45  '2020/12/24'    105       132     246.0
  25        60  '2020/12/25'    102       126     334.5
  26        60      20201226    100       120     250.0
  27        60  '2020/12/27'     92       118     241.0
  28        60  '2020/12/28'    103       132       NaN
  29        60  '2020/12/29'    100       132     280.0
  30        60  '2020/12/30'    102       129     380.3
  31        60  '2020/12/31'     92       115     243.0

테스트 데이터 세트를 살펴보면 11행과 12행이 중복된다고 가정할 수 있습니다.

중복을 찾기 위해 이 duplicated()방법을 사용할 수 있습니다.

duplicated()메서드는 각 행에 대한 부울 값을 반환합니다.

예시

True중복된 모든 행에 대해 반환 합니다. 그렇지 않으면 다음을 반환합니다 False.

print(df.duplicated())

w3schools CERTIFIED . 2021

인증을 받으세요!

Pandas 모듈을 완료하고, 연습을 수행하고, 시험에 응시하면 w3schools 인증을 받게 됩니다!

$10 등록

중복 제거

중복을 제거하려면 이 drop_duplicates()방법을 사용하십시오.

예시

모든 중복 제거:

df.drop_duplicates(inplace = True)

기억하십시오:(inplace = True) 메서드는 DataFrame 을 반환하지 않지만 원본 DataFrame 에서 모든 중복을 제거합니다 .


연습으로 자신을 테스트하십시오

연습:

빈 셀이 있는 행을 제거하기 위한 올바른 구문을 삽입하십시오.

df.()