Computer >> 컴퓨터 >  >> 프로그램 작성 >> Python

주어진 데이터 프레임에서 첫 번째 중복 행을 제거하는 프로그램을 Python으로 작성하십시오.

<시간/>

데이터 프레임이 있고 첫 번째 중복 행을 제거한 결과가 다음과 같다고 가정합니다.

    Id Age
0    1 12
3    4 13
4    5 14
5    6 12
6    2 13
7    7 16
8    3 14
9    9 15
10  10 14

해결책

이 문제를 해결하기 위해 다음 단계를 따릅니다. -

  • 데이터 프레임 정의

  • Id, Age 컬럼 내부에 drop_duplicates 기능을 적용한 후 Keep 초기값을 'last'로 지정합니다.

df.drop_duplicates(subset=['Id','Age'],keep='last')
  • 결과를 동일한 데이터 프레임에 저장하고 인쇄하십시오.

더 나은 이해를 위해 아래 구현을 살펴보겠습니다. −

import pandas as pd
df = pd.DataFrame({'Id':[1,2,3,4,5,6,2,7,3,9,10],
                     'Age':[12,13,14,13,14,12,13,16,14,15,14]
                  })
print("DataFrame is:\n",df)
df = df.drop_duplicates(subset=['Id','Age'],keep='last')
print("Dataframe after removing first duplicate rows:\n", df)

출력

DataFrame is:
    Id    Age
0    1    12
1    2    13
2    3    14
3    4    13
4    5    14
5    6    12
6    2    13
7    7    16
8    3    14
9    9    15
10  10    14
Dataframe after removing first duplicate rows:
    Id Age
0    1 12
3    4 13
4    5 14
5    6 12
6    2 13
7    7 16
8    3 14
9    9 15
10  10 14