데이터 프레임이 있고 첫 번째 중복 행을 제거한 결과가 다음과 같다고 가정합니다.
Id Age 0 1 12 3 4 13 4 5 14 5 6 12 6 2 13 7 7 16 8 3 14 9 9 15 10 10 14
해결책
이 문제를 해결하기 위해 다음 단계를 따릅니다. -
-
데이터 프레임 정의
-
Id, Age 컬럼 내부에 drop_duplicates 기능을 적용한 후 Keep 초기값을 'last'로 지정합니다.
df.drop_duplicates(subset=['Id','Age'],keep='last')
-
결과를 동일한 데이터 프레임에 저장하고 인쇄하십시오.
예
더 나은 이해를 위해 아래 구현을 살펴보겠습니다. −
import pandas as pd df = pd.DataFrame({'Id':[1,2,3,4,5,6,2,7,3,9,10], 'Age':[12,13,14,13,14,12,13,16,14,15,14] }) print("DataFrame is:\n",df) df = df.drop_duplicates(subset=['Id','Age'],keep='last') print("Dataframe after removing first duplicate rows:\n", df)
출력
DataFrame is: Id Age 0 1 12 1 2 13 2 3 14 3 4 13 4 5 14 5 6 12 6 2 13 7 7 16 8 3 14 9 9 15 10 10 14 Dataframe after removing first duplicate rows: Id Age 0 1 12 3 4 13 4 5 14 5 6 12 6 2 13 7 7 16 8 3 14 9 9 15 10 10 14