Computer >> 컴퓨터 >  >> 프로그램 작성 >> Python

Python – DataFrame에서 중복되지 않은 값만 표시

<시간/>

중복되지 않은 값만 표시하는 방법을 살펴보겠습니다. 처음에는 중복 값으로 DataFrame을 생성합니다. −

dataFrame = pd.DataFrame(
   {
      "Student": ['Jack', 'Robin', 'Ted', 'Robin', 'Scarlett', 'Kat', 'Ted'],"Result": ['Pass', 'Fail', 'Pass', 'Fail', 'Pass', 'Pass', 'Pass']
   }
)

위에서 2개의 열을 만들었습니다. 중복되지 않은 값만 표시하려면 duplicated() 메서드와 논리적 NOT을 사용합니다. 이를 통해 중복되지 않은 값을 가져옵니다 -

dataFrame[~dataFrame.duplicated('Student')]

예시

다음은 전체 코드입니다 -

import pandas as pd

# Create DataFrame
dataFrame = pd.DataFrame(
   {
      "Student": ['Jack', 'Robin', 'Ted', 'Robin', 'Scarlett', 'Kat', 'Ted'],"Result": ['Pass', 'Fail', 'Pass', 'Fail', 'Pass', 'Pass', 'Pass']
   }
)

print"DataFrame ...\n",dataFrame

# displaying non-duplicates
res = dataFrame[~dataFrame.duplicated('Student')]
print"\nDataFrame after removing duplicates ...\n",res

출력

이것은 다음과 같은 출력을 생성합니다 -

DataFrame ...
   Result   Student
0    Pass      Jack
1    Fail     Robin
2    Pass       Ted
3    Fail     Robin
4    Pass  Scarlett
5    Pass       Kat
6    Pass       Ted

DataFrame after removing duplicates ...
   Result   Student
0    Pass      Jack
1    Fail     Robin
2    Pass       Ted
4    Pass  Scarlett
5    Pass       Kat