중복되지 않은 값만 표시하는 방법을 살펴보겠습니다. 처음에는 중복 값으로 DataFrame을 생성합니다. −
dataFrame = pd.DataFrame( { "Student": ['Jack', 'Robin', 'Ted', 'Robin', 'Scarlett', 'Kat', 'Ted'],"Result": ['Pass', 'Fail', 'Pass', 'Fail', 'Pass', 'Pass', 'Pass'] } )
위에서 2개의 열을 만들었습니다. 중복되지 않은 값만 표시하려면 duplicated() 메서드와 논리적 NOT을 사용합니다. 이를 통해 중복되지 않은 값을 가져옵니다 -
dataFrame[~dataFrame.duplicated('Student')]
예시
다음은 전체 코드입니다 -
import pandas as pd # Create DataFrame dataFrame = pd.DataFrame( { "Student": ['Jack', 'Robin', 'Ted', 'Robin', 'Scarlett', 'Kat', 'Ted'],"Result": ['Pass', 'Fail', 'Pass', 'Fail', 'Pass', 'Pass', 'Pass'] } ) print"DataFrame ...\n",dataFrame # displaying non-duplicates res = dataFrame[~dataFrame.duplicated('Student')] print"\nDataFrame after removing duplicates ...\n",res
출력
이것은 다음과 같은 출력을 생성합니다 -
DataFrame ... Result Student 0 Pass Jack 1 Fail Robin 2 Pass Ted 3 Fail Robin 4 Pass Scarlett 5 Pass Kat 6 Pass Ted DataFrame after removing duplicates ... Result Student 0 Pass Jack 1 Fail Robin 2 Pass Ted 4 Pass Scarlett 5 Pass Kat