Computer >> 컴퓨터 >  >> 프로그램 작성 >> Python

Python Pandas – 하위 집합을 만들고 중복 값에서 마지막 항목만 표시합니다.

<시간/>

하위 집합을 만들고 중복 값의 마지막 항목만 표시하려면 "유지 ' 매개변수가 '마지막 drop_duplicates() 메소드의 "값. drop_duplicates() 메서드가 중복을 제거했습니다.

먼저 3개의 열이 있는 DataFrame을 생성하겠습니다 -

dataFrame = pd.DataFrame({'Car': ['BMW', 'Mercedes', 'Lamborghini', 'BMW', 'Mercedes', 'Porsche'],'Place': ['Delhi', 'Hyderabad', 'Chandigarh', 'Delhi', 'Hyderabad', 'Mumbai'],'UnitsSold': [85, 70, 80, 95, 55, 90]})

중복 제거 및 마지막 항목 표시. keep 매개변수를 사용하여 "last"를 설정했습니다. 마지막 항목을 제외한 중복 행이 삭제됩니다. 우리는 "subset" 매개변수를 사용하여 부분 집합을 고려했습니다 -

dataFrame2 = dataFrame.drop_duplicates(subset = ['Car', 'Place'], keep ='last').reset_index(drop = True)

다음은 코드입니다 -

import pandas as pd

# Create DataFrame
dataFrame = pd.DataFrame({'Car': ['BMW', 'Mercedes', 'Lamborghini', 'BMW', 'Mercedes', 'Porsche'],'Place': ['Delhi', 'Hyderabad', 'Chandigarh', 'Delhi', 'Hyderabad', 'Mumbai'],'UnitsSold': [85, 70, 80, 95, 55, 90]})

print"Dataframe...\n", dataFrame

# removing duplicates and displaying last entry
# using keep parameter, we have set "last"
# duplicate rows except the last entry will get deleted
# considered a subset using the subset parameter
dataFrame2 = dataFrame.drop_duplicates(subset = ['Car', 'Place'], keep ='last').reset_index(drop = True)
print"\nUpdated DataFrame after removing duplicates...\n",dataFrame2

출력

이것은 다음과 같은 출력을 생성합니다 -

Dataframe...
           Car       Place   UnitsSold
0          BMW       Delhi          85
1     Mercedes   Hyderabad          70
2  Lamborghini  Chandigarh          80
3          BMW       Delhi          95
4     Mercedes   Hyderabad          55
5      Porsche      Mumbai          90

Updated DataFrame after removing duplicates...
           Car       Place   UnitsSold
0  Lamborghini  Chandigarh          80
1          BMW       Delhi          95
2     Mercedes   Hyderabad          55
3      Porsche      Mumbai          90