Computer >> 컴퓨터 >  >> 프로그램 작성 >> Python

Python - 중복 없이 Pandas DataFrame 연결

<시간/>

DataFrame을 연결하려면 concat() 메서드를 사용하고 중복을 무시하려면 drop_duplicates() 메서드를 사용하세요.

필요한 라이브러리 가져오기 -

import pandas as pd

연결할 DataFrame 생성 -

# Create DataFrame1
dataFrame1 = pd.DataFrame(
   {
      "Car": ['BMW', 'Jaguar', 'Audi', 'Mustang'],"Units": [100, 150, 110, 80]
   }
)

# Create DataFrame2
dataFrame2 = pd.DataFrame(
   {
      "Car": ['Tesla', 'Jaguar', 'Mercedes', 'Mustang'],"Units": [120, 150, 180, 80]

   }
)

생성

이제 DataFrame을 연결하고 중복을 제거하겠습니다 -

concatRes = pd.concat([dataFrame1, dataFrame2]).drop_duplicates()

예시

다음은 코드입니다 -

import pandas as pd

# Create DataFrame1
dataFrame1 = pd.DataFrame(
   {
      "Car": ['BMW', 'Jaguar', 'Audi', 'Mustang'],"Units": [100, 150, 110, 80]
   }
)

print"DataFrame1 ...\n",dataFrame1

# Create DataFrame2
dataFrame2 = pd.DataFrame(
   {
      "Car": ['Tesla', 'Jaguar', 'Mercedes', 'Mustang'],"Units": [120, 150, 180, 80]

   }
)

print"\nDataFrame2 ...\n",dataFrame2

# concat DataFrames and remove duplicates
concatRes = pd.concat([dataFrame1, dataFrame2]).drop_duplicates()
print"\nConcatenating DataFrame without duplicates...\n", concatRes

출력

이것은 다음과 같은 출력을 생성합니다 -

DataFrame1 ...
       Car   Units
0      BMW     100
1   Jaguar     150
2     Audi     110
3  Mustang      80

DataFrame2 ...
        Car   Units
0     Tesla     120
1    Jaguar     150
2  Mercedes     180
3   Mustang      80

Concatenating DataFrame without duplicates...
        Car   Units
0       BMW     100
1    Jaguar     150
2      Audi     110
3   Mustang      80
0     Tesla     120
2  Mercedes     180