Computer >> 컴퓨터 >  >> 프로그램 작성 >> Python

Pandas GroupBy – 각 조합의 발생 횟수 계산

<시간/>

열을 그룹화하고 Pandas에서 각 조합의 발생 횟수를 계산하기 위해 DataFrame.groupby()를 size()와 함께 사용합니다. groupby() 메소드는 DataFrame을 그룹으로 분리합니다.

먼저 pd −

별칭을 사용하여 pandas 라이브러리를 가져옵니다.
import pandas as pd

목록의 데이터 초기화 -

# initializing the data
mylist = {'Car': ['BMW', 'Mercedes', 'Lamborgini', 'Audi', 'Mercedes', 'Porche', 'RollsRoyce', 'BMW'], 'Place': ['Delhi', 'Hyderabad', 'Chandigarh', 'Bangalore', 'Hyderabad', 'Mumbai', 'Mumbai','Delhi'],
'Sold': [95, 80, 80, 75, 90, 90, 95, 50 ]}

다음으로 우리는 DataFrame을 생성할 것입니다 -

# DataFrame
dataFrame = pd.DataFrame(mylist, columns=['Car', 'Place', 'Sold'])

이제 groupby()를 사용하여 size() -

로 발생 횟수를 계산합니다.
print("Counting the occurrences...")
res = dataFrame.groupby(['Car', 'Place']).size()

다음은 각 조합의 발생 횟수를 계산하는 코드입니다. -

예시

# importing library
import pandas as pd

# initializing the data
mylist = {'Car': ['BMW', 'Mercedes', 'Lamborgini', 'Audi', 'Mercedes', 'Porsche', 'RollsRoyce', 'BMW'],
'Place': ['Delhi', 'Hyderabad', 'Chandigarh', 'Bangalore', 'Hyderabad', 'Mumbai', 'Mumbai','Delhi'],
'Sold': [95, 80, 80, 75, 90, 90, 95, 50 ]}

# DataFrame
dataFrame = pd.DataFrame(mylist, columns=['Car', 'Place', 'Sold'])

print(dataFrame)

print("Counting the occurrences...")
res = dataFrame.groupby(['Car', 'Place']).size()

# Displaying the occurrences
print(res)

출력

이것은 다음과 같은 출력을 생성합니다 -

          Car           Place       Sold
0         BMW           Delhi         95
1    Mercedes       Hyderabad         80
2  Lamborgini      Chandigarh         80
3        Audi       Bangalore         75
4    Mercedes       Hyderabad         90
5     Porsche          Mumbai         90
6  RollsRoyce          Mumbai         95
7         BMW           Delhi         50
Counting the occurrences...
Car         Place
Audi        Bangalore     1
BMW         Delhi         2
Lamborgini  Chandigarh    1
Mercedes    Hyderabad     2
Porsche     Mumbai        1
RollsRoyce  Mumbai        1
dtype: int64