Computer >> 컴퓨터 >  >> 프로그램 작성 >> Python

Python - Numpy를 사용하여 Pandas 집계에서 고유한 카운트

<시간/>

고유한 수를 계산하려면 Pandas에서 nunique를 사용하십시오. 열을 그룹화하고 Numpy sum()을 사용하여 태양도 찾습니다.

먼저 필요한 라이브러리를 가져옵니다 -

pdimport numpy로 np로 팬더 가져오기

3개의 열이 있는 DataFrame을 만듭니다. 열에 중복 값이 ​​있습니다 -

dataFrame =pd.DataFrame( { "자동차":['BMW', '아우디', 'BMW', '렉서스', '렉서스'],"장소":['델리', '방갈로르',' 델리','찬디가르','찬디가르'],"단위":[100, 150, 50, 110, 90] })

nunique가 있는 집계 agg()에서 고유한 수를 계산합니다. 계산을 위한 합계를 계산할 때 numpy sum() −

을 사용합니다.
dataFrame =dataFrame.groupby("자동차").agg({"단위":np.sum, "장소":pd.Series.nunique})

다음은 코드입니다 -

판다를 pdimport numpy로 npdataFrame =pd.DataFrame( { "Car":['BMW', 'Audi', 'BMW', 'Lexus', 'Lexus'],"Place":['Delhi' ,'Bangalore','Delhi','Chandigarh','Chandigarh'],"Units":[100, 150, 50, 110, 90] })print"DataFrame ...\n",dataFrame# 카운트 고유 nuniquedataFrame을 사용한 집계 =dataFrame.groupby("Car").agg({"Units":np.sum, "Place":pd.Series.nunique})print"\nUpdated DataFrame ...\n",dataFrame 

출력

이것은 다음과 같은 출력을 생성합니다 -

DataFrame ... Car Place Units0 BMW Delhi 1001 Audi Bangalore 1502 BMW Delhi 503 Lexus Chandigarh 1104 Lexus Chandigarh 90Updated DataFrame ... Units PlaceCarAudi 150 1BMW 150 1Lexus 200 1