Computer >> 컴퓨터 >  >> 프로그램 작성 >> Python

Python - Pandas DataFrame의 행 순위 지정

<시간/>

데이터 프레임을 정렬하고 특정 요소의 순위를 결정하는 데 도움이 되는 제공된 데이터 프레임에 있는 각 행의 순위를 포함하는 열을 추가하려면, 예를 들어 -

데이터프레임

이름 재생 시간(시간) 요율
0 콜 오브 듀티 45 평균보다 우수
1 총 과다 복용 46 좋음
2 GTA3 52 최고
3 깡패 22 평균

출력

이름 재생 시간(시간) 요율 순위
0 콜 오브 듀티 45 평균보다 우수 3.0
1 총 과다 복용 46 좋음 2.0
2 GTA3 52 최고 1.0
3 깡패 22 평균 4.0

이제 위의 예에서 볼 수 있듯이 순위는 정수이지만 그 옆에 소수가 있으므로 실수에서도 순위를 가질 수 있습니다. 이는 더 많은 하나의 요소가 동일한 순위를 가질 때 발생합니다. 우리의 순위는 이러한 경우보다 데이터 프레임이 요소 간에 나누어집니다. 따라서 순위는 실수입니다.

이제 데이터 프레임에 순위를 할당하는 방법

데이터 프레임의 요소에 순위를 할당하기 위해 .rank()인 pandas 라이브러리의 내장 함수를 사용합니다. 기능. 요소의 순위를 매기는 기준을 전달하고 이 함수는 순위가 저장된 각 행에 새 열을 반환합니다.

예시

.rank() 함수를 사용하기 위한 코드는

import pandas as pd
games = {'Name' : ['Call Of Duty', 'Total Overdose', 'GTA 3', 'Bully'],
       'Play Time(in hours)' : ['45', '46', '52', '22'],
        'Rate' : ['Better than Average', 'Good', 'Best', 'Average']}
df = pd.DataFrame(games)
df['ranking'] = df['Play Time(in hours)'].rank(ascending = 0)
print(df)# Hello World program in Python
   
print ("Hello World!");

출력

    Name Play Time(in hours)       Rate ranking
0  Call Of Duty   45     Better than Average 3.0
1  TotalOverdose  46     Good                2.0
2  GTA 3          52     Best                1.0
3   Bully        22      Average             4.0

위 코드 설명

이 코드에서 우리는 단순히 panda 라이브러리의 내장 함수를 사용하여 주어진 데이터 프레임에 있는 각 요소의 순위를 매깁니다. 가장 좋은 기준을 사용하여 '재생 시간(단위:시간)' 열로 요소의 순위를 지정할 수 있습니다.

이제 데이터 프레임에 'ranking'이라는 열을 추가하고 .rank()를 사용합니다. 함수를 만들고 요소의 순위를 지정하는 데 필요한 열 이름을 전달합니다(이 경우에는 재생 시간(시간) 열). 이제 새 열이 생성되면 데이터 프레임을 인쇄합니다.

결론

이 자습서에서는 데이터 프레임의 행 순위를 지정한 다음 pandas 라이브러리와 내장 함수를 사용하여 데이터를 인쇄합니다. pandas 데이터 프레임의 행 순위 지정은 쉬운 과정이지만 위의 방법을 제대로 따라야 합니다.