Computer >> 컴퓨터 >  >> 프로그램 작성 >> Python

Python – Pandas DataFrame의 데이터 모양 변경

<시간/>

특정 열을 분류하여 데이터를 쉽게 재구성할 수 있습니다. 여기서는 "결과" 열, 즉 합격 및 불합격 값을 숫자 형식으로 분류합니다.

필요한 라이브러리 가져오기 -

import pandas as pd

2개의 열이 있는 DataFrame 만들기 -

dataFrame = pd.DataFrame(
   {
      "Student": ['Jack', 'Robin', 'Ted', 'Scarlett', 'Kat'],"Result": ['Pass', 'Fail', 'Fail', 'Pass', 'Pass']

   }
)

map() 함수를 사용하여 데이터를 재구성하고 'Pass'를 1로 설정하고 'Fail'을 0으로 설정하십시오 -

dataFrame['Result'] = dataFrame['Result'].map({'Pass': 1,'Fail': 0, })

예시

다음은 코드입니다 -

import pandas as pd

# Create DataFrame
dataFrame = pd.DataFrame(
   {
      "Student": ['Jack', 'Robin', 'Ted', 'Scarlett', 'Kat'],"Result": ['Pass', 'Fail', 'Fail', 'Pass', 'Pass']
   }
)

print"DataFrame ...\n",dataFrame

# reshaping into numbers
dataFrame['Result'] = dataFrame['Result'].map({'Pass': 1,'Fail': 0, })

print"\nReshaped DataFrame ...\n",dataFrame

출력

그러면 다음과 같은 출력이 생성됩니다.

DataFrame ...
   Result   Student
0    Pass      Jack
1    Fail     Robin
2    Fail       Ted
3    Pass  Scarlett
4    Pass       Kat

Reshaped DataFrame ...
   Result   Student
0       1      Jack
1       0     Robin
2       0       Ted
3       1  Scarlett
4       1       Kat