Computer >> 컴퓨터 >  >> 프로그램 작성 >> Python

Python - 특정 데이터 유형이 있는 열 선택

<시간/>

특정 데이터 유형이 있는 열을 선택하려면 select_dtypes()를 사용하세요. 메소드 및 include 매개변수. 먼저 2개의 열이 있는 DataFrame을 만듭니다. -

dataFrame = pd.DataFrame(
   {
      "Student": ['Jack', 'Robin', 'Ted', 'Marc', 'Scarlett', 'Kat', 'John'],"Roll Number": [ 5, 10, 3, 8, 2, 9, 6]
   }
)

이제 각각의 특정 데이터 유형이 있는 2개의 열을 선택하십시오 -

column1 = dataFrame.select_dtypes(include=['object']).columns
column2 = dataFrame.select_dtypes(include=['int64']).columns

예시

다음은 코드입니다 -

import pandas as pd

# Create DataFrame
dataFrame = pd.DataFrame(
   {
      "Student": ['Jack', 'Robin', 'Ted', 'Marc', 'Scarlett', 'Kat', 'John'],"Roll Number": [ 5, 10, 3, 8, 2, 9, 6]
   }
)

print"DataFrame ...\n",dataFrame

print"\nInfo of the entire dataframe:\n"

# get the description
print(dataFrame.info())

# select columns with specific datatype
column1 = dataFrame.select_dtypes(include=['object']).columns
column2 = dataFrame.select_dtypes(include=['int64']).columns

print"Column 1 with object type = ",column1
print"Column 2 with int64 type = ",column2

출력

이것은 다음과 같은 출력을 생성합니다 -

DataFrame ...
   Roll Number   Student
0            5      Jack
1           10     Robin
2            3       Ted
3            8      Marc
4            2  Scarlett
5            9       Kat
6            6      John

Info of the entire dataframe:

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 7 entries, 0 to 6
Data columns (total 2 columns):
Roll Number    7  non-null int64
Student        7  non-null object
dtypes: int64(1), object(1)
memory usage: 184.0+ bytes
None
Column 1 with object type = Index([u'Student'], dtype='object')
Column 2 with int64 type = Index([u'Roll Number'], dtype='object')