Computer >> 컴퓨터 >  >> 프로그램 작성 >> Python

Pandas DataFrame에서 복잡한 기준으로 선택

<시간/>

다른 기준을 사용하여 Pandas DataFrame의 모든 열 값을 비교할 수 있습니다. df[col]<5, df[col]==10과 같은 비교 작업을 수행할 수 있습니다. 등. 예를 들어 df[col]>2 기준을 사용하는 경우 , 그러면 col의 모든 값을 확인하고 값이 2보다 큰지 비교합니다. 모든 열 값에 대해 조건이 유지되면 True를 반환하고 그렇지 않으면 False를 반환합니다. 예를 들어 어떻게 수행되는지 살펴보겠습니다.

단계

  • 크기가 변경 가능한 2차원 테이블 형식 데이터 df 생성 .
  • 입력 DataFrame, df 인쇄 .
  • 열 이름으로 변수 col을 초기화합니다.
  • 몇 가지 비교 작업을 수행합니다.
  • 결과 DataFrame을 인쇄합니다.

import pandas as pd

df = pd.DataFrame(
     {
        "x": [5, 2, 7, 0],
        "y": [4, 7, 5, 1],
        "z": [9, 3, 5, 1]
     }
)
print "Input DataFrame is:\n", df

col = "x"
print "Elements > 5 in column ", col, ":\n", df[col] > 5
print "Elements == 5 in column ", col, ":\n", df[col] == 5

col = "y"
print "Elements < 5 in column ", col, ":\n", df[col] < 5
print "Elements != 5 in column ", col, ":\n", df[col] != 5

출력

Input DataFrame is:
   x  y  z
0  5  4  9
1  2  7  3
2  7  5  5
3  0  1  1

Elements > 5 in column x :
0  False
1  False
2  True
3  False
Name: x, dtype: bool

Elements == 5 in column x :
0  True
1  False
2  False
3  False
Name: x, dtype: bool

Elements < 5 in column y :
0  True
1  False
2  False
3  True
Name: y, dtype: bool

Elements != 5 in column y :
0  True
1  True
2  False
3  True
Name: y, dtype: bool