Computer >> 컴퓨터 >  >> 프로그램 작성 >> Python

Python - Pandas .query() 메서드로 데이터 필터링

<시간/>

Pandas는 데이터 정리, 데이터 분석 등에 널리 사용되는 파이썬 라이브러리입니다. 이 기사에서는 쿼리 메서드를 사용하여 주어진 데이터 세트에서 특정 데이터를 가져오는 방법을 살펴보겠습니다. 쿼리 안에 단일 조건과 다중 조건이 모두 있을 수 있습니다.

데이터 읽기

먼저 pandas 라이브러리를 사용하여 pandas 데이터 프레임으로 데이터를 읽어 보겠습니다. 아래 프로그램이 바로 그 역할을 합니다.

예시

import pandas as pd

# Reading data frame from csv file
data = pd.read_csv("D:\\heart.csv")

print(data)

출력

위의 코드를 실행하면 다음과 같은 결과가 나옵니다. -

Python - Pandas .query() 메서드로 데이터 필터링

단일 조건 쿼리

다음으로 단일 조건으로 쿼리 메서드를 사용하는 방법을 살펴봅니다. 결과에서 볼 수 있듯이 원래 303개 행에서 119개 행만 결과로 반환됩니다.

예시

import pandas as pd

# Data frame from csv file
data = pd.read_csv("D:\\heart.csv")

data.query('chol < 230', inplace=True)

# Result
print(data)

출력

위의 코드를 실행하면 다음과 같은 결과가 나옵니다. -

Python - Pandas .query() 메서드로 데이터 필터링

여러 조건으로 쿼리

위와 유사한 접근 방식으로 쿼리 메서드에 여러 조건을 적용할 수 있습니다. 이렇게 하면 결과 데이터 세트가 더 제한됩니다. 연령을 60세 이상으로 제한하는 경우 이제 79개 행만 반환됩니다.

예시

import pandas as pd

# Data frame from csv file
data = pd.read_csv("D:\\heart.csv")

data.query('chol < 230' and 'age > 60', inplace=True)

# Result
print(data)

출력

위의 코드를 실행하면 다음과 같은 결과가 나옵니다. -

Python - Pandas .query() 메서드로 데이터 필터링