Pandas는 데이터 정리, 데이터 분석 등에 널리 사용되는 파이썬 라이브러리입니다. 이 기사에서는 쿼리 메서드를 사용하여 주어진 데이터 세트에서 특정 데이터를 가져오는 방법을 살펴보겠습니다. 쿼리 안에 단일 조건과 다중 조건이 모두 있을 수 있습니다.
데이터 읽기
먼저 pandas 라이브러리를 사용하여 pandas 데이터 프레임으로 데이터를 읽어 보겠습니다. 아래 프로그램이 바로 그 역할을 합니다.
예시
import pandas as pd # Reading data frame from csv file data = pd.read_csv("D:\\heart.csv") print(data)
출력
위의 코드를 실행하면 다음과 같은 결과가 나옵니다. -
단일 조건 쿼리
다음으로 단일 조건으로 쿼리 메서드를 사용하는 방법을 살펴봅니다. 결과에서 볼 수 있듯이 원래 303개 행에서 119개 행만 결과로 반환됩니다.
예시
import pandas as pd # Data frame from csv file data = pd.read_csv("D:\\heart.csv") data.query('chol < 230', inplace=True) # Result print(data)
출력
위의 코드를 실행하면 다음과 같은 결과가 나옵니다. -
여러 조건으로 쿼리
위와 유사한 접근 방식으로 쿼리 메서드에 여러 조건을 적용할 수 있습니다. 이렇게 하면 결과 데이터 세트가 더 제한됩니다. 연령을 60세 이상으로 제한하는 경우 이제 79개 행만 반환됩니다.
예시
import pandas as pd # Data frame from csv file data = pd.read_csv("D:\\heart.csv") data.query('chol < 230' and 'age > 60', inplace=True) # Result print(data)
출력
위의 코드를 실행하면 다음과 같은 결과가 나옵니다. -