Pandas는 데이터 분석 및 데이터 랭글링을 위한 가장 인기 있는 파이썬 라이브러리 중 하나입니다. 이 기사에서는 pandas 데이터 프레임을 생성한 다음 이 데이터 프레임에서 일부 선택적 행 또는 열을 삭제하는 방법을 살펴보겠습니다.
행 삭제
아래 예에는 데이터 프레임으로 읽어들인 iris.csv 파일이 있습니다. 먼저 기존 데이터 프레임을 살펴본 다음 삭제하려는 값을 제공하여 인덱스 열에 삭제 기능을 적용합니다. 결과 세트의 맨 아래에서 볼 수 있듯이 행 수가 3으로 감소했습니다.
예
import pandas as pd # making data frame from csv file data = pd.read_csv("E:\\iris1.csv",index_col ="Id") print(data) # dropping passed values data.drop([6,9,10],inplace=True) # display print(data)
출력
위의 코드를 실행하면 다음과 같은 결과가 나옵니다. -
SepalLengthCm SepalWidthCm PetalLengthCm PetalWidthCm Species Id 1 5.1 3.5 1.4 0.2 Iris-setosa 2 4.9 3.0 1.4 0.2 Iris-setosa 3 4.7 3.2 1.3 0.2 Iris-setosa . .. … .… .…..…… [150 rows x 5 columns] After Dropping SepalLengthCm SepalWidthCm PetalLengthCm PetalWidthCm Species Id 1 5.1 3.5 1.4 0.2 Iris-setosa 2 4.9 3.0 1.4 0.2 Iris-setosa 3 4.7 3.2 1.3 0.2 Iris-setosa 149 6.2 3.4 5.4 2.3 Iris-virginica 150 5.9 3.0 5.1 1.8 Iris-virginica …………………. [147 rows x 5 columns]
열 삭제
pandas 데이터 프레임에서 열을 삭제하기 위해 axis 매개변수를 사용합니다. 그 값은 drop 함수에서 1로 설정되며 삭제할 열 이름을 제공합니다. 보시다시피 결과 집합의 열 수가 5개에서 3개로 줄어듭니다.
예
import pandas as pd # making data frame from csv file data = pd.read_csv("E:\\iris1.csv",index_col ="Id") print(data) # dropping passed values data.drop(['SepalWidthCm','PetalLengthCm'],axis=1,inplace=True) print("After Dropping") # display print(data)
출력
위의 코드를 실행하면 다음과 같은 결과가 나옵니다. -
SepalLengthCm SepalWidthCm PetalLengthCm PetalWidthCm Species Id 1 5.1 3.5 1.4 0.2 Iris-setosa 2 4.9 3.0 1.4 0.2 Iris-setosa 3 4.7 3.2 1.3 0.2 Iris-setosa . . .… .… .…. .…… [150 rows x 5 columns] After Dropping SepalLengthCm PetalWidthCm Species Id 1 5.1 0.2 Iris-setosa 2 4.9 0.2 Iris-setosa 3 4.7 0.2 Iris-setosa .....…. [150 rows x 3 columns]