Computer >> 컴퓨터 >  >> 프로그램 작성 >> Python

Python Pandas - 누락된 열 값을 중앙값으로 채우기

<시간/>

중앙값은 데이터의 상위 절반과 하위 절반을 구분합니다. fillna() 메서드를 사용하고 중앙값을 설정하여 누락된 열을 중앙값으로 채우십시오. 먼저 필요한 라이브러리를 해당 별칭과 함께 가져오도록 하겠습니다. −

pdimport numpy로 np로 팬더 가져오기

2개의 열이 있는 DataFrame을 만듭니다. Numpy np.NaN을 사용하여 NaN 값을 설정했습니다. -

dataFrame =pd.DataFrame( { "자동차":['렉서스', 'BMW', '아우디', '벤틀리', '머스탱', '테슬라'],"단위":[100, 150, np .NaN, 80, np.NaN, np.NaN] })

여기서 단위 열의 경우 NaN으로 열 값의 중앙값을 찾으십시오. NaN을 Units 열의 median()을 사용하여 위치한 열의 중앙값으로 바꿉니다. -

dataFrame.fillna(dataFrame['단위'].median(), inplace =True)

예시

다음은 코드입니다 -

판다를 pdimport numpy로 np로 가져오기# Create DataFramedataFrame =pd.DataFrame( { "Car":['Lexus', 'BMW', 'Audi', 'Bentley', 'Mustang', 'Tesla']," Units":[100, 150, np.NaN, 80, np.NaN, np.NaN] })print"DataFrame ...\n",dataFrame# NaN이 있는 열 값의 중앙값 찾기 # NaN을 그것이 위치한 열의 중앙값으로 교체dataFrame.fillna(dataFrame['Units'].median(), inplace =True)print"\nNaN 값을 median으로 채운 후 업데이트된 Dataframe...\n",dataFrame 

출력

이것은 다음과 같은 출력을 생성합니다 -

DataFrame ... Car Units0 Lexus 100.01 BMW 150.02 Audi NaN3 Bentley 80.04 Mustang NaN5 Tesla NaN NaN 값을 중앙값으로 채운 후 데이터 프레임 업데이트... Car Units0 Lexus 100.01 BMW 150.02 Audi 100.01.04.0 Mustang .03 Bentley