데이터 프레임이 있고 결측값 열의 최소 수가 다음과 같다고 가정합니다.
DataFrame is: Id Salary Age 0 1.0 20000.0 22.0 1 2.0 NaN 23.0 2 3.0 50000.0 NaN 3 NaN 40000.0 25.0 4 5.0 80000.0 NaN 5 6.0 NaN 25.0 6 7.0 350000.0 26.0 7 8.0 55000.0 27.0 8 9.0 60000.0 NaN 9 10.0 70000.0 24.0 lowest missing value column is: Id
이 문제를 해결하기 위해 다음 단계를 따릅니다. -
해결책
-
세 개의 열 Id,Salary 및 Age로 데이터 프레임을 정의하십시오.
-
모든 행의 null 값 합계를 확인하기 위해 람다 함수 내에서 df.apply() 설정
df = df.apply(lambda x: x.isnull().sum(),axis=0)
-
마지막으로 df.idxmin()을 사용하여 df에서 가장 낮은 값을 인쇄합니다.
df.idxmin()
예시
더 나은 이해를 위해 아래 코드를 보자 -
import pandas as pd import numpy as np df = pd.DataFrame({'Id':[1,2,3,np.nan,5,6,7,8,9,10], 'Salary':[20000,np.nan,50000,40000,80000,np.nan,350000,55000,60000,70000], 'Age': [22,23,np.nan,25,np.nan,25,26,27,np.nan,24] }) print("DataFrame is:\n",df) df = df.apply(lambda x: x.isnull().sum(),axis=0) print("lowest missing value column is:",df.idxmin())
출력
DataFrame is: Id Salary Age 0 1.0 20000.0 22.0 1 2.0 NaN 23.0 2 3.0 50000.0 NaN 3 NaN 40000.0 25.0 4 5.0 80000.0 NaN 5 6.0 NaN 25.0 6 7.0 350000.0 26.0 7 8.0 55000.0 27.0 8 9.0 60000.0 NaN 9 10.0 70000.0 24.0 lowest missing value column is: Id