Computer >> 컴퓨터 >  >> 프로그램 작성 >> Python

Python으로 프로그램을 작성하여 주어진 데이터 프레임에서 누락된 값의 최소 수를 갖는 열을 찾으십시오.

<시간/>

데이터 프레임이 있고 결측값 열의 최소 수가 다음과 같다고 가정합니다.

DataFrame is:
   Id    Salary     Age
0 1.0    20000.0   22.0
1 2.0    NaN       23.0
2 3.0    50000.0   NaN
3 NaN    40000.0   25.0
4 5.0    80000.0   NaN
5 6.0    NaN       25.0
6 7.0    350000.0  26.0
7 8.0    55000.0   27.0
8 9.0    60000.0   NaN
9 10.0   70000.0   24.0
lowest missing value column is: Id

이 문제를 해결하기 위해 다음 단계를 따릅니다. -

해결책

  • 세 개의 열 Id,Salary 및 Age로 데이터 프레임을 정의하십시오.

  • 모든 행의 null 값 합계를 확인하기 위해 람다 함수 내에서 df.apply() 설정

df = df.apply(lambda x: x.isnull().sum(),axis=0)
  • 마지막으로 df.idxmin()을 사용하여 df에서 가장 낮은 값을 인쇄합니다.

df.idxmin()

예시

더 나은 이해를 위해 아래 코드를 보자 -

import pandas as pd
import numpy as np
df = pd.DataFrame({'Id':[1,2,3,np.nan,5,6,7,8,9,10],
'Salary':[20000,np.nan,50000,40000,80000,np.nan,350000,55000,60000,70000],
            'Age': [22,23,np.nan,25,np.nan,25,26,27,np.nan,24]
         })
print("DataFrame is:\n",df)
df = df.apply(lambda x: x.isnull().sum(),axis=0)
print("lowest missing value column is:",df.idxmin())

출력

DataFrame is:
   Id    Salary     Age
0 1.0    20000.0   22.0
1 2.0    NaN       23.0
2 3.0    50000.0   NaN
3 NaN    40000.0   25.0
4 5.0    80000.0   NaN
5 6.0    NaN       25.0
6 7.0    350000.0  26.0
7 8.0    55000.0   27.0
8 9.0    60000.0   NaN
9 10.0   70000.0   24.0
lowest missing value column is: Id