Computer >> 컴퓨터 >  >> 프로그램 작성 >> Python

Python – Pandas에서 누락된 날짜를 확인하는 방법

<시간/>

누락된 날짜를 확인하려면 먼저 날짜 레코드가 있는 목록 사전을 설정합니다.

# dictionary of lists
d = {'Car': ['BMW', 'Lexus', 'Audi', 'Mercedes', 'Jaguar', 'Bentley'],
   'Date_of_purchase': ['2020-10-10', '2020-10-12', '2020-10-17', '2020-10-16', '2020-10-19', '2020-10-22']}

이제 위의 목록 사전에서 데이터 프레임을 만듭니다. -

dataFrame = pd.DataFrame(d)

다음으로 인덱스로 설정 -

dataFrame = dataFrame.set_index('Date_of_purchase')

to_datetime()을 사용하여 문자열을 DateTime 객체로 변환 -

dataFrame.index = pd.to_datetime(dataFrame.index)

범위의 나머지 날짜 표시 -

k = pd.date_range( start="2020-10-10", end="2020-10-22").difference(dataFrame.index);

예시

다음은 코드입니다 -

import pandas as pd

# dictionary of lists
d = {'Car': ['BMW', 'Lexus', 'Audi', 'Mercedes', 'Jaguar', 'Bentley'],
   'Date_of_purchase': ['2020-10-10', '2020-10-12', '2020-10-17', '2020-10-16', '2020-10-19', '2020-10-22'] }

# creating dataframe from the above dictionary of lists
dataFrame = pd.DataFrame(d)
print"DataFrame...\n",dataFrame

# Date_of_purchase set as index
dataFrame = dataFrame.set_index('Date_of_purchase')

# using to_datetime() to convert string to DateTime object
dataFrame.index = pd.to_datetime(dataFrame.index)

# remaining dates displayed as output
print("\nDisplaying remaining dates from a range of dates...")
k = pd.date_range(start="2020-10-10", end="2020-10-22").difference(dataFrame.index);

print(k);

출력

이것은 다음과 같은 출력을 생성합니다 -

DataFrame...
         Car    Date_of_purchase
0       BMW           2020-10-10
1     Lexus           2020-10-12
2      Audi           2020-10-17
3  Mercedes           2020-10-16
4    Jaguar           2020-10-19
5   Bentley           2020-10-22

Displaying remaining dates from a range of dates...
DatetimeIndex(['2020-10-11', '2020-10-13', '2020-10-14', '2020-10-15',
   '2020-10-18', '2020-10-20', '2020-10-21'],
   dtype='datetime64[ns]', freq=None)