데이터에 대한 다양한 기능을 사용하여 데이터에 대한 많은 정보를 얻을 수 있습니다. 그러나 데이터에 대한 모든 정보를 얻고 싶다면 '설명' 기능을 사용할 수 있습니다.
이 함수는 '개수', '평균', '표준편차', 25번째 백분위수, 50번째 백분위수 및 75번째 백분위수와 같은 정보를 제공합니다.
예
import pandas as pd my_data = {'Name':pd.Series(['Tom','Jane','Vin','Eve','Will']), 'Age':pd.Series([45, 67, 89, 12, 23]),'value':pd.Series([8.79,23.24,31.98,78.56,90.20]) } print("The dataframe is :") my_df = pd.DataFrame(my_data) print(my_df) print("The description of data is :") print(my_df.describe())
출력
The dataframe is : Name Age value 0 Tom 45 8.79 1 Jane 67 23.24 2 Vin 89 31.98 3 Eve 12 78.56 4 Will 23 90.20 The description of data is : Age value count 5.000000 5.000000 mean 47.200000 46.554000 std 31.499206 35.747102 min 12.000000 8.790000 25% 23.000000 23.240000 50% 45.000000 31.980000 75% 67.000000 78.560000 max 89.000000 90.200000
설명
- 필수 라이브러리를 가져오고 사용하기 쉽도록 별칭 이름을 지정합니다.
- 키와 값으로 구성된 시리즈 사전이 생성되며, 여기서 값은 실제로 시리즈 데이터 구조입니다.
- 이 사전은 나중에 'pandas' 라이브러리에 있는 'Dataframe' 함수에 매개변수로 전달됩니다.
- 데이터 프레임이 콘솔에 인쇄됩니다.
- 데이터에 대한 모든 정보를 얻고 있습니다.
- 'describe' 함수는 데이터 프레임에서 호출됩니다.
- 설명은 콘솔에 인쇄되어 있습니다.