Computer >> 컴퓨터 >  >> 프로그램 작성 >> Python

Pandas Python에서 데이터를 어떻게 요약할 수 있습니까?

<시간/>

데이터에 대한 다양한 기능을 사용하여 데이터에 대한 많은 정보를 얻을 수 있습니다. 그러나 데이터에 대한 모든 정보를 얻고 싶다면 '설명' 기능을 사용할 수 있습니다.

이 함수는 '개수', '평균', '표준편차', 25번째 백분위수, 50번째 백분위수 및 75번째 백분위수와 같은 정보를 제공합니다.

import pandas as pd
my_data = {'Name':pd.Series(['Tom','Jane','Vin','Eve','Will']),
'Age':pd.Series([45, 67, 89, 12, 23]),'value':pd.Series([8.79,23.24,31.98,78.56,90.20])
}
print("The dataframe is :")
my_df = pd.DataFrame(my_data)
print(my_df)
print("The description of data is :")
print(my_df.describe())

출력

The dataframe is :
   Name  Age   value
0  Tom   45   8.79
1  Jane  67   23.24
2  Vin   89   31.98
3  Eve   12   78.56
4  Will  23   90.20
The description of data is :
          Age     value
count  5.000000  5.000000
mean  47.200000  46.554000
std   31.499206  35.747102
min   12.000000  8.790000
25%   23.000000  23.240000
50%   45.000000  31.980000
75%   67.000000  78.560000
max   89.000000  90.200000

설명

  • 필수 라이브러리를 가져오고 사용하기 쉽도록 별칭 이름을 지정합니다.
  • 키와 값으로 구성된 시리즈 사전이 생성되며, 여기서 값은 실제로 시리즈 데이터 구조입니다.
  • 이 사전은 나중에 'pandas' 라이브러리에 있는 'Dataframe' 함수에 매개변수로 전달됩니다.
  • 데이터 프레임이 콘솔에 인쇄됩니다.
  • 데이터에 대한 모든 정보를 얻고 있습니다.
  • 'describe' 함수는 데이터 프레임에서 호출됩니다.
  • 설명은 콘솔에 인쇄되어 있습니다.