때로는 본질적으로 숫자인 특정 열의 평균 값을 가져와야 할 수도 있습니다. 여기서 'mean' 함수를 사용할 수 있습니다.
평균을 계산해야 하는 열은 데이터 프레임에 인덱싱될 수 있으며, 여기서 점 연산자를 사용하여 평균 함수를 호출할 수 있습니다.
평균을 찾기 위해 열의 인덱스를 전달할 수도 있습니다. mean()이라는 용어는 모든 값의 합을 찾아 데이터 세트의 총 값 수로 나누는 것을 말합니다.
동일한 시연을 봅시다 -
예시
import pandas as pd my_data = {'Name':pd.Series(['Tom','Jane','Vin','Eve','Will']),'Age':pd.Series([45, 67, 89, 12, 23]),'value':pd.Series([8.79,23.24,31.98,78.56,90.20])} print("The dataframe is :") my_df = pd.DataFrame(my_data) print(my_df) print("The mean of column 'Age' is :") print(my_df['Age'].mean()) print("The mean of column 'value' is :") print(my_df['value'].mean())
출력
The dataframe is : Name Age value 0 Tom 45 8.79 1 Jane 67 23.24 2 Vin 89 31.98 3 Eve 12 78.56 4 Will 23 90.20 The mean of column 'Age' is : 47.2 The mean of column 'value' is : 46.553999999999995
설명
-
필요한 라이브러리를 가져오고 사용하기 쉽도록 별칭 이름을 지정합니다.
-
키와 값으로 구성된 시리즈 사전이 생성되며, 여기서 값은 실제로 시리즈 데이터 구조입니다.
-
이 사전은 나중에 'pandas' 라이브러리에 있는 'Dataframe' 함수에 매개변수로 전달됩니다.
-
데이터 프레임이 콘솔에 인쇄됩니다.
-
숫자 값이 포함된 특정 열의 평균을 계산하려고 합니다.
-
'mean' 함수는 도트 연산자를 사용하여 열 이름을 지정하여 데이터 프레임에서 호출됩니다.
-
숫자 열의 평균은 콘솔에 인쇄됩니다.