Computer >> 컴퓨터 >  >> 프로그램 작성 >> Python

Pandas Python의 데이터 프레임에서 특정 열의 표준 편차를 찾는 방법은 무엇입니까?

<시간/>

표준 편차는 데이터 세트의 값이 분산되는 방식을 알려줍니다. 또한 데이터 세트의 값이 데이터 세트의 열 산술 평균에서 얼마나 멀리 떨어져 있는지 알려줍니다.

때로는 본질적으로 숫자인 특정 열의 표준 편차를 가져와야 할 수도 있습니다. 여기서 std() 함수를 사용할 수 있습니다. 평균을 계산해야 하는 열은 데이터 프레임에 인덱싱될 수 있으며, 여기서 점 연산자를 사용하여 평균 함수를 호출할 수 있습니다.

표준편차를 찾기 위해 컬럼의 인덱스를 전달할 수도 있습니다.

동일한 시연을 봅시다 -

예시

판다를 pdmy_data로 가져오기 ={'이름':pd.Series(['Tom','Jane','Vin','Eve','Will']),'Age':pd.Series([45 , 67, 89, 12, 23]),'값':pd.Series([8.79,23.24,31.98,78.56,90.20])}print("데이터 프레임은 다음과 같습니다.")my_df =pd.DataFrame(my_data)print (my_df)print("'나이' 열의 표준편차는 다음과 같습니다.")print(my_df['나이'].std())print("'값' 열의 표준편차는 다음과 같습니다.")print(my_df[ '값'].std())

출력

데이터 프레임은 다음과 같습니다. Name Age value0 Tom 45 8.791 Jane 67 23.242 Vin 89 31.983 Eve 12 78.564 Will 23 90.20'Age7'컬럼 'Age70'의 표준편차는 31.499206339207976입니다.> 

설명

  • 필요한 라이브러리를 가져오고 사용하기 쉽도록 별칭 이름을 지정합니다.

  • 키와 값으로 구성된 시리즈 사전이 생성되며, 여기서 값은 실제로 시리즈 데이터 구조입니다.

  • 이 사전은 나중에 'pandas' 라이브러리에 있는 'Dataframe' 함수에 매개변수로 전달됩니다.

  • 데이터 프레임이 콘솔에 인쇄됩니다.

  • 숫자 값이 포함된 특정 열의 표준 편차를 계산하려고 합니다.

  • 'std' 함수는 도트 연산자를 사용하여 열 이름을 지정하여 데이터 프레임에서 호출됩니다.

  • 숫자 열의 표준편차가 콘솔에 출력됩니다.