Computer >> 컴퓨터 >  >> 프로그램 작성 >> Python

Python의 수학 통계 함수

<시간/>

Python 라이브러리의 통계 모듈은 Fraction, Decimal 유형을 포함한 숫자 데이터 유형을 사용하여 통계 공식을 계산하는 함수로 구성됩니다.

이 글에서 설명하는 기능을 사용하기 위해서는 다음과 같은 import 문이 필요합니다.

>>> from statistics import *

다음 함수는 샘플 데이터의 중심 경향을 계산합니다.

평균() − 이 함수는 데이터의 산술 평균을 시퀀스 또는 반복자 형태로 계산합니다.

>>> from statistics import mean
>>> numbers = [12,34,21,7,56]
>>> mean(numbers)
26

샘플 데이터에는 Decimal 개체 또는 Fraction 개체가 포함될 수 있습니다.

>>> from decimal import Decimal
>>> numbers = [12,34,21,Decimal('7'),56]
>>> mean(numbers)
Decimal('26')
>>> from fractions import Fraction
>>> numbers = [12,20.55,Fraction(4,5),21,56]
>>> mean(numbers)
22.07

harmonic_mean() − 조화 평균은 샘플 데이터의 요소 역수의 산술 평균을 취한 다음 산술 평균 자체의 역수를 취하여 계산됩니다.

샘플 =[1,2,3,4,5]

역수 =[1/1, 1/2, 1/3, 1/4, 1/5] =2.28333333333

평균 =2.28333333333/5 =0. 45666666666666667

조화 평균 =1 / 45666666666666667 =2.189784218663093

>>> harmonic_mean([1,2,3,4,5])
2.18978102189781

중앙값() − 중앙값은 표본 데이터의 중간 값입니다. 데이터는 중앙값을 찾기 위해 자동으로 오름차순으로 정렬됩니다. 요소 수가 홀수이면 중앙값은 중간 값입니다. 개수가 홀수이면 가장 중간에 있는 두 숫자의 평균이 중앙값입니다.

>>> median([2,5,4,8,6])
5
>>> median([11,33,66,55,88,22])
44.0

모드() − 이 함수는 샘플에서 가장 일반적인 값을 반환합니다. 이 기능은 숫자 또는 숫자가 아닌 데이터에 적용할 수 있습니다.

>>> mode((4,7,8,4,9,7,12,4,8))
4
>>> mode(['cc','aa','dd','cc','ff','cc'])
'cc'

다음 함수는 중심 값에서 샘플의 요소 분산 측정을 처리합니다.

분산() − 이 함수는 샘플 데이터의 변동성 또는 분산을 반영합니다. 큰 분산은 데이터가 흩어져 있음을 의미합니다. 분산이 작을수록 데이터가 밀접하게 클러스터되어 있음을 나타냅니다.

다음은 분산을 찾는 절차입니다.

  • 표본에 있는 모든 요소의 산술 평균을 구합니다.
  • 평균과 각 요소의 차이의 제곱을 구하고 제곱을 더하세요.
  • 분산을 얻기 위해 표본 크기가 n인 경우 합계를 n-1로 나눕니다.

수학적으로, 위의 절차는 다음 공식으로 표현됩니다 -

$$s^2 =\frac{1}{n-1}\displaystyle\displaystyle\sum\limits_{i=1}^n(x_{i}-\overline{x})^2$$


고맙게도 Variance() 함수는 위의 공식을 계산해 줍니다.

>>> num = [4, 9, 2, 11, 5, 22, 90, 32, 56, 70]
>>> variance(num)
981.2111111111111

stdev() − 이 함수는 샘플 데이터의 표준 편차를 반환합니다. 표준 편차는 분산의 제곱근입니다.

>>> num = [4, 9, 2, 11, 5, 22, 90, 32, 56, 70]
>>> stdev(num)
31.324289474960338