통계 분석에서 표본의 데이터 변동성에 대한 연구는 주어진 데이터 표본의 값이 얼마나 분산되어 있는지 나타냅니다. 변동성을 계산하는 두 가지 중요한 방법은 절대 편차입니다. 및 평균 절대 편차 .
절대 편차
이 방법에서는 먼저 주어진 샘플의 평균값을 찾은 다음 각 값과 각 데이터 샘플의 절대 편차 값이라고 하는 샘플의 평균값 간의 차이를 계산합니다. 따라서 평균보다 높은 값의 경우 편차 값은 양수이고 평균보다 낮은 값의 경우 편차 값은 음수가 됩니다. 다음으로 절대를 사용하여 절대값을 취합니다. 각 편차를 양수로 만드는 기능입니다. 이러한 모든 절대 편차를 요약하면 긍정적인 결과를 얻을 수 있습니다. 절대값이 없으면 이러한 편차의 합은 0이 됩니다.
아래 예에서 우리는 데이터 샘플을 취하고 각 데이터 요소에 대한 절대 편차를 계산합니다.
예시
from numpy import mean, absolute data =[12, 42, 53, 13, 112]# 샘플의 평균값 찾기M =mean(data)print "Sample Mean Value =",mean(data)print "\n "# 절대 편차 계산print "Data-Mean","","deviation" for i in range(len(data)):dev =absolute(data[i] - M) print data[i],"-",M ,라운드((dev),2)
출력
위의 코드를 실행하면 다음과 같은 결과가 나옵니다. -
샘플 평균값 =46.4데이터-평균 편차12 - 46.4 34.442 - 46.4 4.453 - 46.4 6.613 - 46.4 33.4112 - 46.4 65.6
평균 절대 편차(MAD)
평균 절대 편차(MAD)는 각 데이터 포인트에 대해 계산한 모든 절대 편차의 평균값입니다. 이전 예와 동일한 샘플을 취하여 절대 편차 값을 합산하고 샘플 크기로 나누는 코드를 추가합니다.
예시
from numpy import mean, absolutedata =[12, 42, 53, 13, 112]# 샘플의 평균값 찾기M =mean(data)print "Sample Mean Value =",mean(data)sum =0# 계산 범위(len(data))에서 i에 대한 평균 절대 편차:dev =absolute(data[i] - M) sum =sum + round(dev,2)print "평균 절대 편차:", sum/len(data)사전>출력
위의 코드를 실행하면 다음과 같은 결과가 나옵니다. -
샘플 평균값 =46.4평균 절대 편차:28.88