따라서 Excel을 사용하여 분산을 계산하라는 요청을 받았지만 이것이 의미하는 바 또는 수행 방법을 잘 모릅니다. 걱정하지 마세요. 쉬운 개념이고 훨씬 더 쉬운 과정입니다. 당신은 곧 변주 전문가가 될 것입니다!
차이란 무엇입니까?
"분산"은 평균으로부터의 평균 거리를 측정하는 방법입니다. "평균"은 데이터 세트의 모든 값의 합계를 값의 수로 나눈 값입니다. 분산은 해당 데이터 세트의 값이 평균적으로 평균에 균일하게 고정되는 경향이 있는지 또는 전체에 분산되는 경향이 있는지에 대한 아이디어를 제공합니다.
수학적으로 분산은 그렇게 복잡하지 않습니다.
- 값 집합의 평균을 계산합니다. 평균을 계산하려면 모든 값의 합을 값의 수로 나눈 값을 취하십시오.
- 세트의 모든 값을 가져와 평균에서 빼세요.
- 결과 값을 제곱합니다(음수를 취소하기 위해).
- 제곱 값을 모두 더합니다.
- 분산을 얻기 위해 제곱 값의 평균을 계산합니다.
보시다시피 계산하기 어려운 값이 아닙니다. 그러나 수백 또는 수천 개의 값이 있는 경우 수동으로 수행하는 데 시간이 오래 걸립니다. 따라서 Excel에서 프로세스를 자동화할 수 있다는 것은 좋은 일입니다!
차이를 무엇에 사용합니까?
Variance는 그 자체로 많은 용도를 가지고 있습니다. 순전히 통계적 관점에서 보면 데이터 세트가 얼마나 퍼져 있는지 표현하는 좋은 약식 방법입니다. 투자자는 분산을 사용하여 주어진 투자의 위험을 추정합니다.
예를 들어, 일정 기간 동안 주식의 가치를 측정하고 그 분산을 계산하면 과거의 변동성에 대한 좋은 아이디어를 얻을 수 있습니다. 과거가 미래를 예측한다는 가정하에 분산이 낮은 것이 더 안전하고 예측 가능하다는 의미입니다.
다른 기간에 걸쳐 무언가의 분산을 비교할 수도 있습니다. 이렇게 하면 다른 숨겨진 요소가 무언가에 영향을 미치고 분산을 변경하는 시기를 감지하는 데 도움이 될 수 있습니다.
분산은 표준 편차로 알려진 다른 통계량과도 밀접한 관련이 있습니다. 분산을 계산하는 데 사용되는 값은 제곱임을 기억하십시오. 이는 분산이 원래 값의 동일한 단위로 표현되지 않음을 의미합니다. 표준 편차는 값을 원래 단위로 되돌리기 위해 분산의 제곱근을 취해야 합니다. 따라서 데이터가 킬로그램 단위인 경우 표준 편차도 마찬가지입니다.
모집단과 표본 분산 간의 선택
Excel에는 수식이 약간 다른 두 가지 하위 유형이 있습니다. 어떤 것을 선택해야 하는지는 데이터에 따라 다릅니다. 데이터에 전체 "인구"가 포함된 경우 모집단 분산을 사용해야 합니다. 이 경우 "인구"는 대상 인구 그룹의 모든 구성원에 대한 모든 값이 있음을 의미합니다.
예를 들어, 왼손잡이의 체중을 보고 있다면 인구에는 왼손잡이인 지구상의 모든 개인이 포함됩니다. 모두 무게를 측정했다면 모집단 분산을 사용합니다.
물론 실생활에서 우리는 일반적으로 더 큰 모집단에서 더 작은 표본에 만족합니다. 이 경우 표본 분산을 사용합니다. 모집단 분산은 더 작은 모집단에서 여전히 실용적입니다. 예를 들어, 회사에는 각 직원에 대한 데이터가 있는 직원이 수십만 또는 수천 명이 있을 수 있습니다. 통계적 의미에서 "인구"를 나타냅니다.
적절한 분산 공식 선택
Excel에는 세 가지 표본 분산 공식과 세 가지 모집단 분산 공식이 있습니다.
- VAR , VAR.S 및 VARA 표본 분산을 위한 것입니다.
- VARP , VAR.P 및 VARPA 인구 분산을 위한 것입니다.
VAR 및 VARP는 무시할 수 있습니다. 이것들은 구식이며 레거시 스프레드시트와의 호환성을 위해서만 사용됩니다.
그러면 숫자 값 집합의 분산을 계산하기 위한 VAR.S 및 VAR.P와 텍스트 문자열을 포함하는 VARA 및 VARPA가 남습니다.
VARA 및 VARPA는 "TRUE" 및 "FALSE"를 제외한 모든 텍스트 문자열을 숫자 값 0으로 변환합니다. 이들은 각각 1과 0으로 변환됩니다.
가장 큰 차이점은 VAR.S 및 VAR.P가 숫자가 아닌 값을 건너뛴다는 것입니다. 이렇게 하면 총 값 수에서 해당 케이스가 제외됩니다. 즉, 평균을 얻기 위해 더 적은 수의 케이스로 나누어야 하기 때문에 평균 값이 달라집니다.
Excel에서 분산을 계산하는 방법
Excel에서 분산을 계산하는 데 필요한 것은 값 집합뿐입니다. 아래 예에서는 VAR.S를 사용하지만, 사용하는 분산 공식에 관계없이 공식과 방법은 정확히 동일합니다.
- 범위 또는 개별 값 집합이 준비되어 있다고 가정하고 빈 셀을 선택합니다. 선택하세요.
또는 특정 값을 지정할 수 있습니다. 이 경우 수식은 =VAR.S(1,2,3,4)와 같습니다. . 숫자가 분산을 계산하는 데 필요한 것으로 대체되었습니다. 이와 같이 수동으로 최대 254개의 값을 입력할 수 있지만 소수의 값만 있는 경우가 아니면 거의 항상 셀 범위에 데이터를 입력한 다음 위에서 설명한 수식의 셀 범위 버전을 사용하는 것이 좋습니다.
엑셀, 어, 엑셀
분산 계산은 Excel에서 통계 작업을 수행해야 하는 모든 사용자에게 유용한 트릭입니다. 그러나 이 기사에서 사용한 Excel 용어 중 혼란스러운 것이 있으면 Microsoft Excel 기본 자습서 - Excel 사용 방법 학습을 확인하는 것이 좋습니다.
반면에 더 많은 정보를 얻을 준비가 되었으면 Excel 산점도에 선형 회귀 추세선 추가를 확인하여 산술 평균과 관련하여 데이터 세트의 분산 또는 기타 측면을 시각화할 수 있습니다.