표준편차란 산포도의 일종으로, 주어진 자료들이 평균에서 얼마나 흩어지는 경향성을 보이는지 판단하는 지표다.
다음과 같은 자료가 있다면 평균은 80, 표준편차는 5가 된다.
여기서 표준편차가 5라는 것은 자료 중 절반은 평균보다 5가 크고, 나머지 절반은 평균보다 5가 작다는 의미이다.
STDEV.P 와 STDEV.S 는 모두 표준편차를 구하는 함수인데, 전자는 주어진 자료가 전부일 때, 후자는 주어진 자료가 일부일 때 사용한다.
[이미지: 위키피디아]
위 그림에서 위쪽, 1번부터 12번까지가 우리가 알고 싶은 '전체' 라고 할 때, 이것을 모집단Population 이라고 한다.
현실에서는 모집단 전체의 자료를 모으는 것이 거의 불가능하므로 일부 자료를 모아 그 자료를 토대로 모집단의 특성을 추측한다.
위 그림에서 2, 5, 8, 11번은 그렇게 모은 일부의 자료를 의미하며, 이것을 표본집단Sample 이라고 한다.
STDEV 뒤에 붙는 P와 S 는 각각 모집단과 표본집단을 의미한다. (STDEV 는 표준편차Standard Deviation의 약자이다.)
우리가 이 함수에 넣고 싶은 자료가 '전체'에 해당한다면 P를, '일부'에 해당한다면 S를 사용하면 되겠다.
위의 엑셀 화면에서는 A1 부터 A10 까지 10개의 자료가 전부이므로 STDEV.P 를 사용하였다.
STDEV.S 를 사용하면 다음과 같은 결과가 나온다.
만일 A1부터 A10까지 10개의 숫자가 자료의 전부가 아니라, 어떤 더 많은 수들의 집합으로부터 임의로 10개만 뽑은 것이라면
그 원래 집합(모집단)의 표준편차는 5.27 로 추정할 수 있다는 것이다.
물론 여기에서 실제 그런 모집단은 존재하지 않으므로 저 수는 허구가 되겠지만, 표본집단으로부터 모집단의 성질을 추측할 수 있는 방법이
이미 수학적으로 잘 정리되어 이렇게 엑셀 함수로 간단히 이용할 수 있다는 것은 실로 기꺼운 일이라 하겠다.
평균을 변화시키지 않으면서 자료를 살짝 바꾸어보자. 85 하나를 100으로, 75 하나를 60으로 바꾸어도 평균은 80일 것이다.
표준편차는 커질텐데, 얼마나 커질까?
엑셀은 표준편차가 10이라고 알려준다.
이는 마치 80을 평균으로 절반의 자료는 90, 나머지 절반의 자료는 70인 것과 비슷한 분포를 보인다고 얘기하는 것이다.
그러니까 이것과 -
이것이 -
서로 비슷한 분포라고 말하고 있는 것이다.
실제로 이 둘이 비슷한지, 비슷하다면 어떤 점에서 비슷한지 판단하는 것은 사용자의 몫일 것이나
표준편차는 우리에게 분포를 단적으로 이해할 수 있는 유용한 값을 제공해 준다.
'엑셀' 카테고리의 다른 글
[엑셀] 특정 문자와 일치하는 행 모아서 다른 시트로 추출하기 (51) | 2018.04.17 |
---|---|
[엑셀] 특정 문자와 일치하는 행 모아서 추출하기 (33) | 2018.03.07 |
[구글시트] 다른 시트로부터 내용 가져오기 Importrange (6) | 2018.03.06 |
[엑셀] Indirect 를 이용하여 한 행씩 번갈아 추출하기 (1) | 2018.03.02 |
[엑셀] 중복값의 위치 찾기 (0) | 2018.01.26 |
[엑셀] 두 가지 이상의 다중조건으로 VLOOKUP 사용하기 (13) | 2017.08.24 |
[엑셀] 한 셀 내에서 특정 문자 개수 구하기 (17) | 2017.08.23 |
[엑셀] 수식의 부분 결과 검증하기 F9 (0) | 2017.08.22 |
[엑셀] 엑셀 엔터(줄바꿈) 입력하는 방법 (1) | 2017.08.21 |
[엑셀] 수식 내용을 그대로 표시하는 세 가지 방법 (3) | 2017.08.10 |
댓글