통계적으로 백분위수(Percentile)를 구하는 방법에는 여러 가지가 있다고 한다.
엑셀은 어떻게 계산하는지 알아보자.
다음과 같은 자료에서
하위 30%에 있는 값은 3이 될 것이다.
수식으로는 percentile()을 이용하여 이렇게 적는다.
말하자면 이런 셈이다.
실제로 계산하는 방법은 조금 다르지만,
쉽게, 맨 처음 숫자는 0%이므로 말하자면 '0번째 숫자'로 치고, 1부터 첫 번째 숫자로 생각한다고 보면 이해가 빠를 것이다.
(정확한 계산 방법은 2017/07/31 - [엑셀] - [엑셀] PERCENTILE INC와 EXC의 차이 를 참고)
자료가 1부터 시작한다면 이야기가 좀 다르겠다.
말하자면 1이 0%이므로 0번째 숫자, 2부터 첫 번째 숫자가 되고
이때 하위 10%는 1과 2 사이 어디쯤 될 것이다.
(2가 10%라고 생각하면 3이 20%... 와 같이 10까지 진행했을 때 100%가 맞지 않는 것을 알 수 있다.)
엑셀은 얼마로 판단하는지 보자.
하위 10%에 해당하는 값은 1.9라고 한다.
계산은 이렇다.
1) 시작점에 해당하는 1을 제외하고 숫자가 총 9개이므로
2) 10% 가 몇 번째냐면 9 x 10% = 0.9 번째의 수일 것이다.
3) 0.9 번째의 수는 0번째와 1번째 수 사이에 있는데
4) 0번째 수에서는 0.9만큼, 1번째 수에서는 0.1만큼 떨어져 있을 것이다. (이런 방법을 가중평균이라고 한다.)
임의의 숫자들로 보면 좀 더 이해가 쉬울 것이다.
역시 9개의 숫자에서 10%를 물었고 엑셀의 판단은 다음과 같다.
1) 시작점에 해당하는 10을 제외하고 숫자가 총 9개이므로
2) 10% 가 몇 번째냐면 9 x 10% = 0.9 번째의 수일 것이다.
3) 0.9 번째의 수는 0번째인 10과 1번째인 14사이에 있는데
4) 10으로부터는 0.9만큼, 14로부터는 0.1만큼 떨어져 있을 것이다. (10 + (14-10)*0.9)
상위 10%에 해당하는 수는 90%, 혹은 0.9로 물으면 되겠다.
90%는 9 x 90% = 8.1번째 있는 수이므로
95 + (98-95)*0.1 로 계산하는 것을 볼 수 있다.
'엑셀' 카테고리의 다른 글
[엑셀] 도수분포표/히스토그램 만들기 (2016 데이터분석도구 설치하기) (8) | 2017.08.07 |
---|---|
[엑셀] 랜덤추출하기 RANDBETWEEN() (10) | 2017.08.03 |
[엑셀] 계산 결과 값으로 셀 지정하기 INDIRECT() (0) | 2017.08.02 |
[엑셀] 상/하위 몇% 의 평균 구하기 (0) | 2017.08.01 |
[엑셀] PERCENTILE INC와 EXC의 차이 (0) | 2017.07.31 |
[엑셀] 배열수식에 여러 개의 조건 사용하기 (5) | 2017.07.13 |
[엑셀] 두 수의 사이 빈 곳에 알맞게 연속된 숫자 채우기 (0) | 2017.07.12 |
[엑셀] Char()에 할당된 번호 알아보기, 연속되는 알파벳 채우기 (0) | 2017.07.11 |
[엑셀] 값의 증가 감소에 따라 색깔 넣기 (조건부 서식) (0) | 2017.07.10 |
[엑셀] 홀수 행 삽입하기 (0) | 2017.06.09 |
댓글