2017/07/14 - [엑셀] - [엑셀] 상/하위 몇 퍼센트에 해당하는 값 알아보기 percentile() 에서
엑셀이 어떻게 백분위수를 구하는지 언급한 적이 있다.
Excel 2016 에서는 Percentile 함수가 Percentile.EXC 와 Percentile.INC 두 가지로 나누어졌는데,
이중 Percentile.INC 가 이전에 사용하던 Percentile 과 같은 함수이다.
Percentile.EXC 는 약간 다른 결과를 내어 주는데, 두 함수가 어떻게 다른가 살펴보자.
Percentile.INC 는 주어진 백분위수가 몇 번째인지 판단할 때 정확히 다음과 같은 공식을 사용한다.
(n-1) x p + 1
n은 모든 데이터의 개수고, p는 백분위(0~1)이다.
예를 들어 앞선 포스트에서 0부터 10까지의 정수로 이루어진 데이터에서 percentile(array, 30%) 가 3을 내어주던 것은
0부터 10까지 데이터가 총 11개였으므로 n=11, 30%를 물었으므로 p=0.3에 해당하고
(11-1) x 0.3 + 1 = 4 번째 있는 수를 반환했던 것이다.
(실은 공식에 들어간 -1과 +1이, 앞선 포스트에서 이해를 돕기 위해 도입했던 '0번째 수'의 개념이라고 생각해도 되겠다)
1부터 10까지의 정수의 10%를 물었을 때 1.9를 반환하던 것도 마찬가지로 해석할 수 있다.
(10-1) x 0.1 + 1 = 1.9 번째 있는 수고
이것은 1에서 0.9만큼 떨어진 수다.
반면 Percentile.EXC는 다음과 같은 공식에 따라 몇 번째 수인지를 판단한다.
(n+1) x p
그러므로 0~10까지 정수에서 10%를 물으면
(11+1) x 0.1 = 1.2 번째 있는 수로 판단하고
1번째 수인 0에서 0.2만큼 떨어진 0.2를 반환한다.
1~10까지 정수에서 10%를 물으면
(10+1) x 0.1 = 1.1 번째 있는 수로 판단하고
1.1을 반환한다.
통계적으로 각각 나름의 쓰임이 있고, 큰 차이는 없다고 하나
모집단의 크기가 작을 때는 Percentile.INC 를 쓰는 것이 좀 더 낫다고 한다.
'엑셀' 카테고리의 다른 글
[엑셀] 특정 문자열에 해당하는 값 참조하기 VLOOKUP, MATCH (0) | 2017.08.08 |
---|---|
[엑셀] 도수분포표/히스토그램 만들기 (2016 데이터분석도구 설치하기) (8) | 2017.08.07 |
[엑셀] 랜덤추출하기 RANDBETWEEN() (10) | 2017.08.03 |
[엑셀] 계산 결과 값으로 셀 지정하기 INDIRECT() (0) | 2017.08.02 |
[엑셀] 상/하위 몇% 의 평균 구하기 (0) | 2017.08.01 |
[엑셀] 상/하위 몇 퍼센트에 해당하는 값 알아보기 percentile() (2) | 2017.07.14 |
[엑셀] 배열수식에 여러 개의 조건 사용하기 (5) | 2017.07.13 |
[엑셀] 두 수의 사이 빈 곳에 알맞게 연속된 숫자 채우기 (0) | 2017.07.12 |
[엑셀] Char()에 할당된 번호 알아보기, 연속되는 알파벳 채우기 (0) | 2017.07.11 |
[엑셀] 값의 증가 감소에 따라 색깔 넣기 (조건부 서식) (0) | 2017.07.10 |
댓글