본문 바로가기
엑셀

[엑셀] PERCENTILE INC와 EXC의 차이

by LightBlogger 2017. 7. 31.

2017/07/14 - [엑셀] - [엑셀] 상/하위 몇 퍼센트에 해당하는 값 알아보기 percentile() 에서 


엑셀이 어떻게 백분위수를 구하는지 언급한 적이 있다. 


Excel 2016 에서는 Percentile 함수가 Percentile.EXC 와 Percentile.INC 두 가지로 나누어졌는데,


이중 Percentile.INC 가 이전에 사용하던 Percentile 과 같은 함수이다.


Percentile.EXC 는 약간 다른 결과를 내어 주는데, 두 함수가 어떻게 다른가 살펴보자.



Percentile.INC 는 주어진 백분위수가 몇 번째인지 판단할 때 정확히 다음과 같은 공식을 사용한다.


(n-1) x p + 1


n은 모든 데이터의 개수고, p는 백분위(0~1)이다.



예를 들어 앞선 포스트에서 0부터 10까지의 정수로 이루어진 데이터에서 percentile(array, 30%) 가 3을 내어주던 것은


0부터 10까지 데이터가 총 11개였으므로 n=11, 30%를 물었으므로 p=0.3에 해당하고


(11-1) x 0.3 + 1 = 4 번째 있는 수를 반환했던 것이다.


(실은 공식에 들어간 -1과 +1이, 앞선 포스트에서 이해를 돕기 위해 도입했던 '0번째 수'의 개념이라고 생각해도 되겠다)



1부터 10까지의 정수의 10%를 물었을 때 1.9를 반환하던 것도 마찬가지로 해석할 수 있다.


(10-1) x 0.1 + 1 = 1.9 번째 있는 수고


이것은 1에서 0.9만큼 떨어진 수다.



반면 Percentile.EXC는 다음과 같은 공식에 따라 몇 번째 수인지를 판단한다.


(n+1) x p


그러므로 0~10까지 정수에서 10%를 물으면


(11+1) x 0.1 = 1.2 번째 있는 수로 판단하고


1번째 수인 0에서 0.2만큼 떨어진 0.2를 반환한다.



1~10까지 정수에서 10%를 물으면


(10+1) x 0.1 = 1.1 번째 있는 수로 판단하고


1.1을 반환한다.




통계적으로 각각 나름의 쓰임이 있고, 큰 차이는 없다고 하나


모집단의 크기가 작을 때는 Percentile.INC 를 쓰는 것이 좀 더 낫다고 한다.





반응형

댓글