로또는 종종 사람들로부터 의심의 눈초리를 받는다.
대표적인 의심은 1등 확률이 815만 분의 1임에도
어떻게 매 회차 1등 당첨자가 그렇게 많이 나오냐는 것인데
당첨자의 수가 과연 믿을 만한 것인지 생각해 보자.
(1등 당첨확률 구하는 식은 2016/11/08 - [R] - [R. 아르] 로또 확률 계산하기 for() / choose() 참고)
나눔로또 홈페이지에 들어가면 누구나 이전 회차들에 대한 당첨금 정보를 엑셀로 다운받을 수 있다.
http://www.nlotto.co.kr/gameResult.do?method=byWin
이것은 2018년 5월 25일에 받은 파일이다: excel.xls
열어보면 다음과 같은 데이터가 나온다.
우리가 알고 싶은 것은, 예를 들어 807회차에 1등이 7명 나올 만한가 하는 것이다.
이를 위해서는 판매된 총 장수를 알아야 하는데 이 시트에는 나와 있지 않다.
총 판매 금액이 나와있을 경우 (÷ 1,000) 하면 되겠으나, 총 판매 금액 역시 나와 있지 않다.
다만 엑셀을 다운로드하는 페이지에는 총 판매금액이 적혀 있는 것을 볼 수 있다. 807회차의 경우 73,831,580,000(약 738억)원이다.
1,000원으로 나누면 총 73,831,580(약 7천 3백만)장이 팔렸다는 의미이며,
1등 당첨확률인 1/8,145,060 을 곱해 보면 예상치는 9장 정도가 나오는 것을 알 수 있다.
대략 8백만장에 1장 당첨인데 사람들이 총 7천3백만장이나 샀으니 9장 정도 당첨되어도 이상하지 않다.
해당 회차에는 1등 당첨자가 오히려 약간 적은 셈이다.
다른 회차들도 계산해 보자. 하지만 모든 회차의 총 판매금액을 일일이 웹페이지에서 조회해 볼 수는 없다.
다행히 당첨금을 계산하는 계산식이 나와 있으므로, 시트에서 역으로 추정해 볼 수는 있겠다.
http://www.nlotto.co.kr/gameInfo.do?method=winStructure
계산식은 다음과 같다.
총 당첨금 중 4등과 5등 금액을 제외한 금액의 75%를 1등 당첨자들이 1/n 하는 구조다.
여기서 총 당첨금이란 총 판매금액의 50%를 의미한다. (나머지 50%는 사람들을 돕는 데에 쓰인다고 한다.)
식을 세우면 다음과 같다.
[{(총 판매금액 x 50%) - (4등 당첨금 + 5등 당첨금)} x 75%] ÷ 1등당첨자 수 = 1등의 1인당 당첨금액
이를 총 판매금액에 대해 풀면 다음과 같다.
총 판매금액 = {1등의 1인당 당첨금액 x 1등 당첨자 수 ÷ 75% + (4등 당첨금 + 5등 당첨금)} ÷ 50%
위 시트에서 수식으로 입력하면 다음과 같다.
=(E4*D4/75%+K4*J4+M4*L4)/50%
결과는?
807회차의 경우 73,831,580,011 이 나왔다.
아까 807회차의 총 판매금액이 73,831,580,000원이라고 했으므로 계산식은 맞다고 보아도 되겠다.
이제 이 수식으로 모든 회차의 판매 장수를 구하고
이를 토대로 1등 당첨 장수의 예상치를 구한 후, 실제 당첨 장수와 얼마나 차이나는지 보자.
회차가 다소 많으므로, 일단 2018년만 그려보면 다음과 같다.
예상값은 거의 9와 10 선에서 안정적이다. 매주 판매되는 로또 장수가 비슷하다는 얘기겠다.
예상치의 평균은 9.37, 실제 당첨자 수의 평균은 9.45다.
2017년도 보자.
예상치의 평균은 8.96, 실제 당첨자 수의 평균은 9.19다.
하지만 이런 식으로 모든 해의 그래프를 다 그려본다 해도 확률을 납득할 만큼 검증하기는 어렵다.
어떤 사람은 비슷한 것 같다고도 하고, 어떤 사람은 유의미하게 실제 당첨자가 많다고 생각할 것이다.
어떻게 하면 좀 더 납득할 만한 설명이 될까?
간단한 예를 생각해 보자.
주사위를 던져 3이 나올 확률이 정말 6분의 1인지 검증하는 방법은 무엇인가.
많이 던져서 진짜 그런지 확인해 보면 될 일이다.
실제 던져 보면 아마 처음에는 10번 중 1번, 20번 중 3번... 하는 식으로 나오다가
시행을 아주 많이 할수록 6분의 1에 가까워질 것이다.
만일 다른 값에 가까워진다면 주사위가 잘못된 것은 아닌지 의심해봐야 한다.
여기서 실제 주사위를 던져서 10번 중 1번, 20번 중 3번... 나오는 것을 '통계적 확률' 이라 하고,
우리가 알고 있는 6분의 1이라는 값을 '수학적 확률'이라 한다.
'많이 던져서 진짜 그런지 확인해 본다' 는 방법을 수학에서는
'시행을 거듭할수록 통계적 확률이 수학적 확률에 수렴한다'고 표현한다. (큰 수의 법칙)
이제 로또의 1등 당첨확률이, 시행을 거듭할수록 8,145,060 분의 1에 수렴하는지 검증해 보자.
위 시트에서 판매장수와 당첨자 수를 정리하면 다음과 같다.
첫 날은 약 130만 장 팔리고 당첨자가 없었다. 확률은 0이다.
두 번째는 720만 장 팔리고 당첨자는 한 명이었다.
여기까지 약 850만 장 팔렸고, 당첨자는 한 명이다. 확률은 850만 분의 1이다.
세 번째 날까지는 약 1600만 장 팔렸고, 당첨자는 총 두 명이다. 확률은 1600만 분의 2
이런 식으로 누적해서 확률이 얼마나 되는지 그래프를 그려 보면 다음과 같다.
시행을 거듭할수록 통계적 확률이 수학적 확률에 다가가고 있는 것을 볼 수 있다.
유일하게 수학적 확률을 넘은 것은 세 번째 날까지의 확률인 1600만 분의 2이며, 그 이후는 많이 떨어졌다가 점점 근접해 가고 있다.
마지막 결과치의 통계적 확률은 수학적 확률의 95% 수준이며,
여기까지 결과를 볼 때 로또 1등은 적어도 수학적 확률보다 더 높은 값에 수렴하지는 않는다고 생각할 수 있다.
※ 단, 큰 수의 법칙은 매 회차 동일한 시행을 반복했다는 전제 하에 성립한다.
'엑셀' 카테고리의 다른 글
[엑셀] VLOOKUP 대신 INDEX, MATCH 를 사용하면 좋은 4가지 경우 (0) | 2018.08.30 |
---|---|
[엑셀] VLOOKUP 대신 INDEX, MATCH 사용하기 (0) | 2018.08.28 |
[엑셀] 배열수식에서 AND, OR, NOT 등의 논리연산 사용하기 (2) | 2018.07.10 |
[엑셀] 지난 달, 다음 달 입력하기 EDATE() EOMONTH() (0) | 2018.07.04 |
[엑셀] 최초로 0이 아닌 값이 나오는 곳 찾기 INDEX() MATCH() (26) | 2018.06.13 |
[엑셀] 특정 문자와 일치하는 행 모아서 다른 시트로 추출하기 (51) | 2018.04.17 |
[엑셀] 특정 문자와 일치하는 행 모아서 추출하기 (33) | 2018.03.07 |
[구글시트] 다른 시트로부터 내용 가져오기 Importrange (6) | 2018.03.06 |
[엑셀] Indirect 를 이용하여 한 행씩 번갈아 추출하기 (1) | 2018.03.02 |
[엑셀] 중복값의 위치 찾기 (0) | 2018.01.26 |
댓글