본문 바로가기
엑셀

[엑셀] 도수분포표/히스토그램 만들기 (2016 데이터분석도구 설치하기)

by LightBlogger 2017. 8. 7.

아래와 같은 자료가 있다고 하자.



무슨 숫자가 얼마나 있는지 궁금해서 다음과 같은 차트를 만들었다면


별로 도움이 되지 않는다.



그냥 각 숫자가 한 개씩 있다는 정보일 뿐이다. 


이럴 때 필요한 것이 도수분포표와 히스토그램이다.


도수분포표는 계급을 이용하는데, 계급은 위에 나열된 숫자들을 일정 구간으로 묶어 주는 역할을 한다.


각 숫자는 하나씩 있지만 1에서 10 사이에 위치하는 숫자는 몇 개인지, 10에서 20 사이에 위치하는 숫자는 몇개인지를 보면


숫자들의 전체적인 분포가 눈에 들어올 것이다.



본격적으로 계급을 정해 보자.


계급을 정하기 위해 주어진 자료가 어디부터 어디까지 분포하는지,


자료의 최소값(MIN)과 최대값(MAX)을 확인한다.



숫자들은 최소 0부터 최대 131까지 분포한다고 한다.


계급은 정하기 나름이겠으나 여기서는 0부터 10씩 증가하는 계급으로 진행해 보자.


0을 입력하고 범위를 설정한 후 Alt + E + I + S 를 눌러 연속데이터 입력 창을 띄운다.


단계값으로는 10을 입력한다.



아래와 같이 0에서 140까지 계급이 만들어졌다.


이제 주어진 자료에서 0이상 10미만인 자료가 몇 개인지 카운트한다.


다음과 같이 COUNTIFS 함수를 사용하면 되겠다.


=COUNTIFS(A:A,">="&C2,A:A,"<"&C3)



수식을 140에 해당하는 곳까지 채운다. (Ctrl + D)



이제 아래와 같이 범위를 잡고 [삽입] - [차트] - [막대형 차트] 를 선택한다.



차트가 썩 마음에 들지 않을 것이다. 우리가 기대한 것은 10, 20, 30.. 등이 가로 축의 이름('축 레이블')으로 배열되는 것인데,


정작 가로축은 자동으로 1, 2, 3... 이 입력되고 10, 20, 30.. 은 데이터로 취급되고 있다.


10, 20, 30 을 가로 축의 이름, '축 레이블' 로 지정해 보자.


차트에서 오른쪽 버튼을 클릭하여 [데이터 선택]으로 들어간다.



아래 화면의 왼쪽 창이 데이터가 표시되는 곳이다. 데이터가 계열 1과 계열 2의 두 개로 표시되는 것을 알 수 있다.


[계열 1]이 10, 20, 30 .... [계열 2]가 3, 1, 6... 을 의미하므로, 여기서 계열 1은 삭제해 주자.



오른쪽 창이 축 레이블을 지정하는 곳이다. [편집] 을 눌러 10, 20, 30... 이 적힌 셀들을 지정한다.



확인을 누르면 원하는 형태의 그래프를 얻을 수 있다.



10, 20, 30, 40... 등의 축 레이블이 직관적이지 않다면 다음과 같이 지정해 줄 수도 있다.


10, 20, 30, 40... 이 적힌 셀 옆에 다음과 같이 수식을 적는다.


=C2&" - "&C3



말하자면 0에서 10사이의 값들이라는 의미다. (정확히는 이전의 수식에서 0이상 10미만으로 지정하였다.)


이제 Ctrl + D 로 아래까지 채우고, 차트에서 오른쪽 버튼을 눌러 [데이터 선택]으로 들어간다.



[가로(항목) 축 레이블]에서 [편집]을 누르고



방금 만든 값들을 축 레이블로 지정해 준다.



아래와 같은 차트를 얻을 수 있다.



축 레이블을 선택하면 [홈] 메뉴에서 글꼴이나 크기, 정렬을 바꿀 수 있다.



축 레이블을 기울이고 싶다면 축 레이블에서 오른쪽 버튼을 눌러 [축 서식]으로 들어가자.



세 번째의 메뉴를 누르면 다음과 같이 축 레이블을 기울일 수 있다.







같은 과정을 [히스토그램]이라는 메뉴를 활용하여 진행할 수도 있다.


히스토그램은 [데이터] 메뉴 오른쪽의 [데이터 분석] 항목에서 접근할 수 있는데



혹시 메뉴가 없다면 다음 작업을 통해 [데이터분석도구]를 추가하자. (2016기준)



[파일] 클릭



[옵션] 선택



[추가 기능] 클릭



[분석 도구] 선택 후 [이동] 클릭



[분석 도구] 체크 후 [확인] 클릭


이제 [데이터 분석] 메뉴가 생겼을 것이다. 클릭해 보자.



메뉴 중 [히스토그램]이 보인다.



[입력 범위] 는 데이터가 있는 열,


[계급 구간] 은 아까 만든 계급이 있는 곳을 선택하고


[차트 출력] 에 체크한 후 확인을 누른다.



도수분포표와 히스토그램을 얻었다.


다만 엑셀은 계급 10에 해당하는 빈도를 2라고 카운트하는데,


이는 계급을 (이상 ~ 미만)이 아니라 (초과 ~ 이하)로 잡기 때문이다.


즉 계급 10은 (0초과 10이하) 계급에 해당하는 빈도수가 된다.






반응형

댓글