본문 바로가기
반응형

분석11

[GA] 특정 페이지의 시간별 트래픽 보기 [잠재고객] 항목에서는 시간별로 트래픽을 볼 수 있지만, 특정 페이지를 필터링할 수는 없다. [행동] - [모든페이지] 항목에서는 특정 페이지를 필터링할 수 있지만, 시간별로 볼 수는 없다. 특정 페이지의 시간별 트래픽을 알고 싶을 때는 위 화면에서 원하는 페이지를 눌러 필터링한 뒤 (물론 '고급'이라고 쓰인 검색창에서 필터링해도 된다) [두 번째 측정 기준]을 시간으로 선택해 주면 된다. 시간별로 트래픽이 나오는 것을 볼 수 있다. 2017. 6. 5.
[GA] Google Analytics의 1시간은 몇 분부터 몇 분까지일까? Google Analytics에서는 시간 단위로 트래픽을 체크할 수 있다. 헌데 저 16:00 는 정확히 몇 분부터 몇 분까지일까? 직관적으로 16:00 - 16:59 일 것 같은데, 정말 그런지 확인해 보자. 2017/04/03 - [컴퓨터] - [GA] 구글 애널리틱스에서 자동으로 보고서 만들기 에서 본 대로 시간별, 분별로 Dimensions를 세팅하고 보고서를 생성한다. 분 단위 보고서에서 sumif()로 00:00 - 00:59 의 트래픽을 합산하자(" 2017. 6. 1.
[R.아르] 문장에서 보통명사만 추출하기(1) 문장에서 보통명사만 추출하는 과정은 2016/11/22 - [R] - [R.아르] 문장에서 명사 추출하기 에서 본 과정과 거의 동일하다. 다만 extractNoun()으로 명사를 추출하는 대신 보통명사만 추출해야 하므로 위 포스트에서 제작했던 커스텀 함수 부분을 보통명사 추출로 바꾸어 주면 된다. 커스텀 함수 제작 후, 동일한 과정을 반복해 보자. words 2016. 12. 6.
[R.아르] R에서 피벗테이블 사용하기 dcast() 피벗테이블의 용도야 다양하겠지만 특히 두 가지 경우에 많이 쓰이는 것 같다. 1) 항목별 합산이 필요한데 countif와 sumif를 사용하기는 귀찮을 때 2) 한 항목은 행, 한 항목은 열로 삼아 펼쳐 보고 싶을 때 두 번째 것부터 먼저 알아보자. 먼저 x를 마련하고 reshape2 라이브러리를 불러온다. 피벗테이블 기능을 하는 함수는 dcast()다. dcast(원 데이터, 행이 될 항목 ~ 열이 될 항목, 값으로 사용할 항목, 결과 형태) 와 같이 적어준다. 우리는 날짜를 행으로 삼고 상품을 열로 삼아 펼칠 것이므로 date ~ product 와 같이 써 주면 되겠다. 그리고 sales 열을 값으로 사용할 것이므로 value.var="sales" 로 입력한다. 원하는 결과를 얻었다. 잠깐, 총합이 .. 2016. 9. 23.
[R.아르] 중복된 행 삭제하기 unique() / duplicated() R에서 중복된 행을 삭제하려면 unique()를 사용하면 된다. 다음과 같은 x에서 unique()를 실행시키면 중복된 행들이 사라지는 것을 알 수 있다. 중복된 행이 몇 개나 되는지 숫자가 알고 싶을 때는? 지난 번에 본 nrow를 쓰면 되겠다. 여러 개의 열이 있을 경우에는 행의 모든 값이 완전히 동일할 때만 중복으로 간주한다. 예를들어 다음과 같은 x에서 unique()를 실행시키면 4행과 5행은 서로 중복이 아니므로 제거되지 않는다. 간혹 중복된 행들을 직접 눈으로 확인하고 싶을 때가 있다. 이럴 땐 duplicated() 함수를 사용한다. 다음과 같은 x에서 duplicated()를 사용하면 중복된 행을 TRUE로, 아닌 행을 FALSE로 반환해 준다. 진리값이 보기 어렵다면 which()안에 .. 2016. 9. 12.
[R.아르] 특정 조건에 맞는 글자(이메일 주소)만 추출하기 다음과 같은 x가 있다고 하자. 우리는 여기에서 이메일 주소만 예쁘게 뽑아서 다음과 같이 만들 것이다. 그러기 위해서는 두 가지 함수를 써야 하는데 첫 번째는 '일치하는 문자열만 뽑아줘' regmatches() 이고, 두 번째는 그 일치하는 문자열의 형식을 지정하는 regexpr() 이다. 조합하면 regmatches(regexpr()) 와 같이 될 테니, regexpr()부터 먼저 보자. 사실 regexpr()은 R뿐 아니라 여기저기서 쓰는 유명한 녀석인 '정규표현식' 이라는 녀석을 다루는 함수다. 정규표현식을 다 다루기에는 분량이 너무 방대하고, 일단 팁 하나. http://regexr.com/ 위 사이트에 가면 정규표현식을 공부하고 직접 실습해볼 수 있다. 이제 이메일 주소에 대한 정규표현식을 만들.. 2016. 9. 6.
[R.아르] 특정 조건을 만족하는 행의 개수 구하기 아래와 같은 x에서 var의 값이 60을 넘는 행의 개수는 몇 개일까? 2016/09/05 - [R] - [R.아르] 특정 조건을 만족하는 행만 추출하기 에서 논의한 대로 다음과 같이 뽑으면 될 것이다. 총 5개 행이다. 데이터가 많아지면 직접 셀 수는 없고, 이럴 때 행의 개수를 세어 주는 함수는 nrow() 쨘! 근데 추출이 조금 번거롭다. 조건을 만족하는 행의 개수만 한 번에 셀 수도 있지 않을까? 물론이다. 그냥 y대신 x[x$var>=60,] 를 쓰면 된다. 하지만 개인적으로는 아래의 코드가 훨씬 직관적이고 기억하기 쉽다고 생각하는 바, 오? 왠지 x$var >= 60 에 해당하는 것들의 길이(?) 라고 자연스럽게 읽힌다. which()는 괄호 안의 조건에 해당하는 데이터가 어디어디에 있는지 그.. 2016. 9. 5.
[R.아르] 특정 조건을 만족하는 행만 추출하기 2016/08/30 - [R] - [R.아르] R 행,열 삭제 의 연장선상에서, 꼭 '몇 번째' 행만 뽑을 수 있는 것은 아니다. 특정 조건을 만족하는 행도 추출할 수 있다. 다음과 같은 x가 있다고 하자. 여기서 var 가 70 이상인 행만 뽑아내려면 다음과 같이 하면 된다. 맨 끝의 쉼표를 잊지 말자. 해당 조건을 만족하는 '행' 임을 알려주는 부분이다. 기본적으로 행과 열의 정의를 통해 위와 같이 추출하는 방법도 좋지만, 어쩌면 다음에 소개하는 subset()이 좀 더 마음에 들지도 모르겠다. subset(데이터프레임, 조건) 은 조금 더 간단하고 직관적인 추출을 지원한다. 사잇값을 뽑으려면 and에 해당하는 '&' 기호를 사용하면 된다. 날짜도 마찬가지로 조건을 걸어 추출할 수 있다. 다음과 같은.. 2016. 9. 5.
[R.아르] 글자 수 세기 nchar() 가끔 각 데이터들의 글자 수가 궁금할 때가 있다. 데이터를 예쁘게 잘 다듬은 후, 같은 자리수로 맞춰졌는지 확인할 때라거나. 글자가 조금 들어가 있는 mtcars 자료를 사용하자. mtcars의 head 부분만 x로 가져왔다. 행 이름(rownames(x))의 길이가 각각 얼마나 되는지 알아보자. 이럴 때 nchar()를 사용한다. "Mazda RX4" 는 9글자라는 이야기다. "Mazda RX4 Wag" 는 13글자고. 공백을 포함하여 세는 것을 알 수 있다. 꼭 문자만 세어 주는 것은 아니다. "."을 포함하여 세고, 소수점 이하 마지막 0은 세지 않는 것을 볼 수 있다:) 2016. 9. 2.
[R.아르] R 행,열 삭제 R에서 쓰이는 데이터프레임은 행과 열을 갖고 있다.[2, 1] 은 2행 1열,[1, 3] 은 1행 3열을 의미한다. 같은 원리로, 쉼표의 위치에 따라[2,] 은 '2행'을 의미하고[,3] 은 '3열'을 의미한다 행과 열이 많이 필요할 것 같으니, R에 기본 저장 되어 있는 'iris' 데이터를 보자 150행짜리라, 첫 몇 행만 보려고 head()에 넣었다. 여기서 1행만 뽑고 싶다면 이렇게 1에서 10행까지만 뽑고 싶다면 이렇게 1에서 3열까지만 뽑고 싶다면 이렇게 하면 된다. 3열까지 뽑을 경우 행은 150 행일 것이므로 head()로 조금만 보았다:) 이제 x에서 1행을 삭제해 보자. 삭제는 (-) 기호를 쓰면 된다. 마찬가지로 2, 4, 6 행을 삭제하려면 삭제시에는 행이름이 아니라 행의 순서로 판.. 2016. 8. 30.
반응형