본문 바로가기
반응형

중복5

[GA] SpreadSheet 보고서에 여러 개의 필터 넣기 2017/05/30 - [컴퓨터] - [GA] Dimensions & Metrics 의 파라미터 찾기에 등장했던 필터 문법을 보면 여러 개의 필터도 추가할 수 있음을 알 수 있다. 예를 들어 특정 페이지의 트래픽만 보고 싶다면 위와 같이 pagePath를 특정 값으로 지정해 주면 된다. 만일 그 페이지의 특정 시간대의 트래픽, 예를 들어 21-23시의 트래픽만 보고 싶다면? 페이지 일치 (그리고) 21시 (또는) 22시 (또는) 23시 와 같이 지정해 주면 될 것이다. 필터에서 '그리고'는 세미콜론(;) '또는'은 콤마(,)에 해당한다. 따라서 다음과 같이 필터를 구성하면 되겠다. 다른 시간대는 모두 트래픽이 0으로 나오는 것을 볼 수 있다. 확인했으므로 이제 Dimension 에서 Hour를 제외하고 .. 2017. 6. 12.
[R.아르] R에서 엑셀의 vlookup()처럼 첫 번째 값만 가져오기 다음과 같은 x, y가 있다고 할 때 x의 product에 해당하는 y의 memo를 가져오는 것은 어렵지 않다. 2016/09/08 - [R] - [R.아르] R에서 엑셀의 vlookup() 기능 사용하기에 나왔던 merge()를 사용하면 되겠다. 하지만 이전 포스팅에서 지적했듯이, merge()는 가져오고자 하는 대상에 중복값이 있으면 그 값을 모두 매칭시켜 준다. (이 예에서는 E에 Eggplant와 Enchilada 라는 값이 두 개 있다.) 엑셀의 vlookup()이 첫 번째 값만 반환해 주는 것과는 사뭇 다르다. vlookup()처럼 첫 번째 값만 반환하려면 2016/09/12 - [R] - [R.아르] 중복된 행 삭제하기 unique() / duplicated() 에 등장한 duplicated.. 2016. 10. 28.
[엑셀] 특정 문자(대소문자)가 포함된 셀의 개수 세기 countif() / find() countif()는 조건에 맞는 셀의 갯수를 셀 때 쓰는 함수이며 와일드카드 문자 (*) 의 사용이 가능하다. 예를 들어 다음 중 apple 과 일치하는 셀은 1개 이지만 apple이라는 단어가 들어간(*apple*) 셀은 2개이다. 다른 셀에 들어 있는 문자를 참조로 쓸 때에는 아래와 같이 "*"&셀&"*" 로 표기해 주어야 한다. app이 들어간 셀은 모두 세 개이며 o가 들어간 셀은 두 개이다. countif는 기본적으로 대소문자를 구별하지 않으므로 대소문자의 구분이 중요하다면 다른 방법을 사용해야 한다. 대소문자를 구별하는 find() 함수에서 시작해 보자. find() 함수는 셀에서 특정 문자가 포함된 곳의 위치를 숫자로 반환해 준다. 같은 식을 B5에 적용하면 중간에 a가 있음에도 값을 찾을 .. 2016. 9. 26.
[R.아르] 중복된 행 삭제하기 unique() / duplicated() R에서 중복된 행을 삭제하려면 unique()를 사용하면 된다. 다음과 같은 x에서 unique()를 실행시키면 중복된 행들이 사라지는 것을 알 수 있다. 중복된 행이 몇 개나 되는지 숫자가 알고 싶을 때는? 지난 번에 본 nrow를 쓰면 되겠다. 여러 개의 열이 있을 경우에는 행의 모든 값이 완전히 동일할 때만 중복으로 간주한다. 예를들어 다음과 같은 x에서 unique()를 실행시키면 4행과 5행은 서로 중복이 아니므로 제거되지 않는다. 간혹 중복된 행들을 직접 눈으로 확인하고 싶을 때가 있다. 이럴 땐 duplicated() 함수를 사용한다. 다음과 같은 x에서 duplicated()를 사용하면 중복된 행을 TRUE로, 아닌 행을 FALSE로 반환해 준다. 진리값이 보기 어렵다면 which()안에 .. 2016. 9. 12.
[R.아르] 중복된 값의 개수 세기(엑셀의 countif) 다음과 같은 x가 있다고 하자. a는 총 몇 번 나왔을까? 지난 번에 본 length(which())를 쓰면 되겠다. (2016/09/05 - [R] - [R.아르] 특정 조건을 만족하는 행의 개수 구하기) 3번 나왔다고 한다. 그렇다면 b는? c는? d는? e는? 매번 이렇게 확인하기는 힘든 일이다. 이럴 때 엑셀에서는 countif()를 쓴다. 그리고 R에서는 table()을 사용한다. table은 결과를 표로 정리해 주는 함수이며, 이렇게 열 하나를 지정할 경우 해당 열의 데이터가 몇 번 중복으로 나왔는지 알려준다. 엑셀에서 countif() 함수를 쓰는 것과 비슷하다. 데이터 프레임으로 보는 것이 편하다면 아래와 같이 데이터프레임으로 바꾸어 주자. 2016. 9. 9.
반응형