본문 바로가기
반응형

추출5

[엑셀] 그래프에서 특정 요일만 색을 다르게 설정하기 가끔 특정 요일만 색이 다른 그래프를 만들고 싶을 때가 있다. 위와 같이 일요일만 빨간 색으로 만들어 보자. 먼저 자료를 준비하고 2016/09/01 - [엑셀] - [엑셀] 일요일만 빨간 색으로 바꾸기 에서 나온 WEEKDAY() 함수를 사용하여 일요일에 해당하는 데이터만 별도로 추출한다. '일요일'에 해당하는 조건은 WEEKDAY(셀) = 1 이 될 것이다. A열이 일요일이면 B열의 값을 반환하고, 아니면 공란으로 두라는 IF문을 작성하였다. 아래로 채워주면 일요일에 해당하는 데이터만 뽑아낼 수 있다. 마찬가지로 이번에는 일요일이 아닌 다른 요일의 데이터를 뽑아내 보자. '일요일이 아님'에 해당하는 조건은 WEEKDAY(셀)1 이 될 것이다. NOT을 의미하는 연산자가 != 가 아니라 인 것이 특이하.. 2016. 10. 18.
[R.아르] R에서 월별 합계 구하기 / 글자 일부분 자르기 substr() 2016/10/10 - [엑셀] - [엑셀] 월별 합계 구하기 month() / 배열수식 에서 본 월별합계를 R에서 사용하려면 어떻게 해야 할까? 일단 날짜에서 월을 뽑아내는 함수를 사용해야 할 것이다. lubridate 패키지의 month() 함수가 이러한 역할을 한다. lubridate 패키지를 설치하고 month()와 year() 함수를 사용하면 잘 추출되는 것을 알 수 있다. 이제 다음과 같은 x가 있다고 하자. 월을 추출해 임시 열로 붙여 놓고 참고로 명령줄 전체를 괄호()로 둘러싸 주면 명령줄의 실행 결과를 보여 준다. 즉, 위의 예에서 y를 다시 호출할 필요 없이 와 같이 적으면 cbind()의 결과를 바로 보여준다. 이제 dcast()를 사용하면 되겠다. (참고: 2016/09/23 - [.. 2016. 10. 14.
[R. 아르] 리스트에 없는 항목만 추출하기 (차집합, setdiff()) 지난 번 2016/09/08 - [R] - [R.아르] R에서 엑셀의 vlookup() 기능 사용하기 에서 본 merge()는 일종의 '교집합'을 구하는 함수로 생각해도 되겠다. 이번엔 차집합을 구하는 함수를 알아보자. 예를들어 다음과 같은 x, y에서 x에만 있고 y에는 없는 것을 고르려면 setdiff() 함수를 사용하면 된다. 반대로 y에만 있고 x에는 없는 것을 고르려면 순서를 반대로 사용한다. 내친 김에 합집합, 교집합, 부분집합도 알아보자. 합집합은 union() 함수를 사용한다. 사용하는 순서에 따라 원소의 배열이 다르며 자동으로 정렬되지는 않는다. 정렬하려면 sort()를 사용하자. 교집합은 intersect()를 사용한다. 한 집합이 다른 집합의 부분집합인지도 알 수 있다. 예를들어 다음.. 2016. 9. 23.
[R.아르] 특정 조건에 맞는 글자(이메일 주소)만 추출하기 다음과 같은 x가 있다고 하자. 우리는 여기에서 이메일 주소만 예쁘게 뽑아서 다음과 같이 만들 것이다. 그러기 위해서는 두 가지 함수를 써야 하는데 첫 번째는 '일치하는 문자열만 뽑아줘' regmatches() 이고, 두 번째는 그 일치하는 문자열의 형식을 지정하는 regexpr() 이다. 조합하면 regmatches(regexpr()) 와 같이 될 테니, regexpr()부터 먼저 보자. 사실 regexpr()은 R뿐 아니라 여기저기서 쓰는 유명한 녀석인 '정규표현식' 이라는 녀석을 다루는 함수다. 정규표현식을 다 다루기에는 분량이 너무 방대하고, 일단 팁 하나. http://regexr.com/ 위 사이트에 가면 정규표현식을 공부하고 직접 실습해볼 수 있다. 이제 이메일 주소에 대한 정규표현식을 만들.. 2016. 9. 6.
[R.아르] 특정 조건을 만족하는 행만 추출하기 2016/08/30 - [R] - [R.아르] R 행,열 삭제 의 연장선상에서, 꼭 '몇 번째' 행만 뽑을 수 있는 것은 아니다. 특정 조건을 만족하는 행도 추출할 수 있다. 다음과 같은 x가 있다고 하자. 여기서 var 가 70 이상인 행만 뽑아내려면 다음과 같이 하면 된다. 맨 끝의 쉼표를 잊지 말자. 해당 조건을 만족하는 '행' 임을 알려주는 부분이다. 기본적으로 행과 열의 정의를 통해 위와 같이 추출하는 방법도 좋지만, 어쩌면 다음에 소개하는 subset()이 좀 더 마음에 들지도 모르겠다. subset(데이터프레임, 조건) 은 조금 더 간단하고 직관적인 추출을 지원한다. 사잇값을 뽑으려면 and에 해당하는 '&' 기호를 사용하면 된다. 날짜도 마찬가지로 조건을 걸어 추출할 수 있다. 다음과 같은.. 2016. 9. 5.
반응형