본문 바로가기
반응형

동일2

[R. 아르] 리스트에 없는 항목만 추출하기 (차집합, setdiff()) 지난 번 2016/09/08 - [R] - [R.아르] R에서 엑셀의 vlookup() 기능 사용하기 에서 본 merge()는 일종의 '교집합'을 구하는 함수로 생각해도 되겠다. 이번엔 차집합을 구하는 함수를 알아보자. 예를들어 다음과 같은 x, y에서 x에만 있고 y에는 없는 것을 고르려면 setdiff() 함수를 사용하면 된다. 반대로 y에만 있고 x에는 없는 것을 고르려면 순서를 반대로 사용한다. 내친 김에 합집합, 교집합, 부분집합도 알아보자. 합집합은 union() 함수를 사용한다. 사용하는 순서에 따라 원소의 배열이 다르며 자동으로 정렬되지는 않는다. 정렬하려면 sort()를 사용하자. 교집합은 intersect()를 사용한다. 한 집합이 다른 집합의 부분집합인지도 알 수 있다. 예를들어 다음.. 2016. 9. 23.
[R.아르] 특정 조건에 맞는 글자(이메일 주소)만 추출하기 다음과 같은 x가 있다고 하자. 우리는 여기에서 이메일 주소만 예쁘게 뽑아서 다음과 같이 만들 것이다. 그러기 위해서는 두 가지 함수를 써야 하는데 첫 번째는 '일치하는 문자열만 뽑아줘' regmatches() 이고, 두 번째는 그 일치하는 문자열의 형식을 지정하는 regexpr() 이다. 조합하면 regmatches(regexpr()) 와 같이 될 테니, regexpr()부터 먼저 보자. 사실 regexpr()은 R뿐 아니라 여기저기서 쓰는 유명한 녀석인 '정규표현식' 이라는 녀석을 다루는 함수다. 정규표현식을 다 다루기에는 분량이 너무 방대하고, 일단 팁 하나. http://regexr.com/ 위 사이트에 가면 정규표현식을 공부하고 직접 실습해볼 수 있다. 이제 이메일 주소에 대한 정규표현식을 만들.. 2016. 9. 6.
반응형