본문 바로가기
반응형

문자열3

[R.아르] 일부 글자로 vlookup() 기능 사용하기 pmatch() pmatch()는 partial match 의 약자로 일부 문자열을 입력하면 주어진 벡터 중 몇 번째 요소가 해당 문자를 포함하는지 반환해 준다. 예를 들어 다음과 같은 x에서 appl을 찾으면 첫 번째 요소인 apple에 포함되어 있다고 알려준다. 2016/09/30 - [R] - [R.아르] 객체 지우기 rm() / 특정 문자가 포함된 행 추출하기 grep() 에서 본 grep()과 비슷하지만 인자로 벡터를 받을 수 있다는 점에서 차이가 있다. 후에서 확인할 것이다. 계속해서 'ap'을 찾으면 알 수 없다고 나온다. 이는 ap을 포함한 문자열이 1, 2, 3, 5 등으로 너무 많기 때문이다. R은 이들을 동등하게 취급하며 결과값을 반환하지 않는다. 하지만 'app'의 경우에는 2번째 요소를 반환해 주.. 2016. 10. 4.
[엑셀] 특정 문자(대소문자)가 포함된 셀의 개수 세기 countif() / find() countif()는 조건에 맞는 셀의 갯수를 셀 때 쓰는 함수이며 와일드카드 문자 (*) 의 사용이 가능하다. 예를 들어 다음 중 apple 과 일치하는 셀은 1개 이지만 apple이라는 단어가 들어간(*apple*) 셀은 2개이다. 다른 셀에 들어 있는 문자를 참조로 쓸 때에는 아래와 같이 "*"&셀&"*" 로 표기해 주어야 한다. app이 들어간 셀은 모두 세 개이며 o가 들어간 셀은 두 개이다. countif는 기본적으로 대소문자를 구별하지 않으므로 대소문자의 구분이 중요하다면 다른 방법을 사용해야 한다. 대소문자를 구별하는 find() 함수에서 시작해 보자. find() 함수는 셀에서 특정 문자가 포함된 곳의 위치를 숫자로 반환해 준다. 같은 식을 B5에 적용하면 중간에 a가 있음에도 값을 찾을 .. 2016. 9. 26.
[R.아르] 특정 조건에 맞는 글자(이메일 주소)만 추출하기 다음과 같은 x가 있다고 하자. 우리는 여기에서 이메일 주소만 예쁘게 뽑아서 다음과 같이 만들 것이다. 그러기 위해서는 두 가지 함수를 써야 하는데 첫 번째는 '일치하는 문자열만 뽑아줘' regmatches() 이고, 두 번째는 그 일치하는 문자열의 형식을 지정하는 regexpr() 이다. 조합하면 regmatches(regexpr()) 와 같이 될 테니, regexpr()부터 먼저 보자. 사실 regexpr()은 R뿐 아니라 여기저기서 쓰는 유명한 녀석인 '정규표현식' 이라는 녀석을 다루는 함수다. 정규표현식을 다 다루기에는 분량이 너무 방대하고, 일단 팁 하나. http://regexr.com/ 위 사이트에 가면 정규표현식을 공부하고 직접 실습해볼 수 있다. 이제 이메일 주소에 대한 정규표현식을 만들.. 2016. 9. 6.
반응형