반응형 분류 전체보기218 [R.아르] TDM에서 tokenize 가 동작하지 않을 때 (형태소 분석) 지난 번 2017/10/18 - [R] - [R.아르] Term Document Matrix 생성시 한글 인코딩이 깨질때 포스트에서 눈치채신 분도 있겠지만 TermDocumentMatrix 를 만들 때 웬일인지 tokenize 가 제대로 동작하지 않는 것으로 보인다. 예로, sapply 를 통해 텍스트에 extractNoun함수를 적용시키면 > text text [1] "컴퓨터는 수치 연산을 위해 설계되었다. 컴퓨터 발명 초기에는 문자를 표현해야 하는 요구가 없었다." [2] "그러나 곧 문자를 표현해야 하는 요구가 발생했다. 이기종 컴퓨터끼리 문자 데이터를 교환하기 위해서는 표준이 필요하다." > x x [[1]] [1] "컴퓨터는" "수치" "연산" "설계" "되" "컴퓨터" "발명" "초" "문자".. 2017. 10. 19. [R.아르] Term Document Matrix 생성시 한글 인코딩이 깨질때 다음과 같이 텍스트를 불러올 때는 잘 불러와졌는데 > text text [1] "컴퓨터는 수치 연산을 위해 설계되었다. 컴퓨터 발명 초기에는 문자를 표현해야 하는 요구가 없었다. " [2] "그러나 곧 문자를 표현해야 하는 요구가 발생했다. 이기종 컴퓨터끼리 문자 데이터를 교환하기 위해서는 표준이 필요하다." > 말뭉치를 만들 때까지도 괜찮았는데 > text inspect(text) Metadata: corpus specific: 1, document level (indexed): 0 Content: documents: 2 [1] 컴퓨터는 수치 연산을 위해 설계되었다. 컴퓨터 발명 초기에는 문자를 표현해야 하는 요구가 없었다. [2] 그러나 곧 문자를 표현해야 하는 요구가 발생했다. 이기종 컴퓨터끼리 문.. 2017. 10. 18. [R. 아르] KoNLP 패키지에서 에러가 날 때 다음과 같이 하면 KoNLP 패키지를 설치하고 불러올 수 있지만 install.packages("KoNLP")library(KoNLP) 간혹 다음과 같은 에러메시지가 출력되는 경우도 있다. Error : .onLoad failed in loadNamespace() for 'rJava', details: call: fun(libname, pkgname) error: JAVA_HOME cannot be determined from the registryError: package or namespace load failed for ‘KoNLP’ rJava가 설치되지 않아 발생하는 문제다. 일단 다음 링크에서 운영체제에 맞는 버전의 Java를 설치하자. https://www.java.com/en/download.. 2017. 10. 16. [PHP] 회원들의 재구매율 알아보기(4) - 완성 이제 처음에 작성했던 다음 코드와 2017. 10. 13. [R. 아르] 언어 설정하기 / MDI, SDI 설정하기 2017/10/11 - [R] - [R.아르] 통계 프로그램 R 설치하기에서 본 대로 처음 R을 설치하면 운영체제의 언어를 감지하여 자동으로 설정해 준다. 만일 기본 언어를 영어로 바꾸고 싶다면 C:\Program Files\R\R-3.4.2\etc 의 Rconsole 파일을 연다. 대략 위와 같은 모습일 것이다. language 를 찾는다. language = 하고 비어 있는 공간에 en 을 적어 준다. 언어가 영어로 변경되었다. 2017/10/11 - [R] - [R.아르] 통계 프로그램 R 설치하기에 나온 MDI / SDI 도 여기에서 설정해 줄 수 있다. MDI 를 찾아본다. 현재 MDI = no 로 되어 있는데, 이는 우리가 설치할 때 SDI 로 설정했기 때문이다. 이것을 yes 로 바꾸어 주면.. 2017. 10. 12. [R.아르] 통계 프로그램 R 설치하기 CRAN (Comprehensive R Archive Network) 사이트를 방문하면 R을 설치할 수 있다. 주소는 다음과 같다. https://cran.r-project.org/ 참고로 CRAN에서는 트래픽 과부하를 우려하여 지역적으로 가까운 미러를 방문할 것을 권장하고 있다. 대한민국의 미러는 다음 세 가지로 표기되어 있다. http://cran.nexr.com/http://healthstat.snu.ac.kr/CRAN/http://cran.biodisk.org/ 어디를 방문하든 동일하므로, 마음에 드는 곳을 클릭해 보자. 다음과 같은 화면이 보일 것이다. 사용하는 운영체제에 맞게 다운로드 받자. 여기서는 Windows로 진행하기로 한다. 처음 설치할 때는 base를 설치하라고 알려주고 있다. 20.. 2017. 10. 11. [PHP] 회원들의 재구매율 알아보기(3) - 날짜 계산하기 strtotime() $query = "SELECT distinct user_id FROM `user_data` WHERE date>='□' and date 2017. 9. 26. [PHP] 회원들의 재구매율 알아보기(2) - 두 배열 비교하기 in_array() 첫 번째와 비교할 두 번째 배열도 만들어야겠다. 후에는 물론 반복문으로 처리하겠지만 일단 다음과 같이 배열을 만들자. $query = "SELECT distinct user_id FROM `user_data` WHERE date>='2017-02-01' and date 2017. 9. 25. [PHP] 회원들의 재구매율 알아보기(1) - MySQL 컬럼(열)을 배열로 만들기 다음과 같이 회원, 구매한 상품, 구매한 날짜가 기록된 자료에서 회원들의 월별 재구매율을 알아보려면 어떻게 해야할까? 1월에 구매한 유저들의 명단을 추출하고 2월에 구매한 유저들의 명단을 추출하여 서로 비교해 보면 될 것이다. 1월에 구매한 유저들의 명단은 다음과 같이 구할 수 있다. SELECT distinct user_id FROM `user_data` WHERE date>='2017-01-01' and date 2017. 9. 24. [PHP] mysqli_fetch_row, assoc, array 의 차이 2017/09/18 - [PHP] - [PHP] DB에서 특정 행들만 가져오기(7) - DB에서 가져온 정보 출력하기 mysqli_fetch_row()에서 본 대로 mysqli_fetch_row() 는 다음과 같이 배열의 번호로 요소를 출력할 수 있다. DOCTYPE html> 2017. 9. 20. 이전 1 ··· 8 9 10 11 12 13 14 ··· 22 다음 반응형