반응형 스크랩핑1 [R.아르] 웹페이지에서 원하는 요소 가져오기(크롤링) 다음과 같은 페이지에서 1-10위까지 목록을 추출하는 방법을 알아보자. R사의 베스트셀러 페이지이며, 주소는 다음과 같다. https://ridibooks.com/bestsellers/general?order=monthly 일단, 웹페이지를 가져오려면 httr 패키지가 필요하다. library(httr) 처음 보는 패키지라면 다음과 같이 설치해 주자. install.packages('httr') 패키지를 불러왔다면 GET 함수 안에 위 주소를 넣고 웹페이지를 불러온다. web=GET('https://ridibooks.com/bestsellers/general?order=monthly') 다음과 같이 로 시작하는 202 kB 의 문서가 잘 들어온 것을 확인할 수 있다. 이제 이 HTML 문서 어딘가에 있을.. 2018. 3. 13. 이전 1 다음 반응형