########셀레늄을 이용한 구글 playstore 리뷰 크롤링 코드입니다.
library(RSelenium)
library(jsonlite)
rD <- rsDriver(browser="fire",port=1006L)
remDr <- rD[["client"]]
## 크롤링 하고자 하는 앱 주소
b<-"https://play.google.com/store/apps/details?id=com.nate.android.portalmini#details-reviews"
remDr$navigate(b)
k<-1
comment_list<-list()
while(T){
cat("\n",k)
webElem <- remDr$findElement(using = 'xpath', "//*/div[@data-load-more-docid='com.nate.android.portalmini']/button[2]")
webElem$clickElement()
Sys.sleep(0.3)
webElem <- remDr$findElement(using = 'css selector', "div[data-load-more-docid='com.nate.android.portalmini']")
comment_list[[k]]<-unlist(webElem$getElementText())
# Sys.sleep(1)
k<-k+1
}
library(stringr)
head(comment_list)
length(comment_list)
col<-do.call("rbind",comment_list)
col2<-str_split(col,"\n")
length(unlist(col2))
col3<-matrix(unlist(col2),ncol=2,byrow=T)
data<-c(col3[str_detect(col3[,1],"2014|2015|2016|2017|2018"),2],
col3[str_detect(col3[,2],"2014|2015|2016|2017|2018"),1])
data2<-data[!str_detect(data,"2014|2015|2016|2017|2018")]
length(data2)
head(data2)
# save(col3,file="col3.RData")
write.csv(data2,"nate1.csv",row.names=F)
인프런 강의 할인 쿠폰 코드입니다.
R로 하는 웹 크롤링 - 입문편(할인쿠폰코드) 236-69fc51d93a53
https://www.inflearn.com/course/R-crawling#
R로 하는 웹 크롤링 - 실전편 (할인쿠폰코드) 237-55c672aeb038
https://www.inflearn.com/course/R-crawling-2#
R로 하는 텍스트마이닝 (Top keyword부터 감성분석까지) (할인쿠폰코드) 238-c86096730061
https://www.inflearn.com/course/R-text-mining#
R로 무작정 해보는 data science (할인쿠폰코드) 310-c6164f3d9be9
https://www.inflearn.com/course/R-%EB%8D%B0%EC%9D%B4%ED%84%B0%EC%82%AC%EC%9D%B4%EC%96%B8%EC%8A%A4-%EB%9D%BC%EC%9D%B4%EB%B8%8C%EC%BD%94%EB%94%A9#
'R-크롤링' 카테고리의 다른 글
내 주변 카페리스트 수집하기 (0) | 2019.12.12 |
---|---|
오늘의 유머 크롤링 코드 (0) | 2019.12.12 |
네이버 스포츠 뉴스 제목 및 댓글 크롤링 (Rselenium) (0) | 2019.04.26 |
네이버 TV캐스트 댓글 크롤링 (0) | 2018.04.08 |
R기초크롤링코드 (0) | 2018.04.04 |
댓글