본문 바로가기
R-크롤링

구글 앱 리뷰 크롤링

by 미스터탁 2018. 4. 8.

########셀레늄을 이용한 구글 playstore 리뷰 크롤링 코드입니다.


library(RSelenium)

library(jsonlite)

rD <- rsDriver(browser="fire",port=1006L)


remDr <- rD[["client"]]

## 크롤링 하고자 하는 앱 주소 

b<-"https://play.google.com/store/apps/details?id=com.nate.android.portalmini#details-reviews"

remDr$navigate(b)




  k<-1

comment_list<-list()

while(T){

  cat("\n",k)

  

  webElem <- remDr$findElement(using = 'xpath', "//*/div[@data-load-more-docid='com.nate.android.portalmini']/button[2]")

  webElem$clickElement()

  Sys.sleep(0.3)

  webElem <- remDr$findElement(using = 'css selector', "div[data-load-more-docid='com.nate.android.portalmini']")

  comment_list[[k]]<-unlist(webElem$getElementText())                        

  # Sys.sleep(1)

  k<-k+1

}


library(stringr)

head(comment_list)

length(comment_list)

col<-do.call("rbind",comment_list)

col2<-str_split(col,"\n")

length(unlist(col2))

col3<-matrix(unlist(col2),ncol=2,byrow=T)



data<-c(col3[str_detect(col3[,1],"2014|2015|2016|2017|2018"),2],

        col3[str_detect(col3[,2],"2014|2015|2016|2017|2018"),1])

data2<-data[!str_detect(data,"2014|2015|2016|2017|2018")]

length(data2)

head(data2)

# save(col3,file="col3.RData")

write.csv(data2,"nate1.csv",row.names=F)




인프런 강의 할인 쿠폰 코드입니다.


R로 하는 웹 크롤링 - 입문편(할인쿠폰코드) 236-69fc51d93a53 

https://www.inflearn.com/course/R-crawling# 


R로 하는 웹 크롤링 - 실전편 (할인쿠폰코드) 237-55c672aeb038 

https://www.inflearn.com/course/R-crawling-2# 


R로 하는 텍스트마이닝 (Top keyword부터 감성분석까지) (할인쿠폰코드) 238-c86096730061 

https://www.inflearn.com/course/R-text-mining#




R로 무작정 해보는 data science (할인쿠폰코드) 310-c6164f3d9be9 

https://www.inflearn.com/course/R-%EB%8D%B0%EC%9D%B4%ED%84%B0%EC%82%AC%EC%9D%B4%EC%96%B8%EC%8A%A4-%EB%9D%BC%EC%9D%B4%EB%B8%8C%EC%BD%94%EB%94%A9#

반응형

댓글