본문 바로가기

전체 글150

반응형
R크롤링 - Clien 커뮤니티 게시글 크롤링2 아래 포스팅에 이어지는 포스팅입니다. https://bluediary8.tistory.com/104?category=607867 R크롤링 - Clien 커뮤니티 게시글 크롤링1 이번 포스팅부터 크롤링에 대해 다루어 보도록 하겠습니다. 크롤링은 '긁다'라는 뜻을 지니고 있습니다. 웹에 있는 자료 또는 데이터를 수집하는 행위를 웹크롤링 이라고 합니다. 인간이하면 ctr bluediary8.tistory.com 우리는 저번 포스팅에서 커뮤니티 게시판의 제목을 가져왔습니다. 이번에는 게시글 URL을 가져오도록 하겠습니다. 페이시 소스 보기 페이지를 보시면 제목이 있는 line 보다 두 line 위에 URL이 있는 것을 보실 수 있습니다. 즉 url의 규칙은 제목이 있는 line보다 2line 위에 있다 라는 것.. 2020. 7. 1.
R크롤링 - Clien 커뮤니티 게시글 크롤링1 이번 포스팅부터 크롤링에 대해 다루어 보도록 하겠습니다. 크롤링은 '긁다'라는 뜻을 지니고 있습니다. 웹에 있는 자료 또는 데이터를 수집하는 행위를 웹크롤링 이라고 합니다. 인간이하면 ctrl + c , ctrl + v를 수백 수천번 해야하지만 코드를 작성하면 비교적 수월하게 수집을 할 수가 있죠. 우선 아래의 주소로 들어가 클리앙이라는 커뮤니티에 접속을 해보죠 https://www.clien.net/service/ 클리앙 아들2호 카메라 잡은 날 둘째. 카메라에 관심을 보인 날. 집에 와서 살펴보니 죄다 촛점, 노출 안맞아서 소니 미러리스로 바꿀까 고민중이에요. 7 06-30 www.clien.net 여기서 모두의 공원 탭으로 들어가보죠 https://www.clien.net/service/board/.. 2020. 6. 30.
R프로그래밍 - R에서 함수 내부 변수를 외부에서 사용하는 방법 일반적으로 함수를 만들고 함수 내부에서 사용하는것은 외부에서 사용이 불가합니다. 다음과 같이 xx라는 함수를 만들었다 라고 가정을 해보죠 xx함수내에서 t2,t3,t4라는 함수를 만들고 이를 반환하게되죠. xx(1)의 값은 c(2, 3, 4)가 됩니다. xx 2020. 6. 30.
R 프로그래밍 - plot 저장하기 (해상도 및 크기 조절, multi plot) R의 가장 강력한 도구는 plot이라고 생각합니다. Python보다 plotting이 훨씬 쉽고 다루기가 간편하다고 생각합니다 (제 개인적인 생각...) 단순히 난수 100개를 추출해서 plotting 해보도록 하겠습니다. plot(runif(100)) Rstudio에서는 기본적으로 plotting하게 되면 우측 아래 화면에 plotting이 됩니다. Plotting 패키지에 따라 interaction 가능한 plot은 view tab에 나오기도 합니다. plot을 저장하는 것은 다음과 같은 코드를 통해 가능합니다. 먼저 파일명과, 크기와 해상도를 지정해주고 plot함수를 통해 plotting하고 dev.off 까지 해주셔야 이미지가 저장이 됩니다. setwd("D:\\R\\plot") png("plot.. 2020. 6. 29.
R프로그래밍 - R에서 자동으로 여러개의 변수 선언하기 R에서 작업을 하다보면, 여러개의 변수를 선언해야하는 경우가 있습니다. 예를들면 a 2020. 6. 29.
R프로그래밍 - Vector , matrix, dataframe, list dimension 구하기 list1 2020. 6. 29.