전체 글150 반응형 R프로그래밍 - NA, Inf, -Inf 데이터 찾는법 데이터를 가공하다 보면 NA값이나 Inf 값등이 나올 때가 있습니다. 이 값들을 그대로 가져가는 경우도 있지만, 무조건 제거 또는 다른값으로 대체 해주어야 하는 경우가 있습니다. 우선 0을 1로 나누면 0 값이 출력이 됩니다. 그런데 0을 0으로 나누면 NA값이 나옵니다. NA값인지 판단하기 위해선 is.na 함수를 이용하여야 합니다. 0/1 0/0 is.na(0/0) x2 2020. 7. 2. R프로그래밍 - AND, OR, NOT 연산자 컴퓨터에서 가장 많이 사용하는 AND, OR, NOT 연산자에 대해 다루어 보도록 하겠습니다. 이 연산자들은 매우 자주 사용하므로 꼭 알고 계셔야합니다. R뿐만이 아니라, 다른 프로그래밍 언어에서도 공통적으로 사용합니다. AND연산자는 '그리고' 의 의미를 지닙니다. 두 개의 값이 모두 TRUE여야지만 TRUE를 반환합니다. T & T ## AND T & F F & F OR연산자는 '또는'의 의미를 지닙니다. 두 개의 값중 하나 이상 TURE값이 있으면 TRUE를 반환합니다. T | T ##OR T | F F | F NOT연산자는 '반대'를 의미합니다. TRUE값이 들어오면 FALSE, FALSE값이 들어오면 TRUE값을 반환합니다. !T ## NOT !F 이제 조금 더 직관적인 이해를 돕기 위해 예를 .. 2020. 7. 2. R프로그래밍 - 현재 날짜 또는 시간 가져오는 함수 Sys.time / Sys.Date 현재 날짜나 시간을 가져오는 함수는 Sys.Date 와 Sys.time입니다. Sys.time() Sys.Date() 위와 같이 코드를 실행 하면 아래 화면처럼 현재 시간과 날짜가 출력 되는 것을 보실 수 있습니다. 알아 두셔야할 점은 시간과 날짜에 대해서 -나 + 부호로 연산이 가능하다는 점입니다. Sys.time에서는 초단위 연산이 가능하고 Sys.Date 함수에서는 일단위 연산이 가능합니다. 아래 Sys.Date결과와 Sys.Data-10결과를 보시면 10일 차이가 나는 것을 알 수 있습니다. Sys.time() Sys.Date() Sys.time()-10 Sys.Date()-10 2020. 7. 2. R프로그래밍 - 코드 실행 시키지 않게 유지시키는 Sys.sleep 함수 웹 크롤링이나 무한 루프를 돌려 코드를 실행 할 경우에, R코드를 실행하지 않고 잠자게 할 수가 있습니다. 크롤링을 할때에 무한으로 웹에 접속으로 하다 보면, 해당 서버에서 해킹 공격으로 판단하게 막아버리는 경우가 있을 수 있습니다. 이러한 경우에, 난수를 추출해서 약간씩 term을 두게 하고 수집을 하는 방법이 있습니다. 아래 코드와 같이 난수를 추출하고 그 수만큼 Sys.sleep 함수를 통해 쉬게 하는 것입니다. for(i in 1:10){ cat("\n",i) Sys.sleep(runif(1,min=0.1,max=1)) } Sys.sleep(100) 이렇게 사용하시면 100초를 쉬게 합니다. 2020. 7. 2. R프로그래밍 - 복원추출 / 비복원추출 (sample 함수) sample 함수는 R에서 데이터를 복원 추출 또는 비복원 추출을 하게 해주는 함수입니다. 사용법은 간단합니다. sample(뽑꼬자 하는 후보군, 뽑을 갯수, 확률 정보) 아래와 같이 1부터 10 사이에서 3개를 랜덤하게 선택 할수도 있고 a부터 e문자사이에서 랜덤하게 3개를 선택할 수도 있습니다. sample(1:10,3) sample(c("a","b","c","d","e"),3) 당연히 랜덤하게 뽑는거니 아래 캡쳐화면처럼 실행 할 때 마다 결과가 다릅니다. R에서 sample함수는 기본적으로 비복원 추출입니다. 만약 1부터 10사이에서 100개를 뽑으라고하면 아래 화면처럼 error가 납니다. 복원 추출 option을 주려면 아래와 같이 주시면 됩니다. 참고로 table 함수는 갯수합계를 구해주는 함.. 2020. 7. 2. R크롤링 - Clien 커뮤니티 게시글 크롤링3 아래 포스팅에 이어지는 포스팅입니다. https://bluediary8.tistory.com/105 R크롤링 - Clien 커뮤니티 게시글 크롤링2 아래 포스팅에 이어지는 포스팅입니다. https://bluediary8.tistory.com/104?category=607867 R크롤링 - Clien 커뮤니티 게시글 크롤링1 이번 포스팅부터 크롤링에 대해 다루어 보도록 하겠습니다. 크롤링은 '긁�� bluediary8.tistory.com 우선 저장했던 pagedata를 불러들인 다음 structure를 확인 해 보도록 하죠 data 2020. 7. 1. 이전 1 ··· 7 8 9 10 11 12 13 ··· 25 다음