본문 바로가기

전체 글150

반응형
R프로그래밍 - tapply 함수 제대로 알기, 데이터 요소별 함수 적용하기 이전 포스팅에서 matrix의 행또는 열별로 함수를 적용하는 apply함수에 대해 다루어 보았습니다. https://bluediary8.tistory.com/92 R프로그래밍 - apply 함수 이해하기, 데이터 칼럼 별 합계/행별 합계 구하기 R에서는 vector, matrix, list등에 함수를 적용해 빠른 연산 도와주는 apply계열 함수들이 있습니다. 대표적으로 많이 사용하는 함수는 apply / sapply / lapply / tapply가 있습니다. 우선 apply에 대해 알아보겠. bluediary8.tistory.com 이번 포스팅에서는 tapply함수에 대해 다루어 보도록 하겠습니다. 우선 아래와 같이 홀수 짝수 칼럼을 만들어 보도록 하죠 ifelse함수를 통해 m의 세번째 칼럼을 2로.. 2020. 6. 25.
R프로그래밍 - apply 함수 이해하기, 데이터 칼럼 별 합계/행별 합계 구하기 R에서는 vector, matrix, list등에 함수를 적용해 빠른 연산 도와주는 apply계열 함수들이 있습니다. 대표적으로 많이 사용하는 함수는 apply / sapply / lapply / tapply가 있습니다. 우선 apply에 대해 알아보겠습니다. apply는 기본적으로 행렬이나 데이터프레임에 대하여 행별 또는 열별 함수를 적용 시켜주는 함수입니다. 예를들어 column별 평균이나 표준편차를 구하거나 normalization할때에도 쓰일 수 있겠죠 사용하는 방법은 apply(데이터프레임 또는 행렬 객체, 1 또는 2, 함수) 이렇게 사용할수 가 있습니다. 가운데에 1이 들어가면 행별로 함수를 적용 시키겠다라는 뜻이고 2가 들어가면 열별로 함수를 적용 시키겠다라는 뜻입니다. m = data.f.. 2020. 6. 25.
R프로그래밍 - 여러 폴더에서 원하는 csv파일만 불러서 합치기 이전 포스팅에서 폴더 안에 여러 csv파일을 불러들여서 합치는 코드를 작성해보았습니다. https://bluediary8.tistory.com/85?category=787191 R프로그래밍 - 폴더 안에 여러 csv파일들 하나로 불러 들이기 list.files 함수 이번에는 하나의 폴더안에 있는 여러 csv파일들을 R로 불려들여서 하나로 합쳐보는 코드를 작성해보겠습니다. 우선 임의의 폴더안에 여러개의 csv파일들을 복사해서 붙여넣었습니다. R이 익숙치 bluediary8.tistory.com 이번에는 난이도를 조금 높여서 여러 폴더안에서 특정 문자가 들어간 csv파일만 골라서 합치는 코드를 작성해 보도록 하겠습니다. 아래 화면고 같이 new폴더안에 1, 2, 3 폴더가 있다라고 가정을 하고 각 폴더안에는.. 2020. 6. 25.
최근 인공지능 (딥러닝) 적용 사례 (분야) 딥러닝이 부흥하기 시작하면서 다양한 분야에 다양한 형태로 발전이 되어오고 있습니다. 이번 포스팅에서는 딥러닝이 쓰이는 분야에 대해 간단히 소개 해 보도록 하겠습니다. 이 외에도 다양한 분야가 있으니, 참고 하시길 바랍니다. 컴퓨터 비젼 (Computer Vision) 이미지 분류 (Image classification) 이미지 분류 : 인간이 이미지를 분류하는 성능은 약 95%정도 입니다. 인공지능 모델을 구축해서 이미지를 분류하는 대회가 2010년부터 열려왔습니다. 2010년에 우승했던 모델의 분류 성능은 약 72%입니다. 어떻게 하면 인간처럼 또는 그 이상 이미지 분류의 성능을 낼 수 있을까 많은 연구자들이 고민을 해왔습니다. 2015년 ResNet이라는 모델이 약96%의 성능을 기록하면서 나오면서 .. 2020. 6. 24.
R프로그래밍 - 문자열 찾는 함수 str_detect 함수 %in%연산자 이번에는 R에서 굉장히 많이사용하는 문자열 찾는 함수인 str_detect 함수와 %in% 연산자에 대해 다루어 보도록 하겠습니다. str_detect함수를 사용하기 위해서는 stringr 패키지를 설치해야합니다. install.packages("stringr") library(stringr) 패키지 설치 관련 포스팅을 참고해주세요 https://bluediary8.tistory.com/86?category=787191 R프로그래밍 - R package 설치 법, 설치 오류시 해결 하는 방법 (수동 설치법, 패키지 제거법) R에서 패키지를 설치하고 불러들이실 때에는 아래와 같이 코드로 설치 하실 수 있습니다. install.packages("stringr") #stringr패키지 설치 library(st.. 2020. 6. 24.
DataScience 분야에서 Tree기반 모델이 좋은 이유 (딥러닝이 잘 쓰이지 않는 이유) DataScience 분야에서 Tree기반 모델이 좋은 이유 (딥러닝이 잘 쓰이지 않는 이유) 최근 10년간은 딥러닝의 부흥기라고 감히 말할 수 있습니다. 그만큼, 딥러닝의 엄청난 발전이 있었죠. 그럼에도 불구하고 kaggle 대회와 국내 data science 대회에서 boosting 계열 알고리즘 (tree 기반 알고리즘이 거의 항상 우승합니다. 그 이유가 무엇일까요?) 앞서 우리는 CNN의 graphical representation learning에 다루었습니다. CNN이 해주는 역할은 이미지의 region feature를 잘 뽑아주기 위한 것이지. 완전히 다른 모델이 아니다 라는 것 입니다. https://bluediary8.tistory.com/87 딥러닝(Deep Learning)의 정의, .. 2020. 6. 24.