문자열을 구분하는 str_split함수에 대해 다루어 보겠습니다.
str_split함수는 str_detect와 마찬가지로 stringr패키지 안에 들어가 있는 함수입니다.
다음과 같이 '주소' 문자형 벡터가 있을때 여기서 서울시/경기도/경기도/전라남도만 추출하고 싶다고 가정 해보겠습니다.
c("서울시 서대문구 신촌동","경기도 안산시 단원구", "경기도 평택시","전라남도 연수시 선원동 124")
아래코드로 문자형 벡터를 선언해주고, stringr라이브러리를 불러옵니다.
그리고 str_split함수를 통해서 공백으로 잘라줍니다.
str_split함수를 사용하는 방법은 다음과 같습니다.
str_split(자르고 싶은 대상, "구분자")
addr<-c("서울시 서대문구 신촌동","경기도 안산시 단원구",
"경기도 평택시","전라남도 연수시 선원동 124")
library(stringr)
str_split(addr," ")
결과는 아래 화면과 같습니다.
이러한 구조를 list라고 부르죠. list에 관한 내용은 아래포스팅을 참고해주세요.
https://bluediary8.tistory.com/94
저 list에서 서울시/경기도/경기도/전라남도 만 뽑는 내용은 다음 포스팅을 참고해주세요.
https://bluediary8.tistory.com/96
str_split은 이렇게 단순히 문자를 공백으로만 분리하는 것이 아니라 구분자에 의해서 다양하게 분리할 수 있습니다.
모든 문자열을 한글자씩 분리하고 싶다면 다음과 같이 쓸수 있습니다.
구분자를 "" 로 하여 분리한뒤 unlist함수를 통해서 list를 풀어 헤쳐주면 list가 벡터화 됩니다.
addr<-c("서울시 서대문구 신촌동","경기도 안산시 단원구",
"경기도 평택시","전라남도 연수시 선원동 124")
x1<-str_split(addr,"")
x1
unlist(x1)
반응형
'R프로그래밍' 카테고리의 다른 글
R프로그래밍 - list에 do.call문 사용하기 (0) | 2020.06.27 |
---|---|
R프로그래밍 - Sapply함수와 lapply함수 알아보기 (2) | 2020.06.26 |
R프로그래밍 - list함수 알아보기 (0) | 2020.06.25 |
R프로그래밍 - tapply 함수 제대로 알기, 데이터 요소별 함수 적용하기 (0) | 2020.06.25 |
R프로그래밍 - apply 함수 이해하기, 데이터 칼럼 별 합계/행별 합계 구하기 (0) | 2020.06.25 |
댓글