본문 바로가기
R프로그래밍

R프로그래밍 - 문자열 분리하는 함수 str_split / list구조

by 미스터탁 2020. 6. 26.

문자열을 구분하는 str_split함수에 대해 다루어 보겠습니다.

 

str_split함수는 str_detect와 마찬가지로 stringr패키지 안에 들어가 있는 함수입니다.

 

다음과 같이 '주소' 문자형 벡터가 있을때 여기서 서울시/경기도/경기도/전라남도만 추출하고 싶다고 가정 해보겠습니다.

 

c("서울시 서대문구 신촌동","경기도 안산시 단원구",  "경기도 평택시","전라남도 연수시 선원동 124")

 

 

아래코드로 문자형 벡터를 선언해주고, stringr라이브러리를 불러옵니다.

 

그리고 str_split함수를 통해서 공백으로 잘라줍니다.

 

str_split함수를 사용하는 방법은 다음과 같습니다.

 

str_split(자르고 싶은 대상, "구분자") 

 

addr<-c("서울시 서대문구 신촌동","경기도 안산시 단원구",
        "경기도 평택시","전라남도 연수시 선원동 124")

library(stringr)
str_split(addr," ")

 

결과는 아래 화면과 같습니다.

 

 

 

이러한 구조를 list라고 부르죠. list에 관한 내용은 아래포스팅을 참고해주세요.

 

https://bluediary8.tistory.com/94

 

R프로그래밍 - list함수 알아보기

이번 포스팅에서는 list라는 객체에 대해서 알아 보겠습니다. R에서 가장 많이 쓰이는 객체는 총 세가지입니다. vector, matrix ( dataframe), 그리고 마지막으로 list입니다. vector는 1차원 형태이고 matrix��

bluediary8.tistory.com

 

저 list에서 서울시/경기도/경기도/전라남도 만 뽑는 내용은 다음 포스팅을 참고해주세요. 

 

https://bluediary8.tistory.com/96

 

R프로그래밍 - Sapply함수와 lapply함수 알아보기

이전 포스팅과 이어지는 포스팅입니다. https://bluediary8.tistory.com/95 R프로그래밍 - 문자열 분리하는 함수 str_split / list구조 문자열을 구분하는 str_split함수에 대해 다루어 보겠습니다. str_split함수..

bluediary8.tistory.com

 

str_split은 이렇게 단순히 문자를 공백으로만 분리하는 것이 아니라 구분자에 의해서 다양하게 분리할 수 있습니다.

 

모든 문자열을 한글자씩 분리하고 싶다면 다음과 같이 쓸수 있습니다.

 

구분자를 "" 로 하여 분리한뒤 unlist함수를 통해서 list를 풀어 헤쳐주면 list가 벡터화 됩니다.

 

addr<-c("서울시 서대문구 신촌동","경기도 안산시 단원구",
        "경기도 평택시","전라남도 연수시 선원동 124")

x1<-str_split(addr,"")
x1
unlist(x1)

 

 

반응형

댓글