본문 바로가기

전체 글150

반응형
자연어처리(NLP)분야의 다양한 Task와 데이터 자연어처리 (Text) - 텍스트 (Text) : 텍스트 분야에서의 딥러닝 적용 또한 꾸준히 연구 되었습니다. 텍스트 분야는 세부 Task로 나뉘어 연구가 되었는데 대표적으로 다음과 같은 것 들이 있습니다. - Sentiment Analysis (감정 분석) 문장에 대한 정보를 통해 분류하는 문제 중 하나로 그 중 문장에 대한 특정 감정을 분류해내는 문제로 NLP의 대표적인 Task라고 할 수 있습니다. '이 집은 맛집이야', '이 영화는 재미 없어' 이러한 문장 속 의미가 긍정인지 부정인지를 판단하는 것이라고 볼 수 있습니다. 보통 긍정과 부정을 분류하는 문제들이 많지만, 긍정의 정도를 나타내는 점수 5점 척도로 표현하여 예측하는 문제로 접근하는 경우도 있습니다. Dataset : The Stanfor.. 2020. 12. 10.
[강화학습 논문 리뷰] NEVER GIVE UP: LEARNING DIRECTED EXPLORATION STRATEGIES 이번에 소개해드릴 논문은 NEVER GIVE UP: LEARNING DIRECTED EXPLORATION STRATEGIES 이라는 논문으로 2020 ICLR 에 accept된 논문입니다. https://arxiv.org/pdf/2002.06038.pdf 메인 아이디어는 Exploration 과 Exploitation을 같은 네트워크에서 배우게 하는 것이며 이를 위해 Universal Value Function Approximators (UVFA) 를 사용합니다. 논문의 저자들은 다음 두가지 Intrinsic reward 를 제안 합니다. Per-episode novelty (Episodic Novelty) : Agent가 여러 에피소드에 걸쳐서 친숙한(familiar) state를 지속적으로 재방문 하.. 2020. 10. 29.
[강화학습 논문 리뷰] BEBOLD: EXPLORATION BEYOND THE BOUNDARY OF EXPLORED REGIONS 이전 포스팅에서 RND다음으로 exploration bonus하는 논문인 RIDE에 대해서 소개하였습니다. bluediary8.tistory.com/115?category=640398 Rewarding impact-driven exploration for procedurally-generated environments. 이번에 소개 할 논문은 Rewarding impact-driven exploration for procedurally-generated environments이라는 논문입니다. 2020 ICLR에 accept된 논문 입니다. (openreview.net/forum?id=rkg-TJBFPB) RIDE: Rewar.. bluediary8.tistory.com 이번에는 올해 나온 explora.. 2020. 10. 29.
[강화학습 논문 리뷰] Rewarding impact-driven exploration for procedurally-generated environments. 이번에 소개 할 논문은 Rewarding impact-driven exploration for procedurally-generated environments이라는 논문입니다. 2020 ICLR에 accept된 논문 입니다. (openreview.net/forum?id=rkg-TJBFPB) RIDE: Rewarding Impact-Driven Exploration for... Reward agents for taking actions that lead to changes in the environment state. openreview.net 강화학습에서 주요 문제중 하나는 reward가 부족한 sparse reward problem이고, 이를 해결하기 위한 가장 방법중 하나는 intrinsic rewa.. 2020. 10. 29.
[딥러닝 논문 리뷰] DOMAIN GENERALIZATION WITH MIXSTYLE 이번에는 도메인 generalization에 관한 논문을 소개해 드리도록 하겠습니다. ''MixStyle"이라는 논문으로 여러 style을 섞어서 잘 학습시켜보자 라는 컨셉을 가지고 있습니다. 현재 2021 ICLR에 submit되어 있는 상태이고 아직 decision은 나오지 않은 상태입니다. openreview.net/pdf?id=6xHJ37MVxxp CNN은 이미지 분류에서 매우 뛰어난 성능을 보이지만, 보지 못한 도메인에 대해서는 성능이 좋지 못합니다. 그 이유는, 학습데이터와 테스트 데이터가 같은 분포라는 가정이 있기 때문이죠. 아래 그림을 보시면 네개의 그림이 각기 다른 style을 가지고 있지만 모두 '강아지'라는 것을 알 수 있습니다. 여기서 한 style의 강아지를 학습 시키고 다른 st.. 2020. 10. 28.
R프로그래밍 - 문자열 대체 함수 gsub [], () <> 없애기 stringr 패키지 안에 문자열을 찾아서 대체해주는 str_replace함수가 있습니다. 하지만 저 같은 경우, gsub함수가 훨씬 더 쉽게 쓸수 있다고 생각해서 gsub함수를 자주 사용합니다. gsub함수는 특정 문자열이나 패턴을 찾아서 내가 원하는 문자열로 대체 또는 제거 할 수 있도록 도와주는 함수입니다. 사용법은 아래와 같습니다. gsub("바꾸고자하는 대상의 text 또는 패턴","대체할 text",text객체) 첫번째 예제는 " " 공백을 "" 제거하는 예제이고 두번째 예제는 " " 공백을 | 로 대체하는 예제이고 세번째 예제는 '언어'라는 단어를 'programming 언어'로 대체하는 예제 입니다. text 이런 tag나 \t와 같은 html tag들이 자주 볼 수 있습니다. 이러한 ta.. 2020. 7. 3.