본문 바로가기
반응형

전체 글116

반응형
R프로그래밍 - 분류문제에서의 성능지표 (accuracy/precision/recall/F-measure) 머신러닝에서 y값이 특정 클래스 값을 가질때 우리는 분류 모델(classification model)을 적합시킵니다. 분류 모델에서 사용하는 여러가지 성능지표에 대해 알아 보겠습니다. 가장 기본적으로 사용하는게 정확도(accuracy)입니다. 정확도는 사실 구체적으로 설명할 필요도 없이 직관적이고 간단한 지표이죠. R에서는 아래 코드처럼 간단하게 구할수 있습니다. 실제값과 예측값이 같은 수를 전체 관측치 수로 나누어주면 되겠죠. observed 2022. 5. 23.
R프로그래밍 - 회귀분석에서의 성능 지표 MSE, MAE, MAPE 머신러닝에서 y값이 실수 인 경우, 우리는 회귀 모형(linear regression)을 적합시킵니다. 이 때, 우리가 만든 회귀 모형의 성능 지표를 측정할 필요가 있습니다. 그래야, 어떠한 모델이 성능이 더 좋은지 판단하고 의사결정을 내릴 수 있기 때문입니다. 대표적인 회귀 모델의 성능지표로는 mean squared error(MSE)가 있습니다. 수식은 아래와 같습니다. 즉, 실제값에서 예측값을 뺀 오차에 제곱을 해서 평균을 낸 지표입니다. 이 값이 낮으면 낮을 수록 좋은 모델이라는 뜻이겠죠. 그러나 MSE의 경우에는 상대적인 비교만 가능해서 이 값이 얼마나 낮고 높은지 알 수가 없습니다. 예를 들어, A문제를 풀고자 할때 a의 모델이 MSE가 20,000이 나왔다라고 했을때, 이 값이 높은 것인지 .. 2022. 5. 22.
J1 Visa 발급 후기 (비대면 비자 발급 프로그램/여권 이름 철자 변경) 여권을 어머니께서 어렸을때 만들어 줬는데.. 커서 보니 스펠링이 이상하다.. 2016년경 여권을 재발급 할 때, 바꿔 달라고 했으나 발음상 유사하다고 거절당했다. J1 Visa를 받을 때, CV등 논문등을 학교로 보내는데 내 영어 이름과 여권 상의 이름의 스펠링이 달라서 다시 한번 알아봤다. 결론적으로 최근에 법이 바뀌어서 성인이 되기 전에 여권을 만든 경우에는 딱 한번 바꿀수 있는 기회가 있다. 그렇지 않고, 나와 같이 특별한 사유가 있는 경우에는 논문과 여러 서류를 가지고 외교부 심사를 받아야 한다고 한다. 그렇게 해서 스펠링을 변경해서 여권을 재발급 받았다. (꼭, 여권 사진과 기존 여권을 들고 가야 한다.) 다른 Visa와 마찬가지로 J1 Visa 신청도 이것저것 복잡한게 많았다. DS160신청하.. 2022. 5. 21.
Surprise Minimizing Reinforcement Learning(SMiRL) 이번에 포스팅할 논문은 Surprise Minimizing Reinforcement Learning(SMiRL)로서 2021년 International Conference on Learning Representations(ICLR)에 구두 발표(Oral)로 Accept된 논문을 통해 제안되었습니다. 인공지능 최고의 Conference에서 Oral 발표로 논문이라는 것은 그만큼 논문의 학술적인 가치가 매우 높다라는 뜻입니다. 이전에 포스팅에서 일반적으로 강화학습의 Exploration을 위한 장치로서 Curiosity를 이용하고 그중 RND가 Baseline으로서 많이 사용된다고 서술하였습니다. 본 논문의 저자들은 Curiosity와 같은 Exploration Method를 Novelty-Seeking M.. 2021. 3. 12.
자연어처리(NLP)분야의 다양한 Task와 데이터 자연어처리 (Text) - 텍스트 (Text) : 텍스트 분야에서의 딥러닝 적용 또한 꾸준히 연구 되었습니다. 텍스트 분야는 세부 Task로 나뉘어 연구가 되었는데 대표적으로 다음과 같은 것 들이 있습니다. - Sentiment Analysis (감정 분석) 문장에 대한 정보를 통해 분류하는 문제 중 하나로 그 중 문장에 대한 특정 감정을 분류해내는 문제로 NLP의 대표적인 Task라고 할 수 있습니다. '이 집은 맛집이야', '이 영화는 재미 없어' 이러한 문장 속 의미가 긍정인지 부정인지를 판단하는 것이라고 볼 수 있습니다. 보통 긍정과 부정을 분류하는 문제들이 많지만, 긍정의 정도를 나타내는 점수 5점 척도로 표현하여 예측하는 문제로 접근하는 경우도 있습니다. Dataset : The Stanfor.. 2020. 12. 10.
NEVER GIVE UP: LEARNING DIRECTED EXPLORATION STRATEGIES 이번에 소개해드릴 논문은 NEVER GIVE UP: LEARNING DIRECTED EXPLORATION STRATEGIES 이라는 논문으로 2020 ICLR 에 accept된 논문입니다. https://arxiv.org/pdf/2002.06038.pdf 메인 아이디어는 Exploration 과 Exploitation을 같은 네트워크에서 배우게 하는 것이며 이를 위해 Universal Value Function Approximators (UVFA) 를 사용합니다. 논문의 저자들은 다음 두가지 Intrinsic reward 를 제안 합니다. Per-episode novelty (Episodic Novelty) : Agent가 여러 에피소드에 걸쳐서 친숙한(familiar) state를 지속적으로 재방문 하.. 2020. 10. 29.