본문 바로가기

전체 글150

반응형
Python vs R 무엇을 배워야 할까? 내가 어떤 직업을 갖고자 하는지가 매우 중요하다. AI/데이터 사이언스 분야에서도 다양한 직업이 존재한다. 아래 글을 참고하자. https://bluediary8.tistory.com/148 데이터 사이언티스트 (Data Scientist) 되기 위해서 / 인공지능 관련 직업 데이터 사이언티스트 (Data Scientist) 가 되기 위해서는 무엇을 전공해야 하고 무엇을 공부해야 할까? 어느정도 시간을 투자하고 얼마나 공부해야 데이터 사이언티스트로서 취업할 수 있을까? 문과 bluediary8.tistory.com 당연히 기업에서 요구하는 역할과 내가 원하는 직업에 따라 내가 중점적으로 배워야하는 언어는 달라질 것이다. Python과 R은 둘다 데이터 사이언스 쪽으로 특화된 언어라고 할 수 있다. 그래서.. 2022. 12. 11.
데이터사이언스/인공지능 대학원을 꼭 진학 해야 하는가? 우선 우리는 대학원이 무엇을 하는 곳인지 알아야한다. 필자는 대학원은 학부때 공부하던 것을 더 연장해서 본인의 연구역량을 기르는 곳이라고 생각한다. 즉, 연구를 하는 곳이라 생각한다. 석사나 박사 학위를 받으면, 취업에 있어서도 유리한점이 있지만, 대학원생의 기본 업무는 연구이다. 그렇지만, 대학원에 입학을 하게 된다고 하더라도 마냥 연구만을 할 수 있는 것은 아니다. 강의 자료 작성, 연구실 행정 업무 등 다양하게 할일이 존재 한다^^. 그렇다고, 연구를 잘 할 수 있는 것도 아니다. 내가 생각한 주제는 70억 인구 누군가 중 한명이 했을 확률이 높으니까. 필자의 개인 적인 견해로, 주입식 교육이 아닌 스스로 찾아보고 공부하고 새로운 것을 생각해 낼 수 있는 사람들은 석사와 박사과정을 밟는 것을 권장한.. 2022. 12. 11.
데이터 사이언티스트 (Data Scientist) 되기 위해서 / 인공지능 관련 직업 데이터 사이언티스트 (Data Scientist) 가 되기 위해서는 무엇을 전공해야 하고 무엇을 공부해야 할까? 어느정도 시간을 투자하고 얼마나 공부해야 데이터 사이언티스트로서 취업할 수 있을까? 문과생은 과연 데이터 사이언티스트가 될 수 있을까? 데이터 사이언스 그리고 인공지능에 대한 수요가 증가함에따라 관련 커리어에 관련해서 고민하는 사람들 또한 증가하고 있다. 우선 인공지능, 데이터사이언스 관련한 직업을 살펴보도록 하자. 이에 관련해서는 필자의 주관적인 견해가 들어가있다. 필자는 아래의 총 네가지 직업으로 나눌 수 있다고 생각한다. 데이터 사이언티스트 (Data Scientist) : 데이터를 활용하여 예측 모델 또는 인자 분석 등 관련 알고리즘을 개발하고, insight를 도출. 데이터 분석가 /.. 2022. 12. 10.
Undersampling과 Hybrid-resampling을 활용한 데이터 증강 지난 포스팅에서 Oversamplig method를 다루었는데, 이번 글에서는 간단하게 Undersampling method를 다루어 보도록 하겠다. https://bluediary8.tistory.com/143 머신러닝의 클래스 불균형(Class imbalanced) 문제2 - SMOTE 저번 포스팅에서, 클래스 불균형에 대한 이야기와 해결하기 위한 방법들의 종류에 대해서만 소개하였습니다. https://bluediary8.tistory.com/132 DS/AI를 공부하기 위해 알아두면 좋은 것 8 - 클래스 불균 bluediary8.tistory.com Oversampling은 소수 클래스의 데이터를 새롭게 생성해서, 학습하는 모델이 소수 클래스의 데이터를 무시하지 못하도록 하게 만드는 기법입니다. .. 2022. 12. 10.
[딥러닝 논문 리뷰] ImageNET-Trained CNNS Are Biased Towards Texture; Increasing Shape Bias Improves Accuracy And Robustness 이번에 리뷰할 논문은 ImageNET-Trained CNNS Are Biased Towards Texture; Increasing Shape Bias Improves Accuracy And Robustness 이라는 논문으로 ICLR2019에 oral 발표로 accept된 논문입니다. ICRL2019에 accept된 논문 500편 중에 20여편정도가 oral인걸 감안한다면, 매우 좋은 점수를 받은것을 알 수 있죠. 논문을 읽어보면 아시겠지만, 수식이 거의 없고 직관적으로 설명이 잘 되어 있습니다. 이 논문이 oral로 accept된 이유는 (제생각) 기존의 CNN을 바라보는 관점을 깨뜨린 점과 다양한 실험으로 본인들의 가설을 증명하려고 노력한 점 때문이 아닐까 싶습니다. 이 논문의 핵심은 다음 이미지 한.. 2022. 12. 10.
[강화학습 논문 리뷰] Exploration by Random Network Distillation 이번에 포스팅 할 논문은 Exploration by Random Network Distillation이라는 논문입니다. OpenAI에서 2018년 10월에 발표한 논문이고 제목에서 알수 있듯이 exploration에 관한 논문입니다. 매우 간단한 아이디어에서 시작된 논문이지만 (사실 처음에 직관적으로 잘 이해가 되지 않았습니다), 성능은 매우 띄어 납니다. (연구실 프로젝트에도 적용해보았는데, 효과가 꽤 좋습니다) Reward가 sparse한 환경으로 많이 실험하는 Atari-Montezuma에서 SOTA를 기록했고 최초로 인간성능을 뛰어 넘었습니다. 여태까지 매우 많은 강화학습 알고리즘이 나왔지만 이 Montezuma에서는 인간의 성능을 뛰어 넘지 못했었죠. 그런데 드디어 최초로 인간성능을 뛰어넘는 알.. 2022. 12. 10.