DQN2 반응형 R로하는 강화학습 (DQN) (Keras) library(keras) #####DQN Modelmodel % layer_dense(units = 256, activation = 'relu', input_shape = c(100)) %>% layer_dropout(rate = 0.4) %>% layer_dense(units = 128, activation = 'relu') %>% layer_dropout(rate = 0.3) %>% layer_dense(units = 4, activation = 'linear') summary(model) model %>% compile( loss = 'mean_squared_error', optimizer = optimizer_rmsprop()) ####### Target Network Modeltarget_qn.. 2018. 4. 27. Hierarchical Deep Reinforcement Learning (HDQN) 본 포스팅은 기본적은 강화학습인 Q-learning과 DQN(Deep Q-network)에 대해 알고 있으셔야 읽기 수월합니다. Q-learning과 DQN에 대한 내용은 김성교수님의 모두를 위한 RL 강의를 참고하시기 바랍니다.(https://www.youtube.com/playlist?list=PLlMkM4tgfjnKsCWav-Z2F-MMFRx-2gMGG) Hierarchical Deep Reinforcement Learning (HDQN)은 한국말로 번역하면 계층적 강화학습으로 여러 목표를 정해 그 목표를 차근차근 해결해나가겠다는 컨셉입니다. 굳이 여러 목표를 통해 강화학습을 진행하는 이유는, sparse reward (delayed reward) 문제 때문입니다. 일반적으로 강화학습으로 푸는 문제.. 2017. 11. 21. 이전 1 다음