휴먼러닝

딥러닝 빠개기/RL(1)

About Markov (Reward) Process
https://bskyvision.com/573 [강화학습] 마코프 프로세스(=마코프 체인) 제대로 이해하기 이 포스팅은 어느 카테고리에 넣어야할지 고민이 된다. 확률과도 관련이 있고, 딥러닝의 강화학습과도 관련이 있고, 영상처리의 몇몇 알고리즘에서도 사용되기 때문이다. 짧은 고민 끝에 머신러닝, 딥러닝 카테고.. bskyvision.com https://daeson.tistory.com/317 RL (강화학습) 기초 - 3. Markov Decision Processes (1) 1. Markov Processes 이번에 다루게 될 MDP에 대해서 소개를 하면 RL, 강화학습에서 가장 중요한 핵심 이론이 됩니다. 이 강의에서는 전제조건으로 agent가 환경에서 발생되는 모든 정보를 볼 수 있다고 가정합니..
2020.04.29

1

티스토리툴바