2020. 4. 29. 13:25ㆍ딥러닝 빠개기/RL
https://bskyvision.com/573
[강화학습] 마코프 프로세스(=마코프 체인) 제대로 이해하기
이 포스팅은 어느 카테고리에 넣어야할지 고민이 된다. 확률과도 관련이 있고, 딥러닝의 강화학습과도 관련이 있고, 영상처리의 몇몇 알고리즘에서도 사용되기 때문이다. 짧은 고민 끝에 머신러닝, 딥러닝 카테고..
bskyvision.com
https://daeson.tistory.com/317
RL (강화학습) 기초 - 3. Markov Decision Processes (1)
1. Markov Processes 이번에 다루게 될 MDP에 대해서 소개를 하면 RL, 강화학습에서 가장 중요한 핵심 이론이 됩니다. 이 강의에서는 전제조건으로 agent가 환경에서 발생되는 모든 정보를 볼 수 있다고 가정합니..
daeson.tistory.com
https://www.youtube.com/watch?v=NMesGSXr8H4