휴먼러닝

휴먼러닝

  • 분류 전체보기 (51)
    • 통계 빠개기 (30)
      • Statistics (21)
      • Linear Algebra (5)
      • Basic Math (4)
    • 추천 시스템 빠개기 (8)
      • Algorithm (5)
      • Article (3)
    • 머신 러닝 빠개기 (7)
      • Linear Regression (4)
      • SVM & Clustering (1)
      • Decision Tree (2)
    • 딥러닝 빠개기 (4)
      • Basic Neural Net (2)
      • CNN (0)
      • RNN & LSTM (1)
      • RL (1)
    • Programming Language (1)
      • Python (0)
      • Scala (1)
    • 음성 인식 (1)
    • 기타 (0)
    RSS 피드
    로그인
    로그아웃 글쓰기 관리

    휴먼러닝

    컨텐츠 검색

    태그

    최근글

    댓글

    공지사항

    아카이브

    About Markov (Reward) Process

    2020. 4. 29. 13:25ㆍ딥러닝 빠개기/RL

    https://bskyvision.com/573

     

    [강화학습] 마코프 프로세스(=마코프 체인) 제대로 이해하기

    이 포스팅은 어느 카테고리에 넣어야할지 고민이 된다. 확률과도 관련이 있고, 딥러닝의 강화학습과도 관련이 있고, 영상처리의 몇몇 알고리즘에서도 사용되기 때문이다. 짧은 고민 끝에 머신러닝, 딥러닝 카테고..

    bskyvision.com

    https://daeson.tistory.com/317

     

    RL (강화학습) 기초 - 3. Markov Decision Processes (1)

    1. Markov Processes 이번에 다루게 될 MDP에 대해서 소개를 하면 RL, 강화학습에서 가장 중요한 핵심 이론이 됩니다. 이 강의에서는 전제조건으로 agent가 환경에서 발생되는 모든 정보를 볼 수 있다고 가정합니..

    daeson.tistory.com

    https://www.youtube.com/watch?v=NMesGSXr8H4

     

    티스토리
    © 2018 TISTORY. All rights reserved.

    티스토리툴바