DDPG & TRPO

DDPG : Test Deterministic Policy Gradient Theorem 이 글은 Gabriel Peyré, Marco Cuturi의 Computational Optimal Transport를 읽고 단순히 이해 가는대로 번역한 내용이다. ???: 번역인데 왜 영어가 더 많나요? Theoretical Foundations of O...

Jul 9, 2024 RL

DDPG & TRPO

DDPG : Deep Deterministic Policy Gradient Deterministic Policy Gradient Theorem [\begin{aligned} J(\theta) = \mathbb{E}{s\sim \rho\mu}[Q^{\mu}(s, a)] = \int_\mathcal{S} \rho_\mu (s) Q^{\mu} (s, a...

Jan 9, 2024 RL

Policy Gradient

Policy Gradient 01. Deep Reinforcement Learning Overview Monte Carlo, Sarsa, Q-learning과 같은 일반적인 RL이 state-action value 테이블을 만드는 tabular updating method를 구하는 방법이라면, DRL은 DNN을 통하여 state-action val...

Jan 8, 2024 RL

RL basic and MDP

RL 1. Reinforcement Learning basic concepts 1.1 Intro 강화학습은 크게 두 가지 단계로 구분된다. Policy Evaluation : 주어진 policy에서 total reward를 계산하는 방법 Policy Improvement : Total reward를 maximize하는 쪽으로 policy...

Jan 2, 2024 RL

Github 블로그 만드는 법

Chirpy 테마로 github 블로그 구축하기 3일 걸렸습니다. 여러분은 30분 걸리시길 바랍니다. (공식 가이드) Chirpy starter를 사용하는 방법과 Github Fork를 통해 구축하는 방법이 있는데, Chirpy starter로 시도해본 결과 5분이면 만들 수 있지만, 여러가지 customizing이 어렵다는 점이 마음에 안들어서 ...

Jan 2, 2024 Blogging

DDPG & TRPO

DDPG & TRPO

Policy Gradient

RL basic and MDP

Github 블로그 만드는 법

Trending Tags