[๊ฐํํ์ต] Dueling Double Deep Q Learning(DDDQN / Dueling DQN / D3QN)
ยท
๐ฌ ML & Data/๐ฎ Reinforcement Learning
Dueling Double DQN https://arxiv.org/pdf/1509.06461.pdf https://arxiv.org/pdf/1511.06581.pdf Double DQN DQN์์ reward๋ฅผ ๊ณผ๋ ํ๊ฐํ๋ ๋ฌธ์ ๊ฐ ์์. Q Value๊ฐ agent๊ฐ ์ค์ ๋ณด๋ค ๋์ ๋ฆฌํด์ ๋ฐ์ ๊ฒ์ด๋ผ๊ณ ์๊ฐํ๋ ๊ฒฝํฅ ⇒ Q learning update ๋ฐฉ์ ์์ ๋ค์ ์ํ(state)์ ๋ํ Q value ์ต๋๊ฐ์ด ์กด์ฌํ๊ธฐ ๋๋ฌธ Q ๊ฐ์ ๋ํ max ์ฐ์ฐ์ ํธํฅ์ ์ต๋ํํ๋ค. ํ๊ฒฝ์ ์ต๋ true value๊ฐ 0์ธ๋ฐ agent๊ฐ ์ถ์ ํ๋ ์ต๋ true value๊ฐ ์์์ธ ๊ฒฝ์ฐ์ ์ฑ๋ฅ ์ ํ ํด๊ฒฐ์ ์ํด ๋ ๊ฐ์ network ์ฌ์ฉ. Q Next : action selection → ๋ค์ ์ก์
์ผ๋ก ๊ฐ์ฅ ์ข์ ..