목록강화학습 (1)
인공지능 요모조모

- Efficient Reinforced Feature Selection via Early Stopping Traverse Strategy 논문을 읽기 전 미리 알아두어야 하는 사전 지식에 관해 정리한 내용이다. 2.5 선행 지식(Preliminaries)(논문 읽기 전 알아둘 것들, 생략 가능)(1) Markov Decision Process(MDP)마르코프 결정 프로세스는 아래 튜플과 같이 정의된다.이때, S는 유한한 state space, A는 사전 정의된 action space, R는 state-action 쌍을 scalar로 매핑하는 함수, γ 는 discount factor, P는 state-action 쌍에서 다음 state로의 전이 확률을 의미한다. 본 논문에서는 determinitsi..
강화학습
2023. 11. 27. 17:00