'강화학습' 카테고리의 글 목록

Notice

Recent Posts

Recent Comments

Link

« 2025/05 »
일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

글쓰기
방명록
RSS
관리

목록강화학습 (1)

인공지능 요모조모

[RL] MDP와 Monte Carlo 개념 정리

- Efficient Reinforced Feature Selection via Early Stopping Traverse Strategy 논문을 읽기 전 미리 알아두어야 하는 사전 지식에 관해 정리한 내용이다. 2.5 선행 지식(Preliminaries)(논문 읽기 전 알아둘 것들, 생략 가능)(1) Markov Decision Process(MDP)마르코프 결정 프로세스는 아래 튜플과 같이 정의된다.이때, S는 유한한 state space, A는 사전 정의된 action space, R는 state-action 쌍을 scalar로 매핑하는 함수, γ 는 discount factor, P는 state-action 쌍에서 다음 state로의 전이 확률을 의미한다. 본 논문에서는 determinitsi..

강화학습 2023. 11. 27. 17:00

이전 Prev 1 Next 다음

목록강화학습 (1)

인공지능 요모조모

티스토리툴바