본문 바로가기

인공지능 요모조모

검색하기
인공지능 요모조모
프로필사진 dvl.hyeon_

  • 분류 전체보기 (22)
    • ROKEY (14)
      • Python3 (4)
      • Machine Learning (4)
      • ROS2 (6)
    • 논문 리뷰 (3)
    • 강화학습 (1)
    • 코딩 테스트 오답 (4)
Guestbook
Notice
Recent Posts
Recent Comments
Link
반응형
«   2025/05   »
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
Tags
  • 자료구조
  • 깊은복사
  • 단일에이전트
  • 자료형
  • DFS
  • 그래프
  • 얕은복사
  • BFS
  • 데이터전처리
  • 보상함수설계
  • 파이썬
  • 파이썬3
  • 파이썬패키지
  • 강화학습
  • 딥러닝
  • pandas
  • 특징선택
  • 알고리즘
  • 변수
more
Archives
Today
Total
관리 메뉴
  • 글쓰기
  • 방명록
  • RSS
  • 관리

목록강화학습 (1)

인공지능 요모조모

[RL] MDP와 Monte Carlo 개념 정리

- Efficient Reinforced Feature Selection via Early Stopping Traverse Strategy 논문을 읽기 전 미리 알아두어야 하는 사전 지식에 관해 정리한 내용이다.  2.5 선행 지식(Preliminaries)(논문 읽기 전 알아둘 것들, 생략 가능)(1) Markov Decision Process(MDP)마르코프 결정 프로세스는 아래 튜플과 같이 정의된다.이때, S는 유한한 state space, A는 사전 정의된 action space, R는 state-action 쌍을 scalar로 매핑하는 함수, γ 는 discount factor, P는 state-action 쌍에서 다음 state로의 전이 확률을 의미한다. 본 논문에서는 determinitsi..

강화학습 2023. 11. 27. 17:00
이전 Prev 1 Next 다음

Blog is powered by kakao / Designed by Tistory

티스토리툴바