Course Outline

소개

Reinforcement Learning 기본

기본 Reinforcement Learning 기술

BURLAP 소개

가치와 정책 반복의 융합

보상 형성

탐구

일반화

부분적으로 관찰 가능한 MDP

옵션

물류 센터

TD 람다

정책 변화

딥 Q-러닝

게임이론의 주제

요약 및 다음 단계

Requirements

  • Python 능숙도
  • 대학 미적분학 및 선형 대수학에 대한 이해
  • 확률과 Statistics에 대한 기본 이해
  • Python 및 Numpy에서 머신러닝 모델을 만들어 본 경험

청중

  • 개발자
  • 데이터 과학자
 21 Hours

Number of participants



Price per participant

Related Courses

Related Categories