Course Outline

Reinforcement Learning 소개

  • 강화 학습 및 응용 프로그램 개요
  • 지도 학습, 비지도 학습 및 강화 학습의 차이점
  • 핵심 개념: 에이전트, 환경, 보상 및 정책

마르코프 결정 프로세스(MDP)

  • 상태, 작업, 보상 및 상태 전환 이해
  • 가치 함수와 벨만 방정식
  • MDP를 풀기 위한 동적 프로그래밍

핵심 RL 알고리즘

  • 표 형식 방법: Q-Learning 및 SARSA
  • 정책 기반 방법: REINFORCE 알고리즘
  • Actor-Critic 프레임워크 및 해당 응용 프로그램

딥Reinforcement Learning

  • 딥 Q 네트워크(DQN) 소개
  • 리플레이 및 타겟 네트워크 경험
  • 정책 그래디언트 및 고급 딥 RL 방법

RL 프레임워크 및 도구

  • OpenAI 체육관 및 기타 RL 환경 소개
  • RL 모델 개발을 위해 PyTorch 또는 TensorFlow 사용
  • RL 에이전트 교육, 테스트 및 벤치마킹

RL에서의 도전

  • 훈련에서 탐색과 활용의 균형
  • 희소한 보상과 크레딧 할당 문제 처리
  • ScalaRL의 능력과 계산 과제

핸즈온 Activities

  • Q-Learning 및 SARSA 알고리즘을 처음부터 구현
  • OpenAI Gym에서 간단한 게임을 플레이하기 위한 DQN 기반 에이전트 훈련
  • 사용자 정의 환경에서 성능 향상을 위한 RL 모델 미세 조정

요약 및 다음 단계

Requirements

  • 머신 러닝 원리와 알고리즘에 대한 강력한 이해
  • Python 프로그래밍에 능숙함
  • 신경망과 딥러닝 프레임워크에 대한 지식

청중

  • 머신러닝 엔지니어
  • AI 전문가
 14 Hours

Number of participants


Price per participant

Upcoming Courses

Related Categories