Course Outline

고급 강화학습 기법

강화학습 모델 배포

탐색과 활용

강화학습 소개

정책 기반 방법

Q-러닝 및 심층 Q-네트워크(DQN)

요약 및 다음 단계

OpenAI Gym을 활용한 작업

  • 강화학습 모델에서 탐색과 활용의 균형 조절
  • 탐색 전략: epsilon-greedy, softmax 등
  • Q-러닝 소개
  • TensorFlow을 사용하여 DQN 구현
  • 경험 재생 및 타겟 네트워크를 사용하여 Q-러닝 최적화
  • 다중 에이전트 강화학습
  • 심층 결정적 정책 경사(DDPG)
  • 근접 정책 최적화(PPO)
  • 정책 경사 알고리즘
  • REINFORCE 알고리즘 및 그 구현
  • 액터-크리틱 방법
  • 강화학습의 실제 응용
  • RL 모델을 생산 환경에 통합
  • OpenAI Gym에서 환경 설정
  • 동적 환경에서 에이전트 시뮬레이션
  • 에이전트 성능 평가
  • 강화학습이란 무엇인가?
  • 주요 개념: 에이전트, 환경, 상태, 행동 및 보상
  • 강화학습의 도전 과제

Requirements

대상

  • 데이터 과학자
  • 머신러닝 전문가
  • 인공지능 연구자
  • Python 프로그래밍 경험
  • 딥러닝과 머신러닝 개념에 대한 기본 이해
  • 강화 학습에서 사용되는 알고리즘과 수학적 개념에 대한 지식
 28 Hours

Number of participants


Price per participant

Upcoming Courses

Related Categories