Course Outline

강화 학습 소개

  • 강화 학습이란 무엇인가?
  • 주요 개념: 에이전트, 환경, 상태, 행동, 보상
  • 강화 학습의 도전 과제

탐색과 활용

  • 강화 학습 모델에서 탐색과 활용의 균형
  • 탐색 전략: 에플시온-그리디, 소프트맥스 등

Q-러닝과 심층 Q-네트워크(DQNs)

  • Q-러닝 소개
  • TensorFlow을 사용하여 DQNs 구현
  • 경험 재생 및 타겟 네트워크를 통한 Q-러닝 최적화

정책 기반 방법

  • 정책 경사 알고리즘
  • REINFORCE 알고리즘 및 구현
  • 액터-크리틱 방법

OpenAI Gym과 함께 작업

  • OpenAI Gym에서 환경 설정
  • 동적 환경에서 에이전트 시뮬레이션
  • 에이전트 성능 평가

고급 Reinforcement Learning 기술

  • 다중 에이전트 강화 학습
  • 심층 결정론적 정책 경사(DDPG)
  • 근접 정책 최적화(PPO)

Reinforcement Learning 모델 배포

  • 강화 학습의 실제 응용
  • RL 모델을 생산 환경에 통합

요약 및 다음 단계

Requirements

  • Python 프로그래밍 경험
  • 심층 학습 및 기계 학습 개념에 대한 기본 이해
  • 강화 학습에서 사용되는 알고리즘과 수학적 개념에 대한 지식

대상

  • 데이터 과학자
  • 머신러닝 실무자
  • AI 연구원
 28 Hours

Number of participants


Price per participant

Upcoming Courses

Related Categories