Course Outline

Reinforcement Learning 소개

  • 강화 학습이란?
  • 핵심 개념: 에이전트, 환경, 상태, 작업 및 보상
  • 강화 학습의 과제

탐사와 착취

  • RL 모델에서 탐색과 활용의 균형 맞추기
  • 탐색 전략: epsilon-greedy, softmax 등

Q-러닝과 딥 Q-네트워크(DQN)

  • Q-러닝 소개
  • TensorFlow를 사용하여 DQN 구현
  • 경험 재생 및 타겟 네트워크를 통한 Q-학습 최적화

정책 기반 방법

  • 정책 그래디언트 알고리즘
  • REINFORCE 알고리즘 및 구현
  • 배우-비평가 방법

OpenAI 헬스장에서 일하기

  • OpenAI 체육관 환경 설정
  • 동적 환경에서 에이전트 시뮬레이션
  • 에이전트 성과 평가

고급Reinforcement Learning 기술

  • 다중 에이전트 강화 학습
  • 심층 결정론적 정책 그래디언트(DDPG)
  • 근접 정책 최적화(PPO)

Reinforcement Learning 모델 배포

  • 강화 학습의 실제 세계 응용 프로그램
  • RL 모델을 프로덕션 환경에 통합

요약 및 다음 단계

Requirements

  • Python 프로그래밍 경험
  • 딥러닝과 머신러닝 개념에 대한 기본 이해
  • 강화 학습에 사용되는 알고리즘과 수학적 개념에 대한 지식

청중

  • 데이터 과학자
  • 머신 러닝 실무자
  • AI 연구자
 28 Hours

Number of participants


Price per participant

회원 평가 (4)

Upcoming Courses

Related Categories