Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Course Outline
Reinforcement Learning 소개
- 강화 학습이란?
- 핵심 개념: 에이전트, 환경, 상태, 작업 및 보상
- 강화 학습의 과제
탐사와 착취
- RL 모델에서 탐색과 활용의 균형 맞추기
- 탐색 전략: epsilon-greedy, softmax 등
Q-러닝과 딥 Q-네트워크(DQN)
- Q-러닝 소개
- TensorFlow를 사용하여 DQN 구현
- 경험 재생 및 타겟 네트워크를 통한 Q-학습 최적화
정책 기반 방법
- 정책 그래디언트 알고리즘
- REINFORCE 알고리즘 및 구현
- 배우-비평가 방법
OpenAI 헬스장에서 일하기
- OpenAI 체육관 환경 설정
- 동적 환경에서 에이전트 시뮬레이션
- 에이전트 성과 평가
고급Reinforcement Learning 기술
- 다중 에이전트 강화 학습
- 심층 결정론적 정책 그래디언트(DDPG)
- 근접 정책 최적화(PPO)
Reinforcement Learning 모델 배포
- 강화 학습의 실제 세계 응용 프로그램
- RL 모델을 프로덕션 환경에 통합
요약 및 다음 단계
Requirements
- Python 프로그래밍 경험
- 딥러닝과 머신러닝 개념에 대한 기본 이해
- 강화 학습에 사용되는 알고리즘과 수학적 개념에 대한 지식
청중
- 데이터 과학자
- 머신 러닝 실무자
- AI 연구자
28 Hours
회원 평가 (4)
매우 친절하고 도움이 됨
Aktar Hossain - Unit4
Course - Building Microservices with Microsoft Azure Service Fabric (ASF)
Machine Translated
수동 서버리스 설정. 또한 Idea sls 웹 콘솔 종료도 없었습니다.
Rafal Kucharski - The Software House sp. z o.o.
Course - Serverless Framework for Developers
Machine Translated
All good, nothing to improve
Ievgen Vinchyk - GE Medical Systems Polska Sp. Z O.O.
Course - AWS Lambda for Developers
IOT applications