Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Course Outline
Reinforcement Learning 소개
- 강화 학습 및 응용 프로그램 개요
- 지도 학습, 비지도 학습 및 강화 학습의 차이점
- 핵심 개념: 에이전트, 환경, 보상 및 정책
마르코프 결정 프로세스(MDP)
- 상태, 작업, 보상 및 상태 전환 이해
- 가치 함수와 벨만 방정식
- MDP를 풀기 위한 동적 프로그래밍
핵심 RL 알고리즘
- 표 형식 방법: Q-Learning 및 SARSA
- 정책 기반 방법: REINFORCE 알고리즘
- Actor-Critic 프레임워크 및 해당 응용 프로그램
딥Reinforcement Learning
- 딥 Q 네트워크(DQN) 소개
- 리플레이 및 타겟 네트워크 경험
- 정책 그래디언트 및 고급 딥 RL 방법
RL 프레임워크 및 도구
- OpenAI 체육관 및 기타 RL 환경 소개
- RL 모델 개발을 위해 PyTorch 또는 TensorFlow 사용
- RL 에이전트 교육, 테스트 및 벤치마킹
RL에서의 도전
- 훈련에서 탐색과 활용의 균형
- 희소한 보상과 크레딧 할당 문제 처리
- ScalaRL의 능력과 계산 과제
핸즈온 Activities
- Q-Learning 및 SARSA 알고리즘을 처음부터 구현
- OpenAI Gym에서 간단한 게임을 플레이하기 위한 DQN 기반 에이전트 훈련
- 사용자 정의 환경에서 성능 향상을 위한 RL 모델 미세 조정
요약 및 다음 단계
Requirements
- 머신 러닝 원리와 알고리즘에 대한 강력한 이해
- Python 프로그래밍에 능숙함
- 신경망과 딥러닝 프레임워크에 대한 지식
청중
- 머신러닝 엔지니어
- AI 전문가
14 Hours
회원 평가 (1)
강사 실시간으로 질문에 답변합니다.
Adrian
Course - Agentic AI Unleashed: Crafting LLM Applications with AutoGen
Machine Translated