코스 개요

로봇 학습 입문

  • 로보틱스에서의 머신 러닝 개요
  • 감독형, 비감독형, 강화 학습 비교
  • 제어, 탐색, 조작 분야에서의 RL 응용

강화 학습의 기초

  • 마르코프 결정 과정(MDP)
  • 정책, 가치, 보상 함수
  • 탐색과 활용의 균형

전통적인 RL 알고리즘

  • Q-learning과 SARSA
  • 몬테카를로 방법 및 시간 차분 방법
  • 가치 반복법 및 정책 반복법

딥 강화 학습 기술

  • 딥러닝과 RL의 결합 (Deep Q-Networks)
  • 정책 그래디언트 방법
  • A3C, DDPG, PPO 등의 고급 알고리즘

로봇 학습을 위한 시뮬레이션 환경

  • OpenAI Gym과 ROS 2를 사용한 시뮬레이션
  • 로봇 작업을 위한 맞춤형 환경 구축
  • 성능 평가 및 훈련 안정성 검증

로보틱스에 RL 적용

  • 제어 및 운동 정책 학습
  • 로봇 조작을 위한 강화 학습
  • 군집 로봇 공학에서의 다중 에이전트 강화 학습

최적화, 배포 및 실세계 통합

  • 하이퍼파라미터 조정 및 보상 설계
  • 시뮬레이션에서 실제로의 정책 전송 (Sim2Real)
  • 훈련된 모델을 로봇 하드웨어에 배포

요약 및 다음 단계

요건

  • 머신 러닝 개념 이해
  • Python 프로그래밍 경험
  • 로봇공학 및 제어 시스템에 대한 이해

대상자

  • 머신 러닝 엔지니어
  • 로봇 연구원
  • 지능형 로봇 시스템을 구축하는 개발자
 21 시간

참가자 수


참가자당 가격

회원 평가 (1)

예정된 코스

관련 카테고리