연락처 정보

코스 개요

배포 준비된 기계 학습 모델

  • Docker를 이용한 모델 패키징
  • TensorFlow 및 PyTorch에서 모델 내보내기
  • 버전 관리 및 저장소 고려 사항

Kubernetes에서의 모델 서비스 제공

  • 추론 서버 개요
  • TensorFlow Serving 및 TorchServe 배포
  • 모델 엔드포인트 설정

추론 최적화 기법

  • 배치 처리 전략
  • 동시 요청 처리
  • 지연 시간 및 처리량 튜닝

ML 워크로드 오토스케일링

  • 수평 Pod 오토스케일러 (HPA)
  • 수직 Pod 오토스케일러 (VPA)
  • Kubernetes 이벤트 기반 오토스케일링 (KEDA)

GPU 프로비저닝 및 리소스 관리

  • GPU 노드 구성
  • NVIDIA 장치 플러그인 개요
  • ML 워크로드를 위한 리소스 요청 및 제한

모델 배포 및 릴리스 전략

  • 블루/그린 배포
  • Canary 배포 패턴
  • 모델 평가를 위한 A/B 테스트

프로덕션 환경의 ML 모니터링 및 가시성

  • 추론 워크로드 지표
  • 로깅 및 추적 실습
  • 대시보드 및 알림

보안 및 신뢰성 고려 사항

  • 모델 엔드포인트 보안
  • 네트워크 정책 및 접근 제어
  • 고가용성 보장

요약 및 다음 단계

요건

  • 컨테이너화된 애플리케이션 워크플로우에 대한 이해
  • Python 기반 ML 모델에 대한 경험
  • Kubernetes 기본 개념에 대한 친숙함

대상

  • ML 엔지니어
  • DevOps 엔지니어
  • 플랫폼 엔지니어링 팀
 14 시간

참가자 수


참가자별 가격

회원 평가 (3)

예정된 코스

관련 카테고리