코스 개요

AI 기반 Kubernetes 운영 소개

  • 현대 클러스터 운영에서 AI의 중요성
  • 전통적인 확장 및 스케줄링 논리의 한계
  • 리소스 관리를 위한 ML 핵심 개념

Kubernetes 리소스 관리 기초

  • CPU, GPU, 메모리 할당 기초
  • 쿼터, 제한, 요청 이해
  • 병목 현상 및 비효율성 식별

스케줄링을 위한 머신러닝 접근법

  • 워크로드 배치를 위한 지도 학습 및 비지도 학습 모델
  • 리소스 수요 예측 알고리즘
  • 사용자 정의 스케줄러에서 ML 기능 활용

지능적인 자동 확장을 위한 강화 학습

  • RL 에이전트가 클러스터 동작을 학습하는 방법
  • 효율성을 위한 보상 함수 설계
  • RL 기반 자동 확장 전략 구축

메트릭 및 텔레메트리를 활용한 예측적 자동 확장

  • Prometheus 데이터를 활용한 예측
  • 시간 시리즈 모델을 사용한 자동 확장 적용
  • 예측 정확도 평가 및 모델 조정

AI 기반 최적화 도구 구현

  • ML 프레임워크를 Kubernetes 컨트롤러와 통합
  • 지능적인 제어 루프 배포
  • AI 지원 의사 결정을 위해 KEDA 확장

비용 및 성능 최적화 전략

  • 예측적 확장을 통해 컴퓨팅 비용 절감
  • ML 기반 배치를 활용한 GPU 활용도 개선
  • 지연 시간, 처리량, 효율성 균형 맞추기

실용적인 시나리오 및 실제 사례

  • AI를 활용한 고부하 애플리케이션 자동 확장
  • 이종 노드 풀 최적화
  • 다중 테넌트 환경에서 ML 적용

요약 및 다음 단계

요건

  • Kubernetes 기본 이해
  • 컨테이너화된 애플리케이션 배포 경험
  • 클러스터 운영 및 리소스 관리에 대한 익숙함

대상

  • 대규모 분산 시스템을 다루는 SREs
  • 고부하 워크로드를 관리하는 Kubernetes 운영자
  • 컴퓨팅 인프라를 최적화하는 플랫폼 엔지니어
 21 시간

참가자 수


참가자별 가격

회원 평가 (5)

예정된 코스

관련 카테고리