코스 개요

프로덕션에서의 에이전트 시스템 기초

  • 에이전트 아키텍처: 루프, 도구, 메모리, 오케스트레이션 레이어
  • 에이전트의 수명주기: 개발, 배포, 지속적 운영
  • 프로덕션 규모의 에이전트 관리 도전 과제

인프라 및 배포 모델

  • 컨테이너화 및 클라우드 환경에서 에이전트 배포
  • 확장 패턴: 수평적 vs 수직적 확장, 동시성, 스로틀링
  • 다중 에이전트 오케스트레이션 및 워크로드 균형 조절

모니터링 및 관찰 가능성

  • 주요 메트릭: 지연 시간, 성공률, 메모리 사용량, 에이전트 호출 깊이
  • 에이전트 활동 및 호출 그래프 추적
  • Prometheus, OpenTelemetry, Grafana를 활용한 관찰 가능성 도구화

로깅, 감사, 컴플라이언스

  • 중앙 집중식 로깅 및 구조적 이벤트 수집
  • 에이전트 워크플로의 컴플라이언스 및 감사 가능성
  • 디버깅을 위한 감사 트레일 및 재생 메커니즘 설계

성능 최적화 및 리소스 최적화

  • 추론 오버헤드 감소 및 에이전트 오케스트레이션 주기 최적화
  • 모델 캐싱 및 가벼운 임베딩을 통한 빠른 검색
  • AI 파이프라인의 로드 테스트 및 스트레스 시나리오

비용 관리 및 거버넌스

  • 에이전트 비용 요인 이해: API 호출, 메모리, 컴퓨팅, 외부 통합
  • 에이전트 수준 비용 추적 및 차입 모델 구현
  • 에이전트 확산 및 유휴 리소스 소비를 방지하기 위한 자동화 정책

에이전트의 CI/CD 및 롤아웃 전략

  • 에이전트 파이프라인을 CI/CD 시스템에 통합
  • 반복적인 에이전트 업데이트를 위한 테스트, 버전 관리, 롤백 전략
  • 점진적 롤아웃 및 안전한 배포 메커니즘

장애 복구 및 신뢰성 엔지니어링

  • 고장 내성 및 우아한 강하를 위한 설계
  • 에이전트 신뢰성을 위한 재시도, 타임아웃, 서킷 브레이커 패턴
  • AI 운영을 위한 사고 대응 및 사후 분석 프레임워크

캡스톤 프로젝트

  • 완전한 모니터링과 비용 추적을 포함하는 에이전트 AI 시스템 구축 및 배포
  • 부하 시뮬레이션, 성능 측정, 리소스 사용 최적화
  • 동료들에게 최종 아키텍처 및 모니터링 대시보드 제시

요약 및 다음 단계

요건

  • MLOps 및 프로덕션 머신러닝 시스템에 대한 깊은 이해
  • 컨테이너화 배포(Docker/Kubernetes) 경험
  • 클라우드 비용 최적화 및 관찰 가능성 도구에 대한 친숙함

대상자

  • MLOps 엔지니어
  • 사이트 신뢰성 엔지니어(SREs)
  • AI 인프라를 관리하는 엔지니어링 매니저
 21 시간

참가자 수


참가자별 가격

회원 평가 (3)

예정된 코스

관련 카테고리