코스 개요

AWS에서의 클라우드 운영 기초

  • 클라우드 환경에서의 운영 역할 및 책임
  • AWS 계정 구조, 조직, 다중 계정 전략
  • 주요 운영 서비스: CloudWatch, CloudTrail, AWS Config

인프라 코드화 및 프로비저닝

  • IaC 및 불변 인프라의 원칙
  • Terraform 및 AWS CloudFormation을 사용한 프로비저닝
  • 상태 관리, 모듈, 환경 프로모션

CI/CD 및 배포 전략

  • 클라우드 네이티브 앱을 위한 CI/CD 파이프라인 설계
  • 블루/그린, 카나리아, 롤링 배포
  • 롤백, 건강 상태 확인, 릴리스 검증 자동화

모니터링, 관찰성 및 알림

  • 메트릭, 로그, 트레이스: 전송, 저장, 분석
  • CloudWatch, X-Ray, 서드파티 관찰성 도구 사용
  • SLOs/SLIs 정의, 알림 정책, 대기 당직 실천 방법

보안 운영 및 식별 관리

  • IAM 최적 실천 방법, 최소 권한, 계정 간 액세스
  • 비밀 관리, KMS, 보안 매개변수 저장소
  • 운영 보안: 패치 전략, 취약점 스캐닝, 감사 추적

탄력성, 백업 및 재해 복구

  • 고장 허용 설계 및 높은 가용성
  • 백업 전략, 스냅샷 자동화, 복구 절차
  • 재해 복구 계획 및 runbook 생성

비용 최적화 및 거버넌스

  • 비용 가시성: 청구, 태깅, 비용 할당 전략
  • 크기 조정, 예약 인스턴스/저축 플랜, 예산 제어
  • 거버넌스: 정책, 가이드라인, 컴플라이언스를 위한 자동화

컨테이너, 서버리스, 런타임 운영

  • ECS, EKS, Lambda의 운영 고려 사항
  • 서비스 발견, 자동 스케일링, 리소스 제한
  • 컨테이너화된 워크로드의 로깅, 트레이싱, 디버깅

사고 대응, 매뉴얼, 카오스 엔지니어링

  • runbook 기반 사고 대응 및 사후 분석 실천 방법
  • 자동 복구 및 자체 치유 패턴
  • 탄력성 검증을 위한 카오스 실험 소개

실습 워크샵: 샘플 워크로드 운영

  • IaC 및 CI/CD 파이프라인을 사용하여 샘플 애플리케이션 배포
  • 모니터링, 알림, 자동 복구 스크립트 구현
  • 사고 시뮬레이션 및 runbook 기반 대응 연습

요약 및 다음 단계

요건

  • 클라우드 개념 및 네트워킹에 대한 기본 이해
  • Linux 명령 줄 및 스크립팅에 익숙함
  • 소스 제어(Git) 및 CI/CD 개념에 대한 경험

대상자

  • 클라우드 운영 엔지니어
  • SRE 및 플랫폼 엔지니어
  • DevOps 엔지니어 및 기술 팀 리더
 21 시간

참가자 수


참가자당 가격

회원 평가 (5)

예정된 코스

관련 카테고리