코스 개요

SRE 반복 패턴

  • 비생산적인 실무 식별
  • 반복 패턴이 신뢰성에 미치는 영향 인식
  • 베스트 프랙티스와 개선 대안

SLO를 통한 고객 만족도 측정

  • 서비스 수준 지표(SLIs) 및 서비스 수준 목표(SLOs) 정의
  • 오류 예산 관리와 혁신과 신뢰성 균형 유지
  • 분산 시스템의 한계 이해

안전하고 신뢰할 수 있는 시스템 구축

  • 고장 내성과 탄력성을 위한 설계
  • 신뢰성 엔지니어링에 보안 통합
  • 확장성 및 데이터 보호 전략

전 영역 모니터링(Full-stack Observability)

  • 측정 및 메트릭 수집
  • 분산 추적 및 합성 모니터링
  • 모니터링 중심 개발

플랫폼 엔지니어링과 AIOps

  • 플랫폼 중심 엔지니어링 접근법
  • SRE에서의 자동화 및 오케스트레이션
  • DataOps 및 운영 지능 활용

SRE에서의 사고 관리

  • 사고 대응 역할과 책임
  • OODA 등의 프레임워크 적용
  • 자동 복구 및 AI/ML 지원 해결책

카오스 엔지니어링

  • 탄력성 테스트 원칙 및 전략
  • '게임 데이' 운용 계획 및 실행
  • 제어된 실패 실험에서의 학습

SRE가 DevOps의 순수한 형태

  • DevOps 워크플로에 SRE 통합
  • 문화적 일치 및 협업 실천
  • SRE를 통해 조직 변화 이끌기

수료 후 연습 문제

  • 대규모 시스템 설계 사례 연구
  • 고급 측정 및 모니터링 시나리오
  • 실제 신뢰성 문제 해결

복습과 시험 준비

  • DevOps Institute SRE 실무자 교육 과정 최종 복습
  • 샘플 문제와 모의 시험
  • 시험 응시 전략 및 권장 사항

요약과 다음 단계

요건

  • 사이트 신뢰성 엔지니어링(Site Reliability Engineering) 핵심 원칙 이해
  • DevOps 실무 및 관련 도구 경험
  • 시스템 모니터링, 사고 관리, 및 자동화에 대한 이해

대상자

  • DevOps Institute SRE 실무자 인증을 받으려는 SRE 전문가
  • 신뢰성 중심 역할로 확장하려는 DevOps 엔지니어
  • 신뢰성 전략 및 실행에 책임이 있는 운영 리더
 35 시간

참가자 수


참가자당 가격

회원 평가 (5)

예정된 코스

관련 카테고리