Course Outline

오픈 AIOps 아키텍처 설계

  • 오픈 AIOps 파이프라인의 주요 구성 요소 개요
  • 데이터의 인제스트부터 알림까지의 흐름
  • 도구 비교 및 통합 전략

데이터 수집 및 집계

  • Prometheus을 사용하여 타임시리즈 데이터 인제스트
  • Logstash과 Beats를 사용하여 로그 캡처
  • 다양한 소스의 데이터 정규화

관찰 가능성 대시보드 구축

  • Grafana를 사용하여 메트릭 시각화
  • 로그 분석을 위한 Kibana 대시보드 구축
  • Elasticsearch 쿼리를 사용하여 운영 인사이트 추출

이상 탐지 및 사건 예측

  • 관찰 가능성 데이터를 Python 파이프라인에 내보냄
  • 이상 탐지와 예측을 위한 ML 모델 학습
  • 관찰 가능성 파이프라인에서 모델을 사용하여 실시간 추론 배포

오픈 도구를 이용한 알림 및 자동화

  • Prometheus 알림 규칙 생성 및 Alertmanager 라우팅
  • 자동 응답을 위한 스크립트 또는 API 워크플로우 트리거
  • 오픈 소스 오케스트레이션 도구 사용 (예: Ansible, Rundeck)

통합 및 확장성 고려 사항

  • 고부하 인제스트 및 장기 보존 처리
  • 오픈 소스 스택의 보안 및 접근 제어
  • 인제스트, 처리, 알림 각 계층을 독립적으로 확장

실세계 응용 및 확장

  • 사례 연구: 성능 튜닝, 다운타임 방지 및 비용 최적화
  • 추적 도구나 서비스 그래프로 파이프라인 확장
  • 생산 환경에서 AIOps을 운영하고 유지보수하는 모범 사례

요약 및 다음 단계

Requirements

  • Prometheus 또는 ELK와 같은 가시성 도구 경험
  • Python 및 머신러닝 기본 원리 지식
  • IT 운영 및 알림 워크플로 이해

대상

  • 고급 사이트 신뢰성 엔지니어(SRE)
  • 운영 중인 데이터 엔지니어
  • DevOps 플랫폼 리드 및 인프라 아키텍트
 14 Hours

Number of participants


Price per participant

Upcoming Courses

Related Categories