Course Outline

오픈 AIOps 아키텍처 설계

  • 오픈 AIOps 파이프라인에서 주요 구성 요소 개요
  • 데이터 흐름: 수집에서 알림까지
  • 도구 비교 및 통합 전략

데이터 수집 및 집계

  • Prometheus을 사용하여 시간 series 데이터 수집
  • Logstash과 Beats를 사용하여 로그 캡처
  • 교차 소스 상관을 위한 데이터 정규화

가시성 대시보드 구축

  • Grafana을 사용하여 메트릭 시각화
  • 로그 분석을 위한 Kibana 대시보드 구축
  • Elasticsearch 쿼리를 사용하여 운영 통찰력 추출

이상 탐지와 사건 예측

  • 가시성 데이터를 Python 파이프라인에 내보내기
  • 이상 탐지 및 예측을 위한 ML 모델 학습
  • 가시성 파이프라인에서 실시간 추론을 위한 모델 배포

오픈 도구를 이용한 알림 및 자동화

  • Prometheus 알림 규칙 생성 및 Alertmanager 경로 설정
  • 자동 응답을 위한 스크립트 또는 API 워크플로우 트리거
  • 오픈 소스 오케스트레이션 도구 사용 (예: Ansible, Rundeck)

통합 및 확장성 고려 사항

  • 대용량 수집 및 장기 보관 처리
  • 오픈 소스 스택에서의 보안 및 접근 제어
  • 각 계층 독립적으로 확장: 수집, 처리, 알림

실제 적용 사례 및 확장

  • 성과 조정, 다운타임 방지, 비용 최적화 사례 연구
  • 트레이싱 도구 또는 서비스 그래프로 파이프라인 확장
  • 생산 환경에서 AIOps 실행 및 유지보수에 대한 모범 사례

요약 및 다음 단계

Requirements

  • Prometheus 또는 ELK와 같은 관찰 가능성 도구에 대한 경험
  • Python와 머신러닝 기초에 대한 작업 지식
  • IT 운영 및 알림 워크플로에 대한 이해

대상

  • 고급 사이트 신뢰성 엔지니어(SRE)
  • 운영 중인 데이터 엔지니어
  • DevOps 플랫폼 리더 및 인프라 아키텍트
 14 Hours

Number of participants


Price per participant

Upcoming Courses

Related Categories