Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Course Outline
오픈 AIOps 아키텍처 설계
- 오픈 AIOps 파이프라인의 주요 구성 요소 개요
- 데이터의 인제스트부터 알림까지의 흐름
- 도구 비교 및 통합 전략
데이터 수집 및 집계
- Prometheus을 사용하여 타임시리즈 데이터 인제스트
- Logstash과 Beats를 사용하여 로그 캡처
- 다양한 소스의 데이터 정규화
관찰 가능성 대시보드 구축
- Grafana를 사용하여 메트릭 시각화
- 로그 분석을 위한 Kibana 대시보드 구축
- Elasticsearch 쿼리를 사용하여 운영 인사이트 추출
이상 탐지 및 사건 예측
- 관찰 가능성 데이터를 Python 파이프라인에 내보냄
- 이상 탐지와 예측을 위한 ML 모델 학습
- 관찰 가능성 파이프라인에서 모델을 사용하여 실시간 추론 배포
오픈 도구를 이용한 알림 및 자동화
- Prometheus 알림 규칙 생성 및 Alertmanager 라우팅
- 자동 응답을 위한 스크립트 또는 API 워크플로우 트리거
- 오픈 소스 오케스트레이션 도구 사용 (예: Ansible, Rundeck)
통합 및 확장성 고려 사항
- 고부하 인제스트 및 장기 보존 처리
- 오픈 소스 스택의 보안 및 접근 제어
- 인제스트, 처리, 알림 각 계층을 독립적으로 확장
실세계 응용 및 확장
- 사례 연구: 성능 튜닝, 다운타임 방지 및 비용 최적화
- 추적 도구나 서비스 그래프로 파이프라인 확장
- 생산 환경에서 AIOps을 운영하고 유지보수하는 모범 사례
요약 및 다음 단계
Requirements
- Prometheus 또는 ELK와 같은 가시성 도구 경험
- Python 및 머신러닝 기본 원리 지식
- IT 운영 및 알림 워크플로 이해
대상
- 고급 사이트 신뢰성 엔지니어(SRE)
- 운영 중인 데이터 엔지니어
- DevOps 플랫폼 리드 및 인프라 아키텍트
14 Hours