Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Course Outline
오픈 AIOps 아키텍처 설계
- 오픈 AIOps 파이프라인에서 주요 구성 요소 개요
- 데이터 흐름: 수집에서 알림까지
- 도구 비교 및 통합 전략
데이터 수집 및 집계
- Prometheus을 사용하여 시간 series 데이터 수집
- Logstash과 Beats를 사용하여 로그 캡처
- 교차 소스 상관을 위한 데이터 정규화
가시성 대시보드 구축
- Grafana을 사용하여 메트릭 시각화
- 로그 분석을 위한 Kibana 대시보드 구축
- Elasticsearch 쿼리를 사용하여 운영 통찰력 추출
이상 탐지와 사건 예측
- 가시성 데이터를 Python 파이프라인에 내보내기
- 이상 탐지 및 예측을 위한 ML 모델 학습
- 가시성 파이프라인에서 실시간 추론을 위한 모델 배포
오픈 도구를 이용한 알림 및 자동화
- Prometheus 알림 규칙 생성 및 Alertmanager 경로 설정
- 자동 응답을 위한 스크립트 또는 API 워크플로우 트리거
- 오픈 소스 오케스트레이션 도구 사용 (예: Ansible, Rundeck)
통합 및 확장성 고려 사항
- 대용량 수집 및 장기 보관 처리
- 오픈 소스 스택에서의 보안 및 접근 제어
- 각 계층 독립적으로 확장: 수집, 처리, 알림
실제 적용 사례 및 확장
- 성과 조정, 다운타임 방지, 비용 최적화 사례 연구
- 트레이싱 도구 또는 서비스 그래프로 파이프라인 확장
- 생산 환경에서 AIOps 실행 및 유지보수에 대한 모범 사례
요약 및 다음 단계
Requirements
- Prometheus 또는 ELK와 같은 관찰 가능성 도구에 대한 경험
- Python와 머신러닝 기초에 대한 작업 지식
- IT 운영 및 알림 워크플로에 대한 이해
대상
- 고급 사이트 신뢰성 엔지니어(SRE)
- 운영 중인 데이터 엔지니어
- DevOps 플랫폼 리더 및 인프라 아키텍트
14 Hours