문의를 보내주셔서 감사합니다! 팀원이 곧 연락드리겠습니다.
Thank you for sending your booking! One of our team members will contact you shortly.
Course Outline
오픈 AIOps 아키텍처 설계
- 오픈 AIOps 파이프라인의 주요 구성 요소 개요
- 데이터의 인제스트부터 알림까지의 흐름
- 도구 비교 및 통합 전략
데이터 수집 및 집계
- Prometheus을 사용하여 타임시리즈 데이터 인제스트
- Logstash과 Beats를 사용하여 로그 캡처
- 다양한 소스의 데이터 정규화
관찰 가능성 대시보드 구축
- Grafana를 사용하여 메트릭 시각화
- 로그 분석을 위한 Kibana 대시보드 구축
- Elasticsearch 쿼리를 사용하여 운영 인사이트 추출
이상 탐지 및 사건 예측
- 관찰 가능성 데이터를 Python 파이프라인에 내보냄
- 이상 탐지와 예측을 위한 ML 모델 학습
- 관찰 가능성 파이프라인에서 모델을 사용하여 실시간 추론 배포
오픈 도구를 이용한 알림 및 자동화
- Prometheus 알림 규칙 생성 및 Alertmanager 라우팅
- 자동 응답을 위한 스크립트 또는 API 워크플로우 트리거
- 오픈 소스 오케스트레이션 도구 사용 (예: Ansible, Rundeck)
통합 및 확장성 고려 사항
- 고부하 인제스트 및 장기 보존 처리
- 오픈 소스 스택의 보안 및 접근 제어
- 인제스트, 처리, 알림 각 계층을 독립적으로 확장
실세계 응용 및 확장
- 사례 연구: 성능 튜닝, 다운타임 방지 및 비용 최적화
- 추적 도구나 서비스 그래프로 파이프라인 확장
- 생산 환경에서 AIOps을 운영하고 유지보수하는 모범 사례
요약 및 다음 단계
Requirements
- Prometheus 또는 ELK와 같은 가시성 도구 경험
- Python 및 머신러닝 기본 원리 지식
- IT 운영 및 알림 워크플로 이해
대상
- 고급 사이트 신뢰성 엔지니어(SRE)
- 운영 중인 데이터 엔지니어
- DevOps 플랫폼 리드 및 인프라 아키텍트
14 Hours