코스 개요

NiFi 및 데이터 흐름의 기초

  • 데이터 이동 vs. 정적 데이터: 개념과 과제
  • NiFi 아키텍처: 코어, 흐름 컨트롤러, 출처 추적, 알림
  • 주요 구성 요소: 프로세서, 연결, 제어기, 출처 추적

빅 데이터 컨텍스트 및 통합

  • NiFi가 빅 데이터 생태계(Hadoop, Kafka, 클라우드 저장소)에서 역할
  • HDFS, MapReduce, 현대적 대안 개요
  • 사용 사례: 스트림 인제스트, 로그 전송, 이벤트 파이프라인

설치, 구성 및 클러스터 설정

  • 단일 노드 및 클러스터 모드에서 NiFi 설치
  • 클러스터 구성: 노드 역할, Zookeeper, 로드 밸런싱
  • NiFi 배포 관리: Ansible, Docker, Helm 사용

데이터플로우 설계 및 관리

  • 라우팅, 필터링, 분할, 병합 흐름
  • 프로세서 구성(InvokeHTTP, QueryRecord, PutDatabaseRecord 등)
  • 스키마 처리, 리치먼트, 변환 작업 수행
  • 오류 처리, 재시도 관계, 백프레셔 처리

통합 시나리오

  • 데이터베이스, 메시징 시스템, REST API 연결
  • 분석 시스템으로 스트리밍: Kafka, Elasticsearch, 클라우드 저장소
  • Splunk, Prometheus, 로그 파이프라인 통합

모니터링, 복구 및 출처 추적

  • NiFi UI, 메트릭, 출처 추적 시각화기 사용
  • 자율적인 복구 및 우아한 실패 처리 설계
  • 백업, 플로우 버전 관리, 변경 관리

성능 조정 및 최적화

  • JVM, 힙, 스레드 풀, 클러스터링 매개변수 조정
  • 병목 현상 줄이기 위한 플로우 설계 최적화
  • 리소스 격리, 플로우 우선순위 설정, 처리량 제어

베스트 프랙티스 및 거버넌스

  • 플로우 문서화, 명명 규칙, 모듈식 설계
  • 보안: TLS, 인증, 접근 제어, 데이터 암호화
  • 변경 관리, 버전 관리, 역할 기반 접근, 감사 추적

트러블슈팅 및 사고 대응

  • 주요 문제: 데드락, 메모리 누수, 프로세서 오류
  • 로그 분석, 오류 진단 및 근본 원인 조사
  • 복구 전략 및 플로우 롤백

실습: 현실적인 데이터 파이프라인 구현

  • 단계별 플로우 구축: 수집, 변환, 전달
  • 오류 처리, 백프레셔, 스케일링 구현
  • 파이프라인 성능 테스트 및 조정

요약 및 다음 단계

요건

  • Linux 명령줄 사용 경험
  • 네트워크 및 데이터 시스템에 대한 기본 이해
  • 데이터 스트리밍 또는 ETL 개념에 대한 노출

대상자

  • 시스템 관리자
  • 데이터 엔지니어
  • 개발자
  • DevOps 전문가
 21 시간

참가자 수


참가자당 가격

회원 평가 (7)

예정된 코스

관련 카테고리