Course Outline

아파치 아이스버그 소개

  • Apache Iceberg 개요
  • 기본 개념 검토

Iceberg 아키텍처 심층 분석

  • Iceberg의 테이블 형식에 대한 심층 분석
  • 메타데이터 및 파일 레이아웃을 포함한 자세한 아키텍처 개요
  • 스키마 및 파티션 진화의 내부

고급 설치 및 구성

  • 다양한 환경에서 최적의 성능을 발휘하도록 Iceberg 구성
  • 다양한 데이터 처리 엔진과의 통합
  • 고급 설정: 보안, 암호화 및 액세스 제어
  • 분산 환경에서 Iceberg 설정

고급 운영 및 유지 관리

  • 대규모 Iceberg 테이블 관리
  • 복잡한 스키마 변경 구현 및 관리
  • 파티션 진화 및 숨겨진 파티셔닝 처리
  • 스키마 및 파티션 변경을 통한 고급 CRUD 작업

쿼리 최적화 기술

  • 쿼리 대기 시간을 줄이는 기술
  • 파티션 정리 및 파일 정리
  • 메타데이터 캐싱 및 최적화 전략
  • 쿼리 최적화 기술 구현 및 테스트​

대규모 데이터 세트에 대한 성능 조정

  • 대규모 데이터 세트의 성능 최적화
  • 성능 튜닝을 위해 Iceberg의 내장 기능 사용
  • 실제 시나리오의 성능 튜닝에 대한 사례 연구
  • 대규모 데이터세트의 성능 튜닝

고급 데이터 마이그레이션 및 통합

  • 다른 시스템의 복잡한 데이터 구조 마이그레이션
  • Iceberg를 실시간 데이터 스트림과 통합
  • 복잡한 데이터세트 마이그레이션 및 실시간 데이터 스트림 통합​

신뢰성과 일관성

  • 분산 환경에서 데이터 일관성 및 무결성 보장
  • 거래 보장 구현 및 관리
  • 오류 처리 및 복구 메커니즘
  • 안정성 및 일관성 기능 구현​

고급 기능 및 사용자 정의

  • 맞춤형 카탈로그 구현
  • 맞춤형 기능으로 Iceberg 확장
  • 맞춤형 카탈로그 구현 및 Iceberg 기능 확장​

데이터 Go버넌스 및 규정 준수

  • 데이터 거버넌스 정책 구현
  • 데이터 규정 준수
  • 감사 추적 및 데이터 계보 관리
  • 거버넌스 및 규정 준수 기능 구현​

요약 및 다음 단계

Requirements

  • 핵심 개념, 기본 운영, Iceberg 테이블 관리에 대한 숙지

청중

  • 데이터 엔지니어
  • 데이터 설계자
  • 데이터 분석가
  • 소프트웨어 개발자
 21 Hours

Number of participants


Price per participant

회원 평가 (3)

Upcoming Courses

Related Categories